목록👩🏻💻 (15)
.__.
들어가는 글 지난 주에는 Part4~ Part8을 읽었고, 이번주에는 Part9, Part10을 읽으며 이 책을 마무리 지어보려한다. 지난주에 알게된 점을 짧게 리마인드해보자. Part4 : 예상오차, 표본오차를 고려하여, 자료를 해석하자 Part5 : 그래프를 그리는 방식에 따라, 해석자는 해석은 다양해질 수 있다. Part6 : 시각을 자극하는 그림 도표에 유의하자. Part7 : 사전-사후 눈속임이 통계에 적용될 수 있음에 유의하자. Part8 : 상관관계, 전후관계, 인과관계는 모두 다르고 각각을 동일하다고 해석하지말자. Part9. 통계를 조작하는 방법 Part9에서는 통계를 조작하는 여러 방법에 대해 설명한다. - 쓸데없이 정확한 숫자로 그럴듯해 보이는 방법 쓸데없이 그럴듯한 숫자들을 나열하고..

들어가는 글 지난주에는 Part1 ~ Part3를 읽었고, 이번주에는 Part4 ~ Part8을 읽었다. 이제 남은건 Part9, Part10이다. 😄 독서챌린지를 하니깐 벌써 책 한 권도 다읽어가고 좋은 것 같다. 신청하길 잘한듯 지난주에 알게된 점을 짧게 리마인드해보자. Part1에서는 임의추출에 의해 표본이 잘 추출되었는지를 유의하자는 내용이었다. Part2에서는 표본에 따라 대표값은 산술평균 뿐만아니라, 최빈값, 중앙값이 될 수 있다는 내용이었다. Part3에서는 작은 표본으로 통계결과를 사기칠 수 있음에 유의하자는 내용이었다. Part4. 쓸데없는 숫자로 벌어지는 헛소동 part4에서는 예상오차와 표준오차에 대해서 설명한다. 오차(예상오차, 표준오차)는 추출된 표본이 전체를 얼마나 정확하게 대표..

들어가는 글 : 참여 동기 2024 만다라트 계획을 세우면서 올해는 꼭 책을 3권 이상 읽기로 다짐했다. 🧐 올해 업무 역량을 강화시키기 위해서, 업무와 유관된 책을 읽으려고 했다. 데이터 관련 업무를 함에 있어서 조금 더 논리적이면서 한편으로는 지식에 기반한 직관적인 사람이 되고자 "데이터"관련 서적을 읽기로 마음을 먹었다. 그런데..! 어쩌다가 데이터리안이라는 커뮤니티를 알게되었고, 마침 4월에 독서 챌린지를 한다고 하여 참여하게 되었다. 아니 너무 좋자나..?! 😆 혼자 읽으면 보통 전체의 10%만 읽고 그만두는데.. 함께 읽는다니.! 너무 좋은 것 같다 :) 참여조건은 간단하다. "데이터 관련 책을 읽고싶은 사람"이 그것이다. 따로 모임비가 발생하거나, 학원숙제 같이 강제성(?)이 없어서 좋은 것..

들어가는글 4장을 통해 1장에서 설명한 추천 시스템의 3가지 구성요소 중 '프로세스(추천 설계)'에 해당하는 내용을 공부한다. 이번 장에서는 추천 시스템 알고리즘에서는 어떤 종류가 있는지, 각 알고리즘은 어떻게 사용자가 좋아하는 아이템을 추출하는지, 어떤 특징이 있는지, 어떤 경우에 사용되는지를 직관적으로 이해하는 것이 첫번째 목적이다. 구체적인 구현 과정은 5장에서 이어진다. 4.1 추천 알고리즘 분류 content-based filtering 책의 제목이나 저자, 장르 등과 같이 아이템의 내용을 나타내는 정보를 사용 -> (in e-commerce) 상품의 브랜드, 카테고리 정보와 같이 상품이라는 아이템 자체가 가지는 정보 사용자가 선호하는 정보를 기반으로 내용이 비슷한 아이템을 계산함으로써 추천을 ..

들어가는 글 실제 서비스 사용자에게 영향을 주지 않고 평가를 수행하는 오프라인 평가와 달리, 실제 사용자에게 미치는 영향을 평가하는 온라인 평가에 대해서 알아본다. 온라인 평가는 시스템의 변경점을 실제로 사용자에게 제시해, 평가하는 방법을 온라인 평가라고 부른다. 온라인 평가로 사용되는 A/B테스트와 인터리빙 테스트 방식에 대해 알아보자. 또한 온라인 평가에 사용되는 지표가 있는데, 온라인 평가지표는 어떤 종류가 있으며, 어떤 역할을 하는지에 대해 알아보자. 7.3 온라인 평가 7.3.1 A/B테스트 A/B테스트는 무작위 비교 실험(Randomized Controlled Trial_RCT) 중 하나의 방식이다. 사용자를 Treatment그룹(실험그룹), Control그룹(대조군) 나눠서 평가를 수행한다...

들어가는 글 오프라인 평가 즉, 모델의 자체의 성능 평가를 위한 평가지표를 알아보고, 수많은 평가지표 중 어떤 지표를 선정하는 것이 좋을지에 대한 선정방법에 대해 공부해본다. 7.2 오프라인 평가 오프라인 평가 지표 예측 오차 지표 사용자가 아이템에 부여한 명시적인 평가값과 시스템이 예측한 평가값의 오차를 평가하는 것 지표를 이해하기 위한 변수 MAE MAE = Mean Absolute Error = 평균 절대값 오차 = 예측값과 실제값 차이의 절대값 평균을 나타내는 지표 $$ MAE = \frac{1}{n}\sum_{i=1}^{n}\left|{r_i - \hat{r_i}}\right| $$ MSE MSE = Mean Squared Error = 평균 제곱 오차를 = 예측값과 실제값 차이의 제곱 평균을 ..

들어가는 글 이제 막 인트로(ch01, 02, 03)까지 달려왔고! 이제 본격적으로 ch04(추천알고리즘 개요), ch05(추천알고리즘 상세)를 공부하려고 했는데! 갑자기 ch07부터 공부하기로 했다. ㅎ ch07는 추천시스템을 평가하는 방법에 대해 소개하는 챕터이다. 해당 챕터를 먼저 읽고 본격적으로 ch04, 05를 공부하게 되면, 어떤 추천모델을 설계하는 것이 좋을지에 대한 감(?)이 더 빠르게 올 것 같아서이다. 즉, 만들어진 모델에 대한 평가지표로는 무엇무엇이 있고. 서비스 지표는 무엇무엇이 있고 이 중에서 어떤 지표를 타겟팅할지 정했다면, 나는 과연 어떤 피쳐들을 모델에 녹일 수 있을까? 등의 고민의 시간🤔이 더 짧아질 수 있지 않을까 싶었다. 그래서 이번 챕터에서는 추천시스템을 평가하는 방법..

들어가는 글 3장에서는 추천 시스템이 사용자에게 추천 결과를 전달할 때 어떤 화면(UI)에 따라어떤 체험(UX)을 제공해야하는지에 관해 설명한다. 1장에서 설명한 추천시스템의 3가지 구성 요소 중 "출력(추천 결과 제시)"에 해당한다. https://yesjiyoung.tistory.com/14 [추천 시스템 입문] CH01. 추천시스템 들어가는 글 6주동안 책을 공부하고 그 내용을 정리해보려한다. 책 정보 : https://m.yes24.com/Goods/Detail/118625987 추천 시스템 입문 - 예스24 추천 시스템 도입을 고민하고 있다면 제일 먼저 봐야 하는 yesjiyoung.tistory.com 3.1 UI/UX의 중요성 실제 서비스에 추천 시스템을 도입할 때 어느 정도 고도화된 추천 ..

들어가는 글 2장에서는 추천 시스템 프로젝트를 어떤 팀과 어떤 프로세스로 진행하는지에 관해 설명한다. 이를 통해, 추천 프로젝트를 진행하려면, 어떤 팀들과 협업해야하는지 그리고 어떤 프로세스를 통해 구현이 가능한지에 대해 공부해보려한다. 2.1 추천 시스템 개발에 필요한 3가지 스킬 데이터 과학자에게 필요한 스킬셋으로 "비지니스 문제 해결 능력", "데이터 사이언스 능력", "데이터 엔니어링 능력"의 3가지 스킬이 필요하다고 한다. 추천시스템 개발에도 위의 세 가지 스킬이 필요하다. (당연히, 검색시스템 개발자도 위의 세 가지 스킬이 필요하다!) 비지니스 문제 해결 능력 먼저, 추천 시스템을 도입함으로써 무엇을 기대할 수 있는지 정의하는 것이 중요하다고 한다. 구체적으로는 추천 시스템을 도입하여, 사용자..

들어가는 글 6주동안 책을 공부하고 그 내용을 정리해보려한다. 책 정보 : https://m.yes24.com/Goods/Detail/118625987 추천 시스템 입문 - 예스24 추천 시스템 도입을 고민하고 있다면 제일 먼저 봐야 하는 책! ‘맞춤 동영상’ ‘팔로우 추천’ ‘다른 고객이 함께 본 상품’ 등 추천 기능은 주변의 다양한 서비스에 포함되어 있다. 수많은 m.yes24.com 추천시스템 1.1 추천 시스템 추천 시스템이란? 사용자가 특별히 키워드를 입력하지 않고도 마음에 드는 아이템을 만날 수 있는 시스템. 추천 시스템을 통해서? 고객과 기업은 각각 어떤 이점을 얻는지? 사용자 입장 - 아이템 구입에 도움을 줌 기업 입장 - (1) 매출상승 (2) 고객의 체류시간 상승 ➡️체류시간상승은 곧 ..