목록2024/03 (4)
.__.
들어가는글 4장을 통해 1장에서 설명한 추천 시스템의 3가지 구성요소 중 '프로세스(추천 설계)'에 해당하는 내용을 공부한다. 이번 장에서는 추천 시스템 알고리즘에서는 어떤 종류가 있는지, 각 알고리즘은 어떻게 사용자가 좋아하는 아이템을 추출하는지, 어떤 특징이 있는지, 어떤 경우에 사용되는지를 직관적으로 이해하는 것이 첫번째 목적이다. 구체적인 구현 과정은 5장에서 이어진다. 4.1 추천 알고리즘 분류 content-based filtering 책의 제목이나 저자, 장르 등과 같이 아이템의 내용을 나타내는 정보를 사용 -> (in e-commerce) 상품의 브랜드, 카테고리 정보와 같이 상품이라는 아이템 자체가 가지는 정보 사용자가 선호하는 정보를 기반으로 내용이 비슷한 아이템을 계산함으로써 추천을 ..
들어가는 글 실제 서비스 사용자에게 영향을 주지 않고 평가를 수행하는 오프라인 평가와 달리, 실제 사용자에게 미치는 영향을 평가하는 온라인 평가에 대해서 알아본다. 온라인 평가는 시스템의 변경점을 실제로 사용자에게 제시해, 평가하는 방법을 온라인 평가라고 부른다. 온라인 평가로 사용되는 A/B테스트와 인터리빙 테스트 방식에 대해 알아보자. 또한 온라인 평가에 사용되는 지표가 있는데, 온라인 평가지표는 어떤 종류가 있으며, 어떤 역할을 하는지에 대해 알아보자. 7.3 온라인 평가 7.3.1 A/B테스트 A/B테스트는 무작위 비교 실험(Randomized Controlled Trial_RCT) 중 하나의 방식이다. 사용자를 Treatment그룹(실험그룹), Control그룹(대조군) 나눠서 평가를 수행한다...
들어가는 글 오프라인 평가 즉, 모델의 자체의 성능 평가를 위한 평가지표를 알아보고, 수많은 평가지표 중 어떤 지표를 선정하는 것이 좋을지에 대한 선정방법에 대해 공부해본다. 7.2 오프라인 평가 오프라인 평가 지표 예측 오차 지표 사용자가 아이템에 부여한 명시적인 평가값과 시스템이 예측한 평가값의 오차를 평가하는 것 지표를 이해하기 위한 변수 MAE MAE = Mean Absolute Error = 평균 절대값 오차 = 예측값과 실제값 차이의 절대값 평균을 나타내는 지표 $$ MAE = \frac{1}{n}\sum_{i=1}^{n}\left|{r_i - \hat{r_i}}\right| $$ MSE MSE = Mean Squared Error = 평균 제곱 오차를 = 예측값과 실제값 차이의 제곱 평균을 ..
들어가는 글 이제 막 인트로(ch01, 02, 03)까지 달려왔고! 이제 본격적으로 ch04(추천알고리즘 개요), ch05(추천알고리즘 상세)를 공부하려고 했는데! 갑자기 ch07부터 공부하기로 했다. ㅎ ch07는 추천시스템을 평가하는 방법에 대해 소개하는 챕터이다. 해당 챕터를 먼저 읽고 본격적으로 ch04, 05를 공부하게 되면, 어떤 추천모델을 설계하는 것이 좋을지에 대한 감(?)이 더 빠르게 올 것 같아서이다. 즉, 만들어진 모델에 대한 평가지표로는 무엇무엇이 있고. 서비스 지표는 무엇무엇이 있고 이 중에서 어떤 지표를 타겟팅할지 정했다면, 나는 과연 어떤 피쳐들을 모델에 녹일 수 있을까? 등의 고민의 시간🤔이 더 짧아질 수 있지 않을까 싶었다. 그래서 이번 챕터에서는 추천시스템을 평가하는 방법..