목록👩🏻💻 (15)
.__.

- 01.1 Apache Spark가 도대체 뭘까? - 01.2 Apache Spark 특징은 ? - 01.3 RDD가 뭔데? 01.1 Apache Spark 가 도대체 뭘까? 최근 실무에서, 스파크 환경 세팅을 하느라 시스템엔지니어링팀과 짧게 회의를 했다. (방화벽, 네트워크 관련해서...) 그때, 해당 팀 팀원분이 "아 근데, 스파크가 뭐에요?" 라고 하셨다. 나는 "아.. 스파크는요~ 대규모 데이터를 처리하는 분산 처리 API라고 생각해주시면 됩니다 :)" 라고 (얼버무려) 대답했다.ㅋㅋㅋ 취준 시절에는 데이터를 다룰 때 Pandas, Numpy, TF만 사용했었는데.. 어쩌다보니 지금은 Spark 와 MR 만 사용하게 됐다. (그럴수밖에 없는게, 실무에서는 데이터사이즈가 워낙 크니깐..., 아 그..

3.1 Train/Test and Cross Validation | 학습/테스트 데이터와 교차검증 - Train / Test 분리 - 검증 방법 : k-fold validation -> 학습 데이터의 개수가 적은 경우 사용하면 좋다. -> 과적합 방지용 3.2 Accuracy Metrics (RMSE, MAE) | 정확도 지표(RMSE, MAE) | mean absolute error (MAE) | root mean square error (RMSE) - 예측과 실제의 차이가 크면클수록 더 높은 페널티를 부여받는다. - 예측과 실제의 차이가 작으면작을수록 더 낮은 페널티를 부여받는다. + Netflix Prize는 넷플릭스 사용자들의 영화 별점 데이터를 가지고 2006년 10월부터 2009년 7월까지 약..

파이썬을 주언어로 쓰고 있기 때문에 해당 챕터를 생략한다. 2챕터를 듣진 않았지만, 목차를 보면 대략적으로 어떤 수준의 프로그래밍 실력을 원하는지 알 수 있다.
1.1 Course RoadMap 본격적으로 Building Recommender Systems with Machine Learning and AI 코스를 진행하기 앞서, 강의의 로드맵을 살펴보자! 추천시스템 스터디를 위해 선정한 강의 : Building Recommender Systems with Machine Learning and AI(Udemy) Building Recommender Systems with Machine Learning and AI How to create machine learning recommendation systems with deep learning, collaborative filtering, and Python. www.udemy.com - getting Starte..

해당 글은 카이스트 스마트 에너지 인공지능 연구센터, 정유채 교수님의 강의내용을 정리한 내용입니다. L2_ML-based Approach 1. Introduction to NLP 2. Word Embedding 3. Machine Learning & NLP 4. ML-based Document Classification 1. Introduction to NLP 1.1 NLP - meta model for understanding the structure of language. - NLU(NL Understanding) and NLG(NL Understanding) 2. Word Enbedding - Local Representation (Statistical approach) one-hot endcodi..