본문 바로가기

[A.I] 응용 사례 : 나이브 베이즈 영화 추천

@xuv22024. 6. 6. 18:09

아래 서술하는 자료는 유튜브 위니버스 님의 영상을 참고하여 작성하였습니다.

https://www.youtube.com/watch?v=Y4ecU7NkiEI

https://www.youtube.com/watch?v=me--WQKQQAo

  1. 이진 분류: 두가지중 하나로 분류 ex) 스팸 메일 필터링, 고객 이탈 예측, 클릭률 예측, 암진단
  2. 다중 클래스 분류(다항 분류) : 두개 이상의 클래스 존재 ex) 필기체 인식
  3. 다중 레이블 분류: n개의 이진 분류 문제로 변환하고, 각각의 이진 분류 문제를 개별 이진 분류기로 처리

나이브 베이즈 : 확률적 분류기

나이브: 예측하려고 하는 특징이 상호 독립적이라는 가정하에 확률계산 단순화

베이즈: 베이즈 정리를 기반으로 어떤 클래스에 관해 관찰한 입력 특징의 조건부 확률을 관찰한 특징이 어떤 클래스에 속할지에 대한 조건부 확률에 매핑

베이즈 정리 : P(A|B)는 B가 참일 때 A가 발생할 확률로써 다음과 같이 표기 가능

베이즈 정리는 쉽게 말해 사전 확률을 통하여 사후확률을 얻는 것

 

예시) 넷플릭스 영화 추천

영화 추천에 있어서 초기 사용자가 어떠한 영화를 좋아할 지 모르는 상태(Cold Start)이기에 어떤 장르를 선택하던 그것을 좋아할 확률을 50, 싫어할 확률도 50으로 설정 → 이때 영화를 좋아할 확률을 사전확률 이라고 칭한다.

시간이 지나 사용자가 10편의 영화를 보았고, 총 5편의 영화에 좋아요 를 눌렀다.

그 중에 3편이 액션 영화일 때, 좋아하는 영화 중 60%가 액션 장르이다

10개 중 나머지 5개에 싫어요를 눌렀는데 그 중 하나가 액션 장르였다 → 싫어하는 영화 중 20%가 액션영화 이다.

---------------------------------------------------------------------------------------------

 

이때 나온 결과 값을 통해 알고리즘은 시청자가 액션 영화를 좋아할 확률을 50 → 75%로 업데이트

여기서 75%를 사후확률이라고 한다

추가적으로 추후에 사용자가 비슷한 메커니즘으로 좋아하는 배우가 나오는 영화에 좋아요를 눌러 위와 같이 확률을 분리했을때, 알고리즘은 이를 또 학습하고 액션 장르 + 좋아하는 배우가 등장하는 영화를 추천해줄 확률을 높인다

이를 인공지능은 베이즈 정리를 통해 값을 정확하게 구해냄

xuv2
@xuv2 :: xuvlog

폭싹 늙었수다

목차