본문 바로가기
728x90

TIL - 외29

[추천시스템] Memory Based Collaborative Filtering Collaborative Filtering 사용자와 아이템 간의 상호 상관 관계를 분석하여 새로운 사용자-아이템 관계를 찾아주는 것으로 사용자의 과거 경험과 행동 방식(User Behavior)에 의존하여 추천하는 시스템 책 추천 받을 때 1. 내가 좋아하는 장르, 작가, 출판사의 책 추천 -> Content Based Filtering 2. 나랑 비슷한 성향의 친구들이 읽은 책 책춘 -> Collaborative Filtering Collaborative Filtering의 대표적인 한계점 Cold Start 문자 그대로 새로운 사용자나 새로운 아이템 등장 시, 기존의 관련된 경험 또는 행동 방식이 없기 때문에 추천이 곤란해지는 문제 long Tail 전체 추천 아이템으로 보이는 비율이 '사용자들의 관.. 2023. 4. 11.
[추천시스템] Content Based Filtering 카카오 AI추천 : 카카오의 콘텐츠 기반 필터링 (Content-based Filtering in Kakao) – tech.kakao.com 카카오 AI추천 : 카카오의 콘텐츠 기반 필터링 (Content-based Filtering in Kakao) 카카오 서비스 사용자들의 아이템(콘텐츠 또는 상품) 소비 패턴을 살펴보면, 기존에 소비한 아이템과 유사한 아이템을 소비하는 경우를 쉽게 찾아볼 수 있습니다. 예를 들면, 브런치의 특정 작 tech.kakao.com Content Based Filtering 사용자가 특정 아이템을 선호하는 경우 그 아이템과 비슷한 콘텐츠를 가진 다른 아이템을 추천해주는 방식 사례 : 최근 본 상품과 비슷한 상품 추천, 읽은 자품과 비슷한 작품 추천 등등 아이템 특성화 아이템.. 2023. 4. 11.
[추천시스템] 추천 시스템 개론 추천 시스템 추천 시스템이란? 정보 필터링(IF) 기술의 일종, 특정 사용자가 관심을 가질 만한 정보를 추천하는 것 사용자의 행동 데이터와 아이템 데이터를 분석하여 현재 사용자에게 가장 적절한 아이템을 추천하는 시스템 활용 사례 영화,드라마,음악 추천 구인 구직 매칭 등등 추천 시스템 목적 사용자가 정보를 수집하고 찾는 시간을 효과적으로 감소시키는 것 기존에 알지 못했지만 사용자가 관심을 가질만한 콘텐츠를 접하게 하여 선택의 폭을 넓혀주는 것 개인화된 추천을 통한 만족도 극대화 Push and Pull(추천과 검색) Push : 사용자가 관심을 가질 만한 정보를 시스템이 밀어내듯이 제공 Pull : 사용자의 의도에 맞는 항목을 찾고 추천하는 문제 대부분의 추천 시스템은 Push와 Pull 의 중간에 위치.. 2023. 4. 11.
[머신러닝] K-최근접 이웃(KNN) 알고리즘 및 실습 KNN 알고리즘이란 가장 간단한 머신러닝 알고리즘, 분류(Classification) 알고리즘 어떤 데이터에 대한 답을 구할 때 주위의 다른 데이터를 보고 다수를 차지하는 것을 정답으로 사용 새로운 데이터에 대해 예측할 때는 가장 가까운 직선거리에 어떤 데이터가 있는지 살피기만 하면 된다.(k =1) 단점 데이터가 아주 많은 경우 사용하기 어렵다 데이터가 크기 때문에 메모리가 많이 필요하고 직선 거리를 계산하는 데도 많은 시간이 필요 실제로 k-최근접 알고리즘은 무언가 훈련되는 게 없다. fit() 메서드에 전달한 데이터를 모두 저장하고 있다가 새로운 데이터가 등장하면 가장 가까운 데이터를 참고하여 분류 객체._fit_X 객체._y k의 기본값은 5 n_neighbors 매개변수로 바꿀 수 있다. p 매.. 2023. 4. 9.
모듈로 연산(Modulo Operation) 기본 소수 모듈러 (Modular arithmetic)는 정수 계산에서 일종의 나머지 연산이다. 즉, 어떤 정수를 다른 정수로 나눈 나머지를 계산하는 것이다. 소수 모듈러 연산은 특히 암호학과 관련된 계산에서 매우 유용하다. 예를 들어, 두 소수 p와 q를 곱한 수 n을 사용하여 RSA 암호화를 할 때, 이러한 연산이 사용된다. 보통 소수 모듈러 연산은 mod 연산자로 표시된다. 예를 들어, a mod b는 a를 b로 나눈 나머지를 나타낸다. 소수 모듈러 연산은 다양한 수학적 성질을 가지고 있다. 예를 들어 a mod b == c 이고 d mod b = e 이면, (a+d) mod b = (c+e) mod b 이다. 이러한 성질들을 암호학에서 매우 중요하게 사용되며, 특히 공개키 암호 시스템에서는 소수 모듈러.. 2023. 4. 7.
불균형 데이터 (imbalanced data) 처리를 위한 샘플링 기법 1. 불균형 데이터란 '정상' 범주의 관측치 수와 '이상' 범주의 관측치 수의 차이가 크게 나타나는 경우 클래스 별 관측치의 수가 현저하게 차이가 나는 데이터 문제 정상을 정확히 분류하는 것과 이상을 정확히 분류하는 것 중 일반적으로 이상을 정확히 분류하는 것이 더 중요 불균형한 데이터 세트는 이상 데이터를 정확히 찾아내지 못할 수 있다는 문제점이 존재 2. 불균형 데이터 해결 방안 데이터를 조정해서 해결 샘플링 기법 (Sampling method) 모델을 조정해서 해결 비용 기반 학습 (Cost sensitive learning) 단일 클래스 분류기법 (Novelty detection) 2-1. 샘플링 기법 1) 언더 샘플링 다수 범주의 데이터를 소수 범주의 데이터 수에 맞게 줄이는 샘플링 방식 장점 .. 2023. 3. 22.
반응형