비지도 학습이란?
지도학습의 경우에서는 데이터셋에서 정답 레이블이 주어져 있었고, 해당 정답에 가장 근접하게 맞추는 모델을 만들어내는 과정이었다. 하지만, 일상에서 생성되고 있는 우리가 사용가능한 데이터에는 대부분 레이블이 주어져있지 않다.
Q1. 제품의 사진을 입력 데이터를 받아 결함이 있는 제품을 감지하는 시스템을 설계하려고 한다. 자동으로 사진을 찍는 시스템은 구현이 쉬우니 매시간 수백,수천장의 사진을 받아올 수 있다. 하지만 각 제품사진에 대해서는 제품이 결함인지 정상인지는 알 수 없고, 이를 일일이 수작업으로 레이블을 매기기에는 비용이 많이 들 것이다. 이럴 때에는 어떤 모델을 고안해내야 할까?
Q2. 쇼핑몰을 운용하고 있고, 고객의 온라인 상품 거래내역을 가지고 있다. 이 데이터를 활용하여 고객이 관심을 가질 것 같은 상품을 피드에 띄워 구매를 유도하고 싶다. 만약, 비슷한 거래 내역을 가진 고객끼리 그룹으로 묶어서, 해당 그룹내에 다른 고객은 구매했지만, 해당 고객은 구매하지 않은 물품을 추천하면 수익이 올라갈 것이다. 이럴 때에는 어떤 모델을 고안해내면 좋을까?