Unsupervised Learning

Labeled Data 를 이용해 학습하던 지도학습과 다르게 Unlabeled Data (Raw Data) 를 이용한다. 사람이 데이터에 대한 라벨링을 해주지 않아도 되는 것이다. 라벨이 없기 때문에 주어진 데이터로부터 패턴 등의 hidden knowledge 를 자동으로 찾는다.

image.png

활용 예시로는 Anomaly Detection 이 있다. 이상치는 특정 행동이 아닌 평소와 다른 행동이기 때문에 라벨링이 아닌 다른 접근 방식이 필요한 것이다.

Importance

빅데이터 시대에서 unlabeled data 를 무시하는 것은, 전체 데이터의 99% 이상을 무시하는 것이다. 데이터의 대부분을 차지하는 unlabeled data 를 처리하고 분석하는 것은 중요하다.

Algorithms