본문 바로가기
AI & Data PM/인공지능과 데이터 제품매니저

지도학습, 비지도학습, 강화학습에 대한 개념잡기

by 경성현 2023. 11. 20.

인간의 학습 방식을 기계학습에 비유해보면, 지도학습, 비지도학습, 강화학습의 개념을 더 쉽게 이해할 수 있습니다. 가령, 어린 아이들은 부모나 선생님의 가르침에 의해 개와 고양이를 구분하는 방법을 배우게 됩니다. 또한, 가르쳐준적은 없지만, 흩어져 있는 바둑알을 두개의 통에 나누어 담으라고 하면 색깔을 통해서 바둑알을 검은색과 흰색으로 나눠서 정리할 수 있습니다. 정확히는 알 수 없지만 이렇게 해봤더니 칭찬을 받았었고 저렇게 해봤더니 혼났던 기억으로부터 칭찬을 더 잘 받는 방향으로 스스로 배우기도 합니다. 

기계도 이와 유사한 세 가지 주요 학습 방법을 통해 배웁니다. 인공지능 제품 매니저로서 이 세 가지 기계 학습 방법을 이해하고 해결해야 하는 문제와 데이터의 종류에 따라 가장 적절한 학습 방법을 선택하는 것이 중요합니다.

1️⃣ 지도학습: 지도학습은 모델에게 정확히 무엇을 해야 하는지를 알려주는 방법입니다. 예를 들어, '이것은 고양이다' 또는 '이것은 자동차다'와 같은 레이블이 붙은 데이터를 필요로 합니다. 금융 분야에서는 신용 평가 모델을 예로 들 수 있습니다. 고객의 과거 신용거래 이력을 바탕으로 그들의 신용 위험을 예측하는 모델을 구축할 때 지도학습이 사용됩니다.

2️⃣ 비지도학습: 비지도학습은 기계가 스스로 패턴을 식별하는 방법입니다. 레이블이 없는 데이터를 사용하며, 기계는 데이터에서 공통적인 요소를 스스로 파악합니다. 금융 분야에서는 고객 분류(segmentation)가 있습니다. 각 금융사에서 다양한 고객 유형을 분류하여 맞춤형 마케팅 캠페인을 제공하고자 할 때, 비지도학습 방법으로 비슷한 성향의 고객을 분류하곤 합니다.

3️⃣ 강화학습: 강화학습은 기계에게 목표를 설정하고 그 목표를 달성하는 방법을 기계가 스스로 찾게 하는 매우 강력한 학습 유형입니다. 로보틱스와 게임 분야에서 자주 사용되며, 구글의 AlphaGo가 대표적인 예입니다. 금융 분야에서는 알고리즘 트레이딩이 있습니다. 시장 데이터와 거래 전략에 따라 최적의 트레이딩 결정을 내리는 모델을 구축할 때 강화학습을 활용하기도 합니다.

기계는 다양한 방식으로 학습할 수 있으며, 인공지능 제품 관리자로서는 이러한 다양한 학습 방법을 이해하고 적절히 활용하는 것이 중요합니다. 적절한 학습 방법의 선택은 제품 개발과 문제 해결에 있어 궁극적인 목표를 달성하는 데 중요한 역할을 합니다.