머신러닝의 종류¶
머신러닝
: 인공지능을 공부시키는 방법
1 지도 학습(Supervised Learning)¶
문제와 정답을 모두 알려주고 공부시키는 방법
지도 학습
: 반응변수를 예측해내는 것이 목적
1-1 회귀(Regression)¶
회귀 예측분석(regression)
: *수량형* 반응변수 예측
- 얼마나 많은가?와 같은 *양적*인 문제 해결에 도움되는 알고리즘으로
*분류* 문제에 비해 모형의 복잡도가 높음
예) 구매 금액, 매출액, 이용 고객 수 예측 등
- 선형 회귀, 회귀나무, 시계열 분석 사례
1-2 분류(Classification)¶
분류분석(classification)
: *범주형* 반응변수 예측
- 새로운 데이터와 형성된 모형으로부터 보지못한 데이터 분류
- 이진 분류(binary classification) 문제가 대다수
예) 구매/비구매, 사기거래/정상거래, 양성반응/음성반응 등
- 로지스틱 회귀, 의사결정나무, k-NN 인접 이웃 등
2 비지도 학습(Unsupervised Learning)¶
답을 가르쳐주지 않고 공부시키는 방법
비지도 학습
: 변수들 간의 혹은 관측치 간의 *관계*를 밝혀내는 것이 목적
군집분석(clustering)
: 관측치들을 변수들 간의 유사성으로 그룹핑차원 감소(dimensionality reduction)
: 변수들을 관측치들 간의 유사성을 이용해 적은 수로 줄여줌피처 가공(feature engineering) 혹은 피처 추출(feature extraction)
: 주어진 변수로부터 지도학습의 입력변수로 사용할 수 있는 특징값을 변환하거나 생성
비지도 학습에는 어떤 기법들이 있는가?¶
2-1 연관 규칙 : Association Rule Mining¶
- 목적 : 연관성이 높은 아이템들로 구성된 규칙 집합 생성
- 추천 시스템에 주로 사용되며 "장바구니 분석" 이라고도 불림
예) 아이폰을 구매하는 고객들은 범퍼를 함께 구매한다
- 연관성 분석, 소셜 네트워크 분석 등
2-2 군집: Clustering¶
- 목적 : 전체 데이터를 보다 일관성과 응집성이 높은 세부 그룹으로 나눔
- Market/Customer segmentation 등에 주로 사용되는 방법으로
동일 그룹 내의 개체들이 유사할수록, 다른 그룹 내의 개체들과는 상이할수록 좋은 군집화 결과 - k-Means Clustering, Hierarchical Clustering 등
In [ ]:
'Python, Jupyter 🐍 > [python]파이썬 머신러닝 완벽 가이드' 카테고리의 다른 글
정밀도와 재현율 (0) | 2023.05.06 |
---|---|
[에러]`load_boston` has been removed from scikit-learn since version 1.2. (0) | 2023.05.02 |
2장 사이킷런으로 시작하는 머신러닝 (0) | 2023.04.21 |