'Python, Jupyter 🐍' 카테고리의 글 목록

2023.05.06· Python, Jupyter 🐍/[Jupyter] 주피터

1. code에 삽입 먼저 IPython 패키지를 설치한다 !pip install IPython Image함수로 이미지 경로를 설정하고 이미지를 출력한다 from IPython.display import Image Image('images/image.png') 2. MarkDown에 삽입 ![nn](images/image.png) 경로 설정 후 이미지 출력

정밀도와 재현율

2023.05.06· Python, Jupyter 🐍/[python]파이썬 머신러닝 완벽 가이드

정밀도와 재현율의 공식 정밀도 = TP / (FP + TP) 재현율 = TP / (FN + TP) 정밀도( = 양성 예측도) : 예측을 Positive로 한 대상 중에 예측과 실제 값이 Positive로 일치한 데이터의 비율 재현율( = 민감도, TPR) : 실제 값이 Positive인 대상 중에 예측과 실제 값이 Positive로 일치한 데이터의 비율 재현율이 중요 지표인 경우 - 실제 Positive 양성 데이터를 Negative로 잘못 판단하면 업무상 큰 영향이 발생하는 경우 ex) 암 판단 모델, 보험 사기 정밀도가 중요 지표인 경우 - 실제 Negative 음성 데이터를 Positive로 잘못 판단하면 업무상 큰 영향이 발생하는 경우 ex) 스팸메일 여부 판단 모델 재현율과 정밀도 모두 TP를 ..

[에러]`load_boston` has been removed from scikit-learn since version 1.2.

2023.05.02· Python, Jupyter 🐍/[python]파이썬 머신러닝 완벽 가이드

load_boston()을 실행하였는데 다음과 같은 에러가 떴다 `load_boston` has been removed from scikit-learn since version 1.2. 이는 보스턴 데이터셋의 윤리적인 문제로 1.2버전에서 load_boston()이 삭제되었기 때문이다. 해결법 import pandas as pd import numpy as np data_url = "http://lib.stat.cmu.edu/datasets/boston" raw_df = pd.read_csv(data_url, sep="\s+", skiprows=22, header=None) data = np.hstack([raw_df.values[::2, :], raw_df.values[1::2, :2]]) target..

머신러닝 개요

2023.04.28· Python, Jupyter 🐍/[python]파이썬 머신러닝 완벽 가이드

머신러닝의 종류¶ 머신러닝 : 인공지능을 공부시키는 방법 1 지도 학습(Supervised Learning)¶문제와 정답을 모두 알려주고 공부시키는 방법 지도 학습 : 반응변수를 예측해내는 것이 목적 1-1 회귀(Regression)¶ 회귀 예측분석(regression) : *수량형* 반응변수 예측 얼마나 많은가?와 같은 *양적*인 문제 해결에 도움되는 알고리즘으로 *분류* 문제에 비해 모형의 복잡도가 높음 예) 구매 금액, 매출액, 이용 고객 수 예측 등 선형 회귀, 회귀나무, 시계열 분석 사례 1-2 분류(Classification)¶분류분석(classification) : *범주형* 반응변수 예측 새로운 데이터와 형성된 모형으로부터 보지못한 데이터 분류 이진 분류(binary classificati..

2장 사이킷런으로 시작하는 머신러닝

2023.04.21· Python, Jupyter 🐍/[python]파이썬 머신러닝 완벽 가이드

02 첫 번째 머신러닝 만들어 보기 - 붓꽃 품종 예측하기¶ sklearn.datasets : 사이킷런에서 자체적으로 제공하는 데이터 세트 생성 sklearn.tree : 트리 기반 ML 알고리즘 구현. ML 알고리즘은 의사 결정 트리(Decision Tree) 알고리즘으로, 이를 구현한 DecisionTreeClassifier 적용 sklearn.model_selection : 학습 데이터와 검증 데이터, 예측 데이터로 데이터를 분리하거나 최적의 하이퍼 파라미터로 평가 load_iris() : 붓꽃 데이터 세트 생성 train_test_split() : 데이터 세트를 학습 데이터와 테스트 데이터로 분리 피처는 속성(컬럼, 열), 레이블은 품종 In [7]: from sklearn.datasets imp..

11장

2023.04.19· Python, Jupyter 🐍/[python]파이썬 데이터분석

In [ ]: #11.3.3부터 복습 https://datascienceschool.net/01%20python/04.08%20%EC%8B%9C%EA%B3%84%EC%97%B4%20%EC%9E%90%EB%A3%8C%20%EB%8B%A4%EB%A3%A8%EA%B8%B0.html# https://rfriend.tistory.com/category/Python%20%EB%B6%84%EC%84%9D%EA%B3%BC%20%ED%94%84%EB%A1%9C%EA%B7%B8%EB%9E%98%EB%B0%8D 11장 시계열¶ 11.1 날짜, 자료형, 도구¶ In [1]: from datetime import datetime In [2]: now = datetime.now() In [3]: now Out[3]: dateti..

내 블로그 - 관리자 홈 전환	`Q` `Q`
새 글 쓰기	`W` `W`

글 수정 (권한 있는 경우)	`E` `E`
댓글 영역으로 이동	`C` `C`

이 페이지의 URL 복사	`S` `S`
맨 위로 이동	`T` `T`
티스토리 홈 이동	`H` `H`
단축키 안내	`Shift` + `/` `⇧` + `/`

Python, Jupyter 🐍

티스토리툴바

단축키

내 블로그

블로그 게시글

모든 영역