In [ ]: #11.3.3부터 복습 https://datascienceschool.net/01%20python/04.08%20%EC%8B%9C%EA%B3%84%EC%97%B4%20%EC%9E%90%EB%A3%8C%20%EB%8B%A4%EB%A3%A8%EA%B8%B0.html# https://rfriend.tistory.com/category/Python%20%EB%B6%84%EC%84%9D%EA%B3%BC%20%ED%94%84%EB%A1%9C%EA%B7%B8%EB%9E%98%EB%B0%8D 11장 시계열¶ 11.1 날짜, 자료형, 도구¶ In [1]: from datetime import datetime In [2]: now = datetime.now() In [3]: now Out[3]: dateti..
Python, Jupyter 🐍/[python]파이썬 데이터분석
https://www.openstreetmap.org/#map=7/35.948/127.736 오픈스트리트맵 OpenStreetMap은 여러분과 같은 사람들이 만들어, 개방형 라이선스에 따라 자유롭게 사용할 수 있는 세계 지도입니다. www.openstreetmap.org In [4]: import pandas as pd df = pd.read_excel('서울지역대학교위치.xlsx') df Out[4]: 대학교 위도 경도 0 KAIST 서울캠퍼스 37.592573 127.046737 1 KC대학교 37.548345 126.854797 2 가톨릭대학교(성신교정) 37.585922 127.004328 3 가톨릭대학교(성의교정) 37.499623 127.006065 4 감리교신학대학교 37.56..
In [ ]: # 9.2부터 복습함 9장 그래프와 시각화¶ 9.1 matplotlib API 간략히 살펴보기¶ In [9]: import matplotlib.pyplot as plt In [188]: import numpy as np In [189]: data = np.arange(10) In [190]: data Out[190]: array([0, 1, 2, 3, 4, 5, 6, 7, 8, 9]) In [191]: plt.plot(data) Out[191]: [] 9.1.1 figure와 서브플롯¶ plt.figure¶ matplotlib에서 그래프는 Figure 객체 내에 존재 그래프를 위한 새로운 figure(피겨)는 plt.figure을 사용해 생성 In [192]: fig = plt.figure..
10장 데이터 집계와 그룹 연산¶ 10.1 GroupBy 메카닉¶ In [8]: import pandas as pd import numpy as np df = pd.DataFrame({'key1': ['a', 'a', 'b', 'b', 'a'], 'key2':['one', 'two', 'one', 'two', 'one'], 'data1': np.random.randn(5), 'data2': np.random.randn(5)}) In [9]: df Out[9]: key1 key2 data1 data2 0 a ..
In [52]: ### 7.3.2부터 복습 7장 데이터 정제 및 준비¶ 7.1 누락된 데이터 처리하기¶ isnull¶ 산술 데이터에 한해 pandas는 누락된 데이터를 실숫값인 NaN으로 취급 In [4]: string_data = pd.Series(['aardvark', 'artichoke', np.nan, 'avocado']) In [5]: string_data Out[5]: 0 aardvark 1 artichoke 2 NaN 3 avocado dtype: object In [6]: string_data.isnull() Out[6]: 0 False 1 False 2 True 3 False dtype: bool 파이썬의 내장 None값 또한 NA 값으로 취급 ..
cmd에서 jupyter lab을 실행시켰는데 다음과 같은 오류가 떴다 'jupyter'은(는) 내부 또는 외부 명령, 실행할 수 있는 프로그램, 또는배치 파일이 아닙니다. 해결 방법 1. 윈도우 검색을 통해 Anaconda Prompt를 실행한다. 2. 다음의 코드를 통해 anaconda가 설치된 경로로 이동한다. cd '아나콘다 설치 경로' 3. jupter lab을 실행한다. jupyter lab 추가) cmd에서 jupyter lab이나 jupyter notebook 실행하기 jupyter notebook 실행 python -m notebook jupyter laptop 실행 python -m jupyter lab
문제 pd.concat([s1, s4], axis=1,join_axes=[['a','c','b','e']]) 위의 코드를 실행하였는데 다음과 같은 오류가 떴다. TypeError: concat() got an unexpected keyword argument 'join_axes' 원인 join_axes는 concat()에서 더 이상 사용하지 않는다. 해결 코드를 다음과 같이 수정 # 수정 전 pd.concat([s1, s4], axis=1,join_axes=[['a','c','b','e']]) # 수정 후 pd.concat([s1, s4], axis=1).reindex(['a','c','b','e'])
Numpy란¶ "Numerical Python" or "Numeric Python" Numpy의 특징과 장점¶ Python은 느리다. 왜? 그래서... 강력한 N차원 배열 객체. List보다 빠르다.(메모리구조) 정교한 브로드케스팅(Broadcast) 기능. 반복문 쓰지 않음 유용한 선형 대수학, 푸리에 변환 및 난수 기능 C/C++ 및 포트란 코드 통합 도구 Numpy가 빠른 이유¶ python 코드가 아니라, Numpy는 C코드로 작성 메모리 저장구조가 다름 반복문 사용하지 않고 배열 통해 바로 계산 벡터라이즈와 브로드캐스팅 사용 Numpy를 사용하려면?¶ In [1]: import numpy as np 모듈(라이브러리)을 호출해 속성과 메서드 사용 numpy.sum()을 간단히 별칭(alias)를 ..