[Python] 데이터프레임 합치기 :: pd.merge()
pd.merge는 공통의 열을 기준으로 두 데이터프레임을 합쳐준다. sql에서 join과 같은 역할이다. import pandas as pd # 기준열 이름이 같을 때 pd.merge(left, right, on = '기준열', how = '조인방식') # 기준열 이름이 다를 때 pd.merge(left, right, left_on = '왼쪽 열', right_on = '오른쪽 열', how = '조인방식') left : 왼쪽 데이터프레임 right : 오른쪽 데이터프레임 on : (두 데이터프레임의 기준열 이름이 같을 때) 기준열 how : 조인 방식 {'left', 'right', 'inner', 'outer'} 기본값은 'inner' left_on : 기준열 이름이 다를 때, 왼쪽 기준열 right..
2020. 10. 13.
[Pandas] pd.read_html() :: html에서 표 가져오기/데이터프레임으로 만들기
⭐️ Colab에서 실행해보기 https://colab.research.google.com/drive/1qoZmWeqZV8c_-yOG2bKLMe3aDZJ2O0ia pandas import pandas as pd pd.read_html을 이용하면 html에 있는 table속성에 해당하는 값을 가져올 수 있다. 이는 웹페이지에 있는 표를 불러오겠다는 의미이다. pandas.read_html(URL, match='.+', flavor=None, header=None, index_col=None, skiprows=None, attrs=None, parse_dates=False, tupleize_cols=None, thousands=', ', encoding=None, decimal='.', converters=..
2020. 3. 31.
[Python] pd.read_csv & pd.to_csv :: csv파일 불러오기 & 내보내기, 저장하기
외부의 csv파일을 python의 dataframe으로 불러올 수도 있고 python으로 만든 dataframe을 csv 파일로 내보낼 수 있다. import pandas as pd pandas.read_csv('path/filename.csv', sep=',', delimiter=None, header='infer', names=None, index_col=None, usecols=None, squeeze=False, dtype=None, engine=None, converters=None, true_values=None, false_values=None, skiprows=None, skipfooter=0, nrows=None, na_values=None, keep_defa..
2019. 11. 26.
[Python] 데이터프레임 만들기 :: pd.DataFrame()
Import Pandas import pandas as pd Dataframe 생성 pandas.DataFrame(data=None, index=None, columns=None, dtype=None, copy=False) 1. student_card = pd.DataFrame({'ID':[20190103, 20190222, 20190531], 'name':['Kim', 'Lee', 'Jeong'], 'class':['H', 'W', 'S']}) student_card 2. student_card = pd.DataFrame([[20190103, 'Kim', 'H'], [20190222, 'Lee', 'W'], [20190531, 'Jeong', 'S']], columns = ['ID', 'name', '..
2019. 11. 26.
[Python] Pandas 정리
import numpy as np import pandas as pd # 주피터에서 보이는 행 늘리기 pd.set_option('max_rows', 500) # 주피터에서 보이는 열 늘리기 pd.set_option('max_columns', 500) ################################################# # 데이터프레임 만들기 pd.DataFrame({'col':[data]}) pd.DataFrame([[20190103, 'Kim', 'H'], [20190222, 'Lee', 'W'], [20190531, 'Jeong', 'S']], columns = ['ID', 'name', 'class']) # 행 조회 df.head() # 상위 n개 값만 보이기 df.tail() ..
2019. 11. 11.