[Python] 엑셀 불러오기 :: pd.read_excel
Pandas의 read_excel을 이용하면 엑셀 파일을 python의 dataframe으로 불러올 수 있다.
# Pandas
import pandas as pd
< Excel 파일 불러오기 >
pd.read_excel( io, sheet_name=0, header=0, names=None, index_col=None, usecols=None, squeeze=False, dtype=None, engine=None, converters=None, true_values=None, false_values=None, skiprows=None, nrows=None, na_values=None, keep_default_na=True, na_filter=True, verbose=False, parse_dates=False, date_parser=None, thousands=None, comment=None, skipfooter=0, convert_float=True, mangle_dupe_cols=True)
1. pd.read_excel('경로/불러올파일명.csv')
- 같은 폴더에서 불러올 경우 경로 생략 가능
- 가능한 파일 형식 : xls, xlsx, xlsm, xlsb, odf, ods and odt
pd.read_excel('경로/파일명.xlsx')
2. sheet_name : 불러올 시트(Sheet) 지정
- 시트 이름 또는 번호(시작이 0)
# 이름으로 불러오기
pd.read_excel('경로/파일명.xlsx', sheet_name = '시트명')
# 번호로 불러오기 (시작이 0)
pd.read_excel('경로/파일명.xlsx', sheet_name = 0)
3. header : 헤더(열) 지정
- 열 이름(헤더)으로 사용할 행 지정 / 첫 행이 헤더가 아닌 경우 header = None
pd.read_excel('파일명.xlsx', header = 1)
4. names : 열 이름 변경
- 불러오는 열의 개수와 일치해야한다.
pd.read_excel('파일명.xlsx', names = ['col1', 'col2'])
5. usecols : 불러올 열 지정
# 이름으로 지정
pd.read_excel('파일명.xlsx', usecols = ['사용할열_1', '사용할열_2'])
# 번호로 지정
pd.read_excel('파일명.xlsx', usecols = [0, 1])
6. na_values : 결측값 인식하기
- 결측값(NA / NaN)으로 인식 할 문자열 지정
- '', '# N / A', '# N / AN / A', '#NA', '-1. # IND', '-1. # QNAN', '-NaN', '-nan', '1. # IND', '1. # QNAN', '<NA>', 'N / A', 'NA', 'NULL', 'NaN', 'n / a ','nan ','null '는 기본적으로 결측값으로 인식된다.
pd.read_excel('파일명.xlsx', na_values = '결측값의_형태')
> 예시데이터에서 '-'로 입력된 값을 결측값으로 인식시켰더니 '-'가 NaN으로 나타남
7. 불러올 행 제한
nrows : 불러올 행 개수 제한 / 처음 ~ n번째 행만 불러오기
skiprows : 처음 ~ n번째 행 제외 / n+1번째 ~ 마지막까지
skipfooter : 뒤에서 n개 제외
pd.read_excel('파일명.xlsx', skiprows = n) # 앞에서 n개 행 생략
pd.read_excel('파일명.xlsx', nrows = n) # 처음 ~ n번째
pd.read_excel('example.xlsx', skipfooter = n) # 뒤에서 n개 행 생략
+) 사용한 예제파일
'Python > Pandas' 카테고리의 다른 글
[Python] 고유값 & 고유값의 개수 & 값의 개수 :: unique / nunique / value_counts (1) | 2020.12.12 |
---|---|
[Python] read_excel 오류 :: install xlrd (0) | 2020.11.19 |
[Python] 데이터프레임 중복 제거 :: drop_duplicates (1) | 2020.11.16 |
[Python] 데이터프레임 합치기 :: pd.merge() (0) | 2020.10.13 |
[Python] 데이터프레임 txt로 저장하기 (0) | 2020.09.04 |
Comments