본문 바로가기

Python/Pandas19

[Python] apply, map, applymap의 차이 map - 딕셔너리 사용 - 단일 칼럼 변환 apply - 데이터프레임과 시리즈를 모두 다룰 수 있다. iris.apply(lambda x: x['petal length'] * x['petal width'], axis = 1) applymap - 데이터프레임 전체 데이터 셀에 적용 df.applymap(lambda x: np.log(x)) 2021. 7. 16.
[Python] 데이터프레임 행/열 바꾸기 :: transpose, T 데이터프레임의 행과 열을 바꾸기위해 df.transpose나 df.T를 사용하면 된다. # 행/열 전환 df.transpose() df.T 기존 열 이름이 인덱스가 되고, 인덱스는 열 이름이 된다. 2021. 4. 2.
[Python] 데이터프레임 열 이름/컬럼명 변경 :: rename 데이터프레임의 열 이름을 변경하는 방법으로 df.columns, df.rename이 있다. # 전체 열 이름 입력하기 df.columns = ['col', 'col', 'col'] # 선택하여 열 이름 변경하기 df.rename(columns={'Before':'After'}) df.columns는 전체 열 이름을 지정해줘야하지만 df.rename은 변경할 열 이름만 지정할 수 있다. 열 이름을 전부 변경해야하는 경우는 df.columns를 사용하는 것이 편하다. 하지만 일부만 선택해야하는 경우는 df.rename이 더 낫다. 위와 같이 예시데이터가 있을 때 df.columns만 입력하면 데이터프레임의 열 이름이 조회된다. df.columns 이때 변경할 열 이름 목록을 리스트로 대입하면 열 이름이 변경.. 2021. 4. 1.
[Python] 데이터프레임 열 이름 조회 :: columns 열 이름을 조회하는 방법은 아주 간단하다. 데이터프레임에 .columns만 붙여주면 열 이름을 조회할 수 있다. # 데이터프레임 전체 열 이름 조회 df.columns # i+1번째 열 이름 선택 df.columns[i] 2021. 3. 30.
[Python] 데이터프레임 합치기 :: pd.concat 데이터프레임을 위/아래(행 기준)로 합치거나 옆으로(열 기준)으로 합치기 위해서는 pd.concat을 사용하면 된다. # Pandas import pandas as pd # 위/아래로 합치기 - 행 기준 pd.concat([df1, df2], axis = 0) # 옆으로 합치기 - 열 기준 pd.concat([df1, df2], axis = 1) [] 합칠 데이터프레임을 입력하면 된다. 이때 입력된 순서대로 데이터프레임이 합쳐진다. axis = 0 - 행 기준 - 동일한 column명을 기준으로 데이터프레임이 위/아래로 쌓아진다. axis = 1 - 열 기준 - 데이터프레임이 옆으로 붙는다. [ Example ] 예시로 사용할 데이터를 생성하였다. 행(axis=0)으로 합쳐질 때 column이 일치하지 .. 2021. 3. 7.
[Python] pd.read_csv 오류 :: UnicodeDecodeError [ Error ] UnicodeDecodeError: 'utf-8' codec can't decode byte 0xc0 in position 0: invalid start byte [ Solution ] encoding을 'cp949' 혹은 'euc-kr'로 설정해준다. # euc-kr pd.read_csv('data.csv', encoding='euc-kr') # cp949 pd.read_csv('data.csv', encoding='cp949') 2021. 3. 7.
[Python] 고유값 & 고유값의 개수 & 값의 개수 :: unique / nunique / value_counts 데이터에 고유값이 무엇이 있는지 알고 싶다면 unique 총 고유값의 수가 몇 개인지 알고 싶다면 nunique 값별로 데이터의 개수를 알고 싶다면 value_counts import seaborn as sns # 예시데이터 planets = sns.load_dataset('planets') planets.sample(5) 예시데이터로 seaborn의 planets을 불러왔다. 1. column의 고유값 : unique() # 고유값 df['col'].unique() 데이터가 무엇으로 구성되어있는지 보고 싶다면 .unique()로 열의 고유값을 볼 수 있다. 2. column별 고유값의 개수 : nunique() # 고유값의 수 df.nunique() # 고유값의 수 - 결측값 포함 df.nunique(.. 2020. 12. 12.
[Python] read_excel 오류 :: install xlrd [ Error ] Missing optional dependency 'xlrd'. Install xlrd >= 1.0.0 for Excel support Use pip or conda to install xlrd. [ Solution ] # pip pip install xlrd # conda conda install -c anaconda xlrd 2020. 11. 19.
[Python] 엑셀 불러오기 :: pd.read_excel Pandas의 read_excel을 이용하면 엑셀 파일을 python의 dataframe으로 불러올 수 있다. # Pandas import pandas as pd pd.read_excel( io, sheet_name=0, header=0, names=None, index_col=None, usecols=None, squeeze=False, dtype=None, engine=None, converters=None, true_values=None, false_values=None, skiprows=None, nrows=None, na_values=None, keep_default_na=True, na_filter=True, verbose=False, parse_dates=Fa.. 2020. 11. 19.
[Python] 데이터프레임 중복 제거 :: drop_duplicates 데이터프레임에서 중복되는 행을 제거하고 고유한 값만 남기고 싶을 때 Pandas의 drop_duplicates를 활용하면 된다. import pandas as pd # 중복제거 df.drop_duplicates(subset=None, keep='first', inplace=False, ignore_index=False) 예시데이터 df = pd.DataFrame({'Num':[1, 2, 1, 2, 2, 3], 'Alphabet':['a', 'b', 'a', 'b', 'a', 'b']}) df 중복이 있는 예시데이터를 생성하였다. 1. 중복제거 df.drop_duplicates() 아무것도 지정하지 않고 그냥 drop_duplicates를 할 경우 모든 열(column)을 기준으로 중복을 제거한다. 예시데.. 2020. 11. 16.