본문 바로가기

전체 글100

[Python] 데이터프레임 행/열 바꾸기 :: transpose, T 데이터프레임의 행과 열을 바꾸기위해 df.transpose나 df.T를 사용하면 된다. # 행/열 전환 df.transpose() df.T 기존 열 이름이 인덱스가 되고, 인덱스는 열 이름이 된다. 2021. 4. 2.
[Python] 데이터프레임 열 이름/컬럼명 변경 :: rename 데이터프레임의 열 이름을 변경하는 방법으로 df.columns, df.rename이 있다. # 전체 열 이름 입력하기 df.columns = ['col', 'col', 'col'] # 선택하여 열 이름 변경하기 df.rename(columns={'Before':'After'}) df.columns는 전체 열 이름을 지정해줘야하지만 df.rename은 변경할 열 이름만 지정할 수 있다. 열 이름을 전부 변경해야하는 경우는 df.columns를 사용하는 것이 편하다. 하지만 일부만 선택해야하는 경우는 df.rename이 더 낫다. 위와 같이 예시데이터가 있을 때 df.columns만 입력하면 데이터프레임의 열 이름이 조회된다. df.columns 이때 변경할 열 이름 목록을 리스트로 대입하면 열 이름이 변경.. 2021. 4. 1.
[Python] 데이터프레임 열 이름 조회 :: columns 열 이름을 조회하는 방법은 아주 간단하다. 데이터프레임에 .columns만 붙여주면 열 이름을 조회할 수 있다. # 데이터프레임 전체 열 이름 조회 df.columns # i+1번째 열 이름 선택 df.columns[i] 2021. 3. 30.
[ADP 실기] 20회-21회 데이터분석전문가 실기시험 문제 :: Python 20회 1. 날씨데이터 : temps.csv (50점) year 2016 month 1~12 day 1~31 hour 0~23 week 1~52 (이건 자세하게 모르겠어요..) temp_1 1일 전의 온도 temp_2 2일 전의 온도 actual 최대 온도 (실제값) average 전년도 평균 friend 친구의 예측값 (100% 정확하지는 않지만 참고하라고 올려놓았습니다..) - RandomForest와 SVM 두 모델 중 하나를 최종 분석 모델로 선택 - 분석 결과 / 근거 / 주장의 타당성 제시 1-1. (10점) - EDA - 결측치가 있다면 처리하기 - 결측치 처리 이외에 모델링을 하기 위한 전처리하기 - 최종 분석용 데이터셋의 품질에 문제 없음을 주장 - 학습-시험 데이터 구분 1-2. Ran.. 2021. 3. 7.
[Python] 데이터프레임 합치기 :: pd.concat 데이터프레임을 위/아래(행 기준)로 합치거나 옆으로(열 기준)으로 합치기 위해서는 pd.concat을 사용하면 된다. # Pandas import pandas as pd # 위/아래로 합치기 - 행 기준 pd.concat([df1, df2], axis = 0) # 옆으로 합치기 - 열 기준 pd.concat([df1, df2], axis = 1) [] 합칠 데이터프레임을 입력하면 된다. 이때 입력된 순서대로 데이터프레임이 합쳐진다. axis = 0 - 행 기준 - 동일한 column명을 기준으로 데이터프레임이 위/아래로 쌓아진다. axis = 1 - 열 기준 - 데이터프레임이 옆으로 붙는다. [ Example ] 예시로 사용할 데이터를 생성하였다. 행(axis=0)으로 합쳐질 때 column이 일치하지 .. 2021. 3. 7.
[Python] pd.read_csv 오류 :: UnicodeDecodeError [ Error ] UnicodeDecodeError: 'utf-8' codec can't decode byte 0xc0 in position 0: invalid start byte [ Solution ] encoding을 'cp949' 혹은 'euc-kr'로 설정해준다. # euc-kr pd.read_csv('data.csv', encoding='euc-kr') # cp949 pd.read_csv('data.csv', encoding='cp949') 2021. 3. 7.
GitHub 블로그 Minimal-mistakes 설정하기 :: MAC 깃블로그(Git Pages) 만들려다가 우여곡절을 겪어서.. 기록해둔다. 1. GitHub 블로그 만들기 Create repository > gitID.github.io 로 Repository name을 지정하여 생성한다. 2. minimal-mistakes Fork github.com/mmistakes/minimal-mistakes 다운로드해도 상관없고 포크해도 상관없다. 포크했을 경우 Repository name을 자신의 GitHub Pages url로 변경해주어야한다. 3. Ruby 설치하기 1 ) Hombrew 설치하기 /bin/bash -c "$(curl -fsSL https://raw.githubusercontent.com/Homebrew/install/HEAD/install.sh)" 👆🏻 터.. 2021. 3. 2.
[MySQL] 사용자함수 :: CREATE FUNCTION - 사용자가 생성하는 함수 - 반복되는 쿼리/자주 사용되는 쿼리를 계속 작성하기 번거로우니 함수로 지정하여 호출 CREATE FUNCTION 함수명(parameter, 데이터타입) RETURNS 데이터타입 DETERMINISTIC BEGIN DECLARE 변수 데이터타입; -- 변수선언 / 세미콜론 필수 SET 변수선언내용; -- 변수선언 / 세미콜론 필수 RETURN (Query) / 변수; -- 필수 / 무엇을 내보낼 것인지(output) END ---------------------------------------------------------------- SELECT 'function name'(parameter) CREATE FUNCTION : 함수 지정 - 함수명 : 함수 이름을 무엇으로 지.. 2021. 2. 25.
[MySQL] 윈도우함수(Window Function) 윈도우함수는 Group By와 비슷하게 데이터를 그룹화하여 집계해준다. 하지만 Group By는 집계된 결과만 보여주는 반면, 윈도우함수는 기존 데이터에 집계된 값을 추가하여 나타낸다. 위와 같은 데이터가 있을 때 [ Group By를 사용했을 경우 ] 집계된 값만 나타난다. [ 윈도우함수를 사용했을 경우 ] 기존 데이터에 집계된 값이 추가되어 나타난다. 기본형태 함수(함수_적용_열) OVER (PARTITION BY 그룹열 ORDER BY 순서열) PARTITION BY : Group By와 같은 기능 ORDER BY : Order By와 같은 기능(DESC : 내림차순) ex) 국가별 profit의 합 - 윈도우함수 : SELECT SUM(profit) OVER (PARTITION BY country.. 2021. 2. 25.
[Python] 리스트(list) 중복 제거 / 고유값 1. list(set())을 이용한 중복제거 파이썬 리스트의 중복을 제거하는 방법 중 가장 간편한 방법은 set을 이용하는 것이다. set은 리스트의 고유값을 집합으로 반환한다. # 리스트의 고유값 - 집합 set(리스트) # 리스트의 고유값 - 리스트 list(set(리스트)) 이를 리스트로 변환하려면 list() 함수를 사용하면 된다. 하지만 set을 이용할 경우 고유값이 정렬되어 반환된다. 고유값의 순서가 중요할 경우 set이 아닌 다른 방법을 사용해야 한다. 2. for문 고유값의 순서가 유지되어야 한다면 아래 식을 이용하면 된다. 고유값이 저장될 리스트(temp)에 값이 없다면 값을 추가하는 방식이다. # 리스트 중복제거 - 순서유지 temp = [] for t in 리스트: if t not i.. 2021. 2. 11.