본문 바로가기

분류 전체보기98

[Python] 데이터프레임 열 이름 조회 :: columns 열 이름을 조회하는 방법은 아주 간단하다. 데이터프레임에 .columns만 붙여주면 열 이름을 조회할 수 있다. # 데이터프레임 전체 열 이름 조회 df.columns # i+1번째 열 이름 선택 df.columns[i] 2021. 3. 30.
[ADP 실기] 20회-21회 데이터분석전문가 실기시험 문제 :: Python 20회 1. 날씨데이터 : temps.csv (50점) year 2016 month 1~12 day 1~31 hour 0~23 week 1~52 (이건 자세하게 모르겠어요..) temp_1 1일 전의 온도 temp_2 2일 전의 온도 actual 최대 온도 (실제값) average 전년도 평균 friend 친구의 예측값 (100% 정확하지는 않지만 참고하라고 올려놓았습니다..) - RandomForest와 SVM 두 모델 중 하나를 최종 분석 모델로 선택 - 분석 결과 / 근거 / 주장의 타당성 제시 1-1. (10점) - EDA - 결측치가 있다면 처리하기 - 결측치 처리 이외에 모델링을 하기 위한 전처리하기 - 최종 분석용 데이터셋의 품질에 문제 없음을 주장 - 학습-시험 데이터 구분 1-2. Ran.. 2021. 3. 7.
[Python] 데이터프레임 합치기 :: pd.concat 데이터프레임을 위/아래(행 기준)로 합치거나 옆으로(열 기준)으로 합치기 위해서는 pd.concat을 사용하면 된다. # Pandas import pandas as pd # 위/아래로 합치기 - 행 기준 pd.concat([df1, df2], axis = 0) # 옆으로 합치기 - 열 기준 pd.concat([df1, df2], axis = 1) [] 합칠 데이터프레임을 입력하면 된다. 이때 입력된 순서대로 데이터프레임이 합쳐진다. axis = 0 - 행 기준 - 동일한 column명을 기준으로 데이터프레임이 위/아래로 쌓아진다. axis = 1 - 열 기준 - 데이터프레임이 옆으로 붙는다. [ Example ] 예시로 사용할 데이터를 생성하였다. 행(axis=0)으로 합쳐질 때 column이 일치하지 .. 2021. 3. 7.
[Python] pd.read_csv 오류 :: UnicodeDecodeError [ Error ] UnicodeDecodeError: 'utf-8' codec can't decode byte 0xc0 in position 0: invalid start byte [ Solution ] encoding을 'cp949' 혹은 'euc-kr'로 설정해준다. # euc-kr pd.read_csv('data.csv', encoding='euc-kr') # cp949 pd.read_csv('data.csv', encoding='cp949') 2021. 3. 7.
GitHub 블로그 Minimal-mistakes 설정하기 :: MAC 깃블로그(Git Pages) 만들려다가 우여곡절을 겪어서.. 기록해둔다. 1. GitHub 블로그 만들기 Create repository > gitID.github.io 로 Repository name을 지정하여 생성한다. 2. minimal-mistakes Fork github.com/mmistakes/minimal-mistakes 다운로드해도 상관없고 포크해도 상관없다. 포크했을 경우 Repository name을 자신의 GitHub Pages url로 변경해주어야한다. 3. Ruby 설치하기 1 ) Hombrew 설치하기 /bin/bash -c "$(curl -fsSL https://raw.githubusercontent.com/Homebrew/install/HEAD/install.sh)" 👆🏻 터.. 2021. 3. 2.
[MySQL] 사용자함수 :: CREATE FUNCTION - 사용자가 생성하는 함수 - 반복되는 쿼리/자주 사용되는 쿼리를 계속 작성하기 번거로우니 함수로 지정하여 호출 CREATE FUNCTION 함수명(parameter, 데이터타입) RETURNS 데이터타입 DETERMINISTIC BEGIN DECLARE 변수 데이터타입; -- 변수선언 / 세미콜론 필수 SET 변수선언내용; -- 변수선언 / 세미콜론 필수 RETURN (Query) / 변수; -- 필수 / 무엇을 내보낼 것인지(output) END ---------------------------------------------------------------- SELECT 'function name'(parameter) CREATE FUNCTION : 함수 지정 - 함수명 : 함수 이름을 무엇으로 지.. 2021. 2. 25.
[MySQL] 윈도우함수(Window Function) 윈도우함수는 Group By와 비슷하게 데이터를 그룹화하여 집계해준다. 하지만 Group By는 집계된 결과만 보여주는 반면, 윈도우함수는 기존 데이터에 집계된 값을 추가하여 나타낸다. 위와 같은 데이터가 있을 때 [ Group By를 사용했을 경우 ] 집계된 값만 나타난다. [ 윈도우함수를 사용했을 경우 ] 기존 데이터에 집계된 값이 추가되어 나타난다. 기본형태 함수(함수_적용_열) OVER (PARTITION BY 그룹열 ORDER BY 순서열) PARTITION BY : Group By와 같은 기능 ORDER BY : Order By와 같은 기능(DESC : 내림차순) ex) 국가별 profit의 합 - 윈도우함수 : SELECT SUM(profit) OVER (PARTITION BY country.. 2021. 2. 25.
[Python] 리스트(list) 중복 제거 / 고유값 1. list(set())을 이용한 중복제거 파이썬 리스트의 중복을 제거하는 방법 중 가장 간편한 방법은 set을 이용하는 것이다. set은 리스트의 고유값을 집합으로 반환한다. # 리스트의 고유값 - 집합 set(리스트) # 리스트의 고유값 - 리스트 list(set(리스트)) 이를 리스트로 변환하려면 list() 함수를 사용하면 된다. 하지만 set을 이용할 경우 고유값이 정렬되어 반환된다. 고유값의 순서가 중요할 경우 set이 아닌 다른 방법을 사용해야 한다. 2. for문 고유값의 순서가 유지되어야 한다면 아래 식을 이용하면 된다. 고유값이 저장될 리스트(temp)에 값이 없다면 값을 추가하는 방식이다. # 리스트 중복제거 - 순서유지 temp = [] for t in 리스트: if t not i.. 2021. 2. 11.
[Python] 리스트 정렬하기 :: sort / sorted 파이썬에서 리스트를 정렬하는 방법으로 sort와 sorted가 있다. sort를 실행하면 정렬된 값으로 리스트가 변경된다. 하지만 sorted는 정렬된 값을 보여주고 휘발된다. list.sort() - 정렬된 값으로 리스트가 수정된다.(in-place) - 역순으로 정렬 = list.sort(reverse = True) - 메소드이므로 . 앞에 리스트가 온다. sorted(list) - 정렬을 따로 저장해줘야한다. - 역순으로 정렬 = sorted(list, reverse = True) - 함수이므로 괄호 안에 리스트가 온다. 2021. 2. 10.
[Python] 영문 > 한글 키보드 입력 변환하기 :: 자모결합 / 자소결합 영어로 이루어진 키워드를 한글로 변환해야하는 일이 있었다. 예를들어 '사과'를 입력하고 싶었으나 'tkrhk'로 입력된 경우를 찾기 위해서다. 내가 생각한 방법은 'tkrhk'의 알파벳을 영-한 입력 딕셔너리에서 찾아서 대치하는 방법이다. 자세한건 아래에서 코드와 함께 봅시다! 1. 영문-한글 키보드 딕셔너리 생성 # 자음-초성/종성 cons = {'r':'ㄱ', 'R':'ㄲ', 's':'ㄴ', 'e':'ㄷ', 'E':'ㄸ', 'f':'ㄹ', 'a':'ㅁ', 'q':'ㅂ', 'Q':'ㅃ', 't':'ㅅ', 'T':'ㅆ', 'd':'ㅇ', 'w':'ㅈ', 'W':'ㅉ', 'c':'ㅊ', 'z':'ㅋ', 'x':'ㅌ', 'v':'ㅍ', 'g':'ㅎ'} # 모음-중성 vowels = {'k':'ㅏ', 'o':.. 2021. 1. 29.