본문 바로가기

Python52

[Python] 위경도 거리 구하기 :: haversine haversine 두 위경도(Latitude, Longitude)데이터의 거리를 구해야할 때 편리한 패키지이다. 패키지 설치하기 $ pip install haversine 패키지 불러오기 from haversine import haversine 거리 구하기 # 위경도 입력 Seoul = (37.541, 126.986) #Latitude, Longitude Toronto = (43.65, -79.38) # 거리 계산 haversine(Seoul, Toronto, unit = 'km') unit = ' '으로 출력값의 단위를 정할 수 있다. 단위 unit = 단위 unit = FEET ft INCHES in KILOMETERS km METERS m MILES mi NAUTICAL_MILES nmi 예시 Re.. 2020. 1. 28.
[Python] pd.read_csv & pd.to_csv :: csv파일 불러오기 & 내보내기, 저장하기 외부의 csv파일을 python의 dataframe으로 불러올 수도 있고 python으로 만든 dataframe을 csv 파일로 내보낼 수 있다. import pandas as pd pandas.read_csv('path/filename.csv', sep=',', delimiter=None, header='infer', names=None, index_col=None, usecols=None, squeeze=False, dtype=None, engine=None, converters=None, true_values=None, false_values=None, skiprows=None, skipfooter=0, nrows=None, na_values=None, keep_defa.. 2019. 11. 26.
[Python] 데이터프레임 만들기 :: pd.DataFrame() Import Pandas import pandas as pd Dataframe 생성 pandas.DataFrame(data=None, index=None, columns=None, dtype=None, copy=False) 1. student_card = pd.DataFrame({'ID':[20190103, 20190222, 20190531], 'name':['Kim', 'Lee', 'Jeong'], 'class':['H', 'W', 'S']}) student_card 2. student_card = pd.DataFrame([[20190103, 'Kim', 'H'], [20190222, 'Lee', 'W'], [20190531, 'Jeong', 'S']], columns = ['ID', 'name', '.. 2019. 11. 26.
아나콘다(Anaconda) 설치하기 :: Jupyter Notebook(쥬피터노트북) 아나콘다는 다양한 패키지를 제공하는 Python/R 데이터 과학 플랫폼이다. 쥬피터노트북을 사용하려면 ANACONDA를 설치해야한다. Anaconda | The World's Most Popular Data Science Platform Anaconda is the standard platform for Python data science, leading in open source innovation for machine learning. Develop, manage, collaborate, and govern at scale with our enterprise platform. www.anaconda.com 아나콘다 홈페이지에서 자신의 운영체제에 맞는 파일을 설치한다. Mac 자신이 사용하는 Pytho.. 2019. 11. 26.
[Python] pd.get_dummies() :: One-Hot Encoding / 원핫인코딩 머신러닝에서 문자로 된 데이터는 모델링이 되지 않는 경우가 있다. 대표적으로 회귀분석은 숫자로 이루어진 데이터만 입력을 해야한다. 문자를 숫자로 바꾸어 주는 방법 중 하나로 One-Hot Encoding이 있다. 가변수(dummy variable)로 만들어주는 것인데, 이는 0과 1로만 이루어진 열을 생성하는 것이다. 이때 1은 있다, 0은 없다를 나타낸다. 0과 1로 이루어진 여러개의 열을 생성하는 One-Hot Encoding과 달리, LabelEncoding은 하나의 열에 사과 > 0, 바나나 > 1, 체리 > 2, 3,.. 식으로 숫자로 변환하는 것이다. 자세한건 여기서 볼 수 있다. https://mizykk.tistory.com/12 [Scikit-learn] LabelEncoder() :: .. 2019. 11. 21.
[Scikit-learn] LabelEncoder() :: Labelling 머신러닝에서 모델링을 할 때 문자로 이루어진 데이터를 숫자로 바꿔줘야할 경우가 있다. 이때 Scikit-learn의 LabelEncder를 사용하여 범주형 데이터를 손쉽게 숫자형 데이터로 labelling 할 수 있다. fruit = pd.DataFrame({'name':['apple', 'banana', 'cherry', 'durian'], 'color':['red', 'yellow', 'red', 'green']}) fruit fruit이라는 예시데이터를 생성하였다. from sklearn.preprocessing import LabelEncoder le = LabelEncoder() le.fit(fruit['name']) fruit['name'] = le.transform(fruit['name']).. 2019. 11. 20.
[Scikit-learn] ImportError: cannot import name 'CategoricalEncoder' 아무리 또박또박 써도, 재차 확인해도 해결되지 않는 cannot import name 'CategoricalEncoder' 있는 그대로 복사해와도 실행되지 않는다. https://github.com/scikit-learn/scikit-learn/issues/14402 ImportError: cannot import name 'CategoricalEncoder' from 'sklearn.preprocessing' · Issue #14402 · scikit-learn/scikit-learn Hello, This class was to be available as from 0.20. I'm on 0.21.2. github.com 이유는 간단했다. 제작자가 만들어놓고 배포/업데이트(release)하지 않아서 실.. 2019. 11. 20.
[scikit-learn] LabelEncoder / 범주형 데이터 변환 scikit-learn을 이용해 범주형 데이터를 쉽게 수치형 데이터로 바꿀 수 있다. 0과 1로 이루어진 다수의 열을 만드는 one-hot encoder와 달리 label encoder는 하나의 열에 서로 다른 숫자를 입력해준다. One-Hot Encoder 과일 딸기 1 0 0 사과 0 1 0 바나나 0 0 0 Label Encoder 과일 딸기 1 사과 2 바나나 3 from sklearn.preprocessing import LabelEncoder le = LabelEncoder() le = le.fit(train['col']) #train['col']을 fit train['col'] = le.transform(train['col']) #train['col']에 따라 encoding test['co.. 2019. 11. 13.
[python] googletrans로 언어 번역하기 :: Google Translate 0. 패키지 설치하기 pip install googletrans 1. 번역하기 from googletrans import Translator trans = Translator() result = trans.translate(word, dest='en') result.text .text : 번역된 문자 출력 .src(source) : 번역할 언어(from) .dest(destination) : 번역된 언어(to) 2. 사용할 수 있는 언어 import googletrans googletrans.LANGUAGES {'af': 'afrikaans', 'am': 'amharic', 'ar': 'arabic', 'az': 'azerbaijani', 'be': 'belarusian', 'bg': 'bulgarian.. 2019. 11. 12.
[python] datetime 패키지 Python에서 날짜, 시간을 다룰 때 사용하는 패키지이다. from datetime import datetime datetime.now() 현재시각 now_time = datetime.now() now_time 출력 : datetime.datetime(year, month, day, hour, minute, second, microsecond) datetime.datetime(2019, 11, 11, 3, 31, 42, 393075) datetime.datetime 형식은 .year/.month/...등을 이용해 원하는 값을 불러올 수 있다. 문자열, 숫자가 아닌 datetime.datetime이라는 날짜 형식을 지정할 수 있게 해주기에 날짜 데이터를 다루기 좀 더 수월해진다. .weekday() 요일.. 2019. 11. 11.