[Python] Seaborn 내장데이터 모음 :: iris , titanic 포함
Python의 Seaborn 패키지에는 다양한 내장데이터가 있다. 연습용으로 활용하면 좋을 것 같아서 정리를 해보았다. # Seaborn 패키지 불러오기 import seaborn as sns Seaborn에서 사용할 수 있는 dataset의 목록은 get_dataset_names로 한 번에 알 수 있다. # Seaborn 데이터셋 목록 sns.get_dataset_names() ['anagrams', 'anscombe', 'attention', 'brain_networks', 'car_crashes', 'diamonds', 'dots', 'exercise', 'flights', 'fmri', 'gammas', 'geyser', 'iris', 'mpg', 'penguins', 'planets', 'tip..
2020. 12. 3.
[SQLD] 1과목 간단 요약 :: 데이터 모델링의 이해
과목1 데이터 모델링의 이해 1장. 데이터 모델링의 이해 1절. 데이터 모델의 이해 1. 데이터 모델링 - 일정한 표기법에 의해 표현 - 데이터베이스를 생성하여 개발 및 데이터관리 - 업무 흐름 설명, 분석 - 유의점 : 중복, 비유연성, 비일관성 - 요소 : 어떤 것(Things), 속성(Attributes), 관계(Relationships) - 특징 : 추상화, 단순화, 정확화 - 개념적 모델링 : 추상화 수준이 높고 업무중심적, 포괄적 / 전사적 데이터 모델링, EA수립 - 논리적 모델링 : key, 속성, 관계 등을 정확하게 표현 / 재사용성이 높음 - 물리적 모델링 : 성능, 저장 2. 좋은 데이터 모델 - 완전성 : 업무에 필요한 모든 데이터가 모델에 정의 - 중복배제 : 동일한 사실은 한 번..
2020. 11. 29.
[Python] 엑셀 불러오기 :: pd.read_excel
Pandas의 read_excel을 이용하면 엑셀 파일을 python의 dataframe으로 불러올 수 있다. # Pandas import pandas as pd pd.read_excel( io, sheet_name=0, header=0, names=None, index_col=None, usecols=None, squeeze=False, dtype=None, engine=None, converters=None, true_values=None, false_values=None, skiprows=None, nrows=None, na_values=None, keep_default_na=True, na_filter=True, verbose=False, parse_dates=Fa..
2020. 11. 19.
[Python] 데이터프레임 중복 제거 :: drop_duplicates
데이터프레임에서 중복되는 행을 제거하고 고유한 값만 남기고 싶을 때 Pandas의 drop_duplicates를 활용하면 된다. import pandas as pd # 중복제거 df.drop_duplicates(subset=None, keep='first', inplace=False, ignore_index=False) 예시데이터 df = pd.DataFrame({'Num':[1, 2, 1, 2, 2, 3], 'Alphabet':['a', 'b', 'a', 'b', 'a', 'b']}) df 중복이 있는 예시데이터를 생성하였다. 1. 중복제거 df.drop_duplicates() 아무것도 지정하지 않고 그냥 drop_duplicates를 할 경우 모든 열(column)을 기준으로 중복을 제거한다. 예시데..
2020. 11. 16.