본문 바로가기

전체 글100

[Python] Seaborn 내장데이터 모음 :: iris , titanic 포함 Python의 Seaborn 패키지에는 다양한 내장데이터가 있다. 연습용으로 활용하면 좋을 것 같아서 정리를 해보았다. # Seaborn 패키지 불러오기 import seaborn as sns Seaborn에서 사용할 수 있는 dataset의 목록은 get_dataset_names로 한 번에 알 수 있다. # Seaborn 데이터셋 목록 sns.get_dataset_names() ['anagrams', 'anscombe', 'attention', 'brain_networks', 'car_crashes', 'diamonds', 'dots', 'exercise', 'flights', 'fmri', 'gammas', 'geyser', 'iris', 'mpg', 'penguins', 'planets', 'tip.. 2020. 12. 3.
[SQLD] 1과목 간단 요약 :: 데이터 모델링의 이해 과목1 데이터 모델링의 이해 1장. 데이터 모델링의 이해 1절. 데이터 모델의 이해 1. 데이터 모델링 - 일정한 표기법에 의해 표현 - 데이터베이스를 생성하여 개발 및 데이터관리 - 업무 흐름 설명, 분석 - 유의점 : 중복, 비유연성, 비일관성 - 요소 : 어떤 것(Things), 속성(Attributes), 관계(Relationships) - 특징 : 추상화, 단순화, 정확화 - 개념적 모델링 : 추상화 수준이 높고 업무중심적, 포괄적 / 전사적 데이터 모델링, EA수립 - 논리적 모델링 : key, 속성, 관계 등을 정확하게 표현 / 재사용성이 높음 - 물리적 모델링 : 성능, 저장 2. 좋은 데이터 모델 - 완전성 : 업무에 필요한 모든 데이터가 모델에 정의 - 중복배제 : 동일한 사실은 한 번.. 2020. 11. 29.
[HIVE] 테이블 삭제하기 :: DROP TABLE # 테이블 삭제 DROP TABLE 테이블; # 테이블 존재여부 상관없이 삭제 DROP TABLE IF EXISTS 테이블; 2020. 11. 26.
[Python] read_excel 오류 :: install xlrd [ Error ] Missing optional dependency 'xlrd'. Install xlrd >= 1.0.0 for Excel support Use pip or conda to install xlrd. [ Solution ] # pip pip install xlrd # conda conda install -c anaconda xlrd 2020. 11. 19.
[Python] 엑셀 불러오기 :: pd.read_excel Pandas의 read_excel을 이용하면 엑셀 파일을 python의 dataframe으로 불러올 수 있다. # Pandas import pandas as pd pd.read_excel( io, sheet_name=0, header=0, names=None, index_col=None, usecols=None, squeeze=False, dtype=None, engine=None, converters=None, true_values=None, false_values=None, skiprows=None, nrows=None, na_values=None, keep_default_na=True, na_filter=True, verbose=False, parse_dates=Fa.. 2020. 11. 19.
[Python] 데이터프레임 중복 제거 :: drop_duplicates 데이터프레임에서 중복되는 행을 제거하고 고유한 값만 남기고 싶을 때 Pandas의 drop_duplicates를 활용하면 된다. import pandas as pd # 중복제거 df.drop_duplicates(subset=None, keep='first', inplace=False, ignore_index=False) 예시데이터 df = pd.DataFrame({'Num':[1, 2, 1, 2, 2, 3], 'Alphabet':['a', 'b', 'a', 'b', 'a', 'b']}) df 중복이 있는 예시데이터를 생성하였다. 1. 중복제거 df.drop_duplicates() 아무것도 지정하지 않고 그냥 drop_duplicates를 할 경우 모든 열(column)을 기준으로 중복을 제거한다. 예시데.. 2020. 11. 16.
[컴활] 1급 실기 엑셀(Excel) 프로시저 정리 프로시저 작성 개발도구 > 디자인 모드 > 버튼 더블 클릭 폼이 화면에 나타나도록 프로시저 작성 폼이름.Show 종료 버튼을 클릭하면 폼이 닫히도록 Unload Me 셀에 값 입력 Cells(행, 열) 문자열을 숫자로(계산할 때) Val(txt어쩌구) 데이터를 추가하거나 삭제하여도 항상 마지막 데이터 다음에 입력 Range("내용이 시작하는 위치").CurrentRegion.Rows.Count + 시작하는 위치의 행 번호 ex) Range("B3").CurrentRegion.Rows.Count + 3 폼이 초기화되면 Private Sub UserForm_Initialize() End Sub [H5:H10] 영역의 값이 콤보상자(cmb콤보)/목록상자(Lst목록)의 목록에 나타나도록 설정 cmb콤보.RowS.. 2020. 11. 13.
티스토리 광고 애드핏(Ad-fit) 설정하기 + 스킨편집 깔끔한걸 좋아해서 티스토리 블로그에는 광고를 달지 않으리라 다짐했는데,, 자본주의에 굴복해버렸다. 아는 동생이랑 밥먹는데 "티스토리 광고가 그렇게 짭짤하대"라는 말에 1차로 홀렸고, 구글 애드센스말고 Ad-fit이 새로 생긴거에 2차로 홀렸다. 그냥.. 구글 광고는 안끌려서 너무 난잡하게 하지 않게 하기 위해 목록 하단에 광고를 넣으려고 했다. 근데 치환자가 없어서 광고를 설정할 수 없다는 알람이 떴다. (사진은 상단이지만) 아하 그럼 저 치환자를 넣는 곳에 광고가 들어가는거니까 내 마음대로 해도 되겠네? 😁 목록 상단 광고 : 목록 하단 광고 : 어떠한 가이드도 없이 치환자를 넣으라는 말만 있어서 처음에는 어리둥절했다. 태그는 뭐로 달아야하지..? 이것저것 시도해본 결과.. 그냥 치환자만 넣으면 된다... 2020. 11. 13.
[HIVE] date_format 다루기 :: 날짜함수 date_format(날짜, 형식) : 하이브에서 date_format을 이용하면 날짜에서 다양한 정보를 추출할 수 있다. - 날짜 : date/timestamp/string 입력 가능 - 형식 Format 설명 예시 G 시대(BC, AD) AD y 연도(year) 1996; 96 Y 주(week)에 따른 년도 2009; 09 M 월(Month) July; Jul; 07 w 해당 년도의 몇 번째 주(1~53) 27 W 해당 월의 몇 번째 주(1~5) 2 D 해당 년도의 몇 번째 일(1~366) 189 d 해당 월의 몇 번째 일(1~31) 10 F 해당 월의 몇 번째 요일(1~5) 2 E 요일 Tuesday; Tue u 주의 몇 번째 일 요일을 숫자로 나타낸 것(1 = 월 ~ 7 = 일) 1 a Am/pm.. 2020. 11. 10.
[HIVE] 일 년 중 몇 번째 주 :: weekofyear weekofyear(date) : 일 년 중 몇 번째 주 weekofyear("2020-11-01") weekofyear("2020-11-01") > 44 2020. 11. 10.