본문 바로가기

Mizy's log6

[ADP 실기] 20회-21회 데이터분석전문가 실기시험 문제 :: Python 20회 1. 날씨데이터 : temps.csv (50점) year 2016 month 1~12 day 1~31 hour 0~23 week 1~52 (이건 자세하게 모르겠어요..) temp_1 1일 전의 온도 temp_2 2일 전의 온도 actual 최대 온도 (실제값) average 전년도 평균 friend 친구의 예측값 (100% 정확하지는 않지만 참고하라고 올려놓았습니다..) - RandomForest와 SVM 두 모델 중 하나를 최종 분석 모델로 선택 - 분석 결과 / 근거 / 주장의 타당성 제시 1-1. (10점) - EDA - 결측치가 있다면 처리하기 - 결측치 처리 이외에 모델링을 하기 위한 전처리하기 - 최종 분석용 데이터셋의 품질에 문제 없음을 주장 - 학습-시험 데이터 구분 1-2. Ran.. 2021. 3. 7.
GitHub 블로그 Minimal-mistakes 설정하기 :: MAC 깃블로그(Git Pages) 만들려다가 우여곡절을 겪어서.. 기록해둔다. 1. GitHub 블로그 만들기 Create repository > gitID.github.io 로 Repository name을 지정하여 생성한다. 2. minimal-mistakes Fork github.com/mmistakes/minimal-mistakes 다운로드해도 상관없고 포크해도 상관없다. 포크했을 경우 Repository name을 자신의 GitHub Pages url로 변경해주어야한다. 3. Ruby 설치하기 1 ) Hombrew 설치하기 /bin/bash -c "$(curl -fsSL https://raw.githubusercontent.com/Homebrew/install/HEAD/install.sh)" 👆🏻 터.. 2021. 3. 2.
[컴활] 1급 실기 엑셀(Excel) 프로시저 정리 프로시저 작성 개발도구 > 디자인 모드 > 버튼 더블 클릭 폼이 화면에 나타나도록 프로시저 작성 폼이름.Show 종료 버튼을 클릭하면 폼이 닫히도록 Unload Me 셀에 값 입력 Cells(행, 열) 문자열을 숫자로(계산할 때) Val(txt어쩌구) 데이터를 추가하거나 삭제하여도 항상 마지막 데이터 다음에 입력 Range("내용이 시작하는 위치").CurrentRegion.Rows.Count + 시작하는 위치의 행 번호 ex) Range("B3").CurrentRegion.Rows.Count + 3 폼이 초기화되면 Private Sub UserForm_Initialize() End Sub [H5:H10] 영역의 값이 콤보상자(cmb콤보)/목록상자(Lst목록)의 목록에 나타나도록 설정 cmb콤보.RowS.. 2020. 11. 13.
티스토리 광고 애드핏(Ad-fit) 설정하기 + 스킨편집 깔끔한걸 좋아해서 티스토리 블로그에는 광고를 달지 않으리라 다짐했는데,, 자본주의에 굴복해버렸다. 아는 동생이랑 밥먹는데 "티스토리 광고가 그렇게 짭짤하대"라는 말에 1차로 홀렸고, 구글 애드센스말고 Ad-fit이 새로 생긴거에 2차로 홀렸다. 그냥.. 구글 광고는 안끌려서 너무 난잡하게 하지 않게 하기 위해 목록 하단에 광고를 넣으려고 했다. 근데 치환자가 없어서 광고를 설정할 수 없다는 알람이 떴다. (사진은 상단이지만) 아하 그럼 저 치환자를 넣는 곳에 광고가 들어가는거니까 내 마음대로 해도 되겠네? 😁 목록 상단 광고 : 목록 하단 광고 : 어떠한 가이드도 없이 치환자를 넣으라는 말만 있어서 처음에는 어리둥절했다. 태그는 뭐로 달아야하지..? 이것저것 시도해본 결과.. 그냥 치환자만 넣으면 된다... 2020. 11. 13.
[ADP 실기] 18회-19회 데이터분석전문가 실기시험 문제 :: Python 18회 1. 고객 등급 예측모형 1) EDA & 결측값 채우기 2-1) 파생변수 3개 생성 & 이유 작성 2-2) Train-Test 분할(7:3) / SOM 군집분석 / 정오분류표 2-3) 분류분석 4가지 2. 텍스트 마이닝(영어) 1) 명사 추출 & 불용어 처리 2) 빈도 막대그래프 3. 시계열분석 1) 평균과 분산 일정 + 근거 & 해석 2) ARIMA + 근거 & 해석 3) 최적 모델 선택 + 근거 & 해석 4) 적합 파악 19회 1. 기계학습 1) 전처리 / 탐색적데이터분석(EDA) / 시각화 2) train-test 분리(7:3) / 분류모델 3가지 / Confusion Matrix 3) 분류모델 > 앙상블하여 예측하고 result.csv 제출하기 2. 시계열분석 1) 시계열 시각화 → 이분산.. 2020. 10. 20.
Python을 이용하여 중복 사진 정리하기 :: OpenCV, compare_ssim 1년 넘게 미룬 사진정리를 드디어 해야겠다고 마음먹었다. 내 사진첩에는 중복된 사진이 너무나도 많았는데 하나하나 손으로 할 수 없다고 생각했다. 그래서 python에 있는 이미지 인식을 이용하였다. 수천개의 사진의 이미지를 전부 대조할 수 없으니 우선적으로 처리할 수 있는 방안을 생각해보았다. 💡생각1 : 저장명이 겹치면 같은 파일이다. ex) 6E5DD712-4FDF-4677-AF33-63E29F975035.jpeg 6E5DD712-4FDF-4677-AF33-63E29F975035 2.jpeg 💡생각1 : 용량이 같으면 같은 파일이다. 이 두가지 생각을 토대로 중복사진 정리를 해보았다. 1. Photo File 1) 사진 목록 불러오기 photo_list = [] for f in os.listdir('.. 2020. 5. 2.