본문 바로가기

정보수집/데이터분석6

[ADP] 5과목. 데이터 시각화 1장. 시각화 인사이트 프로세스 - 시각화를 통해 통찰을 추출하는 전체 과정 - 삼찰 : 성찰(내부), 관찰(외부), 통찰(내-외부 연결) [ 맥캔들리스의 시각 이해 계층도 ] 1. 데이터 : 시각화 - 개별적인 요소 2. 정보 : 디자인 - 연관된 요소 - 그 자체로도 의미가 있다. - 데이터가 정보로서 가치를 갖기 위해서는 조직화되고 변형되어야 하며 의미를 전달하기 위한 형태로 표현되어야 한다. - 생산자와 사용자의 관점에 따라 다르게 전달될 수 있으며 일정한 형태와 형식을 갖고 있다. - 사용의 주체나 상황에 따라 의미와 가치가 다르기 때문에 정보가 생산되고 사용되는 컨텍스트가 중요하다. - 생산자와 소비자 두 영역에 모두 포함되면서도 자기 조직화되지 않은 일반적인 의미만을 내재하고 있다. 3. 지.. 2020. 6. 6.
[ADsP/ADP] 4과목. 데이터 분석 1장. R기초와 데이터 마트 R - 통계 계산과 그래픽을 위한 프로그래밍 언어이자 소프트웨어 환경 - 표준 플랫폼(S 언어 기반 : GNU S라고도 함) - 오픈소스 - 모든 운영체제에서 사용 - 객체지향언어이며 함수형 언어 ​ 더보기 - setwd("작업영역") : 작업영역 설정 - help(함수), ?함수, RsiteSearch("함수") : 도움말 - history() : 기록보기 - savehistory(file = "파일명") : 기록 저장 - loadhistory(file = "파일명") : 기록 불러오기 - Ctrl + L : 콘솔 청소 - Ctrl + R : 한 줄 실행 - # : 주석처리 - install.packages("패키지명") : 패키지 설치 - library(패키지) : 패키지.. 2020. 5. 27.
[ADsP/ADP] 3과목. 데이터 분석 기획 1장. 데이터 분석 기획의 이해 - 분석 기획은 단기적으로는 분석 과제를 도출하여 프로젝트화 한 후 관리를 수행하여 분석결과를 도출하는 것이고, 중장기적으로는 분석 마스터플랜을 수행하여 지속적인 분석 과제 수행을 지원할 수 있는 거버넌스 체계를 수립하는 것이다. 분석의방법(How) / 분석의 대상(What) 분석의 대상(What) O 분석의 대상(What) X 분석의방법(How) O Optimization 최적화 Insight 통찰력 분석의방법(How) X Solution 해결책 Discovery 발견 1. 분석 기획 시 고려사항 - 데이터 : 데이터 확보, 데이터 유형에 따른 선행 분석 - 분석을 통해 가치창출되는 적절한 활용방안과 유즈케이스 탐색 - 분석 수행시 발생 가능한 장애요소와 대책에 대한 사.. 2019. 11. 5.
[ADP] 2과목 2장. 데이터 처리 기술 이해 :: 데이터 처리 프로세스 2장. 데이터 처리 기술 분산 파일 시스템 [ 구글 파일 시스템 ] 1. 가정 - 저가형 서버로 구성된 환경으로 서버의 고장이 빈번하게 발생할 수 있다. - 대부분의 파일은 대용량이다. - 작업 부하는 주로 연속적으로 많은 데이터를 읽는 연산이거나 임의의 영역에서 적은 데이터를 읽는 연산이다, - 파일에 대한 연산은 주로 순차적으로 데이터를 추가하며 파일에 대한 갱신은 드물게 이루어진다. - 여러 클라이언트에서 동시에 동일한 파일에 데이터를 추가하는 환경에서 동기화 오버헤드를 최소화할 수 있는 방법이 요구된다. - 낮은 응답 지연시간보다 높은 처리율이 중요하다. 2. Master node - 전체를 관리하고 통제하는 중앙 서버 - 단일 마스터 구조 : 모든 메타데이터를 메모리상에서 관리 - 주기적으로 하.. 2019. 11. 4.
[ADP] 2과목 1장. 데이터 처리 기술 이해 :: 데이터 처리 프로세스 1장. 데이터 처리 프로세스 ETL : Extraction, Transformation, and Load - 데이터 이동과 변환 - Extraction(추출) : 데이터 획득 - Transformation(변형) : 데이터 클렌징/형식 변환/표준화, 통합 또는 비즈니스 룰 적용 등 - Loading(적재) : 변형 처리가 완료된 데이터를 목표 시스템에 적재 - 데이터 웨어하우스(DW), 운영 데이터 스토어(ODS), 데이터 마트(DM)에 대한 데이터 적재작업의 핵심 구성요소 - 데이터 통합, 데이터 이동, 마스터 데이터 관리에 걸쳐 폭넓게 활용 - 데이터 비정규화 : 성능 향상을 위해 테이블을 다시 합치는 것 - ETL 작업 단계 1) Interface : 데이터 획득을 위한 인터페이스 메커니즘 구현 2.. 2019. 11. 4.
[ADsP/ADP] 1과목. 데이터 이해 1장. 데이터의 이해 1. 데이터 1) 정성적 데이터 : 언어, 문자 (예 : sns에 올린 글 등) 2) 정량적 데이터 : 수치, 도형, 기호 (예 : 나이, 몸무게, 온도 등) 2. 지식경영 1) 암묵지 - 학습과 경험을 통해 개인에게 축적된 내면화된 지식 - 개인에게 습득되어 있지만 겉으로 드러나지 않는 지식 - 오랜 경험을 통해 개인에게 습득된 무형의 지식 - 조직의 지식으로 공통화 - 외부에 표출되어 다른 사람에게 공유되기 어려움 2) 형식지 - 문서나 메뉴얼처럼 형상화된 지식 - 언어, 기호, 숫자로 표출화된 지식 - 개인의 지식으로 연결화 - 전달과 공유가 용이하다. 3. DIKW 1) 데이터(Data) - 가공하기 전의 순수한 데이터 - 객관적인 사실 2) 정보(Information) - .. 2019. 11. 4.