[ADsP/ADP] 3과목. 데이터 분석 기획
1장. 데이터 분석 기획의 이해
- 분석 기획은 단기적으로는 분석 과제를 도출하여 프로젝트화 한 후 관리를 수행하여 분석결과를 도출하는 것이고, 중장기적으로는 분석 마스터플랜을 수행하여 지속적인 분석 과제 수행을 지원할 수 있는 거버넌스 체계를 수립하는 것이다.
분석의방법(How) / 분석의 대상(What) |
분석의 대상(What) O |
분석의 대상(What) X |
분석의방법(How) O |
Optimization 최적화 |
Insight 통찰력 |
분석의방법(How) X |
Solution 해결책 |
Discovery 발견 |
1. 분석 기획 시 고려사항
- 데이터 : 데이터 확보, 데이터 유형에 따른 선행 분석
- 분석을 통해 가치창출되는 적절한 활용방안과 유즈케이스 탐색
- 분석 수행시 발생 가능한 장애요소와 대책에 대한 사전 계획 수립
2. 기업의 합리적인 의사결정을 가로막는 장애 요소
- 고정관념(Stereotype)
- 편향된 생각(Bias)
- 프레이밍 효과(Framing Effect) : 문제의 표현 방식에 따라 (동일한)사건이나 상황에 대한 선택이 달라질 수 있는 현상
분석방법론
1. 방법론의 구성 : 절차, 방법, 도구와 기법, 템플릿과 산출물
2. 방법론 모델
1) 폭포수 모델 : 하향식 / 순차 / 피드백 = 문제나 개선사항이 발견되면 전 단계로 돌아간다.
2) 나선형 모델 : 반복 / 점증적 / 반복에 대한 관리 체계를 효과적으로 갖추지 못한 경우 복잡도가 상승하여 프로젝트 진행이 어려울 수 있다.
3) 프로토타입 모델 : 개선
4) 계층적 프로세스 모델 : 단계(최상위) → 태스크 → 스텝
3. 비즈니스 모델 캔버스 : 업무 / 제품 / 고객 / 규제와 감사 / 지원 인프라
4. KDD 분석 방법론 : 데이터 선택 → 전처리 → 변환 → 데이터 마이닝 → 결과 평가
5. CRISP-DM 방법론 : 업무 이해 → 데이터 이해 → 데이터 준비 → 모델링 → 평가 → 전개
1) 업무 이해 : 업무 목적 파악, 상황 파악, 데이터 마이닝 목표 설정, 프로젝트 계획 수립
2) 데이터 이해
- 데이터를 수집하고 데이터 속성을 이해하기 위한 과정
- 데이터 품질에 대한 문제점을 식별하고 숨겨져 있는 인사이트 발견
- 데이터 수집/기술 분석/탐색/품질 확인
3) 데이터 준비
- 수집된 데이터에서 분석기법에 적합한 데이터셋을 편성
- 분석용 데이터 선택, 데이터 정제/통합/포매팅
4) 모델링
- 모델링 기법과 알고리즘을 선택하고 파라미터를 최적화하는 단계
- 모델링 기법 선택, 모델 테스트 계획 설계, 모델 작성, 모델 평가
5) 평가
- 데이터 마이닝 결과를 수용할 것인지 판단
- 분석 결과 평가, 모델링 과정 평가, 모델 적용성 평가
6) 전개
- 완성된 모델을 실제 업무에 적용하기 위한 계획을 수립하고 모델의 유지보수 계획을 마련한다. 또한 마지막 단계에 해당하여 종료 관련 프로세스를 수행하여 프로젝트를 완료시킨다.
- 전개 계획 수립, 모니터링과 유지보수 계획 수립, 프로젝트 종료보고서 작성, 프로젝트 리뷰
6. 빅데이터 분석 방법론 : 분석 기획 → 데이터 준비 → 데이터 분석 → (시스템 구현) → 평가 및 전개
1) 분석 기획
- 비즈니스를 이해하고 도메인의 문제점을 파악하여 빅데이터 분석 프로젝트의 범위를 설정한다.
- 프로젝트 정의 및 계획 수립
- 프로젝트의 위험을 사전에 식별하고 대응방안을 수립
2) 데이터 준비
- 필요 데이터 정의, 데이터 스토어 설계, 데이터 수집 및 정합성 점검
3) 데이터 분석
- 분석용 데이터 준비, 탐색적 분석, 모델링, 모델 평가 및 검증, 모델 적용 및 운영 방안 수립
4) 시스템 구현
- 시스템에 적용하거나 프로토타입을 구현하고자 하는 경우에 진행한다. 분석보고서를 작성하는 것으로 프로젝트가 종료되는 경우에는 생략할 수 있다.
- 설계 및 구현, 시스템 테스트 및 운영
5) 평가 및 전개
- 모델 발전계획 수립, 프로젝트 평가 및 보고
분석 과제 발굴
[ 하향식 접근 방식 : Top Down Approach ]
- 체계적 단계화 / Why 관점 / 문제 → 해법 / 지도학습
- Problem Discovery(문제 탐색) → Problem Definition(문제 정의) → Solution Search(해결방안 탐색) → Feasibility Study(타당성 검사)
1. Problem Discovery 문제 탐색
1) 비즈니스 모델 기반 문제 탐색
- 업무, 제품, 고객, 규제와감사, 지원 인프라
- 새로운 문제의 발굴 및 장기적인 접근을 위해서는 현재 수행하고 있는 비즈니스뿐만 아니라 환경과 경쟁 구도의 변화 및 역량의 재해석을 통한 "혁신"의 관점에서 분석 기회를 추가 도출해야 한다.
- 새로운 관점의 접근 필요
- 거시적 관점 ~ 메가 트랜드 : 사회, 기술, 경제, 환경, 정치
- 경쟁자 확대 ~ 경쟁사의 동향 : 대체제, 경쟁자, 신규 진입자
- 시장 니즈 탐색 ~ 고객 니즈의 변화 : 고객, 채널, 영향자들
- 역량의 재해석 ~ 내부 역량, 파트너 네트워크
2) 외부 참조 모델 기반 문제 탐색
- 기존에 수행한 분석 과제를 살펴보는 것
- 데이터 분석 활용 사례
- 벤치마킹
3) 분석 유즈 케이스 정의
- 풀어야 할 문제에 대한 상세한 설명 및 해당 문제를 해결했을 때 발생하는 효과를 명시함으로써 향후 데이터 분석 문제로의 전환 및 적합성 평가에 활용
2. Problem Definition 문제 정의
- 비즈니스 문제 → 데이터 분석 문제로의 변환
- 분석 수행자 & 최종 사용자의 관점
3. Solution Search 해결방안 탐색
- 수행 옵션 도출
분석기법 및 시스템(How) / 분석 역량(Who) |
분석 역량 확보 |
분석 역량 미확보 |
기존시스템 |
기존 시스템 개선 활용 |
교육 및 채용을 통한 역량 확보 |
신규 도입 |
시스템 고도화 |
전문 업체 Sourcing |
4. Feasibility Study 타당성 검토
- 타당성 평가 → 과제선정
- 경제적 타당성
- 데이터 및 기술적 타당성
[ 상향식 접근 방식 : Bottom Up Approach ]
1.
- What 관점 / 디자인 사고 / 감정이입
- 데이터를 기반으로 문제 정의 및 해결방안 탐색
- 데이터 → 분석 → 문제/통찰력/지식
- 비지도 학습 방법 : 데이터 자체의 결합, 연관성, 유사성을 중심으로 접근
2. 프로토타이핑 접근법
- 시행착오를 통한 문제 해결
- 사용자가 문제나 데이터를 정확하게 규정하기 어렵고 데이터 소스도 명확히 파악하기 어려운 상황에서 일단 분석을 시도해보고 그 결과를 확인해 가면서 반복적으로 개선해가는 방법
- 비록 완전하지는 못하다 해도 신속하게 해결책이나 모형을 제시함으로써 이를 바탕으로 문제를 좀 더 명확하게 인식하고 필요한 데이터를 식별하여 구체화
- 애자일(Agile) 프로젝트 관리방식
- 가설의 생성 > 디자인에 대한 실험 > 실제 환경에서의 테스트 > 테스트 결과에서의 통찰 > 도출 및 가설 확인
- 잘 설계된 프로토타이핑을 지속하면 실험이 가지고 있는 불명확성이 감소하고 의도했던 결과를 도출할 수 있는 성공 가능성은 높아진다.
- 빅데이터에서 프로토타이핑의 필요성 : 문제에 대한 인식 수준 / 필요 데이터의 존재 여부의 불확실성 / 데이터의 사용 목적의 가변성
3. 디자인 사고 프로세스 : 상향식 접근방식의 발산(Diverage)와 하향식 접근 방식의 수렴(Coverage) 단계를 반복적으로 수행
분석 프로젝트 관리 방안
1. 분석 과제의 주요 5가지 특성/주요 관리 영역
1) Data Size
2) Data Complexity : 원천 데이터(비정형 데이터)를 통합해서 분석 프로젝트를 진행할 때는 초기 데이터의 확보와 통합뿐만 아니라 해당 데이터에 잘 적용될 수 있는 분석 모델의 선정 등에 대한 사전 고려가 필요하다.
3) Speed : 시나리오 측면의 속도. 프로젝트 수행 시 분석모델의 성능 및 속도를 고려한 개발 및 테스트가 수행되어야한다.
4) Analytic Complexity : 해석이 가능하면서 정확도를 올릴 수 있는 최적모델을 찾는 방안을 사적에 모색해야 한다.
5) Accuracy & Precision
- Precision : 모델을 지속적으로 반복했을 때의 편차의 수준으로써 일관적으로 동일한 결과를 제시한다.
- 분석의 활용 ~ Accuracy / 안정성 ~ Precision
2. 분석 프로젝트의 관리방안(프로젝트관리 지침)
1) 통합 : 통합적 운영
2) 이해관계자 : 이해관계자를 식별하고 관리
- Data, Business, 분석 등 다양한 영역의 사람들이 프로젝트에 참여하며, Project Sponsor 및 향후 분석 결과를 활용 할 User 등 다양한 사람들의 니즈를 고려해야 한다.
3) 범위 : 작업과 인도물을 식별하고 정의
4) 자원 : 적절한 프로젝트 자원을 식별하고 확보
5) 시간 : 프로젝트 활동의 일정을 수립하고 일정 통제의 진척상황을 관찰
6) 원가 : 예산 개발과 원가통제의 진척상황을 관찰
7) 리스크 : 위험과 기회를 식별하고 관리
8) 품질 : 품질보증, 품질통제/품질목표를 사전에 수립하여 확정
9) 조달 : 계획에 요구된 프로세스를 포함하며 제품 및 서비스 또는 인도물을 인수하고 공급자와의 관계를 관리하는데 요구되는 프로세스
10) 의사소통 : 분석 결과를 모든 프로젝트 이해관계자가 공유할 수 있도록
2장. 분석 마스터 플랜
- 분석기획 : 단기적 분석과제 도출 → 프로젝트화, 관리 → 분석결과를 도출
- 분석 마스터 플랜 : 중장기적/지속적 분석과제 수행, 거버넌스 체계
- ISP : 정보전략계획. 정보기술 또는 정보시스템을 전략적으로 활용하기 위하여 조직 내/외부 환경을 분석하여 기회나 문제점을 도출하고 사용자의 요구사항을 분석하여 시스템 구축 우선순위를 결정하는 등 중장기 마스터 플랜을 수립하는 절차
1. 분석 마스터 플랜 수립
1) 우선순위 설정 : 전략적 중요도, 비즈니스 성과, 실행 용이성
2) 적용 범위 & 방식 고려 : 업무 내재화 적용 수준, 분석 데이터 적용 수준, 기술 적용 수준
2. 과제 우선순위 평가기준
1) 전략적 중요도 : 전략적 필요성, 시급성
2) 실행 용이성 : 투자 용이성, 기술 용이성
3) 비즈니스 성과/ROI
① 난이도
- 데이터 획득/저장/가공비용, 분석 적용 비용, 분석 수준
- 3V(Volume, Variety, Velocity) : 투자비용(Investment)
②시급성
- 전략적 중요도, 목표가치
- Value : 비즈니스 효과(Return)
분석 거버넌스 체계 수립
1. 거버넌스 체계 : 데이터 분석의 지속적인 적용과 확산
- 분석 기획 및 관리를 수행하는 조직
- 과제 기획 및 운영 프로세스
- 분석 관련 시스템
- 데이터
- 분석 관련 교육 및 마인드 육성 체계(Human Resource)
2. 데이터 분석 수준 진단
- 분석 준비도 : 업무, 인력/조직, 기법, 데이터, 문화, 인프라
- 분석 성숙도 : 도입(구축), 활용(적용), 확산(분석 관리/공유), 최적화(진화/혁신/성과 향상)
3. 데이터 거버넌스
- 표준화된 관리체계를 수립하고 운영을 위한 프레임워크 및 저장소를 구축
- 관리 대상 : 마스터데이터, 메타데이터, 데이터 사전
- 원칙(지침, 가이드), 조직(역할과 책임), 프로세스(활동과 체계)
1) 데이터 표준화
2) 데이터 관리체계
3) 데이터 저장소 관리
4) 표준화 활동
4. 데이터 조직
1) 집중구조
- 별도의 분석 전담조직
- 전략적 중요도에 따라 우선순위를 정해서 진행 가능
- 현업 업무부서의 분석업무와 이중화/이원화 가능성 높음
2) 기능구조
- 별도 분석조직 X, 해당 부서에서 분석 수행
- 전시적 핵심분석이 어렵다.
- 과거 실적에 국한된 분석가능성 높음
3) 분산구조
- 분석조직 인력들을 현업부서로 직접 배치하여 분석 수행
- 전사차원의 우선순위 수행
- 분석결과에 따른 신속한 Action 기능
- Best Practice 공유가능
'정보수집 > 데이터분석' 카테고리의 다른 글
[ADP] 5과목. 데이터 시각화 (0) | 2020.06.06 |
---|---|
[ADsP/ADP] 4과목. 데이터 분석 (0) | 2020.05.27 |
[ADP] 2과목 2장. 데이터 처리 기술 이해 :: 데이터 처리 프로세스 (0) | 2019.11.04 |
[ADP] 2과목 1장. 데이터 처리 기술 이해 :: 데이터 처리 프로세스 (0) | 2019.11.04 |
[ADsP/ADP] 1과목. 데이터 이해 (0) | 2019.11.04 |
Comments