본문 바로가기

정보수집13

[ADP] 2과목 2장. 데이터 처리 기술 이해 :: 데이터 처리 프로세스 2장. 데이터 처리 기술 분산 파일 시스템 [ 구글 파일 시스템 ] 1. 가정 - 저가형 서버로 구성된 환경으로 서버의 고장이 빈번하게 발생할 수 있다. - 대부분의 파일은 대용량이다. - 작업 부하는 주로 연속적으로 많은 데이터를 읽는 연산이거나 임의의 영역에서 적은 데이터를 읽는 연산이다, - 파일에 대한 연산은 주로 순차적으로 데이터를 추가하며 파일에 대한 갱신은 드물게 이루어진다. - 여러 클라이언트에서 동시에 동일한 파일에 데이터를 추가하는 환경에서 동기화 오버헤드를 최소화할 수 있는 방법이 요구된다. - 낮은 응답 지연시간보다 높은 처리율이 중요하다. 2. Master node - 전체를 관리하고 통제하는 중앙 서버 - 단일 마스터 구조 : 모든 메타데이터를 메모리상에서 관리 - 주기적으로 하.. 2019. 11. 4.
[ADP] 2과목 1장. 데이터 처리 기술 이해 :: 데이터 처리 프로세스 1장. 데이터 처리 프로세스 ETL : Extraction, Transformation, and Load - 데이터 이동과 변환 - Extraction(추출) : 데이터 획득 - Transformation(변형) : 데이터 클렌징/형식 변환/표준화, 통합 또는 비즈니스 룰 적용 등 - Loading(적재) : 변형 처리가 완료된 데이터를 목표 시스템에 적재 - 데이터 웨어하우스(DW), 운영 데이터 스토어(ODS), 데이터 마트(DM)에 대한 데이터 적재작업의 핵심 구성요소 - 데이터 통합, 데이터 이동, 마스터 데이터 관리에 걸쳐 폭넓게 활용 - 데이터 비정규화 : 성능 향상을 위해 테이블을 다시 합치는 것 - ETL 작업 단계 1) Interface : 데이터 획득을 위한 인터페이스 메커니즘 구현 2.. 2019. 11. 4.
[ADsP/ADP] 1과목. 데이터 이해 1장. 데이터의 이해 1. 데이터 1) 정성적 데이터 : 언어, 문자 (예 : sns에 올린 글 등) 2) 정량적 데이터 : 수치, 도형, 기호 (예 : 나이, 몸무게, 온도 등) 2. 지식경영 1) 암묵지 - 학습과 경험을 통해 개인에게 축적된 내면화된 지식 - 개인에게 습득되어 있지만 겉으로 드러나지 않는 지식 - 오랜 경험을 통해 개인에게 습득된 무형의 지식 - 조직의 지식으로 공통화 - 외부에 표출되어 다른 사람에게 공유되기 어려움 2) 형식지 - 문서나 메뉴얼처럼 형상화된 지식 - 언어, 기호, 숫자로 표출화된 지식 - 개인의 지식으로 연결화 - 전달과 공유가 용이하다. 3. DIKW 1) 데이터(Data) - 가공하기 전의 순수한 데이터 - 객관적인 사실 2) 정보(Information) - .. 2019. 11. 4.