데이터 분석 전문가/제2과목 2

2장 데이처 처리 기술 (1)

학습목표분산 데이터 저장 기술에 대한 이해분산 컴퓨팅 기술에 대한 이해클라우드 인프라 기술에 대한 이해 장 소개 데이터 처리 기술을 3가지 측면에서 알아본다. 1절에서는 분산 파일 시스템, 공유 스토리지, 데이터베이스와 같은 저장 기술의 종류와 각 기능을 이해한다. 2절에서는 구글과 같은 인터넷 포털에서 사용하는 맵리듀스와 같은 저장 기술의 종류와 각 기능을 이해한다. 2절에서는 구글과 같은 인터넷 포털에서 사용하는 맵리듀스와 같은 분산 병렬 처리 기술에 대해서 설명한다. 3절은 XEN, VMWare와 같은 서버 가상화를 중심으로 클라우드 인프라 기술들에 대해서 설명한다. 목차제1절 분산 데이터 저장 기술제2절 분산 컴퓨팅 기술제3절 클라우드 인프라 기술 제1절 분산 데이터 저장 기술최근의 데이터를 처리..

제1장 데이터 처리 프로세스

과목 2 데이터 처리 기술 이해 과목 소개: 1장에서는 데이터 처리 프로세스 과정을 관계형 데이터베이스와 같은 정형 데이터와 같은 비졍형 데이터 측면에서 설명한다. 원천데이터에서 분석에 필요한 데이터를 추출하는 방법, 의미 있는 정보를 만드는 방법들을 설명한다. 2장에서는 데이터 처리를 위한 분산 파일 스토리지 같은 저장 기술과 하둡과 같은 분산 병렬 처리 기술, 그리고 이러한 플랫폼들을 구동할 수 있는 클라우드 컴퓨팅 인프라 기술에 대해서 설명한다. 목차 제1장 데이터 처리 프로세스제1절 ETL(Extraction, Transformation and Load) 제2절 CDC(Change Data Capture)제3절 EAI(Enterprise Application Integration)제4절 데이터 연..