데이터 분석 준전문가/제1과목

제1장 데이터의 이해

표독's 2016. 2. 16. 21:44


제 1장 데이터의 이해

학습 목표 : 데이터 정의에 대한 이해

데이터베이스 정의와 특징 이해

데이터베이스 활용에 대한 이해

 

제 1절 데이터와 정보

  1. 데이터의 정의

데이터는 '객관적 사실'이라는 존재적 특성을 갖는 동시에 '추론, 예측, 전망, 추정을 위한 근거'로 기능하는 당위적 특성 또한 갖고 있다.

 

정성적 데이터와 정량적 데이터

정성적 데이터 : 저장 검색 분석하는 데에 상대적으로 많은 비용과 기술적 투자가 수반됨.

정량적 데이터 : 데이터의 양이 크게 증가하더라도 저장 검색 분석하여 활용하기가 매우 용이하다.

 

암묵지와 형식지

지식경영의 핵심 이슈인 암묵지와 형식지의 상호작용에 있어 중요한 역할.

암묵지 : 개인에게 습득되어 있으나 겉으로 드러나지 않는 지식. 무형의 지식.

공유되기 어렵다는 단점을 갖는다. (공통화, 내면화)

형식지 : 형상화된 지식, 유형의 대상이 있기 때문에 지식의 전달과 공유가 매우 용이

(표출화, 연결화)

 

  1. 데이터와 정보의 관계

데이터의 당위적 특성, '추론 예측 전망 추정을 위한 근거로의 기능'에 주목하여 이들의 관계를 살펴보자.

DIKW 피라미드는 데이터, 정보, 지식을 통해 최종적으로 지혜를 얻어내는 과정을 계층구조로 설명한다. 데이터 -> 정보 -> 지식 -> 지혜

개별 데이터 자체로는 의미가 중요하지 않은 객관적인 사실을 말한다.

데이터의 정확성

향후 데이터 간의 관계 및 현상의 분석(정보)과 적용(지식), 더 나아가 미래를 예측하고 창의적 산물을 도출(지혜)하는 데 지대한 영향을 미치며, 가치창출에 핵심적인 역할을 수행한다.

 

제 2절 데이터베이스 정의와 특징

  1. 용어의 연역

'데이터(data)의 기지(base)'라는 뜻으로 미군의 군비 상황을 집중 관리하기 위해 컴퓨터 기술로 구현한 도서관을 설립하면서 비롯되었다.

 

'대량의 데이터를 축적하는 기지'라는 의미 -> 시스템을 통한 체계적 관리와 저장 등의 의미를 담은 '데이터베이스 시스템'이라는 용어 등장

 

  1. 데이터베이스의 정의

데이터베이스는 체계적으로 정렬된 데이터 집합을 의미, 데이터양과 이용이 늘어나면서 대용량의 데이터를 저장 관리 검색 이용할 수 있는 컴퓨터 기반의 데이터베이스로 진화.

 

데이터베이스와 DBMS

DBMS는 이용자가 쉽게 데이터베이스를 구축하고 유지할 수 있도록 하는 소프트웨어로서 데이터베이스와 구분되며, 일반적으로 데이터베이스와 DMBS를 함께 데이터베이스 시스템으로 칭한다.

  1. 데이터베이스의 특징

단순한 저장소가 아닌, 첨단 정보기술을 바탕으로 원하는 데이터를 저장 검색할 수 있는 복합체

첫째, 데이터베이스는 통합된 데이터.

둘째, 데이터베이스는 저장된 데이터.

셋째, 데이터베이스는 공용 데이터.

넷째, 변화되는 데이터.

 

다양한 측면에서의 특성

기계가독성, 검색가능성, 원격조작성,

원하는 정보를 정확하고 경제적으로 찾아낼 수 있다는 특성.

방대한 양의 정보를 체계적으로 축적하고 새로운 내용 추가나 갱신이 용이.

네트워크 기술 등의 발전을 견인할 수 있다.

다양한 정보를 필요에 따라 제공하는 인프라로서 특성을 가지고 있어, 국민의 편의를 증진하고 경제, 산업, 사회 화동의 효율성 제고

 

제 3절 데이터베이스 활용

  1. 기업내부 데이터베이스

정보통신망 구축 가속화는 기업 경영 전반에 관한 인사, 조직, 생산, 영업 활동을 포함한 모든 자료를 일관된 체계로 구축, 운영하는 경영 활동의 기반이 되는 전사시스템으로 확대.

 

1990' 단순한 정보의 '수집'에서 탈피, '분석'이 중심이 되는 시스템 구축으로 변하게 함.

2000' 기업 DB 구축의 화두는 CRM과 SCM.

  1. 제조부분

부품 테이블이나 재고관리 등의 영역에서의 데이터베이스 활용에서 부품의 설계, 제조, 유통 전 공정을 포함하는 범위로 확대.

 

  1. 금융부분

금융부문의 업무 프로세스 효율화나 e비즈니스 활성화, 금융권 통합 시스템 구축 등이 크게 확산되었다. 

  1. 유통부분

CRM과 SCM 구축이 이루어짐. 상거래를 위한 각종 인프라 및 KMC를 위한 별도의 백업시스템 구축.

  1. 사회기반구조로서의 데이터베이스

사회간접자본 차원에서 데이터 구축 활용이 본격화 되기 시작하여, 부가가치통신망(VAN)을 통한 정보망이 구축되기 시작함.

  1. 물류부분

한 마디로 표현하면 '실시간 차량추적'

  1. 지리부분

국가지형도와 공통주제도, 지하매설물도를 전산화하여 기본 공간정보 데이터베이스를 구축하고, 관련 기술 개발과 함께 범 국가적인 활용을 위한 국가 표준설정과 활용체계를 개발하는 사업.

  1. 교통부분

동적(실시간) 교통정보와 정적(비실시간) 교통정보

동적 교통정보는 지능형교통시스템이나 방송매체 등에서 교통소통을 목적으로 운전자에게 제공되는 교통정보.

정적 교통정보는 교통정책 및 계획 수립 등에 필요한 교통 분야별 기초자료 및 통계를 제공하는 데이터베이스.

  1. 의료부분

의료정보시스템은 크게 처방전달시스템, 임상병리, 전자의무기록, 영상처리시스템, 병원의 멀티미디어, 원격의료, 지식정보화로 이루어져있다.

  1. 교육부분

대학정보화 및 교육행정정보화 위주로 사업을 추진하였다.

2002년에는 전국교육정보공유체제를 선보였다.