전체 글 132

[Perspective] 더 과감한 R&D 투자가 절실하다.

더 과감한 R&D 투자가 절실하다.황인학 한궁경제연구원 선임연구위원 "지금은 익숙한 산업구조와 기술이 언제, 어떻게 와해될지 모르는 4차 산업혁명 시대다."올 초 세계경제포럼(WEF)의 다보스 포럼에서 의제로 채택 인공지능(AI), 로봇, 빗데이터, 사물인터넷(IoT) 등이 주축이 되어 생산과 소비 전 분야의 패러다임을 바꾸는 것을 의미한다. 산업혁명은 슘페터 용어로 표현하면 창조적 파괴 (ex, 코닥, 소니, 노키아) 맥킨지 글로벌 연구소 "인공지능 혁명은 1차 산업혁명 당시에 비해 속도는 10배, 규모는 300배, 사회적 충격은 3000배 더 클 것, 지금의 국제 무역 구조까지 뒤흔들 가능성 거론" 독일, 미국, 일본, 중국 등 많은 나라가 기업이 더 많은 R&D 투자를 하도록 조세혜택을 늘려가는 것..

연습용

라. 임팔라의 데이터 모델임팔라는 하둡 분산 파일 시스템에 데이터를 저장한다. 어떤 저장 포맷을 사용하느냐에 따라 데이터 조회시 처리 성능이 달라진다. 하둡의 기본 파일 포맷인 텍스트나 시퀀스 파일은 로우 단위의 데이터 저장 방식을 사용한다. 컬럼 단위의 파일 저장 포맷인 RCFile을 사용할 경우, 데이터 처리 과정에서 발생하는 디스크 입출력 양을 현저하게 줄일 수 있다. 로우 단위로 저장 시, 테이블에서 하나의 컬럼을 읽든 전체 테이블을 읽든 전체 테이블을 읽든 동일한 디스크 입출력이 발생한다. 반면 컬럼 단위의 저장 포맷을 사용하면, 읽고자 하는 컬럼 만큼의 디스크 입출력이 발생하기 때문에 처리 성능을 개선할 수 있다. 물론 전체 컬럼들을 모두 조회하는 질의는 저장 포맷에 의해 성능이 영향을 받지 ..

카테고리 없음 2016.08.22

2장 데이처 처리 기술 (1)

학습목표분산 데이터 저장 기술에 대한 이해분산 컴퓨팅 기술에 대한 이해클라우드 인프라 기술에 대한 이해 장 소개 데이터 처리 기술을 3가지 측면에서 알아본다. 1절에서는 분산 파일 시스템, 공유 스토리지, 데이터베이스와 같은 저장 기술의 종류와 각 기능을 이해한다. 2절에서는 구글과 같은 인터넷 포털에서 사용하는 맵리듀스와 같은 저장 기술의 종류와 각 기능을 이해한다. 2절에서는 구글과 같은 인터넷 포털에서 사용하는 맵리듀스와 같은 분산 병렬 처리 기술에 대해서 설명한다. 3절은 XEN, VMWare와 같은 서버 가상화를 중심으로 클라우드 인프라 기술들에 대해서 설명한다. 목차제1절 분산 데이터 저장 기술제2절 분산 컴퓨팅 기술제3절 클라우드 인프라 기술 제1절 분산 데이터 저장 기술최근의 데이터를 처리..

제1장 데이터 처리 프로세스

과목 2 데이터 처리 기술 이해 과목 소개: 1장에서는 데이터 처리 프로세스 과정을 관계형 데이터베이스와 같은 정형 데이터와 같은 비졍형 데이터 측면에서 설명한다. 원천데이터에서 분석에 필요한 데이터를 추출하는 방법, 의미 있는 정보를 만드는 방법들을 설명한다. 2장에서는 데이터 처리를 위한 분산 파일 스토리지 같은 저장 기술과 하둡과 같은 분산 병렬 처리 기술, 그리고 이러한 플랫폼들을 구동할 수 있는 클라우드 컴퓨팅 인프라 기술에 대해서 설명한다. 목차 제1장 데이터 처리 프로세스제1절 ETL(Extraction, Transformation and Load) 제2절 CDC(Change Data Capture)제3절 EAI(Enterprise Application Integration)제4절 데이터 연..

Getting Started With Python II

Getting Started with Pandas: Kaggle's Titanic CompetitionPandas와 함께 시작하기 : 케글의 타이타닉 경쟁To recap the last tutorial: we got comfortable with Python for re-implementing the models we originally imagined in Excel. By using a programming language, we were able to (1) use more powerful constructs and methods, like arrays to store and retrieve variables, and (2) to write scripted steps that can be repea..

TOEIC 결과

토익 결과를 기다리면서 눈이 빠질 뻔했다. 인턴 서류접수는 해야하는데, 점수는 TOEFL밖에 없어서 그렇다. 나는 READING에서 강하다.TOEFL의 경우에도 리딩은 27점이었다. 그래서 이번에도 RC를 보고 시간도 남았길래 만점이겠구나.. 싶었는데 430점 (495만점) 나는 Listening에 약하다.TOEFL에서는 22점인가..? 수능 모의고사에서도 항상 2개~ 3개씩 틀렸었다. 그래서 예상점수가 300점 대 일거라 생각했는데 430점 (495만점) 총합 860점으로 결과가 나왔다. 아쉬운 점은 900이 넘었으면 다른 공부를 할텐데 900이 안되서 다시 공부를 해야한다는 것이다.한 번만 더 보자..

TOEIC 2016.04.07

제1장 경제사회와 회계정보

제1절 기업환경과 회계정보제2절 자본시장의 이해제3절 재무정보의 질적 특성과 회계기준 제1절 기업환경과 회계정보1. 기업의 의의와 유형 기업은 재화나 용역을 생산하고 가계나 정부의 소비수요를 충족시켜주는 역할을 한다. 영업의 성격에 따라서비스 기업 : 고객에게 용역을 제공하고 수익을 얻는 기업상품매매기업 : 물리적 실체가 있는 상품을 공급업자로부터 매입, 보유하면서 이를 다시 타기업이나 소비자에게 판매하여 매출수익을 얻는 기업제조기업 : 상품을 직접 생산, 판매하여 매출수익을 얻는 기업 소유구조에 따라1) 개인기업 : 한 개인이 소유는 물론 경영까지 전담하는 기업, 소유주는 무한책임2) 합명회사:개인기업의 소유주처럼 무한책임을 지는 무한책임사원 2인 이상이 모여 조직된 회사.위험부담이 크기 때문에 경영능..

4-1/회계원론 2016.03.29

Chapter 5 pandas 시작하기

Chapter 5 pandas 시작하기 pandas는 앞으로 가장 자주 살펴볼 라이브러리다. pandas는 고수준의 자료 구조와 파이썬을 통한 빠르고 쉬운 데이터 분석 도구를 포함한다. pandas는 NumPy 기반에서 개발되어 NumPy를 사용하는 애플리케이션에서 쉽게 사용할 수 있다. -자동적으로 혹은 명시적으로 축의 이름에 따라 데이터를 정렬할 수 있는 자료 구조, 잘못 정렬된 데이터에 의한 일반적인 오류를 예방하고 다양한 소스에서 가져온 다양한 방식으로 색인되어 있는 데이터를 다룰 수 있는 기능-통합된 시계열 기능-시계열 데이터와 비시계열 데이터를 함께 다룰 수 있는 통합 자료 구조-산술연산과 한 축의 모든 값을 더하는 등의 데이터 축약연산은 축의 이름 같은 메타데이터로 전달될 수 있어야 한다.-..