Python for data analysis 5

Chapter 5 pandas 시작하기

Chapter 5 pandas 시작하기 pandas는 앞으로 가장 자주 살펴볼 라이브러리다. pandas는 고수준의 자료 구조와 파이썬을 통한 빠르고 쉬운 데이터 분석 도구를 포함한다. pandas는 NumPy 기반에서 개발되어 NumPy를 사용하는 애플리케이션에서 쉽게 사용할 수 있다. -자동적으로 혹은 명시적으로 축의 이름에 따라 데이터를 정렬할 수 있는 자료 구조, 잘못 정렬된 데이터에 의한 일반적인 오류를 예방하고 다양한 소스에서 가져온 다양한 방식으로 색인되어 있는 데이터를 다룰 수 있는 기능-통합된 시계열 기능-시계열 데이터와 비시계열 데이터를 함께 다룰 수 있는 통합 자료 구조-산술연산과 한 축의 모든 값을 더하는 등의 데이터 축약연산은 축의 이름 같은 메타데이터로 전달될 수 있어야 한다.-..

Chapter 4. Numpy 기본 : 배열과 벡터 계산

Chapter 4. Numpy : 배열과 벡터 계산 Numerical Python의 줄임말인 Numpy는 고성능의 과학계산 컴퓨팅과 데이터 분석에 필요한 기본 패키지다. Numpy는 이 책에서 사용하는 거의 모든 종류의 고수준의 도구를 작성하는 데 토대가 되는 패키지로 제공하는 기능은 다음과 같다. -빠르고 메모리를 효율적으로 사용하며 벡터 산술연산과 세련된 브로드캐스팅 기능을 제공하는 다차원 배열인 ndarray-반복문을 작성할 필요 없이 전체 데이터 배열에 대해 빠른 연산을 제공하는 표준 수학 함수-배열 데이터를 디스크에 쓰거나 읽을 수 있는 도구와 메모리에 올려진 파일을 사용하는 도구-선형대수, 난수 발생기, 푸리에 변환 기능-C, C++, 포트란으로 쓰여진 코드를 통합하는 도구 마지막 항목은 생태..

Chapter 3. IPython 소개

Chapter 3. IPython 소개 무위로 행하고, 편안하게 일하라, 작은 것을 크게 여기고, 적은 것을 많게 여겨라, 어려운 일은 쉬울 때 처리하고 큰 일은 작은 것부터 처리하라. - 노자, 도덕경 작가는 'IPython과 텍스트 편집기'를 사용한다고 한다. 근본적으로 IPython은 대화형 컴퓨팅과 소프트웨어 개발 두 가지 모두를 위해 최적의 생산성을 얻도록 설계 되었다. 그리고 다른 프로그래밍 언어와 달리 '편집-컴파일-실행'방식보다 '실행-탐색'방식을 장려하고 있다. 또한 운영체제의 셸, 파일 시스템과도 잘 통합되어 있다. 이런 특징 덕분에 데이터 분석 프로그래밍에서 많은 부분을 차지하는 데이터 탐색, 실험, 오류 판독, 반복 등을 IPython에서는 빠르게 처리할 수 있다. IPython 프..

Chapter 2 사례 소개

이 책은 데이터를 생산적으로 다루는 여러 가지 파이썬 도구를 사용하는 방법을 설명한다. 저마다 데이터를 처리하는 목적은 다르겠지만 대개는 다음과 같은 작업을 위해 사용할 것이다. 외부 자료 활용 : 여러 가지 파일 형식과 데이터베이스를 읽고 쓰는 작업데이터 준비 : 데이터 정비, 수집, 집계, 정규화, 개조, 분리, 분석을 위한 이터 변형데이터 변형 : 모아놓은 데이터에 수학적, 통계학적 연산을 적용해 새로운 데이터를 도출. 모델링과 계산 : 통계 모델, 기계 학습 알고리즘 또는 다른 계산 도구와 데이터 연결하기데이터 표현 : 정적 혹은 인터랙티브한 도식화 또는 원문 요약 2.1 bit.ly의 1.usa.gov 데이터 http://1usagov.measuredvoice.com/2012/ 에 가서 usag..

Chaper 1 시작하기 전에

1.1 이 책은?파이썬으로 데이터를 다루는 다양한 기본적인 방법을 소개. 1.2 왜 데이터 분석을 위한 파이썬인가? 파이썬은 스크립트 언어라고 한다. 이름 자체에 중요한 소프트웨어를 만드는 데는 사용하지 못한다는 의미를 함축한다. 과확계산 컴퓨팅 커뮤니티에서 사용된다. 1.2.1 접착제처럼 사용하는 파이썬 C, C++, 포트란 코드와의 통합이 쉽다. 프로그램은 실행 시간의 대부분을 차지하는 작은 부분의 코드와 실행 시간을 얼마 차지하지 않는 많은 양의 '글루 코드'로 이루어져 있다. 1.2.2 한 가지 언어만 사용 파이썬은 연구를 하거나 프로토 타입을 만드는 데 적합한 언어일 분만 아니라 실제 시스템을 개발하는 데도 적합하기에 갈수록 인기를 더하고 있다. 1.2.3 파이썬을 사용하면 안 되는 경우. 파이..