상세정보
Think Stats :프로그래머를 위한 통계 및 데이터 분석 방법

Think Stats :프로그래머를 위한 통계 및 데이터 분석 방법

저자
앨런 B. 다우니 지음, 김석우 옮김
출판사
한빛미디어
출판일
2015-05-11
등록일
2018-01-03
파일포맷
PDF
파일크기
6MB
공급사
알라딘
지원기기
PC 프로그램 수동설치 뷰어프로그램 설치 안내
현황
  • 보유 1
  • 대출 0
  • 예약 0

책소개

데이터 사이언티스트를 꿈꾸는 프로그래머를 위한 통계 및 확률 입문서\n이 책은 통계와 확률을 학습하는 데 어려움을 겪고 있는 개발자들에게 데이터를 분석하는 데 필요한 통계적 이론을 개발자의 관점에서 쉽게 설명해 준다. 과거, 통계학 입문 서적은 복잡한 수식을 통한 이론 설명에 집중하여 개발자가 쉽게 접근할 수 없었다. 이에 반해, 이 책은 복잡한 수식을 배제하고 파이썬 코드를 이용해 개발자적인 관점에서 이론 부분을 설명함으로써, 개발자들도 복잡한 통계 이론을 쉽게 이해할 수 있도록 돕는다. 물론 통계 전문 용어를 그대로 사용하기 때문에, 초반에는 개발자들이 조금 어렵고 낯설게 느낄 수도 있다. 하지만 매 장 부록마다 해당 장에서 다룬 통계 전문 용어를 설명해 주고 있어서, 큰 문제가 되지는 않을 것이라 확신한다.\n \n이 책은 확률과 통계 입문 수업을 위한 새로운 종류의 교과서로, 크기가 큰 데이터 세트를 분석하는 데 통계를 어떻게 사용하는지에 초점을 맞췄다. 이 책은 또한 컴퓨터를 이용한 접근 방식을 취하는데, 여기에는 다음과 같은 장점이 있다.\n \n프로그램을 작성해 봄으로써 자신이 이해한 부분을 발전시켜 보고 검증해 볼 수 있다. 예를 들어, 최소제곱법, 잔차, 그리고 결정계수를 계산하는 함수를 작성할 수 있다. 코드를 작성하고 검증하기 위해서는 이와 관련된 개념을 이해해야 하며, 잘못 이해하고 있었던 부분은 무조건 바로 잡아야 한다.\n독자는 통계학적 거동을 검증하기 위해 실험을 해 볼 수 있다. 예를 들어, 몇몇 분포에서 샘플(표본)을 생성해 보면서 중심극한정리를 탐구해 볼 수 있다. 파레토 분포에서 생성한 변수의 합이 정규로 수렴하지 않는 것을 보면서는 CLT의 기본 가정을 기억하게 된다.\n시뮬레이션을 통해 수학적으로 이해하기 힘든 개념을 쉽게 이해할 수 있다. 예를 들어, 몬테카를로 시뮬레이션으로 p-value의 근사치를 계산함으로써 p-value의 의미를 더 잘 이해할 수 있다. \n이산 분포와 컴퓨터를 이용한 계산을 통해 베이지안 추정 같은, 입문 수업에서 다루기 힘든 주제를 논할 수 있다. 예를 들어 \'독일 탱크 문제\'와 관련하여 사후 분포를 계산해 보라고 한다면? 이 문제는 수리적 또는 해석학적으로는 풀기 어렵지만 컴퓨터로 계산하면 놀라울 정도로 쉽게 답을 구할 수 있다.\n파이썬 같은 범용 프로그래밍 언어를 사용하기 때문에 어떤 종류의 데이터든 대부분 불러올 수 있다. 특정 통계 툴에 맞게 포맷 변경과 정제 작업을 거친 데이터도 아무 제약 없이 사용할 수 있다.\n이 책은 프로젝트 중심으로 구성했다. 실제 강의에서 필자는 학생들에게 한 학기 동안 통계적 문제 해결 방식이 필요한 프로젝트를 주고, 그에 알맞은 데이터를 찾게 하였다. 여러분은 여러 통계적 기술을 데이터에 직접 적용해 봄으로써 데이터에 대해 배울 수 있다.

QUICKSERVICE

TOP