상세정보
아파치 스파크 입문 - 따라 하며 쉽게 익히는 스파크 SQL, 스트림처리, 머신러

아파치 스파크 입문 - 따라 하며 쉽게 익히는 스파크 SQL, 스트림처리, 머신러

저자
사루타 고스케 외 지음, 김진용 옮김, 시모가키 도루 감수
출판사
한빛미디어
출판일
2017-08-31
등록일
2017-10-23
파일포맷
PDF
파일크기
4MB
공급사
알라딘
지원기기
PC 프로그램 수동설치 뷰어프로그램 설치 안내
현황
  • 보유 1
  • 대출 0
  • 예약 0

책소개

★ 처음 만나는 스파크, 따라 하며 쉽게 완성하는 실전 입문서로 익히기!

스파크는 하둡 이후 빅데이터 엔지니어링 부문에서 주목받는 기술이다. 빠르고 배우기 쉬울 뿐 아니라 다양한 언어를 SDK로 지원하는 등의 장점에 힘입어, 국내에서도 각종 서비스에 도입되었다. 이 책은 이러한 스파크를 처음 접하는 개발자용 입문서다. 스파크의 특성과 동작 원리 등 기초 이론을 먼저 설명하고, 실제 활용 측면에서 데이터를 다루는 병렬분산처리 애플리케이션을 작성해본다. 독자의 이해를 돕는 그림과 도표가 풍부하게 실려 있고, 책에서 예제로 사용하는 샘플 코드도 함께 제공한다(일부 챕터는 2.0 기반 코드를 함께 제공).

김진용 역자는 이 책의 품질을 높이는 과정에서 수차례 어려움을 겪었다. 원서 초벌 번역이 끝나자마자 버전 이슈가 발생해 처음부터 다시 뜯어봐야만 했고, 구문분석이나 지리, 날씨 등 일본어에 특화된 내용과 샘플을 한국 실정에 맞게 하나씩 지역화하여 새로 만드는 과정도 절대 순탄치 않았다. 어언 20년 차에 접어드는 일본 생활의 영향으로 입에 밴 일본식 번역 투 문장 역시 순조로운 작업을 방해하는 걸림돌이었고 수 차례에 걸쳐 교정을 봐야 했다. 그 모든 역경을 이겨내고 마침내 세상의 빛을 볼 수 있게 된 책인 만큼 독자 여러분에게 부디 도움이 되었으면 하는 바람이다.

_주요 내용
- 1장: 스파크 탄생 배경과 특징, 활용사례 소개
- 2장: 스파크 병렬분산처리의 핵심 자료구조인 \'RDD\' 기반 모델 이해
- 3장: 스파크 작동을 위한 환경 구축(단일 머신(PC) 기반/ 클러스터 기반)
- 4장: 각종 라이브러리를 이용한 애플리케이션 빌드/ 실행 방법
- 5장: 3장에서 구축한 환경에서 실제 스파크를 돌려가며 기본적인 앱 작성
- 6장~8장: 스파크 병렬분산처리 엔진을 여러 용도에 응용하는 라이브러리 소개(스파크 SQL, 스파크 스트리밍, MLlib)


_대상 독자
- 스파크를 처음 배우는 데이터 엔지니어/데이터 과학자
- 자바, 파이썬, 스칼라 등 프로그래밍 언어 경험이 있는 개발자
- 하둡이나 기타 데이터베이스의 사용 경험이 있는 사람

QUICKSERVICE

TOP