상세정보
하둡 완벽 가이드 - 데이터의 숨겨진 힘을 끌어내는 최고의 클라우드 컴퓨팅 기술, 4판

하둡 완벽 가이드 - 데이터의 숨겨진 힘을 끌어내는 최고의 클라우드 컴퓨팅 기술, 4판

저자
톰 화이트 지음, 임상배 외 옮김
출판사
한빛미디어
출판일
2017-02-28
등록일
2017-08-17
파일포맷
PDF
파일크기
14MB
공급사
알라딘
지원기기
PC 프로그램 수동설치 뷰어프로그램 설치 안내
현황
  • 보유 1
  • 대출 0
  • 예약 0

책소개

★ 곁에 두고 찾아보는 하둡 최고의 바이블 개정 4판 전격 출간!
하둡 프로젝트의 커미터이자 핵심 설계자인 톰 화이트가 집필한 이 책은 하둡 창시자인 더그 커팅을 비롯한 프로젝트별 전문가의 강력한 조언이 충실하게 반영되어 오랫동안 하둡 개발자의 바이블로서 자리를 지켜왔다.

이번 4판에서는 하둡 2.0 기반 YARN, 파케이, 플룸, 크런치, 스파크 프로젝트 예제와 헬스케어 시스템과 유전체 분석 사례가 새로이 추가되었다. 최신 하둡 정보는 물론이고 하둡과 연동하는 아파치 하둡 프로젝트의 서브 프로젝트인 피그, 주키퍼, HBase, 하이브, 스쿱, 에이브 등에 대해서도 다루기 때문에 하둡에 대한 전반적인 지식을 얻을 수 있다. 이 책은 대규모 데이터셋을 분석하는 개발자와 하둡 클러스터를 구축하고 사용하는 시스템 관리자를 위한 최고의 지침서다.

★ 개정4판에서 새로워진 내용
4판은 하둡 2 버전만을 다룬다. 하둡 2 버전은 현재 가장 활발히 개선되고 있으며 가장 안정된 하둡 버전이다. YARN(4장), 파케이(13장), 플룸(14장), 크런치(18장), 스파크(19장)를 다루는 새로운 장이 추가되었다. 이 책을 읽는 다양한 순서를 독자들에게 알려주는 절도 포함되었다. 또한 새로운 두 가지 사례 연구를 포함한다. 첫 번째는 헬스케어 시스템에서 하둡을 사용하기(22장), 두 번째는 하둡으로 유전체 데이터를 처리하기(23장)다. 하둡 최신 버전과 관련 프로젝트를 반영하고자 기존 내용에 많은 수정을 가해 개선했다.

★ 대상 독자
- 시스템 관리자
- 클라우드 컴퓨팅 분야의 학자, 개발자, 기술 기획자
- 데이터 마이닝 등 데이터 분석 및 알고리즘 학자, 개발자

★ 이 책에서 다루는 기술
- 맵리듀스, HDFS, YARN
- 애플리케이션 개발
- 피크, 하이브, 크런치, 스파크
- 분산 데이터베이스 HBase
- 분산 설정 서비스 주키퍼
- 하둡 클러스터 관리 및 설정
- 에이브로로 데이터 직렬화하기
- 파케이로 중첩 데이터 처리하기
- 플룸으로 데이터 수집하기
- 스쿱으로 데이터 일괄 전송하기

QUICKSERVICE

TOP