0人評分過此書

Hadoop+Spark生态系统操作与实战指南

作者
出版日期
2017/09/01
閱讀格式
EPUB
書籍分類
學科分類
ISBN
9787302479673

本館館藏

借閱規則
當前可使用人數 30
借閱天數 14
線上看 0
借閱中 0
選擇分享方式

推薦本館採購書籍

您可以將喜歡的電子書推薦給圖書館,圖書館會參考讀者意見進行採購

讀者資料
圖書館
* 姓名
* 身分
系所
* E-mail
※ 我們會寄送一份副本至您填寫的Email中
電話
※ 電話格式為 區碼+電話號碼(ex. 0229235151)/ 手機格式為 0900111111
* 請輸入驗證碼
本書用於Hadoop+Spark快速上手,全面解析Hadoop和Spark生態系統,通過原理解說和實例操作每一個元件,讓讀者能夠輕鬆跨入大資料分析與開發的大門。 全書共12章,大致分為3個部分,第1部分(第1~7章)講解Hadoop的原生態組件,包括Hadoop、ZooKeeper、HBase、Hive環境搭建與安裝,以及介紹MapReduce、HDFS、ZooKeeper、HBase、Hive原理和Apache版本環境下實戰操作。第2部分(第8~11章)講解Spark的原生態組件,包括Spark Core、Spark SQL、Spark Streaming、DataFrame,以及介紹Scala、Spark API、Spark SQL、Spark Streaming、DataFrame原理和CDH版本環境下實戰操作,其中Flume和Kafka屬於Apache頂級開源項目也放在本篇講解。第3部分(第12章)講解兩個大資料項目目,包絡網頁日誌離線專案和即時專案,在CDH版本環境下通過這兩個專案將Hadoop和Spark原生態元件進行整合,一步步帶領讀者學習和實戰操作。 本書適合想要快速掌握大資料技術的初學者,也適合作為高等院校和培訓機構相關專業師生的教學參考書和實驗用書。
  • 封面页
  • 书名页
  • 版权页
  • 内容简介
  • 推荐序
  • 前言
  • 目录
  • 第1章 ◄Hadoop概述►
    • 1.1 Hadoop简介
    • 1.2 Hadoop版本和生态系统
    • 1.3 MapReduce简介
    • 1.4 HDFS简介
    • 1.5 Eclipse+Java开发环境搭建
      • 1.5.1 Java安装
      • 1.5.2 Maven安装
      • 1.5.3 Eclipse安装和配置
      • 1.5.4 Eclipse创建Maven项目
      • 1.5.5 Eclipse其余配置
    • 1.6 小结
  • 第2章 ◄Hadoop集群搭建►
    • 2.1 虚拟机简介
    • 2.2 虚拟机配置
    • 2.3 Linux系统设置
    • 2.4 Apache版本Hadoop集群搭建
    • 2.5 CDH版本Hadoop集群搭建
      • 2.5.1 安装前期准备
      • 2.5.2 Cloudera Manager安装
      • 2.5.3 CDH安装
    • 2.6 小结
  • 第3章 ◄Hadoop基础与原理►
    • 3.1 MapReduce原理介绍
      • 3.1.1 MapReduce的框架介绍
      • 3.1.2 MapReduce的执行步骤
    • 3.2 HDFS原理介绍
      • 3.2.1 HDFS是什么
      • 3.2.2 HDFS架构介绍
    • 3.3 HDFS实战
      • 3.3.1 HDFS客户端的操作
      • 3.3.2 Java操作HDFS
    • 3.4 YARN原理介绍
    • 3.5 小结
  • 第4章 ◄ZooKeeper实战►
    • 4.1 ZooKeeper原理介绍
      • 4.1.1 ZooKeeper基本概念
      • 4.1.2 ZooKeeper工作原理
      • 4.1.3 ZooKeeper工作流程
    • 4.2 ZooKeeper安装
    • 4.3 ZooKeeper实战
      • 4.3.1 ZooKeeper客户端的操作
      • 4.3.2 Java操作ZooKeeper
      • 4.3.3 Scala操作ZooKeeper
    • 4.4 小结
  • 第5章 ◄MapReduce实战►
    • 5.1 前期准备
    • 5.2 查看YARN上的任务
    • 5.3 加载配置文件
    • 5.4 MapReduce实战
    • 5.5 小结
  • 第6章 ◄HBase实战►
    • 6.1 HBase简介及架构
    • 6.2 HBase安装
    • 6.3 HBase实战
      • 6.3.1 HBase客户端的操作
      • 6.3.2 Java操作HBase
      • 6.3.3 Scala操作HBase
    • 6.4 小结
  • 第7章 ◄Hive实战►
    • 7.1 Hive介绍和架构
    • 7.2 Hive数据类型和表结构
    • 7.3 Hive分区、桶与倾斜
    • 7.4 Hive安装
    • 7.5 Hive实战
      • 7.5.1 Hive客户端的操作
      • 7.5.2 Hive常用命令
      • 7.5.3 Java操作Hive
    • 7.6 小结
  • 第8章 ◄Scala实战►
    • 8.1 Scala简介与安装
    • 8.2 IntelliJ IDEA开发环境搭建
      • 8.2.1 IntelliJ IDEA简介
      • 8.2.2 IntelliJ IDEA安装
      • 8.2.3 软件配置
    • 8.3 IntelliJ IDEA建立Maven项目
    • 8.4 基础语法
    • 8.5 函数
    • 8.6 控制语句
    • 8.7 函数式编程
    • 8.8 模式匹配
    • 8.9 类和对象
    • 8.10 Scala异常处理
    • 8.11 Trait(特征)
    • 8.12 Scala文件I/O
    • 8.13 作业
      • 8.13.1 九九乘法表
      • 8.13.2 冒泡排序
      • 8.13.3 设计模式Command
      • 8.13.4 集合对称判断
      • 8.13.5 综合题
    • 8.14 小结
  • 第9章 ◄Flume实战►
    • 9.1 Flume概述
    • 9.2 Flume的结构
    • 9.3 Flume安装
    • 9.4 Flume实战
    • 9.5 小结
  • 第10章 ◄Kafka实战►
    • 10.1 Kafka概述
      • 10.1.1 简介
      • 10.1.2 使用场景
    • 10.2 Kafka设计原理
    • 10.3 Kafka主要配置
    • 10.4 Kafka客户端操作
    • 10.5 Java操作Kafka
      • 10.5.1 生产者
      • 10.5.2 消费者
    • 10.6 Flume连接Kafka
    • 10.7 小结
  • 第11章 ◄Spark实战►
    • 11.1 Spark概述
    • 11.2 Spark基本概念
    • 11.3 Spark算子实战及功能描述
      • 11.3.1 Value型Transformation算子
      • 11.3.2 Key-Value型Transformation算子
      • 11.3.3 Actions算子
    • 11.4 Spark Streaming实战
    • 11.5 Spark SQL和DataFrame实战
    • 11.6 小结
  • 第12章 ◄大数据网站日志分析项目►
    • 12.1 项目介绍
    • 12.2 网站离线项目
      • 12.2.1 业务框架图
      • 12.2.2 子服务“趋势分析”详解
      • 12.2.3 表格的设计
      • 12.2.4 提前准备
      • 12.2.5 项目步骤
    • 12.3 网站实时项目
      • 12.3.1 业务框架图
      • 12.3.2 子服务“当前在线”详解
      • 12.3.3 表格的设计
      • 12.3.4 提前准备
      • 12.3.5 项目步骤
    • 12.4 小结
  • 出版地 中國大陸
  • 語言 簡體中文

評分與評論

請登入後再留言與評分
幫助
您好,請問需要甚麼幫助呢?
使用指南

客服專線:0800-000-747

服務時間:週一至週五 AM 09:00~PM 06:00

loading