
0人評分過此書
本书重点介绍大数据分析的主要算法及主流计算框架,强调理实一体化的教学模式和方法。在讲解各种计算分析方法的同时,本书对核心技术配以相应的实训项目或案例,真正训练学生解决大数据问题的实践能力。本书内容包括:大数据计算分析技术概述、大数据计算分析常用算法及场景、大数据离线计算分析技术、大数据流式计算分析技术、机器学习在大数据计算分析中的应用。最后本书还以进出口管理风险评估大数据平台设计与实现为例,设置了综合前述知识的实战项目。本书可作为高等学校大数据、云计算、人工智能等相关专业教材,同时也适合希望深入了解大数据计算分析技术的开发人员学习使用。
-
第 1 章 大数据计算分析技术概述
-
1.1 大数据核心技术
-
1.1.1 分布式存储
-
1.1.2 分布式计算
-
-
1.2 大数据技术生态圈
-
1.3 数据分析与大数据分析
-
1.3.1 数据分析
-
1.3.2 大数据分析
-
1.3.3 大数据计算分析的价值
-
-
1.4 大数据计算框架
-
1.4.1 大数据计算框架分类
-
1.4.2 批处理框架
-
1.4.3 流式计算框架
-
1.4.4 内存计算框架
-
1.4.5 图计算框架
-
-
1.5 大数据计算分析平台
-
1.5.1 DANA Studio
-
1.5.2 MaxCompute
-
1.5.3 LeapHD
-
-
1.6 本章小结
-
1.7 课后作业
-
-
第 2 章 大数据计算分析常用算法及场景
-
2.1 分类
-
2.1.1 什么是分类
-
2.1.2 分类过程
-
2.1.3 典型分类算法
-
2.1.4 案例:海洋生物分类
-
-
2.2 聚类
-
2.2.1 什么是聚类
-
2.2.2 聚类过程
-
2.2.3 典型聚类算法
-
2.2.4 案例:鸢尾花分类
-
-
2.3 回归分析
-
2.3.1 什么是回归分析
-
2.3.2 回归分析分类
-
2.3.3 常用回归分析软件
-
2.3.4 案例:广告投入与产品销量预测
-
-
2.4 关联规则
-
2.4.1 什么是关联规则
-
2.4.2 关联规则挖掘过程
-
2.4.3 关联规则典型算法
-
2.4.4 案例:毒蘑菇的相似特征
-
-
2.5 Web 数据挖掘
-
2.5.1 什么是 Web 数据挖掘
-
2.5.2 Web 数据挖掘的类型及流程
-
2.5.3 典型 Web 数据挖掘技术
-
2.5.4 案例:支付中的交易欺诈侦测
-
-
2.6 本章小结
-
2.7 课后作业
-
-
第 3 章 大数据离线计算分析技术
-
3.1 MapReduce 计算模型
-
3.1.1 并行计算
-
3.1.2 分布式计算
-
3.1.3 MapReduce 计算框架
-
3.1.4 MapReduce 键值对和输入输出
-
3.1.5 MapReduce 工作流程
-
3.1.6 MapReduce 应用编程
-
-
3.2 交互式计算模式
-
3.2.1 交互式数据处理
-
3.2.2 Hive 在交互式计算中的应用
-
3.2.3 HBase 在交互式计算中的应用
-
3.2.4 Spark SQL 在交互式计算中的应用
-
3.2.5 Eagles 在交互式计算中的应用
-
-
3.3 图并行计算框架
-
3.3.1 图并行计算
-
3.3.2 图存储模式
-
3.3.3 图计算框架
-
3.3.4 Spark GraphX 框架及编程实例
-
-
3.4 大数据离线分析案例:Web 日志数据分析
-
3.4.1 需求描述
-
3.4.2 数据来源
-
3.4.3 数据处理
-
3.4.4 效果呈现
-
-
3.5 本章小结
-
3.6 课后作业
-
-
第 4 章 大数据流式计算分析技术
-
4.1 大数据流式计算概述
-
4.1.1 流式计算
-
4.1.2 分布式流计算
-
4.2 Storm 流式计算框架
-
4.2.1 Storm 流计算概述
-
4.2.2 Storm 流计算架构
-
4.2.3 Storm 工作机制
-
4.2.4 Storm 流计算编程案例
-
-
4.3 Spark Streaming 流计算框架
-
4.3.1 Spark 关键组件
-
4.3.2 Spark Streaming 数据流
-
4.3.3 Spark Streaming 工作原理
-
4.3.4 Spark Streaming 流计算编程模型
-
4.3.5 Spark Streaming 流计算编程案例
-
-
4.4 大数据内存计算框架
-
4.4.1 内存计算概述
-
4.4.2 内存计算中分布式缓存体系
-
4.4.3 内存数据库
-
4.4.4 Spark SQL 在内存计算中的应用
-
-
4.5 大数据流式计算应用案例:Storm 单词计数
-
4.5.1 功能描述
-
4.5.2 关键代码
-
4.5.3 RandomSentenceSpout 的实现及生命周期
-
4.5.4 SplitSentenceBolt 的实现及生命周期
-
4.5.5 WordCountBolt 的实现及生命周期
-
-
4.6 本章小结
-
4.7 课后作业
-
-
第 5 章 机器学习在大数据计算分析中的应用
-
5.1 机器学习概述
-
5.1.1 机器学习的定义
-
5.1.2 大数据与机器学习
-
5.1.3 人工智能、机器学习及深度学习
-
5.1.4 机器学习的类型
-
-
5.2 Spark MLlib 机器学习库
-
5.2.1 Spark MLBase 分布式机器学习系统
-
5.2.2 Spark MLlib 支持的机器学习算法
-
5.2.3 Spark MLlib 与 Spark ML Pipeline
-
5.2.4 使用 Spark MLlib 实现 K⁃means 聚类分析
-
-
5.3 TensorFlow 计算框架
-
5.3.1 TensorFlow 概述
-
5.3.2 TensorFlow 编程思想
-
5.3.3 TensorFlow 架构
-
5.3.4 基于 TensorFlow 的机器学习应用实例
-
-
5.4 本章小结
-
5.5 课后作业
-
-
第 6 章 项目实战——进出口管理风险评估大数据平台设计与实现
-
6.1 项目背景
-
6.2 进出口管理风险评估大数据平台需求分析
-
6.2.1 平台功能需求
-
6.2.2 平台开发软件需求
-
6.2.3 平台硬件环境需求
-
6.2.4 平台数据需求
-
-
6.3 进出口管理风险评估大数据平台设计及实现
-
6.3.1 基于 DANA 4.0 的大数据开发流程
-
6.3.2 进出口管理风险评估大数据平台的系统架构
-
6.3.3 进出口管理风险评估大数据平台的数据采集
-
6.3.4 进出口管理风险评估大数据平台的数据存储
-
6.3.5 进出口管理风险评估大数据平台的数据分析
-
6.3.6 进出口管理风险评估大数据平台的实现效果
-
-
6.4 本章小结
-
6.5 课后作业
-
- 参考文献
- 出版地 : 中國大陸
- 語言 : 簡體中文
評分與評論
請登入後再留言與評分