
0人評分過此書
《大資料採擷》一書系統介紹了大資料採擷的概念、原理、技術和應用。包括:認識和理解大資料;大資料採擷需要的相關技術(大資料獲取技術、大資料存儲管理技術和大資料視覺化技術等);大資料計算框架;大資料採擷任務(關聯分析、聚類分析、分類分析、演變分析、特異群組分析和異常分析);大資料應用實現;以及大資料採擷工具。《大資料採擷》對大資料採擷技術進行了全面而細緻的定義和歸納,並將向讀者展現該領域最新研究熱點和技術。關於大資料應用實現章節的內容將採用作者實際主持和完成的大資料採擷項目為實際案例,闡述大資料採擷應用實現過
-
第1章 绪论
-
1.1 理解大数据挖掘
-
1.1.1 大数据挖掘的定义
-
1.1.2 大数据挖掘的任务
-
1.1.3 大数据挖掘的特点
-
1.1.4 大数据挖掘与相关技术的差异
-
-
1.2 大数据挖掘的相关技术
-
1.2.1 大数据获取
-
1.2.2 大数据存储与管理
-
1.2.3 大数据可视化
-
-
1.3 小结
-
参考文献
-
-
第2章 大数据计算框架
-
2.1 HDFS
-
2.2 MapReduce
-
2.2.1 MapReduce框架及范例
-
2.2.2 MapReduce存在的问题和解决方法
-
-
2.3 NoSQL(非关系型)数据库
-
2.3.1 NoSQL数据库的分类
-
2.3.2 NoSQL数据库实例
-
-
2.4 SQL(关系型)数据库
-
2.4.1 ApacheHIVE
-
2.4.2 其他SQL数据库
-
-
2.5 小结
-
参考文献
-
-
第3章 关联分析
-
3.1 关联分析的基本概念
-
3.1.1 关联分析的定义
-
3.1.2 关联规则的定义
-
3.1.3 关联规则的分类
-
-
3.2 关联规则挖掘的原理
-
3.2.1 挖掘简单关联规则
-
3.2.2 挖掘量化关联规则
-
3.2.3 挖掘多层关联规则
-
3.2.4 挖掘多维关联规则
-
-
3.3 关联规则挖掘的基础算法
-
3.3.1 Apriori算法
-
3.3.2 Apriori算法的优化
-
3.3.3 FP-Growth算法
-
3.3.4 序列模式挖掘算法
-
-
3.4 挖掘算法的进阶方法
-
3.4.1 USpan:高效用序列模式挖掘算法
-
3.4.2 HulsMaR:基于MapReduCC的序列模式挖掘算法
-
-
3.5 小结
-
参考文献
-
-
第4章 聚类分析
-
4.1 聚类分析的基本概念
-
4.1.1 簇与聚类
-
4.1.2 相似性度量和聚类原理
-
-
4.2 聚类分析的基础算法
-
4.1.1 层次的方法——单连接算法、BIRCH算法
-
4.2.2 划分的方法——κ-means和κ-medoids算法
-
4.2.3 基于密度的方法——OPTICS算法
-
-
4.3 聚类分析的进阶方法
-
4.3.1 DensityPeaks算法(AA算法)
-
4.3.2 κ-means:真基于MapReduce的κ-means算法
-
-
4.4 小结
-
参考文献
-
-
第5章 分类分析
-
5.1 分类分析的基本概念
-
5.2 分类模型
-
5.3 分类分析的原理
-
5.3.1 决策树
-
5.3.2 基于统计的方法
-
5.3.3 基于神经网络的方法
-
-
5.4 分类分析的基础算法
-
5.4.1 ID3和C4.5算法:基于决策树的分类算法
-
5.4.2 SLIQ:一种高速可伸缩的基于决策树的分类算法
-
5.4.3 后向传播算法BP算法:基于神经网络的分类算法
-
-
5.5 分类分析的进阶方法
-
5.6 小结
-
参考文献
-
-
第6章 异常分析
-
6.1 异常分析的基本概念
-
6.1.1 异常
-
6.1.2 异常分析
-
-
6.2 异常分析的原理
-
6.2.1 基于统计的异常分析方法
-
6.2.2 基于偏差的异常分析方法
-
6.2.3 基于距离的异常分析方法
-
6.2.4 基于密度的异常分析方法
-
-
6.3 异常分析的主要算法
-
6.3.1 基于距离的异常分析算法
-
6.3.2 基于密度的异常分析算法
-
-
6.4 小结
-
参考文献
-
-
第7章 特异群组挖掘
-
7.1 特异群组挖掘的基本概念
-
7.2 特异群组挖掘与聚类和异常检测的关系
-
7.3 特异群组挖掘形式化描述
-
7.4 特异群组挖掘框架算法
-
7.5 特异群组挖掘应用
-
7.6 小结
-
参考文献
-
-
第8章 演变分析
-
8.1 演变分析的基本概念
-
8.2 演变分析的原理
-
8.3 演变分析的基础算法
-
8.4 演变分析的进阶算法
-
8.4.1 时间序列随机偏移符号化表示算法
-
8.4.2 多维温度序列协同异常事件挖掘算法
-
-
8.5 小结
-
参考文献
-
-
第9章 异质数据网络挖掘
-
9.1 异质数据网络
-
9.2 异质数据网络挖掘研究现状
-
9.3 数据网络上的相似性度量的研究
-
9.4 异质数据网络挖掘研究内容
-
9.5 小结
-
参考文献
-
-
第10章 大数据挖掘应用之推薦系统
-
10.1 推薦系统研究阶段
-
10.2 推薦系统算法
-
10.2.1 推薦系统定义
-
10.2.2 推薦算法分类
-
10.2.3 比较与分析
-
-
10.3 推薦系统的评测
-
10.4 小结
-
参考文献
-
-
第11章 大数据中的隐私问题
-
11.1 隐私的重要性
-
11.2 隐私保护技术
-
11.2.1 直接攻击的应对方法
-
11.2.2 间接攻击的应对方法
-
-
11.3 小结
-
参考文献
-
評分與評論
請登入後再留言與評分