
0人評分過此書
Python数据分析与大数据处理从入门到精通
本书主要讲解数据分析与大数据处理所需的技术、基础设施、核心概念、实施流程。从编程语言准备、数据采集与清洗、数据分析与可视化,到大型数据的分布式存储与分布式计算,贯穿了整个大数据项目开发流程。
- 封面
- 版权
- 目录
- 前言 Preface
-
第1篇 Python程序设计
-
第1章 Python入门
-
1.1 Python概述
-
1.2 搭建Python开发环境
-
1.3 Python开发工具介绍
-
1.4 Python软件包的管理
-
1.5 实训:编写“Hello World”
-
本章小结
-
-
第2章 Python基础
-
2.1 变量
-
2.2 标识符
-
2.3 代码组织
-
2.4 输入与输出
-
2.5 运算符与优先级
-
2.6 新手问答
-
2.7 实训:设计一个简易计算器
-
本章小结
-
-
第3章 数据类型与流程控制
-
3.1 数字类型
-
3.2 字符串类型
-
3.3 集合类型
-
3.4 流程控制语句
-
3.5 新手问答
-
3.6 实训:设计算法,输出乘法表
-
本章小结
-
-
第4章 函数、模块、包
-
4.1 自定义函数
-
4.2 函数参数
-
4.3 函数式编程
-
4.4 模块与包
-
4.5 新手问答
-
4.6 实训:设计算法,对列表进行排序
-
本章小结
-
-
第5章 面向对象的程序设计
-
5.1 面向对象
-
5.2 自定义类
-
5.3 属性
-
5.4 方法
-
5.5 类的继承
-
5.6 可调用对象
-
5.7 不可变对象
-
5.8 新手问答
-
5.9 实训:设计算法,构造一棵二叉树
-
本章小结
-
-
第6章 高级主题
-
6.1 生成器
-
6.2 迭代器
-
6.3 异步处理
-
6.4 错误、调试
-
6.5 新手问答
-
6.6 实训:使用多进程技术统计数据并汇总
-
本章小结
-
-
-
第2篇 数据采集与数据清洗
-
第7章网络数据采集
-
7.1 HTTP请求概述
-
7.2 XPath网页解析
-
7.3 Scrapy数据采集入门
-
7.4 Scrapy应对反爬虫程序
-
7.5 CrawlSpider类
-
7.6 分布式爬虫
-
7.7 新手问答
-
7.8 实训:构建百度云音乐爬虫
-
本章小结
-
-
第8章 数据清洗
-
8.1 数据清洗的意义
-
8.2 数据清洗的内容
-
8.3 数据格式与存储类型
-
8.4 数据清洗的步骤
-
8.5 数据清洗的工具
-
8.6 新手问答
-
8.7 实训:清洗百度云音乐数据并储存到CSV
-
本章小结
-
-
-
第3篇 数据分析与可视化
-
第9章 NumPy数值计算
-
9.1 NumPy基础
-
9.2 形状操作
-
9.3 副本、浅拷贝和深拷贝
-
9.4 高级索引
-
9.5 排序统计
-
9.6 新手问答
-
9.7 实训:销售额统计
-
本章小结
-
-
第10章 Matplotlib可视化
-
10.1 图形的基本要素
-
10.2 绘图基础
-
10.3 设置样式
-
10.4 图形样例
-
10.5 新手问答
-
10.6 实训:营业数据可视化
-
本章小结
-
-
第11章 Pandas统计分析
-
11.1 Pandas数据结构
-
11.2 基础功能
-
11.3 统计分析
-
11.4 时间数据
-
11.5 数据整理
-
11.6 高级功能
-
11.7 读写MySQL数据库
-
11.8 新手问答
-
11.9 实训:成绩分析
-
本章小结
-
-
第12章 Seaborn可视化
-
12.1 Seaborn概述
-
12.2 可视化数据关系
-
12.3 根据数据分类绘图
-
12.4 单变量与双变量
-
12.5 线性关系
-
12.6 新手问答
-
12.7 实训:成绩分析可视化
-
本章小结
-
-
-
第4篇 大数据存储与快速分析篇
-
第13章 Hadoop数据存储与基本操作
-
13.1 Hadoop概述
-
13.2 Hadoop数据存储与任务调度原理
-
13.3 Hadoop基础环境搭建
-
13.4 Hadoop部署模式
-
13.5 Hadoop常用操作命令
-
13.6 新手问答
-
13.7 实训:动手搭建Hadoop集群环境
-
本章小结
-
-
第14章 Spark入门
-
14.1 Spark概述
-
14.2 Spark核心原理
-
14.3 Spark基础环境搭建
-
14.4 Spark运行模式
-
14.5 新手问答
-
14.6 实训:动手搭建Spark集群
-
本章小结
-
-
第15章 Spark RDD编程
-
15.1 RDD设计原理
-
15.2 RDD编程
-
15.3 键值对RDD
-
15.4 文件读写
-
15.5 编程进阶
-
15.6 新手问答
-
15.7 实训:统计海鲜销售情况
-
本章小结
-
-
第16章 Spark SQL编程
-
16.1 Spark SQL概述
-
16.2 创建DataFrame对象
-
16.3 DataFrame常用API
-
16.4 保存DataFrame
-
16.5 新手问答
-
16.6 实训:统计手机销售情况
-
本章小结
-
-
第17章Spark流式计算编程
-
17.1 流计算简介
-
17.2 Discretized Stream
-
17.3 Structured Streaming
-
17.4 新手问答
-
17.5 实训:实时统计贷款金额
-
本章小结
-
-
-
第5篇 项目实战篇
-
第18章 分析电商网站销售数据
-
18.1 目标分析
-
18.2 数据采集
-
18.3 数据分析
-
本章小结
-
-
第19章 分析旅游网站数据
-
19.1 目标分析
-
19.2 数据采集
-
19.3 数据分析
-
本章小结
-
-
第20章 分析在售二手房数据
-
20.1 目标分析
-
20.2 数据采集
-
20.3 数据分析
-
本章小结
-
-
- 附录:Python常见面试题精选
- 主要参考文献
- 出版地 : 中國大陸
- 語言 : 簡體中文
評分與評論
請登入後再留言與評分