
0人評分過此書
本书以Python语言为基础,介绍利用Python进行数据科学研究与商业分析的全貌。其核心的设计理念是通过经典的商业应用案例对数据爬取、数据存储、数据清洗、数据建模的核心Python模块做相应的介绍。
- 版权信息
- 序1 最年长的Python学习者
- 序2 Python教学的新模式
- 前言
-
第1章 基于Python的数据科学环境搭建
-
1.1 Python是数据科学“大势所趋”
-
1.2 Anaconda入门——工欲善其事,必先利其器
-
1.2.1 Anaconda功能简介
-
1.2.2 Anaconda的下载和安装
-
1.2.3 Navigator和Prompt的选择
-
1.2.4 Conda的使用
-
-
1.3 Jupyter Notebook入门
-
1.3.1 Jupyter Notebook——“程序猿”里的“散文家”
-
1.3.2 Jupyter Notebook的优势
-
1.3.3 Jupyter Notebook的界面
-
1.3.4 Jupyter Notebook的基本使用
-
-
1.4 Markdown单元格的使用
-
1.4.1 入门简介
-
1.4.2 基础语法
-
1.4.3 扩展语法
-
-
1.5 Spyder入门
-
1.5.1 Spyder——Python编程的“热带雨林”
-
1.5.2 Spyder的特点
-
1.5.3 Spyder的用户界面组件
-
1.5.4 Spyder的核心构建块
-
-
1.6 小结
-
-
第2章 Python基础
-
2.1 “火锅团购数据”简介
-
2.2 读写数据
-
2.2.1 文件管理
-
2.2.2 读入火锅团购数据
-
2.2.3 利用open()函数读写文件
-
-
2.3 Python数据类型与结构
-
2.3.1 基本数据类型
-
2.3.2 基本数据结构
-
-
2.4 控制流、函数与模块
-
2.4.1 控制流
-
2.4.2 函数
-
2.4.3 模块
-
-
2.5 面向对象编程的基本概念
-
2.5.1 类的基本定义和使用
-
2.5.2 对象
-
2.5.3 继承
-
2.5.4 方法重写
-
-
2.6 Numpy简介
-
2.6.1 Numpy数组对象
-
2.6.2 数据读入
-
2.6.3 数据去重
-
2.6.4 基本索引方式
-
2.6.5 利用Numpy进行统计分析
-
-
2.7 小结
-
-
第3章 Python的数据处理模块
-
3.1 初级篇——相遇Pandas
-
3.1.1 读入数据——数据分析的“米”
-
3.1.2 检查重复——重复的东西咱不要
-
3.1.3 判断表达式——更Pythonic
-
3.1.4 检查缺失——要命的缺失
-
3.1.5 切片函数——最“笨”的办法
-
3.1.6 描述性统计——一个函数搞定
-
3.1.7 其他——实用的小操作
-
-
3.2 进阶篇——相识Pandas
-
3.2.1 apply()——为你私人定制的函数
-
3.2.2 分组与聚合——速度与优雅兼具
-
3.2.3 时间序列——跨不过的坎
-
3.2.4 合并——Pandas和SQL完美结合
-
-
3.3 小结
-
-
第4章 Python的绘图模块
-
4.1 为什么需要数据可视化
-
4.2 初级篇——Matplotlib基础
-
4.2.1 画布——绘图的画板
-
4.2.2 配置——更个性化的绘图
-
4.2.3 散点图、线图
-
4.2.4 绘制箱线图
-
4.2.5 绘制柱状图
-
4.2.6 绘制饼图、直方图
-
-
4.3 高级篇——Plotly基础
-
4.3.1 开始之前——理解Plotly
-
4.3.2 绘制散点图、线图
-
4.3.3 绘制箱线图
-
4.3.4 绘制柱状图(多子图)
-
4.3.5 绘制饼图、直方图
-
-
4.4 小结
-
-
第5章 Python的统计建模模块
-
5.1 Statsmodels简介
-
5.2 数据接入
-
5.3 统计模型参数估计
-
5.3.1 用Patsy描述统计模型
-
5.3.2 模型中分类变量的处理
-
5.3.3 拟合线性回归模型
-
-
5.4 统计假设检验
-
5.4.1 问题提出
-
5.4.2 一元单因素方差分析
-
5.4.3 一元多因素方差分析
-
-
5.5 探索分析
-
5.5.1 箱线图
-
5.5.2 相关图
-
5.5.3 拟合图
-
5.5.4 回归图
-
-
5.6 小结
-
-
第6章 Python的机器学习模块
-
6.1 机器学习的定义
-
6.2 使用scikit-learn
-
6.2.1 数据准备
-
6.2.2 模型选择
-
6.2.3 模型训练
-
6.2.4 模型评估
-
6.2.5 模型调参
-
6.2.6 模型结果
-
6.2.7 模型保存与加载
-
-
6.3 小结
-
-
第7章 Python的爬虫模块
-
7.1 爬虫的定义
-
7.2 初级篇——单页面静态爬虫
-
7.2.1 入门——一级页面采集
-
7.2.2 进阶——二级页面采集
-
-
7.3 中级篇——多页面静态爬虫
-
7.3.1 入门——单分类多页面采集
-
7.3.2 进阶——多分类多页面采集
-
7.3.3 高级——多线程采集
-
-
7.4 高级篇——爬虫的伪装
-
7.4.1 入门——伪装请求头
-
7.4.2 进阶——IP池
-
7.4.3 其他
-
-
7.5 终级篇——动态爬虫
-
7.5.1 入门——区分静态和动态数据
-
7.5.2 进阶——采集动态数据
-
-
7.6 爬虫注意事项
-
7.7 小结
-
-
第8章 Python的文本分析模块
-
8.1 准备:理解文本分析流程
-
8.1.1 分词
-
8.1.2 特征提取
-
-
8.2 实战
-
8.2.1 数据准备
-
8.2.2 分词
-
8.2.3 统计词频
-
8.2.4 词云
-
8.2.5 提取feature
-
8.2.6 用sklearn进行训练
-
-
8.3 小结
-
-
第9章 Python的数据库模块
-
9.1 为什么需要数据库
-
9.2 初级篇——SQLAlchemy的基本使用
-
9.2.1 连接数据库
-
9.2.2 创建数据表
-
9.2.3 增加数据
-
9.2.4 查看数据
-
9.2.5 修改数据
-
9.2.6 删除数据
-
-
9.3 高级篇
-
9.3.1 构建表关系
-
9.3.2 Pandas读取SQL
-
-
9.4 小结
-
-
第10章 第10章精品案例——火锅团购分析
-
10.1 背景介绍
-
10.1.1 化零为整——从零散的模块学习到完整的案例分析
-
10.1.2 案例背景
-
-
10.2 数据描述
-
10.2.1 数据说明
-
10.2.2 可视化描述
-
-
10.3 建模分析
-
10.3.1 建模结果及模型解读
-
10.3.2 模型对比分析及结论
-
-
10.4 小结
-
- 出版地 : 中國大陸
- 語言 : 簡體中文
評分與評論
請登入後再留言與評分