0人評分過此書

从零开始学Python数据分析与挖掘

出版日期
2018/10/01
閱讀格式
EPUB
書籍分類
學科分類
ISBN
9787302509875

本館館藏

借閱規則
當前可使用人數 30
借閱天數 14
線上看 0
借閱中 0
選擇分享方式

推薦本館採購書籍

您可以將喜歡的電子書推薦給圖書館,圖書館會參考讀者意見進行採購

讀者資料
圖書館
* 姓名
* 身分
系所
* E-mail
※ 我們會寄送一份副本至您填寫的Email中
電話
※ 電話格式為 區碼+電話號碼(ex. 0229235151)/ 手機格式為 0900111111
* 請輸入驗證碼
本書以Python 3版本作為數據分析與挖掘實戰的應用工具,從Pyhton的基礎語法開始,陸續介紹有關數值計算的Numpy、數據處理的Pandas、數據可視化的Matplotlib和數據挖掘的Sklearn等內容。全書共涵蓋15種可視化圖形以及10個常用的數據挖掘算法和實戰項目,通過本書的學習,讀者可以掌握數據分析與挖掘的理論知識和實戰技能。 本書適於統計學、數學、經濟學、金融學、管理學以及相關理工科專業的本科生、研究生使用,也能夠提高從事數據諮詢、研究或分析等人士的專業水平和技能。
  • 封面页
  • 书名页
  • 版权页
  • 作者简介
  • 内容简介
  • 前言
  • 目录
  • 第1章 数据分析与挖掘概述
    • 1.1 什么是数据分析和挖掘
    • 1.2 数据分析与挖掘的应用领域
      • 1.2.1 电商领域——发现破坏规则的“害群之马”
      • 1.2.2 交通出行领域——为打车平台进行私人订制
      • 1.2.3 医疗健康领域——找到最佳医疗方案
    • 1.3 数据分析与挖掘的区别
    • 1.4 数据挖掘的流程
      • 1.4.1 明确目标
      • 1.4.2 数据搜集
      • 1.4.3 数据清洗
      • 1.4.4 构建模型
      • 1.4.5 模型评估
      • 1.4.6 应用部署
    • 1.5 常用的数据分析与挖掘工具
    • 1.6 本章小结
  • 第2章 从收入的预测分析开始
    • 2.1 下载与安装Anoconda
      • 2.1.1 基于Windows系统安装
      • 2.1.2 基于Mac系统安装
      • 2.1.3 基于Linux系统安装
    • 2.2 基于Python的案例实战
      • 2.2.1 数据的预处理
      • 2.2.2 数据的探索性分析
      • 2.2.3 数据建模
    • 2.3 本章小结
  • 第3章 Python快速入门
    • 3.1 数据结构及方法
      • 3.1.1 列表
      • 3.1.2 元组
      • 3.1.3 字典
    • 3.2 控制流
      • 3.2.1 if分支
      • 3.2.2 for循环
      • 3.2.3 while循环
    • 3.3 字符串处理方法
      • 3.3.1 字符串的常用方法
      • 3.3.2 正则表达式
    • 3.4 自定义函数
      • 3.4.1 自定义函数语法
      • 3.4.2 自定义函数的几种参数
    • 3.5 一个爬虫案例
    • 3.6 本章小结
  • 第4章 Python数值计算工具——Numpy
    • 4.1 数组的创建与操作
      • 4.1.1 数组的创建
      • 4.1.2 数组元素的获取
      • 4.1.3 数组的常用属性
      • 4.1.4 数组的形状处理
    • 4.2 数组的基本运算符
      • 4.2.1 四则运算
      • 4.2.2 比较运算
      • 4.2.3 广播运算
    • 4.3 常用的数学和统计函数
    • 4.4 线性代数的相关计算
      • 4.4.1 矩阵乘法
      • 4.4.2 diag函数的使用
      • 4.4.3 特征根与特征向量
      • 4.4.4 多元线性回归模型的解
      • 4.4.5 多元一次方程组的求解
      • 4.4.6 范数的计算
    • 4.5 伪随机数的生成
    • 4.6 本章小结
  • 第5章 Python数据处理工具——Pandas
    • 5.1 序列与数据框的构造
      • 5.1.1 构造序列
      • 5.1.2 构造数据框
    • 5.2 外部数据的读取
      • 5.2.1 文本文件的读取
      • 5.2.2 电子表格的读取
      • 5.2.3 数据库数据的读取
    • 5.3 数据类型转换及描述统计
    • 5.4 字符与日期数据的处理
    • 5.5 常用的数据清洗方法
      • 5.5.1 重复观测处理
      • 5.5.2 缺失值处理
      • 5.5.3 异常值处理
    • 5.6 数据子集的获取
    • 5.7 透视表功能
    • 5.8 表之间的合并与连接
    • 5.9 分组聚合操作
    • 5.10 本章小结
  • 第6章 Python数据可视化
    • 6.1 离散型变量的可视化
      • 6.1.1 饼图
      • 6.1.2 条形图
    • 6.2 数值型变量的可视化
      • 6.2.1 直方图与核密度曲线
      • 6.2.2 箱线图
      • 6.2.3 小提琴图
      • 6.2.4 折线图
    • 6.3 关系型数据的可视化
      • 6.3.1 散点图
      • 6.3.2 气泡图
      • 6.3.3 热力图
    • 6.4 多个图形的合并
    • 6.5 本章小结
  • 第7章 线性回归预测模型
    • 7.1 一元线性回归模型
    • 7.2 多元线性回归模型
      • 7.2.1 回归模型的参数求解
      • 7.2.2 回归模型的预测
    • 7.3 回归模型的假设检验
      • 7.3.1 模型的显著性检验——F检验
      • 7.3.2 回归系数的显著性检验——t检验
    • 7.4 回归模型的诊断
      • 7.4.1 正态性检验
      • 7.4.2 多重共线性检验
      • 7.4.3 线性相关性检验
      • 7.4.4 异常值检验
      • 7.4.5 独立性检验
      • 7.4.6 方差齐性检验
    • 7.5 本章小结
  • 第8章 岭回归与LASSO回归模型
    • 8.1 岭回归模型
      • 8.1.1 参数求解
      • 8.1.2 系数求解的几何意义
    • 8.2 岭回归模型的应用
      • 8.2.1 可视化方法确定λ值
      • 8.2.2 交叉验证法确定λ值
      • 8.2.3 模型的预测
    • 8.3 LASSO回归模型
      • 8.3.1 参数求解
      • 8.3.2 系数求解的几何意义
    • 8.4 LASSO回归模型的应用
      • 8.4.1 可视化方法确定λ值
      • 8.4.2 交叉验证法确定λ值
      • 8.4.3 模型的预测
    • 8.5 本章小结
  • 第9章 Logistic回归分类模型
    • 9.1 Logistic模型的构建
      • 9.1.1 Logistic模型的参数求解
      • 9.1.2 Logistic模型的参数解释
    • 9.2 分类模型的评估方法
      • 9.2.1 混淆矩阵
      • 9.2.2 ROC曲线
      • 9.2.3 K-S曲线
    • 9.3 Logistic回归模型的应用
      • 9.3.1 模型的构建
      • 9.3.2 模型的预测
      • 9.3.3 模型的评估
    • 9.4 本章小结
  • 第10章 决策树与随机森林
    • 10.1 节点字段的选择
      • 10.1.1 信息增益
      • 10.1.2 信息增益率
      • 10.1.3 基尼指数
    • 10.2 决策树的剪枝
      • 10.2.1 误差降低剪枝法
      • 10.2.2 悲观剪枝法
      • 10.2.3 代价复杂度剪枝法
    • 10.3 随机森林
    • 10.4 决策树与随机森林的应用
      • 10.4.1 分类问题的解决
      • 10.4.2 预测问题的解决
    • 10.5 本章小结
  • 第11章 KNN模型的应用
    • 11.1 KNN算法的思想
    • 11.2 最佳k值的选择
    • 11.3 相似度的度量方法
      • 11.3.1 欧式距离
      • 11.3.2 曼哈顿距离
      • 11.3.3 余弦相似度
      • 11.3.4 杰卡德相似系数
    • 11.4 近邻样本的搜寻方法
      • 11.4.1 KD树搜寻法
      • 11.4.2 球树搜寻法
    • 11.5 KNN模型的应用
      • 11.5.1 分类问题的解决
      • 11.5.2 预测问题的解决
    • 11.6 本章小结
  • 第12章 朴素贝叶斯模型
    • 12.1 朴素贝叶斯理论基础
    • 12.2 几种贝叶斯模型
      • 12.2.1 高斯贝叶斯分类器
      • 12.2.2 高斯贝叶斯分类器的应用
      • 12.2.3 多项式贝叶斯分类器
      • 12.2.4 多项式贝叶斯分类器的应用
      • 12.2.5 伯努利贝叶斯分类器
      • 12.2.6 伯努利贝叶斯分类器的应用
    • 12.3 本章小结
  • 第13章 SVM模型的应用
    • 13.1 SVM简介
      • 13.1.1 距离公式的介绍
      • 13.1.2 SVM的实现思想
    • 13.2 几种常见的SVM模型
      • 13.2.1 线性可分的SVM
      • 13.2.2 一个手动计算的案例
      • 13.2.3 近似线性可分SVM
      • 13.2.4 非线性可分SVM
      • 13.2.5 几种常用的SVM核函数
      • 13.2.6 SVM的回归预测
    • 13.3 分类问题的解决
    • 13.4 预测问题的解决
    • 13.5 本章小结
  • 第14章 GBDT模型的应用
    • 14.1 提升树算法
      • 14.1.1 AdaBoost算法的损失函数
      • 14.1.2 AdaBoost算法的操作步骤
      • 14.1.3 AdaBoost算法的简单例子
      • 14.1.4 AdaBoost算法的应用
    • 14.2 梯度提升树算法
      • 14.2.1 GBDT算法的操作步骤
      • 14.2.2 GBDT分类算法
      • 14.2.3 GBDT回归算法
      • 14.2.4 GBDT算法的应用
    • 14.3 非平衡数据的处理
    • 14.4 XGBoost算法
      • 14.4.1 XGBoost算法的损失函数
      • 14.4.2 损失函数的演变
      • 14.4.3 XGBoost算法的应用
    • 14.5 本章小结
  • 第15章 Kmeans聚类分析
    • 15.1 Kmeans聚类
      • 15.1.1 Kmeans的思想
      • 15.1.2 Kmeans的原理
    • 15.2 最佳k值的确定
      • 15.2.1 拐点法
      • 15.2.2 轮廓系数法
      • 15.2.3 间隔统计量法
    • 15.3 Kmeans聚类的应用
      • 15.3.1 iris数据集的聚类
      • 15.3.2 NBA球员数据集的聚类
    • 15.4 Kmeans聚类的注意事项
    • 15.5 本章小结
  • 第16章 DBSCAN与层次聚类分析
    • 16.1 密度聚类简介
      • 16.1.1 密度聚类相关的概念
      • 16.1.2 密度聚类的步骤
    • 16.2 密度聚类与Kmeans的比较
    • 16.3 层次聚类
      • 16.3.1 簇间的距离度量
      • 16.3.2 层次聚类的步骤
      • 16.3.3 三种层次聚类的比较
    • 16.4 密度聚类与层次聚类的应用
    • 16.5 本章小结
  • 出版地 中國大陸
  • 語言 簡體中文

評分與評論

請登入後再留言與評分
幫助
您好,請問需要甚麼幫助呢?
使用指南

客服專線:0800-000-747

服務時間:週一至週五 AM 09:00~PM 06:00

loading