0人評分過此書

大数据分析与应用实战:统计机器学习之数据导向编程

出版日期
2021/04/01
閱讀格式
EPUB
書籍分類
學科分類
ISBN
9787302575337

本館館藏

借閱規則
當前可使用人數 30
借閱天數 14
線上看 0
借閱中 0
選擇分享方式

推薦本館採購書籍

您可以將喜歡的電子書推薦給圖書館,圖書館會參考讀者意見進行採購

讀者資料
圖書館
* 姓名
* 身分
系所
* E-mail
※ 我們會寄送一份副本至您填寫的Email中
電話
※ 電話格式為 區碼+電話號碼(ex. 0229235151)/ 手機格式為 0900111111
* 請輸入驗證碼
本书特色:(1)文字说明、源代码与运行结果穿插呈现,结合理论知识与实践经验。 (2)凸显第四代与第三代程序语言不同之处,掌握数据驱动程序设计的特点。 (3)左手用R,右手用Python,厚植追随**数据科学家的实力。 (4)配套资源丰富,来自各行业的数据处理与分析案例、R/Python对比的源代码、完整的教学课件。 (5)深入浅出地介绍统计机器学习理论与实务,做中学、学中做,迈向术道兼修的境界。 凝聚数据挖掘、机器学习等多学科的领悟R 与 Python兼修,配套课件、案例、源代码简单直白的叙述,带领读者认识数据分析与数据科学程序,通过案例代入练习,帮助读者快速建立数据科学的重要概念。 ——东吴大学巨量资料管理学院院长许晋雄博士学者的研究主题多半固定在某些范围内,很少人能像邹教授一样,醉心追求人工智能的*新趋势、数学分析方法及软件,让相关技术落地生根。 ——明志科技大学机械工程系特聘教授兼工程学院院长梁晶炜博士邹教授结合自己多年来的研究经验和体会,深入浅出地介绍了机器学习基础及各种统计学习方式下的数据分析方法,对高校学生及相关领域科技工作者有很好的启发。 ——南京理工大学教授博导、江苏省应用统计学会秘书长程龙生博士来自不同领域的资料处理与分析范例,同时掌握资料分析两大主流工具 —— R 与 Python,深入浅出地介绍统计机器学习理论与实务。
  • 封面页
  • 书名页
  • 版权页
  • 内容简介
  • 作者简介
  • 推荐序1
  • 推荐序2
  • 推荐序3
  • 前言
  • 目录
  • 第1章 数据驱动程序设计
    • 1.1 套件管理
      • 1.1.1 基本套件
      • 1.1.2 建议套件
      • 1.1.3 贡献套件
    • 1.2 环境与辅助说明
    • 1.3 R语言数据对象
      • 1.3.1 向量
      • 1.3.2 矩阵
      • 1.3.3 数组
      • 1.3.4 列表
      • 1.3.5 数据集
      • 1.3.6 因子
      • 1.3.7 R语言原生数据对象取值
      • 1.3.8 R语言衍生数据对象
    • 1.4 Python语言数据对象
      • 1.4.1 Python语言原生数据对象处理
      • 1.4.2 Python语言衍生数据对象取值
      • 1.4.3 Python语言类别变量编码
    • 1.5 向量化与隐式循环
    • 1.6 编程范式与面向对象概念
      • 1.6.1 R语言S3类别
      • 1.6.2 Python语言面向对象
    • 1.7 控制流程与自定义函数
      • 1.7.1 控制流程
      • 1.7.2 自定义函数
    • 1.8 数据导入与导出
      • 1.8.1 R语言数据导入及导出
      • 1.8.2 Python语言数据导入及导出
    • 1.9 程序调试与效率监测
  • 第2章 数据前处理
    • 2.1 数据管理
      • 2.1.1 R语言数据组织与排序
      • 2.1.2 Python语言数据排序
      • 2.1.3 R语言数据变形
      • 2.1.4 Python语言数据变形
      • 2.1.5 R语言数据清理
      • 2.1.6 Python语言数据清理
    • 2.2 数据摘要与汇总
      • 2.2.1 摘要统计量
      • 2.2.2 R语言群组与摘要
      • 2.2.3 Python语言群组与摘要
    • 2.3 特征工程
      • 2.3.1 特征转换与移除
      • 2.3.2 特征提取的主成分分析
      • 2.3.3 特征选择
      • 2.3.4 结语
    • 2.4 大数据处理概念
      • 2.4.1 文本数据处理
      • 2.4.2 Hadoop分布式文件系统
      • 2.4.3 Spark集群计算框架
  • 第3章 统计机器学习基础
    • 3.1 随机误差模型
      • 3.1.1 统计机器学习类型
      • 3.1.2 过度拟合
    • 3.2 模型性能评量
      • 3.2.1 回归模型性能指标
      • 3.2.2 分类模型性能指标
      • 3.2.3 模型性能可视化
    • 3.3 模型选择与评定
      • 3.3.1 重抽样与数据分割方法
      • 3.3.2 单类模型参数调校
      • 3.3.3 比较不同类的模型
    • 3.4 相似性与距离
    • 3.5 相关与独立
      • 3.5.1 数值变量与顺序尺度类别变量
      • 3.5.2 名目尺度类别变量
      • 3.5.3 类别变量可视化关联检验
  • 第4章 无监督式学习
    • 4.1 数据可视化
    • 4.2 关联形态挖掘
      • 4.2.1 关联形态评估准则
      • 4.2.2 在线音乐城关联规则分析
      • 4.2.3 结语
    • 4.3 聚类分析
      • 4.3.1 k均值聚类法
      • 4.3.2 阶层式聚类
      • 4.3.3 密度聚类
      • 4.3.4 聚类结果评估
      • 4.3.5 结语
  • 第5章 监督式学习
    • 5.1 线性回归与分类
      • 5.1.1 多元线性回归
      • 5.1.2 偏最小二乘法回归
      • 5.1.3 岭回归、套索回归与弹性网罩惩罚模型
      • 5.1.4 线性判别分析
      • 5.1.5 逻辑回归分类与广义线性模型
    • 5.2 非线性分类与回归
      • 5.2.1 朴素贝叶斯分类
      • 5.2.2 k近邻法分类
      • 5.2.3 支持向量机分类
      • 5.2.4 分类与回归树
  • 第6章 其他学习方式
    • 6.1 集成学习
      • 6.1.1 拔靴集成法
      • 6.1.2 多模激发法
      • 6.1.3 随机森林
      • 6.1.4 结语
    • 6.2 深度学习
      • 6.2.1 人工神经网络简介
      • 6.2.2 多层感知机
      • 6.2.3 卷积神经网络
      • 6.2.4 递归神经网络
      • 6.2.5 自动编码器
      • 6.2.6 受限玻尔兹曼机
      • 6.2.7 深度信念网络
      • 6.2.8 深度学习参数调校
    • 6.3 强化学习
  • 参考文献
  • 索引

評分與評論

請登入後再留言與評分
幫助
您好,請問需要甚麼幫助呢?
使用指南

客服專線:0800-000-747

服務時間:週一至週五 AM 09:00~PM 06:00

loading