
0人評分過此書
熱門資料科學與機器學習演算法學習指南
本書介紹並說明資料科學領域常見且重要的機器學習演算法,這些演算法可用於監督式與非監督學習、強化學習與半監督式學習。書中所討論的演算法包括線性迴歸、logistic迴歸、SVM、樸素貝氏、k-means、隨機森林、TensorFlow與特徵工程。
你將會學到如何使用這些演算法來解決問題,以及它們的工作原理。同時也會介紹自然語言處理與推薦系統,以協助同時執行多種演算法。
最後將會知道如何挑選正確的機器學習演算法,來為你的問題進行分群、分類或迴歸。
你將學會:
• 熟悉機器學習的重要元素
• 瞭解特徵選擇與特徵工程流程
• 平衡線性迴歸的效能與誤差
• 建立資料模型,與使用各種類型的演算法來瞭解它的工作方式
• 微調SVM的參數
• 實作資料集的群聚
• 探索自然語言處理與推薦系統的概念
• 從零開始建立機器學習架構
本書介紹並說明資料科學領域常見且重要的機器學習演算法,這些演算法可用於監督式與非監督學習、強化學習與半監督式學習。書中所討論的演算法包括線性迴歸、logistic迴歸、SVM、樸素貝氏、k-means、隨機森林、TensorFlow與特徵工程。
你將會學到如何使用這些演算法來解決問題,以及它們的工作原理。同時也會介紹自然語言處理與推薦系統,以協助同時執行多種演算法。
最後將會知道如何挑選正確的機器學習演算法,來為你的問題進行分群、分類或迴歸。
你將學會:
• 熟悉機器學習的重要元素
• 瞭解特徵選擇與特徵工程流程
• 平衡線性迴歸的效能與誤差
• 建立資料模型,與使用各種類型的演算法來瞭解它的工作方式
• 微調SVM的參數
• 實作資料集的群聚
• 探索自然語言處理與推薦系統的概念
• 從零開始建立機器學習架構
- 前言
-
第1章 機器學習簡介
-
簡介—傳統與自我調整機器
-
學習才是最重要的
-
監督式學習
-
非監督式學習
-
強化學習
-
-
超越機器學習—深度學習與受生物啟發的自我調整系統
-
資料學習與大數據
-
進階讀物
-
總結
-
-
第2章 機器學習的重要元素
-
資料格式
-
多類別策略
-
-
可學習性
-
欠擬與過擬
-
誤差測量
-
PAC學習
-
-
統計學習方法
-
MAP學習
-
最大似然學習
-
-
資訊理論元素
-
參考文獻
-
總結
-
-
第3章 特徵選擇與特徵工程
-
scikit-learn玩具資料集
-
建立訓練與測試集合
-
管理分類資料
-
管理遺漏的特徵
-
資料縮放與標準化
-
選擇特徵與過濾
-
主成分分析
-
非負矩陣分解
-
稀疏PCA
-
核PCA
-
-
原子擷取與字典學習
-
參考文獻
-
總結
-
-
第4章 線性迴歸
-
線性模型
-
二維範例
-
使用scikit-learn與較高維度來做線性迴歸
-
迴歸分析運算式
-
-
Ridge、Lasso與ElasticNet
-
使用隨機抽樣一致法的穩健迴歸
-
多項式迴歸
-
保序迴歸
-
參考文獻
-
總結
-
-
第5章 Logistic迴歸
-
線性分類
-
Logistic迴歸
-
實作與最佳化
-
隨機梯度下降演算法
-
使用格點搜尋來找出最佳超參數
-
分類度量
-
ROC曲線
-
總結
-
-
第6章 樸素貝氏
-
貝氏定理
-
樸素貝氏分類器
-
scikit-learn的樸素貝氏
-
白努力樸素貝氏
-
多項式樸素貝氏
-
高斯樸素貝氏
-
-
參考文獻
-
總結
-
-
第7章 支援向量機
-
線性支援向量機
-
scikit-learn實作
-
線性分類
-
核式分類
-
非線性範例
-
-
受控支援向量機
-
支援向量迴歸
-
參考文獻
-
總結
-
-
第8章 決策樹與整體學習
-
二元決策樹
-
二元決策
-
不純度度量
-
特徵重要性
-
-
使用scikit-learn來做決策樹分類
-
整體學習
-
隨機森林
-
AdaBoost
-
梯度樹提升
-
投票分類器
-
-
參考文獻
-
總結
-
-
第9章 分群基礎
-
分群基本概念
-
K-means
-
DBSCAN
-
譜分群
-
-
採用地真來評價方法
-
同質性
-
完整性
-
調整蘭德指數
-
-
參考文獻
-
總結
-
-
第10章 階層式分群
-
階層式策略
-
聚合式分群
-
樹狀圖
-
scikit-learn的聚合式分群
-
連接限制
-
-
參考文獻
-
總結
-
-
第11章 推薦系統簡介
-
以使用者為基礎的稚嫩系統
-
以scikit-learn來實作以使用者為基礎的系統
-
-
以內容為基礎的系統
-
無模型(或基於記憶)的協同過濾
-
模型式協同過濾
-
奇異值分解法
-
交錯最小平方法
-
使用ApacheSparkMLlib做交錯最小平方法
-
-
參考文獻
-
總結
-
-
第12章 自然語言處理簡介
-
NLTK與內建的語料庫
-
語料庫範例
-
-
詞袋策略
-
基元化
-
移除剔除字
-
詞幹分析
-
向量化
-
-
採用Reuters語料庫的樣本文字分類器
-
參考文獻
-
總結
-
-
第13章 NLP的主題建模與情緒分析
-
主題建模
-
潛在語義分析
-
機率性潛在語義分析
-
潛在狄利克雷分配
-
-
情緒分析
-
使用NLTK來做VADER情緒分析
-
-
參考文獻
-
總結
-
-
第14章 深度學習與TensorFlow簡介
-
深度學習簡介
-
人工神經網路
-
深度架構
-
-
TensorFlow簡介
-
計算梯度
-
Logistic迴歸
-
使用多層感知器來分類
-
影像摺積
-
-
Keras簡介
-
參考文獻
-
總結
-
-
第15章 建立機器學習架構
-
機器學習架構
-
資料收集
-
正規化
-
降維
-
資訊擴充
-
資料轉換
-
建模/格點搜尋/交叉驗證
-
視覺化
-
-
用於機器學習架構的scikit-learn工具
-
管道
-
特徵聯集
-
-
參考文獻
-
總結
-
- 索引
評分與評論
請登入後再留言與評分