
0人評分過此書
進擊的資料科學:Python與R的應用實作
內容簡介:從如何獲取、掌控、探索、預測與溝通資料認識現代資料科學應用您已經具備Python或R語言基礎程式設計能力,卻不曉得該如何應用所學來撰寫網頁爬蟲、連結資料庫、清理資料、資料視覺化或者機器學習嗎?這是為您量身打造的一本進階應用書,您將在本書找到用Python和R語言實踐前述這些迷人資料科學應用場景的實作範例!●用語平易近人、淺顯易讀●有效提升就學、研究與求職的即戰力●適合閱讀本書的讀者:已經能嫻熟使用Python或R語言基本程式設計的使用者、想學習Python或R語言資料科學應用的使用者
-
Chapter 1 資料科學的前世今生
-
1-1 橫空出世的職業
-
1-2 資料科學家的日常
-
-
Part 1:如何獲取資料
-
Chapter 2 載入常見檔案格式
-
2-1 文字編輯器
-
2-2 檔案:CSV
-
2-3 如何載入 CSV 檔案
-
2-4 檔案:TXT
-
2-5 如何載入 TXT 檔案
-
2-6 檔案:試算表
-
2-7 如何載入 Excel 試算表檔案
-
2-8 檔案:JSON
-
2-9 如何載入 JSON 檔案
-
-
Chapter 3 向資料庫查詢
-
3-1 如何啟動 Amazon Web Service 的 MySQL
-
3-2 如何建立資料:MySQL
-
3-3 如何讀取資料:MySQL
-
3-4 如何啟動 Google Cloud Platform 的 BigQuery
-
3-5 如何建立資料:BigQuery
-
3-6 如何讀取資料:BigQuery
-
3-7 如何啟動 Google Firebase
-
3-8 如何建立資料:Firebase
-
3-9 如何讀取資料:Firebase
-
-
Chapter 4 靜態擷取網頁內容
-
4-1 如何定位網頁資料
-
4-2 安裝 Selector Gadget
-
4-3 使用 Selector Gadget
-
4-4 安裝 XPath Helper
-
4-5 使用 XPath Helper
-
4-6 擷取網頁內容
-
-
Chapter 5 動態擷取網頁內容
-
5-1 修飾擷取電影資訊的函數
-
5-2 遭遇到的問題
-
5-3 什麼是 Selenium
-
5-4 下載瀏覽器
-
5-5 安裝 Selenium
-
5-6 盤點手動操控的動作順序
-
5-7 盤點要使用到的方法
-
5-8 擷取多部電影資訊的函數
-
-
-
Part 2:如何掌控資料
-
Chapter 6 認識常見的資料結構
-
6-1 陣列
-
6-2 向量、矩陣與張量
-
6-3 資料框
-
6-4 清單
-
-
Chapter 7 基礎資料框操作技巧
-
7-1 建立
-
7-2 檢視
-
7-3 篩選
-
7-4 選擇
-
7-5 排序
-
7-6 新增變數
-
7-7 新增觀測值
-
7-8 摘要
-
7-9 分組
-
-
Chapter 8 進階資料框操作技巧
-
8-1 調整變數的型別
-
8-2 對文字變數重新編碼
-
8-3 對數字重新歸類分組為文字變數
-
8-4 處理遺漏值
-
8-5 處理時間序列
-
8-6 轉置資料框
-
8-7 聯結資料框
-
-
Chapter 9 關於文字
-
9-1 建立
-
9-2 量測長度
-
9-3 調整大小寫
-
9-4 去除多餘空格
-
9-5 格式化輸出
-
9-6 擷取部份文字
-
9-7 轉換為日期時間格式
-
9-8 根據特徵分隔
-
9-9 判斷特徵存在與否及存在之位置
-
9-10 根據特徵取代
-
9-11 正規表達特徵
-
9-12 應用文字處理函數至陣列上
-
-
-
Part 3:如何探索資料
-
Chapter 10 基礎視覺化
-
10-1 視覺化的基本單位速記
-
10-2 一組文字資料的相異觀測值數量
-
10-3 一組數值資料依類別分組摘要排序
-
10-4 一組數值資料的分佈
-
10-5 一組數值資料依類別分組的分佈
-
10-6 兩組數值資料的相關
-
10-7 數值資料隨著日期時間的變動趨勢
-
-
Chapter 11 視覺化中的元件
-
11-1 調整畫布的佈景主題
-
11-2 加入圖標題與軸標籤
-
11-3 加入註釋
-
11-4 調整座標軸
-
11-5 加入與調整圖例
-
11-6 在一個畫布上繪製多個子圖形
-
-
Chapter 12 其他視覺化類型
-
12-1 一組文字資料的相異觀測值數量
-
12-2 一組數值資料依類別分組摘要排序
-
12-3 一組數值資料的分佈
-
12-4 一組數值資料依類別分組的分佈
-
12-5 多組數值資料的相關
-
12-6 證券的 OHLC 趨勢
-
12-7 數值資料依地理資訊的摘要
-
-
-
Part 4:如何預測資料
-
Chapter 13 尋找迴歸模型的係數
-
13-1 關於迴歸模型
-
13-2 學習資料集
-
13-3 什麼是訓練、驗證與測試資料
-
13-4 單變數的迴歸模型
-
13-5 尋找係數的任務
-
13-6 正規方程
-
13-7 梯度遞減
-
13-8 使用模組或套件尋找係數
-
13-9 將模型繪製到散佈圖上
-
-
Chapter 14 迴歸模型的評估
-
14-1 標準化(Normalization)
-
14-2 評估迴歸模型的表現
-
14-3 精進評估
-
14-4 交叉驗證
-
14-5 正規化(Regularization)
-
-
Chapter 15 尋找羅吉斯迴歸的係數
-
15-1 關於分類模型
-
15-2 學習資料集
-
15-3 Sigmoid 函數
-
15-4 羅吉斯迴歸的成本函數
-
15-5 尋找羅吉斯迴歸的係數
-
15-6 Step 函數
-
15-7 使用模組與套件尋找係數
-
15-8 在散佈圖繪製決策邊界
-
-
Chapter 16 分類模型的評估
-
16-1 學習資料集
-
16-2 混淆矩陣
-
16-3 建立非線性決策邊界
-
16-4 正規化(Regularization)
-
16-5 多元分類
-
-
-
Part 5:如何溝通資料
-
Chapter 17 互動式圖表及 R 語言
-
17-1 Hans Rosling、Gapminder 與 Factfulness
-
17-2 瀏覽最終成品
-
17-3 關於 Plotly 與 Shiny
-
17-4 繪製 Plotly 氣泡圖
-
17-5 加入時間軸滑桿篩選年份
-
17-6 加入複選框清單篩選洲別
-
17-7 部署 Shiny 網頁應用程式
-
-
Chapter 18 互動式圖表及 Python
-
18-1 瀏覽最終成品
-
18-2 關於 Plotly 與 Dash
-
18-3 取得 Gapminder 資料
-
18-4 安裝 Dash
-
18-5 Dash 網頁應用程式的組成
-
18-6 繪製氣泡圖
-
18-7 加入時間軸滑桿篩選年份
-
18-8 加入複選框清單或下拉式選單篩選洲別
-
18-9 部署 Dash 網頁應用程式
-
-
- 出版地 : 臺灣
- 語言 : 繁體中文
評分與評論
請登入後再留言與評分