
0人評分過此書
巨量資料時代來臨,
你需要最新、最實用、功能最強的資料分析工具─R語言
R是一套自由免費的軟體,具有入門容易、使用簡單之特色,目前多應用於機器學習、資料探勘、文字探勘、統計分析及巨量資料分析等領域。
本書第1至5章先介紹R的基本操作及應用,包括認識R語言特性、資料讀取及寫入方式,接著介紹R的繪圖功能及相關套件之運用;第6至9章介紹各類學習演算法,如:決策樹、K平均算法、基因演算法等,每一章節都加入範例供讀者即時練習;第10至12章介紹關聯性規則、社群網路分析、文字探勘及圖形化資料分析工具等內容,將R軟體在資料分析上的使用作更完整的補充,對於沒有程式設計經驗的讀者來說,本書是入門的最佳選擇;第13章及14章加入巨量資料分析介紹,讀者可先了解Hadoop基本原理並充分結合R與Hadoop之功能;讀者亦可了解Spark基本原理並充分學習SparkR之功能,進而導引讀者進入巨量資料分析的殿堂;第15章加入SparkR應用,讀者可瞭解如何應用SparkR。
本書特色
1. 各章節皆附範例實作,幫助初學者從做中學,增加練習機會,同時培養自行撰寫程式之能力。
2. 附錄加入R、RStudio、Hadoop及Spark軟體的下載及安裝步驟,指令清楚、操作容易,讓讀者輕鬆完成安裝。
你需要最新、最實用、功能最強的資料分析工具─R語言
R是一套自由免費的軟體,具有入門容易、使用簡單之特色,目前多應用於機器學習、資料探勘、文字探勘、統計分析及巨量資料分析等領域。
本書第1至5章先介紹R的基本操作及應用,包括認識R語言特性、資料讀取及寫入方式,接著介紹R的繪圖功能及相關套件之運用;第6至9章介紹各類學習演算法,如:決策樹、K平均算法、基因演算法等,每一章節都加入範例供讀者即時練習;第10至12章介紹關聯性規則、社群網路分析、文字探勘及圖形化資料分析工具等內容,將R軟體在資料分析上的使用作更完整的補充,對於沒有程式設計經驗的讀者來說,本書是入門的最佳選擇;第13章及14章加入巨量資料分析介紹,讀者可先了解Hadoop基本原理並充分結合R與Hadoop之功能;讀者亦可了解Spark基本原理並充分學習SparkR之功能,進而導引讀者進入巨量資料分析的殿堂;第15章加入SparkR應用,讀者可瞭解如何應用SparkR。
本書特色
1. 各章節皆附範例實作,幫助初學者從做中學,增加練習機會,同時培養自行撰寫程式之能力。
2. 附錄加入R、RStudio、Hadoop及Spark軟體的下載及安裝步驟,指令清楚、操作容易,讓讀者輕鬆完成安裝。
-
CHAPTER 01 簡介
-
1.1 開始使用R 軟體
-
1.2 R 物件
-
1.2.1 向量
-
1.2.2 陣列
-
1.2.3 矩陣
-
1.2.4 資料框架
-
1.2.5 因子
-
1.2.6 列表
-
1.2.7 物件轉換
-
-
-
CHAPTER 02 資料的讀取與寫入
-
2.1 資料讀取
-
2.2 資料寫入與資料集
-
2.3 RData 格式資料之寫入與讀取
-
2.4 讀取SQL Srver 資料庫資料
-
2.5 讀取Excel 資料
-
-
CHAPTER 03 流程控制及自訂函數
-
3.1 條件執行
-
3.2 迴圈控制
-
3.3 自訂函數
-
-
CHAPTER 04 繪圖功能及基本統計
-
4.1 高階繪圖
-
4.2 低階繪圖
-
4.3 互動式繪圖
-
4.4 圖形參數
-
4.5 基本統計
-
-
CHAPTER 05 相關套件介紹
-
5.1 機器學習
-
5.2 資料探勘
-
5.3 社群網路分析及文字探勘
-
5.4 巨量資料分析
-
5.5 套件介紹
-
-
CHAPTER 06 監督式學習
-
6.1 決策樹
-
6.2 支持向量機器
-
6.3 人工神經網路
-
6.4 組合方法
-
6.4.1 隨機森林
-
6.4.2 推進法
-
-
CHAPTER 07 非監督式學習
-
7.1 階層式分群法
-
7.2 K平均算法
-
7.3 模糊C平均算法
-
7.4 分群指標
-
-
CHAPTER 08 演化式學習
-
8.1 基因演算法
-
8.2 人工蜂群演算法
-
-
CHAPTER 09 混合式學習
-
9.1 使用C50 及ABCoptim 套件範例
-
9.2 使用基因演算法來調整人工神經網路參數範例
-
-
CHAPTER 10 關聯性規則
-
10.1 關聯性規則簡介
-
10.2 Apriori 演算法
-
-
CHAPTER 11 社群網路分析及文字探勘
-
11.1 社群網路分析
-
11.2 文字探勘
-
-
CHAPTER 12 圖形化資料分析工具
-
12.1 匯入資料
-
12.1.1 處理資料集
-
12.1.2 設定變數
-
-
12.2 探索及檢定資料
-
12.3 轉換資料
-
12.4 建立、評估及匯出模型
-
-
CHAPTER 13 巨量資料分析(R+Hadoop)
-
13.1 Hadoop 簡介
-
13.2 R+Hadoop
-
-
CHAPTER 14 SparkR巨量資料分析
-
14.1 Dplyr 資料處理套件
-
14.2 SparkR 資料處理
-
14.3 SparkR 與SQL Server
-
14.4 SparkR 與Cassandra
-
14.5 Spark Standalone模式
-
14.6 SparkR 資料分析
-
-
CHAPTER 15 SparkR應用
-
15.1 SparkR應用於氣溫預測
-
15.2 SparkR應用於先分群後分類
-
-
APPENDIX 附錄
-
A.下載及安裝 R
-
B.安裝RStudio Desktop
-
C.安裝ODBC
-
D.指令及用法
-
E.安裝R+Hadoop於虛擬機上
-
F.安裝SparkR於虛擬機上
-
- 參考文獻
- 出版地 : 臺灣
- 語言 : 繁體中文
評分與評論
請登入後再留言與評分