0人評分過此書
本書用於Hadoop+Spark快速上手,全面解析Hadoop和Spark生態系統,通過原理解說和實例操作每一個元件,讓讀者能夠輕鬆跨入大資料分析與開發的大門。 全書共12章,大致分為3個部分,第1部分(第1~7章)講解Hadoop的原生態組件,包括Hadoop、ZooKeeper、HBase、Hive環境搭建與安裝,以及介紹MapReduce、HDFS、ZooKeeper、HBase、Hive原理和Apache版本環境下實戰操作。第2部分(第8~11章)講解Spark的原生態組件,包括Spark Core、Spark SQL、Spark Streaming、DataFrame,以及介紹Scala、Spark API、Spark SQL、Spark Streaming、DataFrame原理和CDH版本環境下實戰操作,其中Flume和Kafka屬於Apache頂級開源項目也放在本篇講解。第3部分(第12章)講解兩個大資料項目目,包絡網頁日誌離線專案和即時專案,在CDH版本環境下通過這兩個專案將Hadoop和Spark原生態元件進行整合,一步步帶領讀者學習和實戰操作。 本書適合想要快速掌握大資料技術的初學者,也適合作為高等院校和培訓機構相關專業師生的教學參考書和實驗用書。
- 出版地 : 中國大陸
- 語言 : 簡體中文
評分與評論
請登入後再留言與評分