Hadoop：從雲端到大數據完整Ecosystem全介紹


	本書系統介紹Hadoop 2.0生態圈的核心和擴展元件，包括：管理工具Ambari、分散式檔案系統HDFS、分散式資源管理器YARN、分散式平行處理MapReduce、記憶體型計算架構Spark、資料流程即時處理系統Storm、分散式鎖服務ZooKeeper、分散式資料庫HBase、資料倉儲工具Hive，以及Pig、Oozie、Flume、Mahout等。　　適合：運用雲端運算和大數據相關企業，或相關人員。


	目錄前言 01大數據元件概述 1.1 Google 大數據元件 1.2 Apache 大數據元件 02大數據叢集 2.1 大數據叢集簡介 2.2 大數據叢集bigCstor 2.3 我的大數據叢集littleCstor 2.4 小結 03叢集管理工具Ambari 3.1 Ambari 簡介 3.2 使用Ambari 部署HDP 3.3 使用Ambari 架設littleCstor 3.4 使用Ambari 管理littleCstor 3.5 小結 04分散式檔案系統HDFS 4.1 分散式儲存引例 4.2 HDFS 簡介 4.3 HDFS 介面 4.4 實戰HDFS Shell 4.5 實戰WebHDFS 4.6 實戰HDFS JAVA API 4.7 實戰HDFS 大專案：用HDFS 儲存巨量視訊資料 05分散式資源管理員YARN 5.1 分散式資源管理員引例 5.2 YARN 簡介 5.3 YARN 介面 5.4 實戰YARN Shell 5.5 實戰YARN 程式設計 5.6 實戰YARN 程式設計之DistributedShell 5.7 實戰YARN 程式設計之三大範式 06分散式平行處理MapReduce 6.1 平行化範式M-S-R 引例 6.2 MapReduce 簡介 6.3 MapReduce 介面 6.4 實戰MapReduce Shell 6.5 實戰MapReduce 程式設計 6.6 實戰MapReduce 程式設計之WordCount 6.7 實戰MapReduce 程式設計之SecondarySort 6.8 實戰MapReduce 程式設計之倒排索引 6.9 實戰MapReduce 之效能最佳化 07分散式鎖服務ZooKeeper 7.1 ZooKeeper 簡介 7.2 ZooKeeper 介面 7.3 實戰ZooKeeper 程式設計 7.4 實戰ZooKeeper 之處理程序通訊 7.5 實戰ZooKeeper 之處理程序排程系統 7.6 實戰ZooKeeper 之實現NameNode 自動切換 08分散式資料庫HBase 8.1 HBase 簡介 8.2 HBase 介面 8.3 實戰HBase Shell 8.4 實戰HBase API 8.5 實戰HBase 之綜例 8.6 實戰HBase 之使用MapReduce 建置索引 09記憶體型計算架構Spark 9.1 Spark 簡介 9.2 Spark 介面 9.3 實戰Spark Shell 9.4 實戰Spark 程式設計之RDD 9.5 實戰Spark 之WordCount 9.6 實戰Spark 之MLLib 10資料流程即時處理系統Storm 10.1 Storm 簡介 10.2 Storm 介面 10.3 實戰Storm Shell 10.4 實戰Storm API 之RollingTopWords 11資料倉儲工具Hive 11.1 Hive 簡介 11.2 Hive 介面 11.3 實戰Hive Shell 11.4 實戰Hive 之複雜敘述 11.5 實戰Hive 之綜合範例 11.6 實戰Hive API 介面 12其他常見大數據元件 12.1 Pig 12.2 Oozie 12.3 Flume 12.4 Mahout A手動部署Hadoop2.0