预购商品
书目分类
特别推荐
第1章大數據概論 1.1大數據的特徵 1.2大數據的發展前景 1.2.1大數據的應用場景 1.2.2大數據的未來發展 1.3大數據生態體系與Hadoop 1.3.1Hadoop的發展史 1.3.2大數據生態體系 1.3.3Hadoop架構 1.4本章總結 第2章環境準備 2.1安裝VMware 2.2安裝CentOS 2.3安裝遠端終端機 2.3.1安裝Xshell 2.3.2安裝SecureCRT 2.4虛擬機器配置 2.4.1網路配置 2.4.2網路IP位址配置 2.4.3主機名稱配置 2.4.4防火牆配置 2.4.5一般使用者配置 2.4.6克隆虛擬機器 2.5本章總結 第3章Hadoop快速上手 3.1集群角色 3.1.1Hadoop集群的主要角色 3.1.2YARN的主要組成部分 3.2本地模式 3.2.1安裝 3.2.2運行官方示例程式 3.3接近分散式模式 3.3.1SSH免密登錄 3.3.2shell腳本準備 3.3.3集群配置 3.3.4NameNode格式化問題 3.3.5配置歷史伺服器與日誌聚集功能 3.3.6Hadoop集群啟停腳本 3.3.7集群時間同步 3.4本章總結 第4章分散式檔案系統HDFS 4.1HDFS概述 4.1.1HDFS背景及定義 4.1.2HDFS的基本架構 4.2HDFS的shell操作 4.2.1命令大全 4.2.2命令列命令實操 4.3HDFS的API操作 4.3.1用戶端環境準備 4.3.2HDFS文件上傳案例 4.3.3HDFS文件下載案例 4.3.4HDFS檔重命名案例 4.3.5HDFS檔刪除案例 4.3.6HDFS文件詳情查看案例 4.3.7HDFS文件和數據夾判斷案例 4.4HDFS的讀/寫流程 4.4.1HDFS中的數據塊大小 4.4.2寫數據流程程 4.4.3讀數據流程程 4.5HDFS的工作機制 4.5.1NameNode和SecondaryNameNode的工作機制 4.5.2EditLog和FsImage文件解析 4.5.3檢查點時間設置 4.5.4DataNode的工作機制 4.5.5數據完整性 4.6本章總結 第5章分散式運算MapReduce 5.1MapReduce概述 5.1.1MapReduce定義 5.1.2MapReduce核心思想 5.2MapReduce程式設計入門 5.2.1官方示例程式WordCount源碼 5.2.2程式設計規範 5.2.3WordCount案例實操 5.3Hadoop的序列化 5.3.1序列化概述 5.3.2Writable介面 5.3.3序列化案例實操 5.4MapReduce框架原理之InputFormat數據登錄 5.4.1切片與MapTask並行度決定機制 5.4.2Job提交流程源碼和FileInputFormat切片源碼詳解 5.4.3FileInputFormat切片機制總結 5.4.4TextInputFormat 5.4.5CombineTextInputFormat切片機制 5.4.6CombineTextInputFormat案例實操 5.5MapReduce框架原理之shuffle機制 5.5.1shuffle機制 5.5.2分區 5.5.3分區案例實操 5.5.4WritableComparable排序 5.5.5WritableComparable排序案例實操(全排序) 5.5.6WritableComparable排序案例實操(區內排序) 5.5.7Combiner合併 5.5.8Combiner合併案例實操 5.6MapReduce框架原理之OutputFormat數據輸出 5.6.1OutputFormat介面的實現類 5.6.2自訂OutputFormat類的案例實操 5.7MapReduce工作流程 5.8Join 5.8.1ReduceJoin 5.8.2ReduceJoin案例實操 5.8.3MapJoin 5.8.4MapJoin案例實操 5.9數據清洗 5.10Hadoop中的數據壓縮 5.10.1數據壓縮概述 5.10.2壓縮參數配置 5.10.3壓縮案例實操 5.11本章總結 第6章資源調度器YARN 6.1YARN概述 6.1.1基本架構 6.1.2工作機制 6.2YARN的資源調度器和調度演算法 6.2.1FIFO調度器 6.2.2容量調度器 ……
尚矽谷教育是一家專業的IT教育培訓機構,開設了JavaEE、大資料、HTML5前端等多門學科,在互聯網上發佈的JavaEE、大資料、HTML5前端、區塊鏈、C語言、Python等技術視頻教程廣受讚譽。
客服公告
热门活动
订阅电子报