|
|
|
|
|
|
|
|
ISBN |
9787302608844 |
定价 |
RMB69.00 |
售价 |
RM75.90 |
优惠价 |
RM53.13 * (-30%)
|
作者 |
遲殿委
|
出版社 |
清華大學出版社
|
出版日期 |
2022-07-01 |
装订 |
平裝. 單色印刷. 290 页. 26. |
库存量 |
購買後立即進貨 下单时可选择“空运”或“海运”(空运和海运需独立下单)。空运费每本书/CD是RM16.00。 空运需时8-11个工作天,海运需时约30个工作天。 (以上预计时间不包括出版社调货的时间以及尚未出版的预购商品) 库存有限或需要调货,订购时间可能延长。如无法订购则将通知进行退款。 |
|
我要订购 有现货时通知我 |
|
放入下次购买清单 |
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
本書是Hadoop + Spark大數據分析技術入門書,基於Hadoop和Spark兩大框架體系的3.2版本,以通俗易懂的方式介紹Hadoop + Spark原生態組件的原理、集群搭建、實戰操作,以及整個Hadoop生態系統主流的大數據分析技術。
本書共分14章。第1章講解Hadoop框架及新版本特性,並詳細講解大數據分析環境的搭建工作,包括Linux操作系統的安裝、SSH工具使用和配置等;第2章講解Hadoop偽分佈式的安裝和開發體驗,使讀者熟悉Hadoop大數據開發兩大核心組件,即HDFS和MapReduce;第3~12章講解Hadoop生態系統各框架HDFS、MapReduce、輸入輸出、Hadoop集群配置、高可用集群、HBase、Hive、數據實時處理系統Flume,以及Spark框架數據處理、機器學習等實戰技術,並通過實際案例加深對各個框架的理解與應用;第13~14章分別通過影評分析、旅遊酒店評價分析實戰項目來貫穿大數據分析的完整流程。
本書可以作為大數據分析初學者的入門指導書,也可以作為大數據開發人員的參考手冊,同時也適合作為高等院校大數據相關專業的教材或教學參考書。
|
|
|
|
|
|
|
|
|
|
|
|
購買中國簡體書籍請注意:
1. 因裝幀品質及貨運條件未臻完善,中國簡體書可能有出現磨痕、凹痕、折痕等問題,故簡體字館除封面破損、內頁脫落、缺頁等較嚴重的狀態外,其餘所有商品將正常出貨。
|
|
|
|
|
|
|
|
|
目錄
第1章 大數據與Hadoop
1.1 什麼是大數據
1.2 大數據的來源
1.3 如何處理大數據
1.3.1 數據分析與挖掘
1.3.2 基於雲平臺的分散式處理
1.4 Hadoop 3新特性
1.5 虛擬機器與Linux作業系統的安裝
1.5.1 VirtualBox虛擬機器的安裝
1.5.2 Linux作業系統的安裝
1.6 SSH工具與使用
1.7 Linux統一設置
1.8 本章小結
第2章 Hadoop偽分散式集群
2.1 安裝獨立運行的Hadoop
2.2 Hadoop偽分散式環境準備
2.3 Hadoop偽分散式安裝
2.4 HDFS操作命令
2.5 Java專案訪問HDFS
2.6 winutils
2.7 快速MapReduce程式示例
2.8 本章小結
第3章 HDFS分散式檔案系統
3.1 HDFS的體系結構
3.2 NameNode的工作
3.3 SecondaryNameNode
3.4 DataNode
3.5 HDFS的命令
3.6 RPC遠程程序呼叫
3.7 本章小結
第4章 分散式運算框架MapReduce
4.1 MapReduce的運算過程
4.2 WordCount示例
4.3 自訂Writable
4.4 Partitioner分區程式設計
4.5 自訂排序
4.6 Combiner程式設計
4.7 默認Mapper和默認Reducer
4.8 倒排索引
4.9 Shuffle
4.9.1 Spill過程
4.9.2 Sort過程
4.9.3 Merge過程
4.10 本章小結
第5章 Hadoop輸入輸出
5.1 自訂檔輸入流
5.1.1 自訂LineTextInputFormat
5.1.2 自訂ExcelInputFormat類
5.1.3 DBInputFormat
5.1.4 自訂輸出流 |
|
|
|
|
|
|
|
|
|
|
|