预购商品
书目分类
特别推荐
第2版前言 第1版前言 第1章 緒論1 1.1 認識大資料1 1.1.1 大資料產生的歷史必然1 1.1.2 大資料概念和特徵2 1.1.3 大資料生命週期4 1.1.4 大資料、物聯網與雲計算之間的關係6 1.2 大資料時代帶來的變化6 1.2.1 決策方式6 1.2.2 計算方式6 1.2.3 思維方式7 1.3 大資料價值8 1.3.1 增加額外收入9 1.3.2 減少支出9 1.3.3 降低風險9 1.3.4 參照系9 1.4 大資料產業及崗位10 1.4.1 大資料產業鏈條10 1.4.2 大資料產業分析11 1.4.3 大數據崗位12 1.5 虛擬機器13 1.5.1 安裝虛擬機器13 1.5.2 安裝CentOS15 1.5.3 安裝虛擬機器常見問題20 1.5.4 大資料實驗平臺概述21 1.6 Linux作業系統22 1.6.1 Linux版本22 1.6.2 Linux 系統目錄結構23 1.6.3 文字編輯器vi24 1.6.4 文件許可權解讀24 1.6.5 Linux系統常用命令25 習題127 實驗:Linux實驗29 第2章 大數據生態30 2.1 認識Hadoop30 2.2 部署Hadoop30 2.2.1 Hadoop安裝模式30 2.2.2 單節點偽分佈模式安裝31 2.2.3 多節點偽分佈模式安裝32 2.3 HDFS38 2.3.1 HDFS體系結構39 2.3.2 HDFS存儲原理41 2.3.3 HDFS實戰41 2.4 MapReduce44 2.4.1 MapReduce邏輯結構44 2.4.2 MapReduce實戰45 2.5 Zookeeper47 2.5.1 Zookeeper集群47 2.5.2 部署Zookeeper47 習題249 實驗:HDFS操作52 第3章 大資料獲取與預處理53 3.1 數據53 3.1.1 數據是什麼53 3.1.2 資料分類54 3.1.3 度量和維度55 3.2 資料獲取56 3.2.1 資料獲取概述56 3.2.2 資料獲取工具56 3.3 日誌採集元件Flume60 3.3.1 Flume結構60 3.3.2 Flume部署62 3.3.3 Flume實戰63 3.4 數據清洗68 3.4.1 缺失值處理68 3.4.2 異常值處理69 3.4.3 數據清洗實戰71 3.5 數據變換74 3.5.1 規範化74 3.5.2 樞紐分析表76 3.5.3 列聯表78 3.5.4 聚合表78 3.5.5 特徵編碼79 習題379 第4章 大資料管理82 4.1 資料管理概述82 4.2 大資料管理NoSQL83 4.2.1 NoSQL概述83 4.2.2 NoSQL分類及主要產品83 4.3 列式資料庫HBase85 4.3.1 HBase模型85 4.3.2 HBase系統架構85 4.3.3 HBase應用場景88 4.4 HBase實戰89 4.4.1 HBase部署89 4.4.2 HBase Shell基本操作91 4.4.3 HBase Shell應用案例94 習題496 實驗:HBase基本操作97 第5章 數據視覺化98 5.1 數據視覺化概述98 5.2 常用圖形99 5.3 視覺化設計105 5.3.1 資料視覺化圖形選擇建議106 5.3.2 用數據講故事106 5.4 資料視覺化工具111 5.4.1 FineReport111 5.4.2 ECharts113 5.4.3 Tableau114 習題5115 第6章 大資料分析117 6.1 大資料分析概述117 6.1.1 資料分析概念117 6.1.2 資料分析流程118 6.1.3 資料分析師的基本技能和素養119 6.2 業務理解124 6.2.1 業務理解概述124 6.2.2 資料業務化125 6.3 數據認知126 6.3.1 描述性分析126 6.3.2 對比分析126 6.3.3 細分分析128 6.3.4 交叉分析129 6.3.5 相關分析129 6.4 分析指標設計131 6.4.1 設計指標技巧131 6.4.2 如何設計指標131 6.5 數據建模133 6.6 記憶體計算引擎Spark134 6.6.1 Spark概述134 6.6.2 Spark結構135 6.6.3 Spark部署137 6.6.4 Spark實戰140 6.7 資料倉庫Hive143 6.7.1 資料倉庫概述143 6.7.2 Hive設計特點143 6.7.3 Hive系統架構143 6.7.4 Hive部署144 6.7.5 Hive實戰146 習題6149 實驗:Hive實驗151 第7章 大資料應用153 7.1 零售業大數據153 7.1.1 市場行銷153 7.1.2 商品管理156 7.1.3 運營管理157 7.1.4 供應鏈管理158 7.1.5 商業模式159 7.2 交通大資料159 7.2.1 道路運輸安全事故預警160 7.2.2 城市道路交通信號燈智慧調時160 7.2.3 繪製即時路況資訊圖161 7.2.4 停車管理161 7.3 醫療大資料162 7.3.1 大資料電子病歷162 7.3.2 大數據與流行病防控163 7.3.3 基因測序—精准治癌正在成為現實164 7.4 農業大資料164 7.4.1 農業大資料構成165 7.4.2 農業大資料應用167 7.4.3 智慧畜牧業170 7.4.4 水產養殖環境監測172 7.4.5 食品溯源172 7.5 環保大資料173 7.5.1 多維度的環保資料整合173 7.5.2 環保資料服務介面174 7.5.3 環保資料視覺化175 7.6 教育大資料175 7.6.1 教育大資料特點175 7.6.2 教育大資料作用176 7.6.3 大資料應用於教育行業十大案例177 7.6.4 教育大資料技術179 7.7 政府大資料180 7.7.1 政府主要部門的資料內容及資料應用開發價值180 7.7.2 政府大資料應用案例181 7.8 工業大資料184 7.8.1 工業大資料概述184 7.8.2 工業大資料架構185 7.8.3 工業大資料的價值創造185 7.8.4 工業大資料應用案例186 習題7187 第8章 大資料安全188 8.1 大資料安全的重要意義188 8.2 大數據面臨的挑戰189 8.3 大資料安全技術190 8.4 大資料安全保障體系194 習題8195 附錄196 附錄A 大數據運維“1+X” 考證樣卷(初級)196 附錄B 資料分析“1+X” 考證樣卷(初級)199 參考文獻204
客服公告
热门活动
订阅电子报