预购商品
书目分类
特别推荐
第1章 概述 1.1 大數據基礎 1.1.1 大數據的定義與特徵 1.1.2 我國的大數據發展及趨勢 1.1.3 大數據的應用 1.1.4 大數據的層次架構 1.2 大數據技術 1.2.1 大數據關鍵技術 1.2.2 大數據支撐技術 1.3 大數據的影響及思維方式 1.3.1 大數據的影響 1.3.2 大數據的思維方式 1.4 大數據倫理及安全 1.4.1 大數據倫理 1.4.2 大數據安全 1.5 本章小結 習題 第2章 大數據採集技術基礎 2.1 傳統數據採集技術 2.1.1 傳統數據採集及特點 2.1.2 傳統數據採集的硬體與軟件 2.1.3 傳統數據採集的關鍵技術 2.2 大數據採集基礎 2.2.1 大數據採集的概念 2.2.2 大數據採集的要點 2.2.3 大數據的來源 2.2.4 大數據採集的基本方法 2.3 大數據分散式檔案系統 2.3.1 數據管理技術的發展 2.3.2 HDFS概述 2.3.3 HDFS特點 2.3.4 HDFSX工作原理 2.3.5 HDFS的讀/寫數據流程 2.4 分散式數據庫系統HBase 2.4.1 分散式關係數據庫系統的缺陷 2.4.2 HBase簡介 2.4.3 HBase的數據模型關鍵要素 2.4.4 HBasel的體系結構 2.5 大數據分散式數據倉庫 2.5.1 數據倉庫的特點 2.5.2 Hive的內部架構 2.5.3 Hive的數據組織 2.6 本章小結 習題 第3章 系統日誌數據採集 3.1 系統日誌數據採集概述 3.1.1 系統日誌分類 3.1.2 日誌分析應用場景 3.1.3 系統日誌收集方法 3.2 Flume數據採集 3.2.1 Flume效益 3.2.2 Flume整體結構 3.2.3 Flume的核心部件Agent 3.2.4 Flume運行機構 3.3 Scrihe數據採集 3.3.1 Scribe的功能 3.3.2 Scribe的架構 3.3.3 Scribe的流程 3.3.4 Scribe存儲類型 3.4 Event Log Analyzer數據採集 3.4.1 Event Log Analyzer特點 3.4.2 Event Log Analyzer主要功能 3.4.3 Eveilt Log Analyzer的視覺化使用者介面 3.5 基於Log Parser的數據採集 3.5.1 Log Parser組成部分 3.5.2 Log Parser Lizard軟件功能 3.5.3 Log Parser Lizard軟件特色 3.6 本章小結 習題 第4章 大數據遷移 4.1 數據遷移基礎 4.1.1 大數據遷移的需求 4.1.2 大數據遷移的風險 4.1.3 大數據遷移的流程 4.1.4 大數據遷移任務類型 4.2 數據遷移相關技術 4.2.1 基於存儲的數據遷移 4.2.2 基於主機邏輯卷的數據遷移 4.2.3 基於數據庫的數據遷移 4.2.4 基於伺服器虛擬化的數據遷移 4.3 大數據遷移工具Sqoop 4.3.1 Sqoop概述 4.3.2 Sqoop的數據導入 4.3.3 Scloop的數據匯出 4.4 ETL數據遷移技術 4.4.1 ETL概述 4.4.2 ETL的實現模式 4.4.3 ETL工具 4.5 本章小結 習題 第5章 互聯網數據採集 5.1 網路爬蟲概述 5.1.1 網路爬蟲的基本概念 5.1.2 網路爬蟲的爬行策略 5.1.3 web 新策略 5.1.4 robots協議 5.2 網路爬蟲方法 5.2.1 按功能分類的網路爬蟲 5.2.2 通用網路爬蟲 5.2.3 焦點網路爬蟲 5.2.4 Deep Web爬蟲 5.2.5 分散式網路爬蟲 5.3 網路爬蟲工具 5.3.1 ParseHub 5.3.2 Web Scraper 5.3.3 後羿採集器 5.3.4 八爪魚收集器 5.4 Python爬蟲技術 5.4.1 Python爬行器基礎知識 5.4.2 反爬蟲與反爬蟲技術 5.5 本章小結 習題 第6章 數據預處理基礎 6.1 數據的描述 6.1.1 數據物件與屬性類型 6.1.2 數據的統計描述 6.1.3 數據矩陣與相似(相異)矩陣 6.2 相似性或相異性度量方法 6.2.1 標稱屬性相似性或相異性的度量 6.2.2 二元屬性相似性或相異性的度量 6.2.3 數值屬性相似性或相異性的度量 6.2.4 文檔相似性和相異性的度量 6.3 大數據品質 6.3.1 常見的數據品質問題 6.3.2 大數據品質標準 6.4 本章小結 習題 第7章 數據清洗與集成 7.1 數據清洗基礎 7.1.1 數據清洗的任務 7.1.2 數據清洗的前期準備 7.1.3 數據清洗的一般性系統框架 7.2 數據清洗技術 7.2.1 缺失值處理 7.2.2 光滑雜訊數據處理 7.2.3 檢測偏差與糾正偏差 7.3 數據集成基礎 7.3.1 數據集成的難點 7.3.2 數據集成的方式 7.4 數據集成技術 7.4.1 模式識別和物件匹配 7.4.2 冗餘處理 7.4.3 數據值衝突的檢測與處理 7.5 本章小結 習題 第8章 數據歸約與變換 8.1 數據歸約基礎 8.1.1 數據歸約策略 8.1.2 數據歸約演算法的特點 8.1.3 數據歸約的一般方法 8.2 數據歸約技術 8.2.1 小波變換
客服公告
热门活动
订阅电子报