预购商品
书目分类
特别推荐
本書解釋、探索了數據挖掘的主要技術,可以從數據中自動提取隱式和潛在有用的資訊。數據挖掘越來越多地用於商業、科學和其他應用領域,它側重於分類、關聯規則挖掘和聚類。書中對每個主題都進行了清晰的解釋,重點是演算法而不是數學公式,並通過詳細的有效示例加以說明。本書是為沒有強數學或統計學背景的讀者寫的,並詳細解釋了使用的所有公式。本書適合作為本科生或研究生層次的教材,適用專業包括電腦科學、商業研究、市場行銷、人工智慧、生物資訊學和法醫學。 為了幫助讀者自學,本書旨在幫助普通讀者理解什麼是“黑盒”,這樣他們就可以有差別地使用商業數據挖掘包,讀者或學術研究者可以對未來該領域的技術進步做出貢獻。書中每一章都有實踐練習,讓讀者檢查自己的進度。附錄還包括所使用的技術術語的完整術語表。數據挖掘原理包括對流數據分類演算法的介紹,包括平穩數據(底層模型是固定的)和依賴時間的數據(底層模型不時變化)——這種現象稱為概念漂移。本書提供了前饋神經網絡與反向傳播的詳細描述,並顯示它如何可以用於分類。
第1章 數據挖掘簡介 1.1 數據 1.2 知識發現 1.3 數據挖掘的應用 1.4 標籤數據和無標籤數據 1.5 監督學習:分類 1.6 監督學習:數值預測 1.7 無監督學習:關聯規則 1.8 無監督學習:聚類 第2章 用於挖掘的數據 2.1 標準制定 2.2 變數的類型 2.3 數據準備 2.4 缺失值 2.4.1 丟棄實例 2.4.2 用 頻繁值/平均值替換 2.5 減少屬性個數 2.6 數據集的UCI存儲庫 2.7 本章小結 2.8 自我評估練習 第3章 分類簡介:樸素貝葉斯和 近鄰演算法 3.1 什麼是分類 3.2 樸素貝葉斯分類器 3.3 近鄰分類 3.3.1 距離測量 3.3.2 標準化 3.3.3 處理分類屬性 3.4 急切式和懶惰式學習 3.5 本章小結 3.6 自我評估練習 第4章 使用決策樹進行分類 4.1 決策規則和決策樹 4.1.1 決策樹:高爾夫示例 4.1.2 術語 4.1.3 degrees數據集 4.2 TDIDT演算法 4.3 推理的類型 4.4 本章小結 4.5 自我評估練習 第5章 決策樹歸納:使用熵進行屬性選擇 5.1 屬性選擇:一個實驗 5.2 替代決策樹 5.2.1 足球/無板籃球示例 5.2.2 匿名數據集 5.3 選擇要分裂的屬性:使用熵 第6章 決策樹歸納:使用頻率表進行屬性選擇 第7章 估計分類器的預測精度 第8章 連續屬性 第9章 避免決策樹的過度擬合
麥克斯·布拉默 是英國樸資茅斯大學資訊技術系榮譽教授、IFIP副主席、英國電腦學會AI專家組主席。 自從 “數據挖掘”“數據庫中的知識發現”“大數據”和“預測分析”等技術興起以來,Max積極參與了多個數據挖掘項目,尤其是與數據自動分類相關的項目。Max發表了大量技術文章,曾撰寫Research and Development in Intelligent Systems等著作。Max具有多年的本科和研究生教學經驗。
客服公告
热门活动
订阅电子报