预购商品
书目分类
特别推荐
通常來說,人工智慧(Artificial Intelligence,AI)是研究、開發用於模擬、延伸和擴展人的智慧的理論、方法、技術及應用系統的一門新的技術科學。人工智慧的研究領域包括機器人、語音辨識、圖像識別、自然語言處理和專家系統等。 機器學習就是用演算法解析資料,不斷學習,對世界中發生的事做出判斷和預測的一項技術。生活中很多機器學習的書籍只注重演算法理論方法,並沒有注重演算法的落地。本書是初學者非常期待的入門書,書中有很多的示例可以幫助初學者快速上手。 本書分為3個部分:第1章和第2章是人工智慧的數學基礎,主要介紹了機器學習的概念、Python開發環境的搭建、機器學習bibei的數學知識,以及線性代數和概率論的相關知識;第3~12章主要介紹了回歸模型、分類模型、聚類模型、半監督模型的建立和相關演算法的理論,以及如何使用sklearn具體實現相關演算法模型的搭建;第13章介紹了Spark機器學習,筆者認為對於機器學習,不能只限於Python中的sklearn的學習,還要緊跟大資料時代的發展。 本書內容通俗易懂,案例豐富,實用性強,特別適合Python語言的入門讀者和進階讀者閱讀,也適合其他演算法程式師和程式設計愛好者閱讀。
第1章 走進機器學習的世界 1 1.1 機器學習概述 2 1.1.1 什麼是機器學習 2 1.1.2 機器學習的分類 2 1.1.3 常用的機器學習演算法 3 1.1.4 機器學習的流程 5 1.2 Python程式設計語言 6 1.2.1 Python環境搭建 6 1.2.2 機器學習相關套裝軟體介紹 8 1.3 機器學習的數學知識 9 1.3.1 導數 9 1.3.2 基本函數的求導公式 9 1.3.3 求導法則 10 1.3.4 Python實現求導 10 1.3.5 泰勒展開式 12 1.3.6 微積分基本定理 14 1.3.7 基本函數的積分公式 14 1.3.8 Python實現積分 16 第2章 人工智慧數學基礎 18 2.1 線性代數 19 2.1.1 向量及其線性運算 19 2.1.2 矩陣及其線性運算 20 2.2 隨機變數 26 2.2.1 離散型隨機變數 26 2.2.2 連續型隨機變數 27 2.3 隨機變數概率分佈 28 2.3.1 伯努利分佈 28 2.3.2 泊松分佈 29 2.3.3 指數分佈 30 2.3.4 二項分佈 31 2.3.5 正態分佈 32 2.3.6 伽馬分佈 33 2.3.7 貝塔分佈 34 2.3.8 卡方分佈 35 2.3.9 t分佈 37 2.3.10 F分佈 40 第3章 資料獲取和預處理 42 3.1 資料獲取 43 3.1.1 自帶和下載資料集 43 3.1.2 創建資料集 45 3.1.3 資料集 49 3.2 標準化 50 3.2.1 Z?score標準化 50 3.2.2 Min?Max標準化 51 3.3 二值化 52 3.3.1 特徵二值化 52 3.3.2 標籤二值化 53 3.4 特徵處理 54 3.4.1 獨熱編碼 54 3.4.2 多項式特徵 56 3.4.3 PCA降維 57 3.5 數據清洗 59 3.5.1 Pandas數據清洗 59 3.5.2 sklearn處理缺失值 62 3.6 文本特徵提取 64 3.6.1 字典提取器 64 3.6.2 詞袋模型 65 3.6.3 權重向量 67 3.7 圖像特徵提取 69 3.7.1 提取圖元矩陣 69 3.7.2 提取角點 71 3.7.3 提取輪廓 74 3.7.4 提取局部特徵點 74 3.8 特徵選擇 76 3.8.1 Filter過濾法 76 3.8.2 Wrapper包裝法 78 3.8.3 Embedded嵌入法 79 第4章 線性回歸和邏輯回歸 81 4.1 線性回歸 82 4.1.1 最小二乘法 82 4.1.2 梯度下降法 84 4.1.3 線性回歸實現 86 4.1.4 Lasso回歸和嶺回歸 90 4.1.5 回歸模型評估 93 4.1.6 多項式回歸 94 4.2 邏輯回歸 96 4.2.1 邏輯回歸演算法 96 4.2.2 邏輯回歸實現 98 4.2.3 分類模型評估 100 第5章 KNN和貝葉斯分類演算法 107 5.1 KNN演算法 108 5.1.1 KNN演算法的距離度量 108 5.1.2 KNN演算法代碼實現 112 5.1.3 交叉驗證 113 5.1.4 KD樹 115 5.2 貝葉斯分類演算法 118 5.2.1 貝葉斯定理 118 5.2.2 高斯樸素貝葉斯 119 5.2.3 多項式樸素貝葉斯 121 5.2.4 伯努利樸素貝葉斯 123 第6章 決策樹和隨機森林 125 6.1 決策樹 126 6.1.1 熵 126 6.1.2 決策樹演算法 129 6.1.3 剪枝演算法 131 6.2 決策樹代碼實現 133 6.2.1 視覺化決策樹 133 6.2.2 分類樹 136 6.2.3 回歸樹 143 6.3 隨機森林 144 6.3.1 集成學習演算法 144 6.3.2 隨機森林分類 145 6.3.3 隨機森林回歸 148 第7章 支持向量機 150 7.1 SVM核心概念 151 7.1.1 線性可分 151 7.1.2 核函數 153 7.2 SVM代碼實現 154 7.2.1 SVC 154 7.2.2 SVM人臉識別 158 7.2.3 SVR 161 第8章 聚類演算法 163 8.1 K?means聚類演算法 164 8.1.1 K?means聚類演算法原理 164 8.1.2 模型評估 166 8.1.3 影像處理 167 8.1.4 K?means聚類演算法實例 169 8.2 層次聚類演算法 173 8.2.1 層次聚類演算法原理 173 8.2.2 層次聚類演算法實例 174 8.3 密度聚類演算法 176 8.3.1 密度聚類演算法原理 176 8.3.2 密度聚類演算法實例 177 第9章 EM和HMM聚類演算法 179 9.1 EM聚類演算法 180 9.1.1 最大似然估計 180 9.1.2 詹森不等式 181 9.1.3 EM演算法原理 182 9.2 EM演算法代碼實現 183 9.3 HMM聚類演算法 186 9.3.1 瑪律可夫過程 186 9.3.2 隱瑪律可夫模型 187 第10章 主題模型 190 10.1 LDA主題模型 191 10.1.1 Dirichlet分佈 191 10.1.2 LDA貝葉斯模型 192 10.2 自然語言處理常用工具包 193 10.2.1 NLTK 193 10.2.2 spaCy 196 10.2.3 Gensim 197 10.2.4 jieba 201 10.2.5 Stanford NLP 202 10.2.6 FuzzyWuzzy 203 10.2.7 HanLP 204 10.3 LDA主題模型實例 207 第11章 推薦演算法 212 11.1 關聯規則 213 11.1.1 置信度 213 11.1.2 支持度 213 11.1.3 提升度 214 11.1.4 關聯規則代碼實現 214 11.2 基於使用者行為的推薦演算法 217 11.2.1 矩陣分解 217 11.2.2 SVD演算法代碼實現 219 11.3 基於評分的推薦演算法 221 11.3.1 SlopeOne演算法 221 11.3.2 SlopeOne演算法代碼實現 222 11.4 協同過濾 222 第12章 數據建模 226 12.1 監督學習 227 12.1.1 監督學習回歸 227 12.1.2 監督學習分類 228 12.2 半監督學習 235 12.2.1 標籤傳播演算法 235 12.2.2 半監督學習分類 236 12.3 保存模型 239 12.3.1 pickle 239 12.3.2 joblib 240 12.3.3 sklearn2pmml 240 第13章 Spark機器學習 244 13.1 Spark分散式集群搭建 245 13.1.1 創建CentOS 7虛擬機器 245 13.1.2 設置靜態IP 247 13.1.3 配置SSH服務 248 13.1.4 安裝Java 248 13.1.5 搭建三台CentOS 7主機 249 13.1.6 修改hosts檔 250 13.1.7 配置SSH免密碼登錄 251 13.1.8 搭建Hadoop集群 252 13.1.9 搭建ZooKeeper集群 255 13.1.10 啟動Hadoop和ZooKeeper集群 257 13.1.11 搭建Spark集群 260 13.2 Hadoop和Spark的基礎知識 262 13.2.1 HDFS 262 13.2.2 Spark Shell 264 13.2.3 RDD程式設計 268 13.2.4 Spark SQL 273 13.3 Spark MLlib 279 13.3.1 回歸模型 279 13.3.2 分類模型 281
劉潤森,CSDN博客專家,熟悉PyTorch、TensorFlow等深度學習框架,對電腦視覺、機器學習和深度學習有深入研究,目前擔任AI演算法工程師,從事民航目標識別和檢測的工作。
客服公告
热门活动
订阅电子报