预购商品
书目分类
特别推荐
這是一本金融資料採擷與分析領域的實戰性著作,它能指導零Python程式設計基礎和零資料採擷與分析基礎的讀者快速掌握金融資料採擷與分析的工具、技術和方法。 讀完本書,你將會有如下3個方面的收穫: (1)Python程式設計基礎和資料預處理 首先詳細講解了Python的核心語法,以及NumPy、Matplotlib、PySpark、Jupyter Notebook等Python資料處理工具的使用;然後詳細介紹了資料預處理的流程和技巧。通過深入淺出的語言和豐富的樣例展示,幫助初學者快速上手 Python,為之後的資料分析實戰夯實基礎。 (2)資料採擷與分析的經典方法 詳細講解了經典的資料採擷方法,包括聚類分析、回歸分析、分類分析、異常檢測、關聯分析、時間序列分析等。 (3)主要金融應用場景的資料採擷方法 針對網路輿情的採集和熱點分析、輿情分析中的情感分析、股價趨勢預測、個人信用評分、企業信用評分、使用者畫像、目標客戶精准分析、銷售資料分析等金融行業的常見應用場景,給出了資料採擷和分析的方法。 本書注重實戰,配有大量精心設計的案例,同時還有配套的視頻講解、代碼和資料資源,可操作性強。
第1章Python工作環境準備 1 1.1Anaconda環境安裝 1 1.2常用Python 交互工具 4 1.3Jupyter Notebook簡介 6 1.4習題 9 第2章Python入門 10 2.1Python基礎知識 10 2.2Python基礎語法 11 2.3Python變數類型 15 2.4Python運算子 20 2.4.1算術運算子 20 2.4.2比較運算子 22 2.4.3設定運算子 23 2.4.4按位運算子 24 2.4.5邏輯運算子 25 2.4.6成員運算子 26 2.4.7身份運算子 27 2.4.8運算子優先順序 28 2.5Python條件與迴圈語句 29 2.5.1條件陳述式 29 2.5.2迴圈語句 31 2.6Python函數 38 2.7Python模組 43 2.8Python 文件處理 46 2.9Python異常 48 2.10資料分析相關庫 50 2.10.1NumPy 50 2.10.2Matplotlib 51 2.10.3PySpark 53 2.10.4其他常用庫 54 2.11習題 55 第3章數據預處理 56 3.1資料分析工作流程 56 3.2數據預處理 58 3.2.1資料集導入 59 3.2.2數據概覽 60 3.2.3數據清洗 61 3.2.4類別變數轉換 66 3.2.5數據分割 67 3.2.6特徵縮放 68 3.3鳥瞰機器學習 71 3.4習題 72 第4章資料採擷方法 74 4.1分類分析 74 4.1.1決策樹 75 4.1.2支持向量機 75 4.1.3分類演算法的選擇 76 4.2聚類分析 76 4.2.1K均值演算法 77 4.2.2聚類演算法和分類演算法的區別 78 4.3回歸分析 78 4.3.1變數間的關係 79 4.3.2回歸分析演算法的分類和步驟 79 4.3.3回歸分析演算法的選擇 81 4.4關聯分析 81 4.4.1關聯規則 82 4.4.2關聯規則的序列模式 82 4.5時間序列分析 83 4.5.1時間序列分析方法和步驟 83 4.5.2時間序列的三種預測模式 85 4.6異常檢測 85 4.7推薦演算法 86 4.8習題 89 第5章網路輿情採集與熱點分析 90 5.1網路輿情概述 90 5.1.1大資料網路輿情背景 90 5.1.2輿情處理過程 91 5.2輿情資料獲取 94 5.2.1網路輿情採集工具 95 5.2.2網路輿情資料爬取實例 100 5.3實戰:微博熱點話題聚類 104 5.4習題 110 第6章輿情研判之情感分類 112 6.1情感分析介紹 112 6.1.1情感分析分類 112 6.1.2情感分析文本預處理 114 6.1.3實戰:中文文本處理練習 115 6.2情感分類方法 118 6.2.1基於詞典的情感分類 118 6.2.2基於機器學習的情感分類 121 6.2.3基於深度學習模型的情感分類 122 6.3情感分類實戰演練 131 6.3.1淘寶家電商品評論情感分類預測 131 6.3.2京東客戶評論情感傾向預測 134 6.4習題 140 第7章用機器學習方法預測股價 142 7.1股市資料分析價值 142 7.1.1案例背景 142 7.1.2案例價值 143 7.2ARIMA模型 144 7.3實戰:基於SVM和ARIMA的股價預測 145 7.4 習題 156 第8章用人工智慧方法預測股價 157 8.1神經網路預測方法 157 8.1.1門控迴圈單元 158 8.1.2VADER情感分析 158 8.2實戰:基於LSTM和GRU的股價預測 159 8.3實戰:股票市場新聞情感分析 165 8.4習題 172 第9章個人信用評分 173 9.1個人信用評分概述 173 9.1.1需求背景 174 9.1.2國內外發展狀況 175 9.2信用評分的技術與方法 176 9.2.1信用評分的簡要歷史 176 9.2.2信用評分的主要模型與方法 176 9.3信用評分卡模型 180 9.3.1模型介紹 180 9.3.2數據分箱 180 9.3.3WOE值 182 9.3.4IV值 183 9.3.5邏輯回歸演算法原理 185 9.3.6模型評價指標 186 9.3.7建立信用評分卡 190 9.4實戰:信用評分卡 190 9.4.1讀取數據 191 9.4.2數據預處理 191 9.4.3探索性分析 197 9.4.4模型分析 204 9.4.5建立信用評分卡 208 9.5習題 211 第10章個人信用等級評估 213 10.1概述 213 10.2個人信用等級評估方法 215 10.2.1決策樹 215 10.2.2隨機森林 221 10.2.3XGBoost簡介 224 10.2.4多重共線性 228 10.2.5資料重採樣 229 10.3實戰:個人信用等級評估 232 10.3.1導入相應包並讀取資料 232 10.3.2查看資料情況 234 10.3.3資料預處理及相關函數構建 241 10.3.4模型訓練 244 10.3.5預測並生成結果 251 10.4習題 253 第11章企業信用評估 255 11.1企業信用評估概述 255 11.2企業信用評估的技術與方法 257 11.2.1支持向量機 257 11.2.2樸素貝葉斯 259 11.2.3感知機 260 11.3實戰:企業信用評估 261 11.3.1導入相應包並讀取資料 261 11.3.2數據預處理 262 11.3.3視覺化各變數總體分佈長條圖 264 11.3.4建模分析預測企業違約情況 271 11.3.5模型評估 273 11.3.6模型預測 273 11.4習題 274 第12章用戶畫像 276 12.1用戶畫像的價值 276 12.1.1用戶畫像的定義 277 12.1.2標籤體系 278 12.1.3用戶畫像的意義 282 12.2用戶畫像的構建 283 12.2.1使用者畫像的構建步驟 283 12.2.2創建用戶畫像的方法 287 12.2.3豐富用戶畫像 290 12.3實戰:電商用戶畫像構建 292 12.4實戰:電商用戶行為分析 303 12.5習題 321 第13章目標客戶運營 322 13.1目標客戶運營概述 322 13.2目標客戶運營模型 323 13.2.1目標客戶模型探索 323 13.2.2目標客戶聚類演算法 326 13.3目標客戶的挖掘與分類 330 13.3.1挖掘目標客戶 331 13.3.2目標客戶的視覺化工具 332 13.3.3基於RFM模型的客戶分類 333 13.3.4基於LRFMC模型的客戶分類 334 13.4實戰:商場客戶細分管理 335 13.4.1導入相關庫 335 13.4.2資料視覺化及分析 336 13.4.3K均值聚類分析 342 13.5實戰:航空公司VIP客戶體系管理 345 13.5.1資料集說明 345 13.5.2導入相關庫 346 13.5.3資料分析及視覺化 347 13.5.4特徵屬性的相關性分析 354 13.5.5屬性規約 355 13.5.6構建聚類模型 357 13.5.7客戶分群視覺化 361 13.6習題 363 第14章智能推薦 364 14.1精准行銷概述 364 14.1.1傳統行銷 365 14.1.2新時代行銷 366 14.2智能推薦概述 367 14.2.1Apriori演算法 369 14.2.2P-Growth演算法 374 14.2.3關聯規則的應用實例 378 14.3實戰:火鍋店推薦 379 14.3.1導入相關庫 380 14.3.2資料視覺化及分析 381 14.3.3特色菜推薦 386 14.3.4K均值聚類分析 387 14.3.5智能推薦器 388 14.4實戰:基於關聯規則的資料採擷 390 14.4.1導入相關庫 391 14.4.2資料視覺化及分析 392 14.4.3關聯分析—Apriori演算法 398 14.5習題 401 參考文獻 403
客服公告
热门活动
订阅电子报