预购商品
书目分类
特别推荐
這是一本金融商業資料分析的實戰工具書。作者都是在金融行業有10~20年資料分析經驗的資深專家,他們將多年來的專案經驗、培訓和諮詢經驗融合成了這本書。它將指導讀者零基礎掌握金融資料分析的工具、思路、方法和技巧,快速實現從入門到進階的突破。 本書強調實戰,方法論與實踐相結合,所有案例均來自實際的金融業務,涵蓋工具使用、資料處理、統計分析等資料分析的全流程。 本書內容共14章,可分為3篇。 分析工具篇(第1~4章):首先介紹了資料科學和數理統計的基本常識,然後講解了資料分析工具SAS EG和Python的基礎知識。 資料處理篇(第5~9章):首先通過描述性統計分析進行資料探索,繼而講到基本的報表和統計製圖,還包括使用SAS EG進行資料處理,用Python進行資料整合、資料清洗,構建出滿足分析需求的資料集。 統計分析篇(第10~14章):從統計學的基本概念引出假設檢驗與樣本t檢驗,三大統計檢驗、構造預測模型,並分享基於時間序列演算法的建模方法。
前言 分析工具篇 第1章 資料科學與數理統計2 1.1 資料科學的基本概念2 1.2 數理統計技術5 1.2.1 描述性統計分析5 1.2.2 統計推斷與統計建模6 第2章 SAS EG資料操作基礎8 2.1 SAS EG入門8 2.1.1 SAS EG簡介8 2.1.2 SAS EG的視窗及功能表9 2.2 訪問資料10 2.2.1 SAS EG實現方式11 2.2.2 SAS程式實現方式13 2.3 定義SAS資料集13 2.3.1 SAS資料的相關概念13 2.3.2 SAS EG實現方式16 2.3.3 SAS程式實現方式18 2.4 導入其他格式的資料檔案19 2.4.1 SAS EG實現方式19 2.4.2 SAS程式實現方式21 第3章 Python程式設計基礎22 3.1 Python概述22 3.2 Anaconda的安裝及使用方法23 3.2.1 下載與安裝23 3.2.2 使用Jupyter Notebook24 3.2.3 使用Spyder25 3.2.4 使用Conda管理協力廠商庫27 3.3 Python的基底資料型別29 3.3.1 字串29 3.3.2 浮點型和整型29 3.3.3 布林類型30 3.3.4 其他資料類型31 3.4 Python的基本資料結構31 3.4.1 列表32 3.4.2 元組33 3.4.3 集合33 3.4.4 字典34 3.5 Python的程式設計結構35 3.5.1 三種基本的程式設計結構簡介35 3.5.2 順序結構35 3.5.3 分支結構36 3.5.4 迴圈結構37 3.6 Python的函數與模組40 3.6.1 Python的函數40 3.6.2 Python的模組42 3.7 使用Pandas讀寫結構化資料43 3.7.1 讀數據43 3.7.2 寫數據46 第4章 在SAS EG中使用程式47 4.1 如何在SAS EG中使用程式47 4.2 SAS程式49 4.2.1 SAS程式分析簡介49 4.2.2 DATA步50 4.2.3 PROC步51 資料處理篇 第5章 描述性統計分析與製圖54 5.1 描述性統計分析54 5.1.1 變數度量類型與分佈類型54 5.1.2 變數的統計量56 5.1.3 連續變數的分佈與集中趨勢56 5.1.4 連續變數的離散程度58 5.1.5 資料分佈的對稱與高矮59 5.2 製作報表與統計圖60 5.3 製圖步驟及統計圖適用場景64 5.4 利用SAS EG進行統計分析67 5.4.1 連續變數描述性統計分析67 5.4.2 單因數頻數統計分析69 5.4.3 匯總統計分析72 5.4.4 繪製橫條圖進行統計分析76 5.4.5 繪製地圖進行統計分析79 第6章 表資料的行處理82 6.1 數據篩選82 6.1.1 SAS EG實現方式82 6.1.2 SAS程式實現方式84 6.2 排序與求秩87 6.2.1 SAS EG實現方式87 6.2.2 SAS程式實現方式94 6.3 抽樣95 6.3.1 抽樣理論介紹95 6.3.2 SAS EG實現方式97 6.3.3 SAS程式實現方式99 6.4 資料分組和匯總100 6.4.1 SAS EG實現方式100 6.4.2 SAS程式實現方式102 第7章 表資料的列處理103 7.1 構造列變數103 7.2 拆分列105 7.3 堆疊列107 7.4 轉置列110 7.4.1 SAS EG實現方式111 7.4.2 SAS 程式實現方式113 7.5 對列重編碼114 7.5.1 SAS EG實現方式114 7.5.2 SAS程式實現方式119 7.6 變數標準化119 7.6.1 SAS EG實現方式120 7.6.2 SAS程式實現方式122 第8章 資料集的操作124 8.1 縱向連接124 8.1.1 SAS EG實現方式125 8.1.2 SAS程式實現方式127 8.2 橫向連接131 8.2.1 SAS EG實現方式131 8.2.2 SAS程式實現方式135 8.3 資料集的比較138 8.3.1 SAS EG實現方式138 8.3.2 SAS程式實現方式141 8.4 創建格式142 8.4.1 相關理論介紹142 8.4.2 SAS EG實現方式143 8.4.3 SAS程式實現方式146 8.5 刪除資料集、格式和視圖147 8.5.1 SAS EG實現方式147 8.5.2 SAS程式實現方式148 第9章 利用Python處理資料149 9.1 數據整合150 9.1.1 行操作和列操作150 9.1.2 條件查詢152 9.1.3 橫向連接155 9.1.4 縱向合併157 9.1.5 排序159 9.1.6 分組匯總160 9.1.7 拆分與堆疊列163 9.1.8 賦值與條件賦值165 9.2 數據清洗167 9.2.1 重複值處理167 9.2.2 缺失值處理168 9.2.3 雜訊值處理170 9.3 實戰175 9.3.1 提取行為特徵的RFM方法175 9.3.2 使用RFM方法計算變數176 9.3.3 資料整理與彙報177 統計分析篇 第10章 資料科學的統計推斷180 10.1 基本的統計學概念180 10.1.1 總體、樣本和統計量180 10.1.2 點估計、區間估計和中心極限定理181 10.2 假設檢驗186 10.2.1 理論介紹186 10.2.2 利用Python實現單樣本t檢驗189 10.2.3 利用SAS EG實現單樣本t檢驗189 10.2.4 利用SAS EG實現雙樣本t檢驗189 10.2.5 利用Python實現雙樣本t檢驗191 10.3 方差分析193 10.3.1 利用Python實現單因素方差分析193 10.3.2 利用SAS EG實現單因素方差分析198 10.3.3 利用Python實現多因素方差分析202 10.3.4 利用SAS EG實現多因素方差分析204 10.4 相關分析207 10.4.1 相關分析理論207 10.4.2 Python實現方式210 10.4.3 SAS EG實現方式210 10.5 列聯表分析與卡方檢驗211 10.5.1 利用Python實現列聯表分析212 10.5.2 利用SAS EG實現列聯表分析213 10.5.3 利用Python實現卡方檢驗215 10.5.4 利用SAS EG實現卡方檢驗216 第11章 構造連續變數的預測模型219 11.1 線性回歸模型介紹219 11.1.1 簡單線性回歸220 11.1.2 多元線性回歸224 11.2 模型的構建226 11.2.1 多元線性回歸模型的構建226 11.2.2 將連續變數和分類變數同時作為解釋變數來構建模型228 11.3 線性回歸模型的診斷230 11.3.1 殘差230 11.3.2 強影響點234 11.3.3 共線性236 11.4 建模流程238 11.5 利用SAS EG實現客戶價值預測239 11.5.1 單連續變數下建模239 11.5.2 多連續變數下建模242 11.5.3 加入分類解釋變數建模243 第12章 構造二分類變數的預測模型245 12.1 邏輯回歸入門245 12.2 模型表現優劣的評估251 12.3 多水準值分類變數的邏輯回歸253 12.4 關於構造因果關係模型的討論255 12.5 利用SAS EG實現貸款違約可能性預測257 第13章 描述性資料分析方法266 13.1 客戶細分266 13.1.1 客戶細分的意義266 13.1.2 根據客戶利潤貢獻細分268 13.1.3 根據個人或公司的生命歷程細分269 13.1.4 根據客戶的產品偏好細分269 13.1.5 根據客戶的多維行為屬性細分270 13.1.6 根據客戶結構細分271 13.1.7 綜合應用272 13.2 連續變數間關係探索與變數壓縮273 13.2.1 多元變數間關係統計基礎273 13.2.2 多元變數壓縮的思路276 13.2.3 主成分分析278 13.2.4 因數分析288 13.3 聚類分析293 13.3.1 基本邏輯293 13.3.2 層次聚類294 13.3.3 快速聚類301 13.3.4 兩步法聚類308 第14章 時間序列分析314 14.1 時間序列及其分析方法簡介314 14.2 利用效應分解法分析時間序列316 14.2.1 時間序列的效應分解316 14.2.2 SAS EG實現方式316 14.2.3 Python實現方式318 14.3 平穩時間序列分析322 14.3.1 平穩時間序列簡介322 14.3.2 AR模型、MA模型、ARMA模型簡介323 14.3.3 Python實現方式324 14.4 非平穩時間序列分析328 14.4.1 差分與ARIMA模型328 14.4.2 SAS EG實現方式330 14.4.3 Python實現方式336
張秋劍 就職于騰訊雲金融拓展中心,從事微信財富行銷管理、資料中台、AI應用等解決方案拓展工作,研究方向包括數位化轉型、創新實踐等。 張浩 曾任騰訊雲金融首席架構師和星環科技金融行業技術總監,主要從事大資料、人工智慧、雲計算、區塊鏈、聯邦學習等相關技術研發與產品設計,具有豐富的企業架構設計、企業數位化戰略轉型運營與業務諮詢經驗。 周大川 就職于某中央金融企業金融科技研發中心,主要從事企業級數據平臺開發、核心業務平臺建設、AI賦能金融科技創新等工作,具有豐富的新一代金融業務系統建設經驗。 常國珍 曾任畢馬威諮詢大資料總監,具有近20年資料採擷、精益資料治理、數位化運營諮詢經驗,是金融信用風險、反欺詐和反洗錢演算法領域的專家。
客服公告
热门活动
订阅电子报