预购商品
书目分类
特别推荐
處理大量資料的基本工具 「這本書提供了清晰且易於遵循的範例,幫助您設置與使用最重要的資料科學和機器學習工具。」 —Anne Bonner Content Simplicity創辦人和CEO Python是許多研究人員的首選工具,它擁有豐富的儲存、操作及洞察資料的程式庫。這些資源散布在資料科學的領域中,藉由本書,您可以一次獲得這些資源,包括Ipython、NumPy、Pandas、Matplotlib、Scikit-Learn和其它相關的工具。 對於熟悉Python,需要處理大量資料的資料科學家和資料處理人員來說,這是一本非常有價值的案頭書。可以有效率地處理每天面對的問題,像是操作、轉換及清理資料,視覺化不同形式的資料,建立統計學或機器學習模型等。 藉由本書,你將可以學習到: .IPython和Jupyter:提供資料科學家使用的Python計算環境 .NumPy:在Python中進行高效儲存及操作密集資料陣列的ndarrys .Pandas:在Python中進行對於標籤式/欄位式的資料高效率儲存與操作 .Matplotlib:在Python中進行彈性範圍的資料視覺化功能 .Scikit-Learn:提供機器學習演算法以及簡潔的Python實作
第一章 IPython:更好用的Python Shell還是Notebook IPython 的求助與說明文件 在IPython Shell中的快捷鍵 IPython的Magic命令 輸入和輸出的歷程 IPython和Shell命令 和Shell相關的Magic命令 錯誤以及除錯 剖析和測定程式碼的時間 第二章 NumPy介紹 瞭解Python的資料型態 NumPy陣列基礎 NumPy 陣列屬性 陣列索引:存取單一個陣列元素 在NumPy陣列中的計算:Universal Functions 聚合操作:Min、Max、以及兩者間的所有事 在陣列上的計算:Broadcasting 比較、遮罩以及布林邏輯 Fancy索引 排序陣列 結構化的資料:NumPy的結構化陣列 更多進階的複合型態 第三章 使用Pandas操作資料 安裝並使用Pandas Pandas 物件的介紹 資料的索引和選擇 在Pandas中操作資料 處理缺失資料 階層式索引 資料集的合併:Concat 和Append 合併資料集:Merge 以及Join 聚合計算與分組 樞紐分析表 向量化字串操作 使用時間系列 高效率Pandas:eval() 以及query() 第四章 使用Matplotlib進行視覺化 通用的Matplotlib技巧 買一送一的介面 簡單的線條圖形 簡單的散佈圖 視覺化誤差 密度圖和等高線圖 直方圖、分箱法及密度 自訂圖表的圖例 自訂色彩條 多重子圖表 文字和註解 自訂刻度 客製化Matplotlib:系統配置和樣式表 在Matplotlib中的三維繪圖法 Basemap的地理資料 使用Seaborn進行視覺化 第五章 機器學習 什麼是機器學習? Scikit-Learn簡介 超參數以及模型驗證 特徵工程 深究:Naive Bayes Classification 深究:線性迴歸(Linear Regression) 深究:Support Vector Machines 深究:決策樹(Decision Tree)和隨機森林(Random Forest) 深究:主成份分析(Principal Component Analysis) 深究:流形學習(Manifold Learning) 深究:k- 均集群法 深究:高斯混合模型(Gaussian Mixture Models) 深究:核密度估計(Kernel Density Estimation) 應用:臉部辨識的管線
作者簡介 Jake VanderPlas 是Google Research的軟體工程師,致力於開發支援資料密集型研究的工具。 他創建並開發了用於資料密集型科學的Python工具,包括Scikit-Learn、SciPy、AstroPy、Altair、JAX等。
最近浏览商品
客服公告
热门活动
订阅电子报