预购商品
书目分类
特别推荐
本書以Python中的pandas庫為主線,介紹各類數據處理與分析方法。本書共包含13章,第一部分介紹NumPy和pandas的基本內容;第二部分介紹pandas庫中的4類操作,包括索引、分組、變形和連接;第三部分介紹基於pandas庫的4類數據,包括缺失數據、文本數據、分類數據和時間序列數據,並介紹這4類數據的處理方法;第四部分介紹數據觀測、特徵工程和性能優化的相關內容。本書以豐富的練習為特色,每章的最後一節為習題,同時每章包含許多即時性的練習(練一練)。讀者可通過這些練習將對數據科學的宏觀認識運用到實踐中。 耿遠昊,威斯康星大學麥迪遜分校統計學碩士在讀,Datawhale成員,“Joyful Pandas”開源項目作者。pandas貢獻者,活躍于pandas開源社區,主要貢獻涉及漏洞修復、功能實現與性能優化等方面,對pandas在數據處理與分析中的應用有豐富經驗。
耿遠昊 威斯康辛大學麥迪森分校統計學碩士在讀,Datawhale成員,“Joyful Pandas”開源專案作者。pandas貢獻者,活躍於pandas開源社區,主要貢獻涉及漏洞修復、功能實現與性能優化等方面,對pandas在數據處理與分析中的應用有豐富經驗。
客服公告
热门活动
订阅电子报