你還在建立模型分析玩具資料集嗎?你還在使用只有幾百筆資料的鳶尾花資料集嗎?你還在透過Numpy亂數產生器建立資料集嗎?
還是,你苦於找不到資料集?又或是,你發現以前所學的技術,套在真實資料集,根本不能用?
假資料或玩具資料集無法和產業界接軌,練再多只是徒勞無功,但想要有真實資料集卻不知從何得到。
現在你看到的這本書,將帶你在初學和實戰之間,提供一個累積實務經驗值的試驗場,解決你的以上煩惱!
如何獲取要分析的資料,經常是資料分析與機器學習時會遇到的瓶頸,而 Kaggle 平台有各大企業提供的免費資料集、完善的開發環境、匯集世界各地資料科學專家的討論區、以及高額獎金尋求各種問題的解決方案。只要註冊帳號,就能免費使用以上所有 Kaggle 的資源,顯然是一個絕佳的機器學習、資料科學練習環境。
本書專為入門者所寫,讓讀者知道如何善用平台資源,包含解析 Kaggle 上面的資料集,以及操作平台提供的完整 Python 開發環境。此外,書中從基礎的線性迴歸模型開始打底,隨後詳細講解當前火紅的神經網路,並深入探討循環神經網路的進階案例,也介紹各種特徵工程、模型超參數調整、模型集成的技術,一書掌握機器學習領域中重要的模型。本書所使用的範例,包含經典的CIFAR-10上萬張影像資料集、也有日本 Mercari 企業提供的資料集等,讓你擺脫不切實際的玩具資料集,直接打造實戰能力。
本書將助你從入門開始一步步打造技術力,同時銜接上實務應用,讓你在研究、職場脫穎而出。
本書特色
● 國立成功大學資訊工程學系特聘教授 陳培殷博士 推薦
● 完整介紹 Kaggle 平台上的資源,幫助讀者與世界頂級資料科學家接軌
● 一書掌握基礎的迴歸、熱門的神經網路、以及進階的循環神經網路等重要模型
● 使用 Kaggle 平台的資料集,讓讀者學習到實戰所需的機器學習技能,擺脫無聊的玩具資料集
● 透過巨量資料集為範例,如分析日本 Mercari企 業提供的資料預測商品價格,了解實務應用
● 本書由施威銘研究室監修,內容易讀易懂,並加入大量「編註」以幫助理解及補充必要知識
● 完整 Jupyter Notebook 互動式開發環境的 Python 範例程式免費下載 |