预购商品
书目分类
特别推荐
MADlib是一套SQL中的大數據機器學習庫。通常SQL查詢能發現數據最明顯的模式和趨勢,但要想獲取數據中最為有用的信息,需要的則是一套牢固紮根于數學和應用數學的技能,這就是機器學習。如果將SQL的簡單易用與MADlib機器學習的複雜演算法結合起來,就能實現簡單的機器學習功能。 本書分為11章,從MADlib的基本概念、MADlib的架構、支持的模型類型與功能入手,詳細解析MADlib各種模型的具體用法,包括數據類型、矩陣分解、數據轉換、數據探索、主成分分析、回歸、時間序列分析、分類、聚類、關聯規則、圖演算法、模型評估等。每種模型將從背景知識、函數語法、應用示例三方面進行逐一說明。 本書適合MADlib機器學習的初學者、想學習MADlib機器學習的DBA以及從事數據分析與挖掘的高級技術人員閱讀,也適合高等院校與培訓學校相關專業的師生教學參考。 王雪迎 ,畢業於中國地質大學電腦專業,高級工程師,20年資料庫、數據倉庫相關技術工作;先後供職于北京現代商業信息技術有限公司、北京在線九州信息技術服務有限公司、華北計算技術研究所、北京優貝在線網路科技有限公司,擔任DBA、數據架構師等職位;著有圖書《Hadoop構建數據倉庫實踐》和《HAWQ數據倉庫與數據挖掘實戰》。
客服公告
热门活动
订阅电子报