大 AI 時代將至,你不可不讀的語言模型獨門祕笈
帶你輕鬆遨遊生成式 AI 的世界
本書內容改編自第15屆 iThome 鐵人賽 AI & Data 組冠軍系列文章《LLM 學習筆記》,這是個生成式 AI 崛起的年代,其中又以 ChatGPT 為首的大型語言模型(Large-Scale Language Model, LLM)們最為令人驚豔,但是每當我們提到 LLM 時,腦中浮現的可能都是一些參數量龐大、架構絢麗又複雜、沒有個幾千幾百張 GPU 跑不動的超複雜數學模型!
其實掌握語言模型並沒有那麼困難,本書介紹了許多在建立 LLM 相關應用時會使用到的技術:在雲端可以透過簡單的 ChatGPT API 打造有趣的塔羅占卜應用;在地端有 Hugging Face TGI、vLLM、llama.cpp 等推論框架,就算只有單顯卡也能高速部署、輕鬆玩轉各式各樣 Open Source 的 LLM。透過多種量化技術減少記憶體開銷,小顯卡也能推動大模型!還有許多文本檢索的技巧,帶你一步步構築出 RAG 實務應用。最後當然少不了,透過 LoRA 訓練手法輕鬆打造專屬於你的客製化語言模型!
筆者根據自身的實務經驗,介紹深入但是易懂的理論,使用簡單但是務實的技術,帶領大家瞭解如何在低成本、低資源的環境中打造 LLM 相關應用。無論你是求知若渴的研究員,或是躍躍欲試的工程師,都能從本書中得到滿滿的收穫!
重點摘要
✦ 語言模型
雲有 ChatGPT,地有 Llama
✦ 推論部署
不只高速生成,還要低成本量化
✦ 檢索應用
掌握提示工程,徹底瞭解 RAG
✦ 微調訓練
活用 LoRA 訓練,打造客製化模型
本書可以學到哪些知識
● 量化:減少模型的顯示卡記憶體使用量。
● 部署:將模型以後端服務的形式進行部署。
● 推論:如何達到更快速的文字生成速度。
● 微調:調整訓練模型的權重以符合應用需求。
● 檢索:從外部知識庫搜尋相關資料輔助模型生成。
● 應用:結合以上技術搭建出一個實際的應用。
目標讀者
.對 LLM 充滿好奇的讀者
.想要嘗試涉足 AI 領域的初學者
.想要簡單瞭解 LLM 相關理論的領導者
.想要深入學習 LLM 相關技術的工程師
.想要一本 AI 相關的書籍,又不想要內容太深澀難懂的休閒玩家
.擁有自己的機器,想要實際動手玩轉語言模型的深度玩家
.大 AI 時代來臨,手邊卻還沒有一本 AI 相關書籍的朋友
專業推薦
本書在鐵人賽文章的基礎上增加了更多內容。除了介紹各種常見的語言模型及其使用方式外,還補充了許多細節和實作部分,書中的程式碼附有連結至 GitHub 供參考。本書內容涵蓋了 ChatGPT 的各項使用、延伸應用及工具,還有各種神經網路語言模型的說明,例如 Transformer、LLaMa ,並且介紹了台灣常見的大型語言模型,如 Breeze、Taiwan LLM、TAIDE 等。當然,書中也詳細指導如何透過開放源碼的語言模型來建立並訓練自己的 AI 應用。感謝作者花費大量時間編寫此書,清楚地整理及介紹了大型語言模型。對於想學習大型語言模型並打造屬於自己 AI 的讀者,相信本書可以讓你事半功倍。──── 徐千洋|台灣駭客年會創辦人、CYBAVO 共同創辦人
威廷在求學時期就是個興趣廣泛的人,一聽到新觀念,會馬上深入研究。頗有心得時,還會將筆記分享給大家,是那種資工系最歡迎的自動自發的學生。長期在網路世界打滾的他也深諳網路語彙,由他來寫這本書真是再適合不過了。這本書有理論、有程式,有實作運用演練,也有趨勢新知的分享。內容論述深入淺出,範例鮮明。整本書居然涵蓋了二十多種主題,簡直物超所值,收穫滿滿!期待這本書能點燃許多人心中對 LLM 的好奇心,並成為踏入 AI 世界的最大支援火力!──── 林川傑|國立臺灣海洋大學資訊工程學系 助理教授
不管你是什麼原因想要認識 AI:是正要開始認識 AI 的新手小白,或是突然接到一個 AI 專案導入並且要馬上有一番通盤概念的苦命工程師,都非常適合閱讀這本書。本書中前半的篇章淺顯易懂,讓完全的新手也能夠輕易讀懂難啃的專業術語,後面的篇章有很多實作的專案練習;而我作為一名本科仔,依然可以透過這些實作加深印象,也補足了離校至今的新知。書中同時也穿插了許多情境式的帶入及豐富的額外小知識補充,再搭配詳細的文獻資料可供延伸學習以及深入解析。相信這本書一定可以讓大家更容易進入 AI 的世界,成為 LLM 大師指日可待!──── 林俊廷 JT Lin|iThome 鐵人賽戰友、NZXT 軟體工程師、花生大師追隨者 |