预购商品
书目分类
特别推荐
自然語言處理的目標是使計算機能夠像人類一樣理解語言。近年來,自然語言處理作為一門學科發展迅速,得到了越來越廣泛的應用。本書從基本概念出發,對自然語言基礎任務進行介紹,首先介紹自然語言處理基礎的詞法、句子以及篇章級任務:中文分詞、命名實體識別、關係抽取、詞向量技術、關鍵字提取和文本分類,然後介紹近年來廣泛應用的知識圖譜、機器閱讀理解、自動文摘、文本生成、對話系統等內容以期讀者能夠對自然語言處理各個部分的研究內容和技術手段有更加深入的理解。 本書可作為高等院校相關專業本科生及研究生對於自然語言處理領域學習的入門教材。
第1章 中文分詞 1.1中文分詞中的基本問題 1.1.1中文分詞規範問題 1.1.2歧義切分問題 1.1.3未登錄詞識別問題 1.2基於詞表的分詞演算法 1.2.1正向優選匹配演算法 1.2.2逆向優選匹配演算法 1.2.3雙向優選匹配演算法 1.3基於統計模型的分詞演算法 1.4基於序列標注的分詞演算法 1.4.1基於HMM的分詞方法 1.4.2基於CRF的分詞方法 1.4.3基於Bi-LSTM-CRF的中文分詞方法 參考文獻 第2章 命名實體識別 2.1基於CRF的命名實體識別 2.1.1CRF基本概念 2.1.2命名實體識別任務 2.2基於Bi-LSTM-CRF的命名實體識別 2.2.1RNN 2.2.2LSTM網路 2.2.3雙向LSTM網路 2.2.4Bi-LSTM-CRF 2.3注意力機制 參考文獻 第3章 關係抽取 3.1實體關係抽取定義 3.2實體關係抽取框架 3.3評測方法 3.4有監督實體關係抽取方法 3.5半監督實體關係抽取方法 3.6遠端監督實體關係抽取方法 參考文獻 第4章 詞向量技術 4.1One-Hot詞向量技術 4.2Word2Vec詞向量技術 4.2.1CBOW模型 4.2.2Skip-Gram模型 4.2.3優化方法 4.3BERT詞向量嵌入 4.3.1注意力機制 4.3.2Transformer 4.3.3BERT 4.3.4基於BERT的衍生模型 參考文獻 第5章 關鍵字提取 5.1TextRank關鍵字提取演算法 5.1.1基於圖的排序演算法 5.1.2基於圖的排序演算法的拓展運用 5.1.3基於圖的排序演算法在關鍵字提取中的運用 5.1.4TextRank演算法 5.2TF-IDF關鍵字提取演算法 5.3LDA與PLSA關鍵字提取演算法 5.3.1相關基礎知識 5.3.2PLSA模型 5.3.3LDA模型 參考文獻 第6章 文本分類 6.1文本分類概述 6.2文本表示 6.2.1離散式表示 6.2.2分散式表示 6.3文本特徵提取 6.3.1基於DF的特徵提取法 6.3.2信息增益法 6.3.3χ2統計量 6.3.4互信息法 6.4特徵權重計算方法 6.5分類器構建 6.5.1樸素貝葉斯分類器 6.5.2SVM分類器 6.5.3基於神經網路的分類器 6.6文本分類評價指標 參考文獻 第7章 知識圖譜 7.1知識圖譜概述 7.1.1知識圖譜的介紹 7.1.2知識圖譜基本概念 7.1.3知識表示與存儲 7.2知識圖譜構建 7.2.1知識抽取 7.2.2知識融合 7.2.3知識加工 7.2.4知識更新 7.3知識圖譜補全 7.3.1知識圖譜補全簡介 7.3.2表示學習的相關理論 7.3.3知識圖譜補全(表示學習) 7.4知識圖譜應用 7.4.1通用和領域知識圖譜 7.4.2語義集成 7.4.3語義搜索 7.4.4基於知識的問答 參考文獻 第8章 機器閱讀理解 8.1機器閱讀理解概述 8.1.1機器閱讀理解任務 8.1.2機器閱讀理解發展 8.2數據集以及測評方式 8.2.1數據集 8.2.2測評方式 8.3模型 8.3.1模型架構 8.3.2預訓練模型 8.4應用以及未來 8.4.1智能客服 8.4.2搜尋引擎 8.4.3教育 8.4.4機器閱讀理解面臨的挑戰 參考文獻 第9章 自動文摘和文本生成 9.1自動文摘概述 9.1.1自動文摘任務 9.1.2自動文摘發展及分類 9.2生成式摘要 9.2.1問題與方法 9.2.2文摘評測 9.3自動文本生成 9.3.1自動文本生成概述 9.3.2基於主題的文本生成 9.3.3自動文本生成技術評測 參考文獻 第10章 對話系統 10.1問題理解 10.1.1意圖識別 10.1.2槽填充 10.2對話狀態管理 10.2.1對話狀態跟蹤 10.2.2對話策略 10.3答句生成 參考文獻
李洋 副教授,碩士生導師。2017年博士畢業于哈爾濱工業大學計算機應用技術專業,主要研究方向為自然語言處理、社交網路挖掘。中國計算機學會會員,CCF YOCSEF哈爾濱2021-2022副主席,主持國家自然科學基金、黑龍江省自然科學基金面上專案,黑龍江省博士後基金面上專案。累計發表SCI/EI檢索論文十餘篇,其中包括ACM Transactions on Intelligent Systems and Technology(ACM TIST)、Neurocomputing、Bioinformatics等國際期刊。目前擔任國際期刊Knowledge-Based Systems(KBS), Neurocomputing, ACM Transactions on Asian and Low-Resource Language Information Processing (TALLIP)等的審稿人。
客服公告
热门活动
订阅电子报