自然語言處理實踐:聊天機器人技術原理與應用( 簡體 字) | |
作者:王昊奮 等 | 類別:1. -> 程式設計 -> 自然語言 |
出版社:電子工業出版社 | 3dWoo書號: 50722 詢問書籍請說出此書號! 有庫存 NT售價: 345 元 |
出版日:2/1/2019 | |
頁數:204 | |
光碟數:0 | |
站長推薦: | |
印刷:黑白印刷 | 語系: ( 簡體 字 ) |
ISBN:9787121357152 | 加入購物車 │加到我的最愛 (請先登入會員) |
(簡體書上所述之下載連結耗時費功, 恕不適用在台灣, 若讀者需要請自行嘗試, 恕不保證, 繁體書的下載亦請直接連絡出版社) | |
1 聊天機器人概述 1
1.1 聊天機器人的發展歷史 1 1.2 聊天機器人的分類與應用場景 6 1.3 聊天機器人生態介紹 9 1.3.1 典型聊天機器人框架介紹 11 1.3.2 聊天機器人平臺介紹 13 1.3.3 典型的聊天機器人產品介紹 13 1.4 參考文獻 19 2 聊天機器人技術原理 20 2.1 自然語言理解 21 2.1.1 自然語言理解概覽 23 2.1.2 自然語言理解基本技術 26 2.1.3 自然語言表示和基于深度學習的自然語言理解 36 2.1.4 基于知識圖譜的自然語言理解 46 2.2 自然語言生成 56 2.2.1 自然語言生成綜述 56 2.2.2 基于檢索的自然語言生成 58 2.2.3 基于模板的自然語言生成 59 2.2.4 基于深度學習的自然語言生成 60 2.3 對話管理 61 2.4 參考文獻 65 3 問答系統 67 3.1 問答系統概述 67 3.2 KBQA 系統 71 3.2.1 KBQA 系統簡介 71 3.2.2 主流的 KBQA 方法 79 3.3 KBQA 系統實現 96 3.3.1 系統簡介 96 3.3.2 模塊設計 97 3.4 參考文獻 105 4 對話系統 109 4.1 對話系統概述 109 4.2 對話系統技術原理 113 4.2.1 NLU 模塊 115 4.2.2 DST 模塊 120 4.2.3 DPL 模塊 121 4.2.4 NLG 模塊 126 4.3 基于聊天機器人平臺搭建對話系統 126 4.3.1 NLU 模塊實現 129 4.3.2 DST 與 DPL 模塊實現 130 4.3.3 NLG 模塊實現 131 4.4 面向任務的對話系統實現 132 4.5 參考文獻 137 5 閑聊系統 139 5.1 閑聊系統概述 139 5.2 基于對話庫檢索的閑聊系統 140 5.2.1 基于對話庫檢索的閑聊系統介紹140 5.2.2 對話庫的建立 143 5.2.3 基于檢索的閑聊系統實現145 5.3 基于生成的閑聊系統 150 5.3.1 基于生成的閑聊系統介紹 150 5.3.2 生成式閑聊系統的新發展 152 5.3.3 基于生成的閑聊系統實現 155 5.4 參考文獻 157 6 聊天機器人系統評測 159 6.1 問答系統評測 159 6.1.1 問答系統評測會議 160 6.1.2 問答系統評測數據集 171 6.1.3 問答系統評測標準 173 6.2 對話系統評測 174 6.2.1 對話系統評測會議 176 6.2.2 對話系統評測數據集 177 6.2.3 對話系統評測標準 178 6.3 閑聊系統評測 179 6.3.1 閑聊系統評測介紹 179 6.3.2 閑聊系統評測標準 180 6.4 參考文獻 183 7 聊天機器人挑戰與展望 185 7.1 開放式挑戰 185 7.2 技術與應用展望 187 7.3 從聊天機器人到虛擬生命190 7.4 參考文獻 193 本書全面系統地介紹了聊天機器人的背景、典型應用場景,以及核心技術模塊。并圍繞問答系統、任務對話系統和閑聊系統三種聊天機器人的具體展現,從技術原理和實踐兩個方面進行闡述,適合對自然語言處理有一定基礎又想進入聊天機器人應用研發的一線研發人員學習。
推薦序
聊天機器人是社會關系網絡、自動客服、語音助手、智能音箱、游戲等的重要支撐技術,它綜合應用了自然語言處理技術。自然語言處理是體現語言智能非常關鍵的技術,它分析、理解和生成自然語言,實現人與機器的自然交流。 同時,機器翻譯、自動文摘、自動寫作、郵件或者短消息的自動回復也有助于人與人之間的交流。如果語言智能可以實現突破,跟它同屬認知智能的知識圖譜與常識推理等技術也會得到長足的發展,并推動整個人工智能體系的進步,使更多的場景落地。自然語言處理被視為人工智能“皇冠上的明珠”。要做好這項技術,達到和人一樣自然的交互是非常具有挑戰性的一項課題。許多積極投身于自然語言處理研究和開發的同仁,迫切需要掌握自然語言處理的基礎技術,了解技術前沿。 我很高興看到本書的出版。它系統地介紹了聊天機器人的技術體系和自然語言處理在聊天機器人中的應用,輔以案例,理論和實踐結合良好。本書深入淺出的風格對不同層次的讀者都有幫助。 本書由王昊奮博士和邵浩博士主導,他們二位都是從學術界跨越到工業界的年輕人,并致力于將技術應用到產品實踐中。我和王昊奮在中國計算機學會術語工作委員會和自然語言專委會等組織中有緊密的合作。我認為,他不僅在學術上積極進取,還特別希望嘗試把各種新技術應用到產品中。他將理論和實踐相結合,多年來積累了豐富的研發經驗,走出了一條獨到的創新之路。本書由多位相關企業的資深技術研發人員參與撰寫。因此我相信本書一定會激發大家對聊天機器人的興趣和更深入的思考。 從本書的內容上看,除了對聊天機器人的歷史發展和技術體系的闡述,重點介紹了聊天機器人的 3 種典型表現形式:閑聊、對話和問答。以閑聊型聊天機器人為例,雖然基于檢索的方法是目前主流的產品實現方式,但隨著自然語言處理端到端技術的發展,生成式對話越來越受重視,有很多研究者嘗試用生成方法解決個性化、多輪對話和安全回復等問題。同時,本書介紹了知識圖譜的重要作用,因為基于知識圖譜的問答也是問答型聊天機器人的重要組成部分。 本書盡可能完整地展現了聊天機器人相關技術的最新進展,有興趣的讀者可通過此書全面了解聊天機器人。 聊天機器人已經在智能客服、知識問答等場景里有了較好的應用,未來會在大數據、深度學習和重要場景的推動下進一步提升智能水平。我們可以暢想,在未來的某個時刻,會出現一個基于人工智能技術的虛擬生命,它能夠真正理解人類的語言,有自己的記憶和情感,并可以和人進行自然真實的對話。盡管我們離這個目標尚遠,但是我們可以逐步靠近。這里孕育著無窮的研究、開發機會和樂趣。我期待本書能激勵更多優秀的年輕人投身其中,做出更多成就! 微軟亞洲研究院副院長、國際計算語言學會主席 周明 前 言 緣起 寫作本書的初衷,是作者在聊天機器人相關的技術公司工作時,在做產品的過程中,深深感受到理論和實踐的差別。舉例來說,學術界一直追捧的 seq2seq技術,并沒有很好地應用在聊天機器人的產品中。而且,對于剛入職的工程師,也沒有一本系統性的書籍來幫助他們快速理解和掌握聊天機器人的技術脈絡。 因此,我提議:我們為什么不寫一本全面的技術讀本,將我們在實踐中遇到的問題和解決方案都放到這本書里,讓更多的讀者了解聊天機器人的知識體系,避免踩我們在工作中踩過的很多坑呢?于是我們開始了本書的撰寫。希望這本書能盡可能全面地梳理聊天機器人技術,使讀者更深入地理解其背后的理論知識。 本書特色 本書應該是國內第一本聊天機器人參考書,書中不僅介紹了聊天機器人的發展歷史,還深入介紹了不同類型聊天機器人的技術實現。無論是擁有實體的聊天機器人還是聊天機器人軟件,其功能都跳不出閑聊、問答、對話和主動交互 4 種。不同類型的聊天機器人的側重點不同,但終極目標都是擁有自我感知能力,并能像人一樣進行情感交互。本書涵蓋的范圍比較廣泛,但受限于時間和精力,對某些特定的技術點,我們僅僅給出了簡要介紹(例如語音識別和語音合成技術),而將主要精力放在了在文字層面聊天機器人如何進行交互上。對于工業界的朋友,希望本書能夠在您尋找特定技術的時候提供一定幫助;對于學術界的專家,本書給出的很多難題也期待著您在理論上加以研究并尋求突破。 本書分 7 章。第 1 章簡要介紹了聊天機器人的發展和分類,第 2 章給出了聊天機器人的技術體系介紹,第 3 章到第 5 章分別介紹了 3 種不同類型的聊天機器人的技術實現(問答、對話和閑聊),第 6 章給出了聊天機器人系統評測的相關信息,第 7 章提出了聊天機器人進一步發展所面臨的技術挑戰和展望。下面簡要介紹每章的具體內容: 第 1 章“聊天機器人概述” 在本章中,我們追溯了聊天機器人的發展歷史,并闡述了聊天機器人的分類和應用場景,從技術層面給出了一個典型的聊天機器人應該包含的技術框架,同時著重介紹了最具代表性的聊天機器人產品。 第 2 章“聊天機器人技術原理” 在本章中,我們從技術的角度,詳細介紹了一個文字型交互聊天機器人涉及的技術,包括自然語言理解、對話管理和自然語言生成。我們不僅介紹了傳統的自然語言處理技術,也給出了深度學習在解決同類問題上的研究進展。同時,引出了跨越認知智能的關鍵技術之一——知識圖譜,通過不同的例子,闡述了從構建到應用知識圖譜的過程。 第 3 章“問答系統” 在本章中,我們介紹了聊天機器人的一種形式——問答。對于某一問題,問答系統旨在獲取其精準答案。我們重點介紹了基于知識庫的問答系統,闡述了構建知識庫所需的技術,并給出了 IBM Watson 問答系統的詳細說明。同時,我們介紹了 4 種主流的問答方法,包括模板匹配、語義解析、圖遍歷和深度學習。最后,給出了一個問答系統的具體實踐案例。 第 4 章“對話系統” 在本章中,我們主要介紹面向任務的對話系統。與問答系統不同,面向任務的對話系統旨在完成用戶指定的一項特定任務。從技術的層面,我們分別介紹了自然語言理解、對話狀態跟蹤、對話策略學習及自然語言生成,同時穿插了具體的案例,讓讀者可以有更直觀的理解。 第 5 章“閑聊系統” 在本章中,我們分別介紹了閑聊系統的兩種實現方式,一種基于對話庫檢索,另一種基于生成模型。我們不僅介紹了技術的最新進展,還給出了具體的實現案例。 第 6 章“聊天機器人系統評測” 在本章中,我們梳理了目前國內外聊天機器人評測的公開會議、數據集和進展,并分別針對問答系統和對話系統給出了詳細的評測介紹。 第 7 章“聊天機器人挑戰與展望” 在本章中,我們給出了聊天機器人發展到現階段所面臨的挑戰,并對未來不同場景的應用進行了展望。同時,對聊天機器人發展的下一代范式——虛擬生命,給出了我們的見解和期望。 本書是集體智慧的結晶,寫作成員包括王昊奮、邵浩、李方圓、張凱、宋亞楠。同時,感謝很多同事和朋友在寫作過程中給予的協助。在寫作過程中,我們從實際出發,考慮搭建一個聊天機器人所需要的技術應該是什么樣的,同時,關注國內外關于聊天機器人、自然語言處理、知識圖譜、機器學習的最新進展,并思考如何將這些技術真正應用于構建聊天機器人中。需要說明的是,在寫作過程中,我們參閱了很多領域專家的資料,并盡可能地將所有參考資料都列出了。如果您發現某些內容有爭議,請聯系我們。 尤其要感謝鄭柳潔編輯,沒有她的督促和協助,本書不可能有這樣的完成度。 擁抱人工智能時代 最近幾年,技術的飛速發展讓我們每個人都無比興奮。我們也很激動地看到 AI 巨頭不斷地開源最新、最快的模型,例如谷歌開源了語言模型 BERT,已經在所有 benchmark 數據集上取得了突破。“工欲善其事,必先利其器”,這些強大的算法和工具,讓人工智能領域從業者可以創造出更多、更好的產品。 在人工智能的發展過程中,我們希望貢獻自己的微薄之力。如果讀者能夠在閱讀的過程中獲得一點靈感,也將讓我們無比欣慰。 愿意創造下一代聊天機器人范式的朋友,我們非常誠摯地邀請您們,一起創造出讓人驚艷的、跨越感知智能和認知智能的產品! |