|
-- 會員 / 註冊 --
|
|
|
|
智能問答與深度學習 ( 簡體 字) |
作者:王海良 等 | 類別:1. -> 程式設計 -> 深度學習 |
譯者: |
出版社:電子工業出版社 | 3dWoo書號: 50204 詢問書籍請說出此書號!【有庫存】 NT售價: 345 元 |
出版日:11/1/2018 |
頁數:268 |
光碟數:0 |
|
站長推薦: |
印刷:黑白印刷 | 語系: ( 簡體 版 ) |
|
加入購物車 │加到我的最愛 (請先登入會員) |
ISBN:9787121349218 |
作者序 | 譯者序 | 前言 | 內容簡介 | 目錄 | 序 |
(簡體書上所述之下載連結耗時費功, 恕不適用在台灣, 若讀者需要請自行嘗試, 恕不保證) |
作者序: |
譯者序: |
前言:推薦序1 我們生活在一個美好的時代,人工智能在實際中的應用越來越廣泛,很多前人暢想過的事情正在變成現實。同時,作為科技工作者,我們也應該抓住時代給予的機會,讓機器更好地服務于人。智能問答是一個重要方向,今天我們所使用的搜索引擎和20 世紀末它剛剛出現時已經截然不同,基于海量數據及復雜的算法,其答案的精確程度讓人驚嘆。但是有一天,它會不會只給我們一個答案,不是一個列表,而是唯一的回答?隨著語音交互的日益普及,這個需求有著重要的價值。那么,怎么樣才能讓機器準確地理解人的問題呢?深入的思考會帶來更多的問題,世界上最聰明的一群人正在嘗試解決這些問題。 本書介紹了近年來自然語言處理和機器閱讀的成果,帶有翔實的示例,對實際應用有很好的借鑒意義。而且本書從原理上進行了解釋,這樣更能幫助讀者掌握這些技術,融會貫通,促進更多的創新,是入門自然語言處理和深度學習難得的好書。 王海良先生是本書作者之一,我們是因為共同興趣——探索實現智能的聊天機器人而認識的。他對智能問答有著很高的積極性,尤其對企業普及聊天機器人應用有著強烈的愿景。本書中很多內容是作者的真知灼見,“問渠那得清如許,為有源頭活水來”。我向大家強烈推薦本書! 李紀為,香儂科技CEO
推薦序2 人工智能時代已經到來,2018 年5 月OpenAI 發布報告,其中提到在人工智能訓練任務中使用的算力呈指數級增長,其目前速度為每3.5 個月翻一倍(相比之下,摩爾定律是每18 個月翻一倍)。自2012 年以來,人們對算力的需求增長了超過300 000 倍,未來4 年每年還會增長10 倍,這意味著4 年后人工智能訓練的算力規模將是現在的1 萬倍。 IBM 研究稱,在全人類的全部數據中90% 是在最近兩年內產生的,到2020 年,全世界的數據規模將是今天的44 倍。每一天,全世界會上傳超過6 億張圖片,到2017 年年底已有4.7 萬億張圖片被存儲。 所有行業都在數字化和互聯網化,所有互聯網公司都將AI 化。只有充分掌握使用人工智能進行經營決策的企業才能成為行業領導者。每家公司都需要人工智能工程師和分析師。 現在全國每年畢業的人工智能博士生不足千名,碩士生不足萬名。面對行業人才短缺,需要更多的在職工程師和非人工智能專業的碩博人才加快進入這個領域。 最新出版的計算機專業圖書已有一半和人工智能相關,書的數量不少,但真正有學習價值的卻不多,大部分都集中在圖像識別領域。 其實語音交互及智能問答是人工智能正在快速發展的方向,而且應用領域廣泛。垂直行業的人工智能應用有著巨大潛力,需要更多的工程師加入這一行列中。當前最需要的就是有動手能力實現AI 項目,并且具備基礎知識體系的人,他們能夠根據項目應用場景和數據的不同而調整設計相應的算法模型。 當前最易入手的就是針對不同行業深入挖掘行業知識,智能問答是入口。本書是有著滿滿干貨的好書。本書從智能問答系統的應用實例出發,系統講解了深度學習必備的數學知識,還有豐富的工程項目資源和實踐分析。按圖索驥,順著作者的指引,就能掌握智能問答系統所需要的知識體系。 蔣濤,CSDN 創始人、極客幫創始人
前言 人工智能熱潮襲來,很多人對它有著美好的預期,因為在很多工作崗位上,人們重復勞動,或者工作強度大,甚至是危險的,是不是人工智能產品能夠改變這種現狀?另外,技術人員出于研究的目的開始學習機器學習技術。人工智能就像是一片藍海,甚至上升到國家戰略的高度,《人工智能基礎(高中版)》已經于2018 年出版,未來將有更多的人才進入這個迷人的領域。 近兩年,人工智能有愈演愈烈之勢,這得益于很多人對開源社區的貢獻,因為從理論研究過渡到生產實踐需要一個過程,開源社區大大地加速了這個過程。人工智能的創新受益于原創思想,通常這些思想以學術論文的形式發布。因此,關注arXiv 上關于使用機器學習完成各種文本任務是我的一個愛好。一些優秀的論文被發布后,也可以在GitHub 上找到對應的開源項目和開放數據集,這使得愛好者或廣大技術人員不但有機會接觸前沿的研究成果,而且可以實踐,從而應用或繼續創新。 目前,市場上有很多關于人工智能的書籍,本書是作者在學習和使用人工智能技術的過程中總結和整理而成的。我通過論文、開源項目、工作和比賽等方式慢慢進入機器學習的殿堂,回憶這兩年開發人機對話系統的經歷,感覺如果有一本書能從原理出發,同時也不失實踐的指導意義,將會大大加速掌握機器學習的過程,于是便產生了寫這樣一本書的想法。 本書有助于科研人員和愛好者學習深度學習、自然語言處理和機器閱讀,也可以作為深度學習和自然語言處理相關課程的教學參考書。本書配套了很多代碼示例。 本書初稿由王海良、李卓桓和林旭鳴完成,經過陳可心和李思珍的編寫,完善了部分章節。在本書編寫過程中,電子工業出版社的編輯鄭柳潔和葛娜提供了很多幫助,在此向她們表示衷心的感謝。同時,感謝給予鼓勵和支持的家人、朋友們。 由于作者水平有限,書中難免有疏漏、不當之處,歡迎讀者朋友予以指正。建議或意見請發表在GitHub上。 王海良 |
內容簡介:《智能問答與深度學習》面向在校學生或計算機軟件從業人員,由淺入深地介紹了人工智能在文本任務中的應用。《智能問答與深度學習》不但介紹了自然語言處理、深度學習和機器閱讀理解等基礎知識,還簡述了信息論、人工智能等的發展過程。 |
目錄:1 概述1 1.1 智能問答:讓機器更好地服務于人 1 1.2 問答系統類型介紹 2 1.2.1 基于事實的問答系統 3 1.2.2 基于常見問題集的問答系統 3 1.2.3 開放域的問答系統 4 1.3 使用本書附帶的源碼程序 4 1.3.1 安裝依賴軟件 4 1.3.2 下載源碼 5 1.3.3 執行示例程序 5 1.3.4 聯系我們 6 1.4 全書結構 6 2 機器學習基礎8 2.1 線性代數 8 2.1.1 標量、向量、矩陣和張量 8 2.1.2 矩陣運算 9 2.1.3 特殊類型的矩陣 10 2.1.4 線性相關 11 2.1.5 范數 12 2.2 概率論基礎 12 2.2.1 隨機變量 13 2.2.2 期望和方差 13 2.2.3 伯努利分布 14 2.2.4 二項分布 14 2.2.5 泊松分布 15 2.2.6 正態分布 15 2.2.7 條件概率、聯合概率和全概率 17 2.2.8 先驗概率與后驗概率 18 2.2.9 邊緣概率 18 2.2.10 貝葉斯公式 18 2.2.11 最大似然估計算法 19 2.2.12 線性回歸模型 20 2.2.13 邏輯斯蒂回歸模型 21 2.3 信息論基礎 22 2.3.1 熵 23 2.3.2 聯合熵和條件熵 23 2.3.3 相對熵與互信息 24 2.3.4 信道和信道容量 25 2.3.5 最大熵模型 26 2.3.6 信息論與機器學習 29 2.4 統計學習 29 2.4.1 輸入空間、特征空間與輸出空間 30 2.4.2 向量表示 30 2.4.3 數據集 31 2.4.4 從概率到函數 31 2.4.5 統計學習三要素 32 2.5 隱馬爾可夫模型 33 2.5.1 隨機過程和馬爾可夫鏈 33 2.5.2 隱馬爾可夫模型的定義 36 2.5.3 三個基本假設及適用場景 37 2.5.4 概率計算問題之直接計算 39 2.5.5 概率計算問題之前向算法 40 2.5.6 概率計算問題之后向算法 42 2.5.7 預測問題之維特比算法 45 2.5.8 學習問題之Baum-Welch 算法 48 2.6 條件隨機場模型 52 2.6.1 超越HMM 52 2.6.2 項目實踐 55 2.7 總結 59 3 自然語言處理基礎60 3.1 中文自動分詞 60 3.1.1 有向無環圖 61 3.1.2 最大匹配算法 63 3.1.3 算法評測 69 3.1.4 由字構詞的方法 72 3.2 詞性標注 77 3.2.1 詞性標注規范 77
3.2.2 隱馬爾可夫模型詞性標注 79 3.3 命名實體識別 81 3.4 上下文無關文法 82 3.4.1 原理介紹 83 3.4.2 算法淺析 83 3.5 依存關系分析 84 3.5.1 算法淺析 85 3.5.2 項目實踐 92 3.5.3 小結 94 3.6 信息檢索系統 95 3.6.1 什么是信息檢索系統 95 3.6.2 衡量信息檢索系統的關鍵指標 95 3.6.3 理解非結構化數據 97 3.6.4 倒排索引 98 3.6.5 處理查詢 100 3.6.6 項目實踐 102 3.6.7 Elasticsearch 103 3.6.8 小結 112 3.7 問答語料 113 3.7.1 WikiQA 113 3.7.2 中文版保險行業語料庫InsuranceQA 113 3.8 總結 115 4 深度學習初步116 4.1 深度學習簡史 116 4.1.1 感知機 116 4.1.2 寒冬和復蘇 117 4.1.3 走出實驗室 118 4.1.4 寒冬再臨 119 4.1.5 走向大規模實際應用 119 4.2 基本架構 120 4.2.1 神經元 121 4.2.2 輸入層、隱藏層和輸出層 122 4.2.3 標準符號 123 4.3 神經網絡是如何學習的 124 4.3.1 梯度下降 124 4.3.2 反向傳播理論 127 4.3.3 神經網絡全連接層的實現 130 4.3.4 使用簡單神經網絡實現問答任務 131 4.4 調整神經網絡超參數 136 4.4.1 超參數 136 4.4.2 參考建議 137 4.5 卷積神經網絡與池化 138 4.5.1 簡介 138 4.5.2 卷積層的前向傳播 139 4.5.3 池化層的前向傳播 141 4.5.4 卷積層的實現 141 4.5.5 池化層的實現 145 4.5.6 使用卷積神經網絡實現問答任務 148 4.6 循環神經網絡及其變種 149 4.6.1 簡介 149 4.6.2 循環神經網絡 149 4.6.3 長短期記憶單元和門控循環單元 153 4.6.4 循環神經網絡的實現 156 4.6.5 使用循環神經網絡實現問答任務 159 4.7 簡易神經網絡工具包 160 5 詞向量實現及應用161 5.1 語言模型 161 5.1.1 評測 162 5.1.2 ARPA 格式介紹 162 5.1.3 項目實踐 163 5.2 One-hot 表示法 164 5.3 詞袋模型 165 5.4 NNLM 和RNNLM 165 5.5 word2vec 168 5.5.1 C-BOW 的原理 169 5.5.2 Skip-gram 的原理 172 5.5.3 計算效率優化 174 5.5.4 項目實踐 179 5.6 GloVe 189 5.6.1 GloVe 的原理 189 5.6.2 GloVe 與word2vec 的區別和聯系 191 5.6.3 項目實踐 193 5.7 fastText 198 5.7.1 fastText 的原理 198 5.7.2 fastText 與word2vec 的區別和聯系 200 5.7.3 項目實踐 201 5.8 中文近義詞工具包 204 5.8.1 安裝 205 5.8.2 接口 205 5.9 總結 205 6 社區問答中的QA 匹配206 6.1 社區問答任務簡介 206 6.2 孿生網絡模型 207 6.3 QACNN 模型 207 6.3.1 模型構建 207 6.3.2 實驗結果 214 6.4 Decomposable Attention 模型 214 6.4.1 模型介紹 214 6.4.2 模型構建 216 6.5 多比較方式的比較–集成模型 216 6.5.1 模型介紹 216 6.5.2 模型構建 218 6.6 BiMPM 模型 219 6.6.1 模型介紹 219 6.6.2 模型構建 221 7 機器閱讀理解222 7.1 完型填空型機器閱讀理解任務 222 7.1.1 CNN/Daily Mail 數據集 222 7.1.2 Children’s Book Test(CBT)數據集 223 7.1.3 GA Reader 模型 226 7.1.4 SA Reader 模型 227 7.1.5 AoA Reader 模型 228 7.2 答案抽取型機器閱讀理解任務 230 7.2.1 SQuAD 數據集 231 7.2.2 MS MARCO 數據集 232 7.2.3 TriviaQA 數據集 234 7.2.4 DuReader 數據集 235 7.2.5 BiDAF 模型 235 7.2.6 R-Net 模型 237 7.2.7 S-Net 模型 240 7.3 答案選擇型機器閱讀理解任務 243 7.4 展望 245 參考文獻 246 |
序: |
|