|
-- 會員 / 註冊 --
|
|
|
|
基于混合方法的自然語言處理:神經網絡模型與知識圖譜的結合 ( 簡體 字) |
作者:何塞·曼努埃爾·戈麥斯-佩雷斯,羅納德·德諾(Ronald Denaux),安德烈·加西亞-席爾瓦 | 類別:1. -> 程式設計 -> 自然語言 |
譯者: |
出版社:機械工業出版社 | 3dWoo書號: 55193 詢問書籍請說出此書號!【有庫存】 NT售價: 495 元 |
出版日:9/1/2021 |
頁數:268 |
光碟數:0 |
|
站長推薦: |
印刷:黑白印刷 | 語系: ( 簡體 版 ) |
|
加入購物車 │加到我的最愛 (請先登入會員) |
ISBN:9787111690696 |
作者序 | 譯者序 | 前言 | 內容簡介 | 目錄 | 序 |
(簡體書上所述之下載連結耗時費功, 恕不適用在台灣, 若讀者需要請自行嘗試, 恕不保證) |
作者序: |
譯者序: |
前言: |
內容簡介:本書分為三個部分:基于知識圖譜和神經網絡的構建部分;結合知識圖譜和神經網絡的混合體系結構;實際應用部分。在三個部分中,主題通常是獨立的,允許讀者快速、輕松地閱讀所需的信息。本書的兩個特點是實用性和擁有前沿信息。書中準確地演示了如何創建和使用上下文表示,對意義嵌入和知識圖譜嵌入有著明確的處理方法,解釋了使用它們的語言模型和Transformer體系結構。 |
目錄:推薦序二 譯者序 前言 第一部分 預備知識和構建模塊 第1章 混合自然語言處理簡介 2 1.1 知識圖譜、嵌入和語言模型簡史 2 1.2 自然語言處理中知識圖譜和神經網絡方法的結合 4 第2章 單詞、意義和知識圖譜嵌入 6 2.1 引言 6 2.2 分布式單詞表示 6 2.3 詞嵌入 7 2.4 意義和概念嵌入 8 2.5 知識圖譜嵌入 9 2.6 本章小結 13 第3章 理解詞嵌入和語言模型 14 3.1 引言 14 3.2 語言模型 15 3.2.1 統計語言模型 15 3.2.2 神經語言模型 16 3.3 NLP遷移學習的預訓練模型微調 16 3.3.1 ELMo 16 3.3.2 GPT 17 3.3.3 BERT 17 3.4 機器人檢測中預訓練語言模型的微調 18 3.4.1 實驗結果與討論 21 3.4.2 使用Transformer庫對BERT進行微調 21 3.5 本章小結 27 第4章 從文本中捕獲意義作為詞嵌入 28 4.1 引言 28 4.2 下載一個小文本語料庫 29 4.3 一種學習詞嵌入的算法 29 4.4 使用Swivel prep生成共現矩陣 30 4.5 從共現矩陣中學習嵌入 31 4.6 讀取并檢查存儲的二進制嵌入 32 4.7 練習:從古騰堡工程中創建詞嵌入 33 4.7.1 下載語料庫并進行預處理 33 4.7.2 學習嵌入 34 4.7.3 檢查嵌入 34 4.8 本章小結 34 第5章 捕獲知識圖譜嵌入 35 5.1 引言 35 5.2 知識圖譜嵌入 35 5.3 為WordNet創建嵌入 37 5.3.1 選擇嵌入算法:HolE 37 5.3.2 將WordNet知識圖譜轉換為所需輸入 39 5.3.3 學習嵌入 44 5.3.4 檢查嵌入結果 44 5.4 練習 47 5.4.1 練習:在自己的知識圖譜上訓練嵌入 47 5.4.2 練習:檢查WordNet 3.0的預計算嵌入 47 5.5 本章小結 48 第二部分 神經網絡與知識圖譜的結合 第6章 從文本語料庫、知識圖譜和語言模型中構建混合表達 50 6.1 引言 50 6.2 準備工作和說明 51 6.3 Vecsigrafo的概念及構建方式 51 6.4 實現 53 6.5 訓練Vecsigrafo 54 6.5.1 標記化和詞義消歧 56 6.5.2 詞匯表和共現矩陣 58 6.5.3 從共現矩陣學習嵌入 62 6.5.4 檢查嵌入 64 6.6 練習:探索一個預先計算好的Vecsigrafo 66 6.7 從Vecsigrafo到Transigrafo 68 6.7.1 安裝設置 70 6.7.2 訓練Transigrafo 71 6.7.3 擴展知識圖譜的覆蓋范圍 73 6.7.4 評估 Transigrafo 73 6.7.5 檢查Transigrafo中的義項嵌入 75 6.7.6 探索Transigrafo嵌入的穩定性 77 6.7.7 額外的反思 81 6.8 本章小結 81 第7章 質量評估 82 7.1 引言 82 7.2 評估方法的概述 83 7.3 練習1:評估單詞和概念嵌入 84 7.3.1 可視化探索 84 7.3.2 內在評估 85 7.3.3 詞匯預測圖 87 7.3.4 外在評估 90 7.4 練習2:評價通過嵌入獲取的關系知識 90 7.4.1 下載embrela項目 91 7.4.2 下載生成的數據集 91 7.4.3 加載待評估的嵌入 92 7.4.4 學習模型 94 7.4.5 分析模型的結果 94 7.4.6 數據預處理:合并且增加字段 96 7.4.7 計算范圍閾值和偏差數據集檢測 97 7.4.8 發現統計上有意義的模型 99 7.4.9 關系型知識的評估結論 101 7.5 案例研究:評估和對比Vecsigrafo嵌入 101 7.5.1 比較研究 101 7.5.2 討論 111 7.6 本章小結 114 第8章 利用Vecsigrafo捕獲詞法、語法和語義信息 116 8.1 引言 116 8.2 方法 118 8.2.1 Vecsigrafo:基于語料的單詞–概念嵌入 118 8.2.2 聯合嵌入空間 119 8.2.3 嵌入的評估 119 8.3 評估 120 8.3.1 數據集 121 8.3.2 單詞相似度 121 8.3.3 類比推理 124 8.3.4 單詞預測 125 8.3.5 科學文檔的分類 127 8.4 討論 129 8.5 練習:使用surface form對科學文獻進行分類 130 8.5.1 導入所需的庫 130 8.5.2 下載surface form的詞嵌入和SciGraph論文 131 8.5.3 讀取并準備分類數據集 131 8.5.4 surface form的詞嵌入 133 8.5.5 創建嵌入層 134 8.5.6 訓練一個卷積神經網絡 134 8.6 本章小結 136 第9章 知識圖譜的詞嵌入空間對齊與應用 137 9.1 引言 137 9.2 概述及可能的應用 138 9.2.1 知識圖譜的補全 139 9.2.2 超越多語言性:跨模態的詞嵌入 139 9.3 詞嵌入空間的對齊技術 140 9.3.1 線性對齊 140 9.3.2 非線性對齊 146 9.4 練習:尋找古代英語和現代英語的對應 146 9.4.1 下載小型文本語料庫 146 9.4.2 學習基于老莎士比亞語料庫的Swivel詞嵌入 147 9.4.3 在WordNet之上加載UMBC的Vecsigrafo 149 9.4.4 練習的結論 149 9.5 本章小結 150 第三部分 應用 第10章 一種虛假信息分析的混合方法 152 10.1 引言 152 10.2 虛假信息檢測 153 10.2.1 定義和背景 153 10.2.2 技術方法 155 10.3 應用:構建斷言數據庫 156 10.3.1 訓練一個語義斷言編碼器 156 10.3.2 創建嵌入的一個語義索引并進行探索 165 10.3.3 以STS-B開發數據集填充索引 165 10.3.4 為一個斷言數據集創建另一個索引 166 10.3.5 加載數據集到一個Pandas的DataFrame 167 10.3.6 構建一個斷言數據庫的總結 171 10.4 應用:假新聞和欺騙性語言檢測 171 10.4.1 使用深度學習的基本文檔分類 172 10.4.2 使用HolE的嵌入 176 10.4.3 使用Vecsigrafo UMBC WNet的嵌入 178 10.4.4 HoLE和UMBC嵌入的結合 179 10.4.5 討論與結果 180 10.5 通過一個知識圖譜得到傳播虛假信息的評分 182 10.5.1 Data Commons Claim-Review的知識圖譜 182 10.5.2 不可信度評分的傳播 187 10.6 本章小結 190 第11章 科學領域中文本與視覺信息的聯合學習 191 11.1 引言 191 11.2 圖例–標題對應分析的模型與架構 193 11.3 數據集 195 11.4 評估圖例–標題的對應分析任務 195 11.5 圖例–標題的對應分析與圖像–句子匹配的對比 197 11.6 標題與圖例的分類 199 11.7 教科書問答的多模態機器理解 200 11.8 圖例–標題對應分析的練習 201 11.8.1 預備步驟 201 11.8.2 圖例–標題的對應分析 203 11.8.3 圖像–句子匹配 216 11.8.4 標題/圖例分類 219 11.8.5 教科書問答 223 11.9 本章小結 228 第12章 展望自然語言處理的未來 229 12.1 最終的評論、想法和愿景 229 12.2 趨勢是什么?社會各界的意見 231 參考文獻 238 |
序: |
|