-- 會員 / 註冊 --  
 帳號:
 密碼:
  | 註冊 | 忘記密碼
12/1 新書到! 11/25 新書到! 11/17 新書到! 11/11 新書到!
購書流程Q & A站務留言版客服信箱
3ds MaxMayaRhinoAfter EffectsSketchUpZBrushPainterUnity
PhotoShopAutoCadMasterCamSolidWorksCreoUGRevitNuke
C#CC++Java遊戲程式Linux嵌入式PLCFPGAMatlab
駭客資料庫搜索引擎影像處理FluentVR+ARANSYS深度學習
單晶片AVROpenGLArduinoRaspberry Pi電路設計CadenceProtel
HadoopPythonStm32CortexLabview手機程式AndroidiPhone
可查書名,作者,ISBN,3dwoo書號
詳細書籍分類

Java自然語言處理(原書第2版)

( 簡體 字)
作者:(美)理查德·M.里斯//(印)艾希什辛格·巴蒂亞類別:1. -> 程式設計 -> JAVA -> Java
   2. -> 程式設計 -> 自然語言
譯者:鄒偉//李妍//武現臣
出版社:機械工業Java自然語言處理(原書第2版) 3dWoo書號: 53113
詢問書籍請說出此書號!

有庫存
NT售價: 395

出版日:7/1/2020
頁數:221
光碟數:0
站長推薦:
印刷:黑白印刷語系: ( 簡體 版 )
加入購物車 加到我的最愛
(請先登入會員)
ISBN:9787111657873
作者序 | 譯者序 | 前言 | 內容簡介 | 目錄 | 
作者序:

譯者序:

前言:

內容簡介:

目錄:

第1章 NLP概論 1
1.1 NLP是什麼 2
1.2 為什麼使用NLP 2
1.3 為什麼NLP這麼難 3
1.4 NLP工具匯總 4
1.4.1 Apache OpenNLP 5
1.4.2 Stanford NLP 7
1.4.3 LingPipe 8
1.4.4 GATE 9
1.4.5 UIMA 9
1.4.6 Apache Lucene Core 10
1.5 Java深度學習 10
1.6 文本處理任務概述 11
1.6.1 查找文本的各部分 11
1.6.2 文本斷句 13
1.6.3 特徵工程 14
1.6.4 查找人物和事件 14
1.6.5 詞性判斷 16
1.6.6 對文本和文檔進行分類 17
1.6.7 關係提取 17
1.6.8 使用組合方法 19
1.7 理解NLP方法 19
1.7.1 識別任務 19
1.7.2 選擇模型 20
1.7.3 建立並訓練模型 20
1.7.4 驗證模型 20
1.7.5 運用模型 21
1.8 準備數據 21
1.9 總結 22
第2章 查找文本的各部分 24
2.1 理解文章的各個部分 24
2.2 分詞是什麼 25
2.3 簡單的Java分詞器 27
2.3.1 使用Scanner類 27
2.3.2 使用split方法 29
2.3.3 使用BreakIterator類 29
2.3.4 使用StreamTokenizer類 30
2.3.5 使用StringTokenizer類 32
2.3.6 Java核心分詞的性能考慮 32
2.4 NLP分詞器API 33
2.4.1 使用OpenNLPTokenizer類 33
2.4.2 使用Stanford分詞器 35
2.4.3 訓練分詞器找出文本的各部分 38
2.4.4 分詞器比較 41
2.5 瞭解規範化 42
2.5.1 轉換成小寫 42
2.5.2 刪除停用詞 43
2.5.3 使用詞幹分析 45
2.5.4 使用詞元化 48
2.5.5 使用管道進行標準化處理 51
2.6 總結 52
第3章 文本斷句 53
3.1 SBD方法 53
3.2 SBD難在何處 54
3.3 理解LingPipe的HeuristicSentenceModel類的SBD規則 55
3.4 簡單的Java SBD 56
3.4.1 使用規則運算式 56
3.4.2 使用BreakIterator類 58
3.5 使用NLP API 59
3.5.1 使用OpenNLP 60
3.5.2 使用Stanford API 62
3.5.3 使用LingPipe 69
3.6 訓練文本斷句模型 73
3.6.1 使用訓練好的模型 75
3.6.2 使用SentenceDetector-Evaluator類評估模型 75
3.7 總結 76
第4章 人物識別 77
4.1 NER難在何處 78
4.2 NER方法 78
4.2.1 列表和規則運算式 79
4.2.2 統計分類器 80
4.3 使用規則運算式進行NER 80
4.3.1 使用Java的規則運算式來尋找實體 80
4.3.2 使用LingPipe的RegEx-Chunker類 82
4.4 使用NLP API 83
4.4.1 使用OpenNLP進行NER 83
4.4.2 使用Stanford API進行NER 88
4.4.3 使用LingPipe進行NER 89
4.5 使用NER注釋工具構建新資料集 93
4.6 訓練模型 98
4.7 總結 101
第5章 詞性判斷 102
5.1 詞性標注 102
5.1.1 詞性標注器的重要性 104
5.1.2 詞性標注難在何處 105
5.2 使用NLP API 106
5.2.1 使用OpenNLP POS標注器 107
5.2.2 使用 Stanford POS標注器 115
5.2.3 使用LingPipe POS標注器 120
5.2.4 訓練OpenNLP POSModel 124
5.3 總結 125
第6章 用特徵表示文本 127
6.1 n-gram 127
6.2 詞嵌入 129
6.3 GloVe 131
6.4 word2vec 133
6.5 降維 134
6.6 主成分分析 134
6.7 t-SNE 135
6.8 總結 138
第7章 資訊檢索 139
7.1 布林檢索 139
7.2 字典和容錯性檢索 141
7.2.1 萬用字元查詢 141
7.2.2 拼寫校正 142
7.2.3 Soundex 143
7.3 向量空間模型 143
7.4 計分和術語加權 144
7.5 逆文檔頻率 145
7.6 TF-IDF加權 145
7.7 資訊檢索系統的評估 145
7.8 總結 146
第8章 對文本和文檔進行分類 147
8.1 如何使用分類 147
8.2 理解情感分析 148
8.3 文本分類技術 150
8.4 使用API對文本進行分類 151
8.4.1 使用OpenNLP 151
8.4.2 使用Stanford API 154
8.4.3 使用LingPipe對文本進行分類 158
8.5 總結 165
第9章 主題建模 166
9.1 什麼是主題建模 166
9.2 LDA的基礎 167
9.3 使用MALLET進行主題建模 168
9.3.1 訓練 168
9.3.2 評價 168
9.4 總結 171
第10章 使用解析器提取關係 172
10.1 關係類型 173
10.2 理解解析樹 174
10.3 使用提取的關係 175
10.4 提取關係 178
10.5 使用NLP API 178
10.5.1 使用OpenNLP 178
10.5.2 使用Stanford API 181
10.5.3 查找共指消解實體 184
10.6 為問答系統提取關係 186
10.6.1 查找單詞依賴關係 186
10.6.2 確定問題類型 187
10.6.3 尋找答案 188
10.7 總結 190
第11章 組合管道 192
11.1 準備數據 193
11.1.1 使用Boilerpipe從HTML抽取文本 193
11.1.2 使用POI從Word文檔中抽取文本 195
11.1.3 使用PDFBox從PDF文檔抽取文本 200
11.1.4 使用Apache Tika進行內容分析和抽取 201
11.2 管道 203
11.2.1 使用Stanford管道 203
11.2.2 在Stanford管道中使用多核處理器 205
11.3 創建用於搜索文本的管道 206
11.4 總結 211
第12章 創建一個聊天機器人 212
12.1 聊天機器人架構 213
12.2 人工語言網
序: