-- 會員 / 註冊 --  
 帳號:
 密碼:
  | 註冊 | 忘記密碼
3/26 新書到! 3/19 新書到! 3/14 新書到! 12/12 新書到!
購書流程Q & A站務留言版客服信箱
3ds MaxMayaRhinoAfter EffectsSketchUpZBrushPainterUnity
PhotoShopAutoCadMasterCamSolidWorksCreoUGRevitNuke
C#CC++Java遊戲程式Linux嵌入式PLCFPGAMatlab
駭客資料庫搜索引擎影像處理FluentVR+ARANSYS深度學習
單晶片AVROpenGLArduinoRaspberry Pi電路設計CadenceProtel
HadoopPythonStm32CortexLabview手機程式AndroidiPhone
可查書名,作者,ISBN,3dwoo書號
詳細書籍分類

NLTK基礎教程 用NLTK和Python庫構建機器學習應用

( 簡體 字)
作者:[印度] Nitin Hardeniya 哈登尼亞類別:1. -> 程式設計 -> Python
譯者:
出版社:人民郵電出版社NLTK基礎教程 用NLTK和Python庫構建機器學習應用 3dWoo書號: 46891
詢問書籍請說出此書號!

缺書
NT售價: 245

出版日:5/1/2017
頁數:153
光碟數:0
站長推薦:
印刷:黑白印刷語系: ( 簡體 版 )
加入購物車 加到我的最愛
(請先登入會員)
ISBN:9787115452573
作者序 | 譯者序 | 前言 | 內容簡介 | 目錄 | 
(簡體書上所述之下載連結耗時費功, 恕不適用在台灣, 若讀者需要請自行嘗試, 恕不保證)
作者序:

譯者序:

前言:

內容簡介:

  NLTK 庫是當前自然語言處理(NLP)領域zui為流行、使用zui為廣泛的庫之一, 同時Python語言經過一段時間的發展也已逐漸成為主流的編程語言之一。
本書主要介紹如何通過NLTK庫與一些Python庫的結合從而實現復雜的NLP任務和機器學習應用。全書共分為10章。第1章對NLP進行了簡單介紹。第2章、第3章和第4章主要介紹一些通用的預處理技術、專屬于NLP領域的預處理技術以及命名實體識別技術等。第5章之后的內容側重于介紹如何構建一些NLP應用,涉及文本分類、數據科學和數據處理、社交媒體挖掘和大規模文本挖掘等方面。
本書適合 NLP 和機器學習領域的愛好者、對文本處理感興趣的讀者、想要快速學習NLTK的zishenPython程序員以及機器學習領域的研究人員閱讀。
目錄:

第1章 自然語言處理簡介 1
1.1 為什么要學習NLP 2
1.2 先從Python開始吧 5
1.2.1 列表 5
1.2.2 自助功能 6
1.2.3 正則表達式 8
1.2.4 字典 9
1.2.5 編寫函數 10
1.3 向NLTK邁進 11
1.4 練習 16
1.5 小結 17
第2章 文本的歧義及其清理 18
2.1 何謂文本歧義 18
2.2 文本清理 20
2.3 語句分離器 21
2.4 標識化處理 22
2.5 詞干提取 23
2.6 詞形還原 24
2.7 停用詞移除 25
2.8 罕見詞移除 26
2.9 拼寫糾錯 26
2.10 練習 27
2.11 小結 28
第3章 詞性標注 29
3.1 何謂詞性標注 29
3.1.1 Stanford標注器 32
3.1.2 深入了解標注器 33
3.1.3 順序性標注器 35
3.1.4 Brill標注器 37
3.1.5 基于機器學習的標注器 37
3.2 命名實體識別(NER) 38
3.3 練習 40
3.4 小結 41
第4章 文本結構解析 43
4.1 淺解析與深解析 43
4.2 兩種解析方法 44
4.3 為什么需要進行解析 44
4.4 不同的解析器類型 46
4.4.1 遞歸下降解析器 46
4.4.2 移位-歸約解析器 46
4.4.3 圖表解析器 46
4.4.4 正則表達式解析器 47
4.5 依存性文本解析 48
4.6 語塊分解 50
4.7 信息提取 53
4.7.1 命名實體識別(NER) 53
4.7.2 關系提取 54
4.8 小結 55
第5章 NLP應用 56
5.1 構建第一個NLP應用 57
5.2 其他NLP應用 60
5.2.1 機器翻譯 60
5.2.2 統計型機器翻譯 61
5.2.3 信息檢索 62
5.2.4 語音識別 64
5.2.5 文本分類 65
5.2.6 信息提取 66
5.2.7 問答系統 67
5.2.8 對話系統 67
5.2.9 詞義消歧 67
5.2.10 主題建模 68
5.2.11 語言檢測 68
5.2.12 光符識別 68
5.3 小結 68
第6章 文本分類 70
6.1 機器學習 71
6.2 文本分類 72
6.3 取樣操作 74
6.3.1 樸素貝葉斯法 76
6.3.2 決策樹 79
6.3.3 隨機梯度下降法 80
6.3.4 邏輯回歸 81
6.3.5 支持向量機 81
6.4 隨機森林算法 83
6.5 文本聚類 83
6.6 文本中的主題建模 84
6.7 參考資料 87
6.8 小結 87
第7章 Web爬蟲 88
7.1 Web爬蟲 88
7.2 編寫第一個爬蟲程序 89
7.3 Scrapy庫中的數據流 92
7.3.1 Scrapy庫的shell 93
7.3.2 目標項 98
7.4 生成網站地圖的蜘蛛程序 99
7.5 目標項管道 100
7.6 參考資料 102
7.7 小結 102
第8章 NLTK與其他Python庫的搭配
運用 104
8.1 NumPy 104
8.1.1 多維數組 105
8.1.2 基本運算 106
8.1.3 從數組中提取數據 107
8.1.4 復雜矩陣運算 108
8.2 SciPy 112
8.2.1 線性代數 113
8.2.2 特征值與特征向量 113
8.2.3 稀疏矩陣 114
8.2.4 優化措施 115
8.3 pandas 117
8.3.1 讀取數據 117
8.3.2 數列 119
8.3.3 列轉換 121
8.3.4 噪聲數據 121
8.4 matplotlib 123
8.4.1 子圖繪制 123
8.4.2 添加坐標軸 124
8.4.3 散點圖繪制 125
8.4.4 條形圖繪制 126
8.4.5 3D繪圖 126
8.5 參考資料 126
8.6 小結 127
第9章 Python中的社交媒體挖掘 128
9.1 數據收集 128
9.2 數據提取 132
9.3 地理可視化 134
9.3.1 影響力檢測 135
9.3.2 Facebook 135
9.3.3 有影響力的朋友 139
9.4 小結 141
第10章 大規模文本挖掘 142
10.1 在Hadoop上使用Python的
不同方式 142
10.1.1 Python的流操作 143
10.1.2 Hive/Pig下的UDF 143
10.1.3 流封裝器 143
10.2 Hadoop上的NLTK 144
10.2.1 用戶定義函數
(UDF) 144
10.2.2 Python的流操作 146
10.3 Hadoop上的Scikit-learn 147
10.4 PySpark 150
10.5 小結 153


序: