-- 會員 / 註冊 --  
 帳號:
 密碼:
  | 註冊 | 忘記密碼
3/26 新書到! 3/19 新書到! 3/14 新書到! 12/12 新書到!
購書流程Q & A站務留言版客服信箱
3ds MaxMayaRhinoAfter EffectsSketchUpZBrushPainterUnity
PhotoShopAutoCadMasterCamSolidWorksCreoUGRevitNuke
C#CC++Java遊戲程式Linux嵌入式PLCFPGAMatlab
駭客資料庫搜索引擎影像處理FluentVR+ARANSYS深度學習
單晶片AVROpenGLArduinoRaspberry Pi電路設計CadenceProtel
HadoopPythonStm32CortexLabview手機程式AndroidiPhone
可查書名,作者,ISBN,3dwoo書號
詳細書籍分類

智能搜索:大數據搜索引擎原理及算法解析

( 簡體 字)
作者:沙蕓類別:1. -> 程式設計 -> 搜索引擎
譯者:
出版社:清華大學出版社智能搜索:大數據搜索引擎原理及算法解析 3dWoo書號: 51869
詢問書籍請說出此書號!

缺書
NT售價: 350

出版日:11/1/2019
頁數:196
光碟數:0
站長推薦:
印刷:語系: ( 簡體 版 )
加入購物車 加到我的最愛
(請先登入會員)
ISBN:9787302535508
作者序 | 譯者序 | 前言 | 內容簡介 | 目錄 | 
(簡體書上所述之下載連結耗時費功, 恕不適用在台灣, 若讀者需要請自行嘗試, 恕不保證)
作者序:

譯者序:

前言:

智慧生物與機器集群構建的搜索系統已進化成為強大的智能系統。搜索引擎服務早已成為人們生活中不可或缺的一部分。
搜索引擎技術有著悠久的發展歷史。1990年以來,搜索引擎經歷了從Archie那樣的FTP文件搜索服務到谷歌網頁搜索服務的轉變。強化學習、深度學習等技術的發展為搜索引擎技術持續不斷地注入新的活力。
本書共分6章:第1章介紹開發智能搜索引擎可以采用的軟件和硬件基礎;第2章介紹搜索引擎理解文本語義的一些方法;第3章介紹通過開發語音識別技術來索引音頻信息的一種方法;第4章介紹使用Elasticsearch實現的大數據分布式搜索引擎;第5章介紹分布式計算平臺中的共識算法和遠程過程調用(RPC)框架;第6章介紹醫藥垂直搜索引擎和電商搜索的案例分析。
本書相關的參考軟件和代碼在讀者QQ群(661922108)的附件中可以找到。一些具體的細節也可以在讀者QQ群討論。感謝早期合著者、合作伙伴、員工、學員、讀者的支持。他們的支持給我們提供了良好的工作基礎,就像玻璃容器中的水培植物一樣,這是一個持久可用的成長基礎。技術的融合與創新無止境,歡迎一起探索。
本書適合需要具體實現搜索引擎的程序員使用,對于信息檢索等相關領域的研究人員也有一定的參考價值,同時獵兔搜索技術團隊已經開發出以本書為基礎的專門培訓課程和商業軟件。
參與本書編寫的還有羅剛、張子憲、石天盈、張繼紅、劉曉波、葉虎、羅庭亮、柳若邊,在此一并表示感謝。


作者
內容簡介:

《智能搜索:大數據搜索引擎原理及算法解析》介紹大數據分布式搜索引擎開發原理與技術實現,主要內容包括多種語言的文本處理、分布式算法與代碼實現、Elasticsearch的使用與原理等,通過一個醫藥領域垂直搜索引擎和電商搜索來說明如何開發實際的大數據智能搜索引擎。《智能搜索:大數據搜索引擎原理及算法解析》共分6章,第1章著重介紹開發智能搜索引擎可以采用的軟硬件環境;第2∼5章著重討論構建分布式智能搜索引擎可能需要的多種語言文本處理方法,例如Kaldi語音識別實現和基于Raft共識協議的分布式計算平臺實現;第6章介紹醫藥和電商搜索兩個應用案例。
《智能搜索:大數據搜索引擎原理及算法解析》適合作為高等院校計算機、軟件工程專業本科生、研究生的參考用書,對于對人工智能領域感興趣的人士也有一定的參考價值。
目錄:

第1章智能搜索引擎開發 1
1.1人工智能與智能搜索引擎 1
1.2Linux操作系統基礎 2
1.2.1SSH遠程登錄 2
1.2.2Micro文本編輯器 4
1.2.3LinuxShell腳本基礎 4
1.2.4Shell腳本 5
1.2.5AWK 8
1.3Java基礎 8
1.3.1使用Ant 9
1.3.2使用Maven 11
1.3.3使用Gradle 13
1.3.4使用GroovyShell 16
1.3.5使用JShell 17
1.4Python基礎 17
1.4.1Windows下安裝Python 17
1.4.2Linux下安裝Python 17
1.4.3開發環境 18
1.5C#基礎 19
1.6硬件基礎 21
1.7本章小結 22
第2章搜索引擎理解語義 23
2.1處理文本 23
2.2基于文法的語言模型 24
2.3正則表達式查找文本 25
2.4中文詞語切分與詞性標注 27
2.4.1使用中文分詞 28
2.4.2正向最大長度匹配法 30
2.4.3未登錄串識別 31
2.4.4基本的N元模型 34
2.5隱馬爾可夫模型 43
2.5.1數據基礎 43
2.5.2維特比算法 44
2.6英文文本切分與標注 48
2.6.1句子切分 48
2.6.2標注詞性 50
2.7命名實體識別 52
2.7.1人名識別 52
2.7.2 人名識別規則 53
2.8文本歸一化 61
2.9依存樹模型 62
2.10情感分析 63
2.11本章小結 66
第3章搜索引擎聽懂語音 67
3.1語音識別總體結構 67
3.2Kaldi快速入門 68
3.2.1安裝Kaldi 69
3.2.2yesno例子 69
3.2.3數據準備 70
3.2.4詞典準備 71
3.2.5構建一個簡單的ASR 74
3.3使用FFmpeg提取音頻 82
3.4時間序列 82
3.5動態時間規整 84
3.6傅里葉變換 86
3.6.1離散傅里葉變換 86
3.6.2快速傅里葉變換 89
3.7MFCC特征 92
3.8在線解碼 93
3.8.1使用現成的模型 93
3.8.2使用Alex-ASR 94
3.9加權有限狀態轉換 95
3.9.1FSA 96
3.9.2FST 97
3.9.3WFST 98
3.10語音識別語料庫 99
3.10.1TIMIT語音庫 99
3.10.2中文語音庫 99
3.11本章小結 100
第4章Elasticsearch分布式搜索引擎 101
4.1搭建Elasticsearch集群 101
4.2索引數據 103
4.3實現搜索接口 107
4.4搜索界面開發 108
4.4.1使用SpringBoot開發搜索界面 109
4.4.2使用.NET開發搜索界面 132
4.5檢索模型 142
4.5.1使用BM25檢索模型 146
4.5.2參數調優 146
4.6搜索中文優化 147
4.7Elasticsearch源代碼分析 152
4.7.1導入源代碼到Eclipse 152
4.7.2Guice框架 152
4.7.3Netty異步IO框架 154
4.7.4分布式設計與實現 155
4.7.5使用Lucene 156
4.8本章小結 159
第5章分布式計算平臺 160
5.1Atomix框架 160
5.1.1Raft協議 160
5.1.2使用Atomix 162
5.2gRPC框架 164
5.3本章小結 167
第6章智能搜索案例分析 168
6.1醫藥垂直搜索引擎 168
6.1.1網絡爬蟲 169
6.1.2抓取PubMed 177
6.1.3MVC搜索界面開發 179
6.1.4構建知識庫 183
6.1.5自動問答 185
6.2電商搜索 188
6.2.1電商爬蟲 188
6.2.2商品搜索 192
6.2.3在線客服 195
6.3本章小結 198
參考文獻 199
序: