|
-- 會員 / 註冊 --
|
|
|
|
Solr權威指南 下卷 ( 簡體 字) |
作者:蘭小偉 著 | 類別:1. -> 程式設計 -> 搜索引擎 |
譯者: |
出版社:機械工業出版社 | 3dWoo書號: 48060 詢問書籍請說出此書號!【缺書】 NT售價: 445 元 |
出版日:11/1/2017 |
頁數:314 |
光碟數:0 |
|
站長推薦: |
印刷:黑白印刷 | 語系: ( 簡體 版 ) |
|
加入購物車 │加到我的最愛 (請先登入會員) |
ISBN:9787111582076 |
作者序 | 譯者序 | 前言 | 內容簡介 | 目錄 | 序 |
(簡體書上所述之下載連結耗時費功, 恕不適用在台灣, 若讀者需要請自行嘗試, 恕不保證) |
作者序: |
譯者序: |
前言: |
內容簡介:Solr是一個構建在Apache Lucene上的流行的、快速的、開源的企業搜索平臺,它的主要功能包括強大的全文搜索、命中高亮、多維度查詢與分析統計、豐富的文檔解析、地理空間搜索、大量的REST API以及并行SQL。Solr是安全的、高度可伸縮的、可自動容錯的分布式索引和搜索的企業級解決方案,并為世界上許多高流量的internet站點提供了全文搜索和導航的技術支持并備受歡迎。
Solr在企業內一個典型的應用場景就是電商商品搜索、類別導航區塊、屬性過濾區塊、搜索框自動聯想,等等。當下已是大數據時代,企業的業務數據量呈TB級增長,對于數據的搜索需求會愈加強烈,對于低成本的互聯網企業,Solr的使用訴求也會更加普遍。
對于歷史數據的查詢,在數據量還不具規模的情況下,一般采用傳統關系型數據庫自帶的索引功能即可實現高效的數據查詢。但當數據上升到一定規模時,或許你會想到使用HBase數據庫來救急,然而HBase目前只支持針對rowkey的一級索引,尚且不支持二級索引,此時Solr+Hbase的珠聯璧合就可以完美打破這一局限性。但Solr的強大不僅如此,尤其當你足夠了解Solr之后。
本書采用淺顯易懂的語言加以適當的配圖為你詳細解讀Solr的每個技術點,讓其中涉及的每個原理、機制都不再晦澀難懂。理論結合實踐才能出真知,案例驅動的方式貫穿本書始終,希望讀者能夠多上機實踐書中的每個示例,遵循“理解為主,實踐為輔”的學習原則,學以致用并在自己所在公司企業內部部署Solr,充分施展Solr的威力,從而體現自己的個人價值。
本書作者是國內最早接觸Solr的技術專家之一,多年一直在Solr的研究、實踐和布道的路上不遺余力、樂此不彼。本書立足全球視野,綜合Solr技術的最新發展和應用、從業人員的學習曲線,以及中英文資料的供給情況,給自己設定了一個極高的目標:力爭在內容的全面性、系統性、深淺度和實戰性上超越所有的同類書。從完成的結果上來看,我們的目標接近完成,Solr的基礎知識、核心技術、進階知識和擴展知識悉數包括在內。
全書一共16章,分為上下兩卷:
上卷(第1~10章)
全面、系統地講解了Solr的基礎知識和核心技術。包括部署、配置、Solr Core、Solr DIH、全量導入、增量導入、索引、中文分詞、查詢組件、Solr Facet、高亮、查詢建議,以及企業如何在真實的項目中使用Solr。不僅講解了基本概念和使用方法,而且還分析了各組件的內部工作機制。
下卷(第11~16章)
細致、深入地講解了Solr的高級知識和拓展知識。
高級知識部分包括:Solr的高級查詢及其各種查詢技巧,如函數查詢、地理空間查詢、Facet嵌套等;SolrJ、SolrCloud、Spring Data Solr的使用詳解和工作原理;Solr的多種性能優化技巧,如索引的性能優化、緩存的性能優化、查詢的性能優化、JVM和Web容器的優化,以及操作系統級別的優化。
拓展知識中首先講解了Solr的一些比較生僻的知識點,如偽域、多語種索引支持、安全認證,以及Solr 6.x中的SQL接口和Streaming表達式等;然后講解了Solr與MapReduce、HDFS、Hbase、Kafka、Flume、Storm、Spark等大數據技術的結合使用的集成方法。 |
目錄:序 言
第11章 Solr高級查詢 1
11.1 Solr函數查詢 2
11.1.1 Function語法 2
11.1.2 使用函數查詢 4
11.1.3 將函數計算值作為“偽域”返回 5
11.1.4 根據函數進行排序 6
11.1.5 Solr中的內置函數 7
11.1.6 自定義函數 13
11.2 Solr地理空間查詢 16
11.2.1 Solr地理空間簡單查詢 17
11.2.2 Solr地理空間高級查詢 19
11.3 Pivot Facet 29
11.4 Solr Subfacet 31
11.4.1 Subfacet語法 32
11.4.2 Subfacet復雜示例 32
11.5 Solr Facet Function 34
11.5.1 聚合函數 35
11.5.2 聚合函數與Subfacet結合 35
11.5.3 Solr中的Percentile函數 36
11.6 JSON Facet API 39
11.6.1 JSON Facet API簡介 39
11.6.2 JSON Facet簡單使用 40
11.6.3 Facet類型 41
11.6.4 JSON Facet語法 41
11.6.5 Term Facet 42
11.6.6 Query Facet 43
11.6.7 Range Facet 43
11.6.8 Multi-Select Facet 44
11.7 Interval Facet 47
11.8 Hierarchical Facet 48
11.9 Solr Stats組件 50
11.10 Solr Terms組件 52
11.11 SolrTerm Vector組件 54
11.12 Solr Query Elevation組件 56
11.13 Solr Result Clustering組件 59
11.14 本章總結 62
第12章 Solr查詢進階篇 63
12.1 Solr深度分頁 63
12.2 Solr自定義排序 66
12.3 Solr Join查詢 70
12.3.1 跨Core Join 71
12.3.2 跨Document Join 73
12.3.3 Block Join 74
12.3.4 Block Join Facet 77
12.4 深入Solr相關性評分 79
12.4.1 Field權重 79
12.4.2 Term權重 80
12.4.3 Payload權重 80
12.4.4 Function權重 81
12.4.5 鄰近Term權重 82
12.4.6 Document權重 83
12.4.7 自定義Similarity插件 84
12.5 Solr NRT近實時查詢 86
12.6 Solr Real-time Get查詢 88
12.7 Solr評分查詢 90
12.8 Solr MoreLikeThis組件 91
12.9 Solr自定義Query Parser 95
12.10 本章總結 97
第13章 SolrJ 98
13.1 什么是SolrJ 98
13.2 SolrJ的環境依賴與配置 99
13.3 SolrClient介紹 101
13.4 SolrJ簡單使用 103
13.5 SolrJ查詢 106
13.6 使用SolrJ高效導出數據 110
13.7 SolrJ增量更新 111
13.8 SolrJ原子更新 112
13.9 使用SolrJ管理Core 116
13.9.1 創建Core 117
13.9.2 卸載Core 118
13.9.3 加載Core 119
13.9.4 交換Core 119
13.9.5 重命名Core 120
13.9.6 查看Core狀態 120
13.9.7 Core合并 120
13.9.8 Core分裂 121
13.10 使用SolrJ管理schema.xml 122
13.10.1 Field管理 122
13.10.2 FieldType管理 127
13.10.3 Schema管理 130
13.10.4 Schema管理的事務性批量操作 132
13.11 使用SolrJ操作JSON Request API 133
13.12 使用Spring Data Solr 136
13.12.1 Spring Data Solr環境搭建 136
13.12.2 Spring Data Solr的CRUD 138
13.12.3 Spring Data Solr中的查詢 141
13.12.4 Spring Data Solr中的Repository詳解 143
13.12.5 Spring Data Solr中Solr-Template工具類詳解 146
第14章 SolrCloud 153
14.1 SolrCloud快速入門 153
14.2 SolrCloud工作原理 156
14.2.1 SolrCloud的核心概念 156
14.2.2 SolrCloud中的Shard 157
14.2.3 Collection VS Core 158
14.2.4 索引文檔路由 161
14.2.5 Shard的幾種狀態 162
14.2.6 Replica的幾種狀態 162
14.2.7 Shard分割 163
14.2.8 SolrCloud里的自動提交 163
14.2.9 SolrCloud的分布式查詢請求 164
14.2.10 讀寫端的自動容錯 171
14.2.11 Zookeeper 173
14.3 SolrCloud集群搭建 182
14.3.1 在Tomcat容器下搭建SolrCloud集群 183
14.3.2 在Jetty容器下搭建SolrCloud集群 189
14.4 SolrCloud的基本操作 194
14.4.1 Solr環境變量設置 194
14.4.2 創建Collection 195
14.4.3 刪除Collection 196
14.4.4 啟動Solr 196
14.4.5 停止Solr 197
14.4.6 查看Solr狀態 198
14.4.7 Collection健康檢測 198
14.4.8 管理Zookeeper上的配置文件 199
14.5 SlorCloud配置詳解 201
14.5.1 solr.xml詳解 201
14.5.2 zoo.cfg詳解 204
14.6 SolrCloud分布式索引 205
14.6.1 添加索引文檔到SolrCloud 205
14.6.2 SolrCloud里的近實時查詢 206
14.7 SolrCloud分布式查詢 207
14.8 SolrCloud Collection API 208
14.8.1 Collection常用操作API 209
14.8.2 Shard常用操作API 212
14.8.3 Replica常用操作API 215
14.8.4 集群管理API 216
14.9 Solr索引主從復制 217
14.9.1 索引復制簡介 217
14.9.2 索引復制的術語 218
14.9.3 索引復制的配置 219
14.9.4 配置索引復制中繼器 221
14.9.5 索引復制工作機制 222
14.9.6 ReplicationHandler HTTP接口 223
14.10 跨數據中心的索引復制(CDCR) 224
14.10.1 什么是CDCR 224
14.10.2 CDCR的Push機制 225
14.10.3 CDCR搭建 226
14.10.4 CDCR配置詳解 228
14.10.5 CDCR的HTTP接口 229
14.10.6 CDCR存在的限制 229
14.11 本章總結 230
第15章 Solr性能優化 231
15.1 Schema設計的注意事項 232
15.2 Solr索引更新與提交的優化建議 233
15.3 索引合并性能調優 234
15.4 索引優化的注意事項 235
15.5 Solr緩存 235
15.5.1 Solr緩存的常見配置參數 236
15.5.2 Filter緩存 236
15.5.3 Document緩存 237
15.5.4 QueryResult緩存 237
15.5.5 FieldValue緩存 237
15.5.6 HTTP緩存 238
15.5.7 緩存相關的其他配置 238
15.6 Solr查詢性能的優化建議 239
15.7 JVM以及Web容器的優化 242
15.8 操作系統級別的優化建議 249
15.9 本章總結 250
第16章 Solr擴展篇 251
16.1 Solr如何版本升級 251
16.2 Solr中的偽域 253
16.3 Solr多語種索引支持 255
16.4 Solr中自定義Redis緩存 257
16.5 Solr如何開啟HTTPS 258
16.6 Solr安全認證 260
16.6.1 基礎安全認證插件 260
16.6.2 Solr中的Authorization API 263
16.7 SolrCloud模式下使用Canal增量更新索引 264
16.8 Solr與MapReduce集成 270
16.9 Solr使用HDFS存儲索引 271
16.10 使用Flume收集數據并索引至Solr 273
16.11 使用Solr實現HBase的二級索引 277
16.12 Solr與Kafka、Flume集成 282
16.13 使用Storm索引數據至Solr 286
16.14 Spark與Solr進行數據交互 291
16.15 Solr6中的SQL接口 297
16.15.1 Solr SQL架構 297
16.15.2 Solr SQL配置 299
16.15.3 發送Solr SQL請求 300
16.15.4 Solr SQL語法 301
16.15.5 Solr SQL客戶端可視化工具的使用 302
16.16 Solr6中的Streaming表達式 304
16.16.1 Streaming語言基礎 304
16.16.2 Streaming源函數 305
16.16.3 Streaming裝飾函數 307
16.17 Solr常見問題解答 310 |
序: |
|