TRIP非結構化數據庫及其搜索引擎技術與應用( 簡體 字) | |
作者:練亞純 | 類別:1. -> 程式設計 -> 搜索引擎 2. -> 資料庫 -> 綜合 |
出版社:電子工業出版社 | 3dWoo書號: 39321 詢問書籍請說出此書號! 有庫存 NT售價: 210 元 |
出版日:7/1/2014 | |
頁數:256 | |
光碟數:0 | |
站長推薦: | |
印刷:黑白印刷 | 語系: ( 簡體 字 ) |
ISBN:9787121237034 | 加入購物車 │加到我的最愛 (請先登入會員) |
(簡體書上所述之下載連結耗時費功, 恕不適用在台灣, 若讀者需要請自行嘗試, 恕不保證, 繁體書的下載亦請直接連絡出版社) | |
引言:漫話數據庫技術發展 1
0.1 非結構化數據庫的相關概念 1 0.2 數據庫技術發展簡略回顧 3 0.3 非結構化數據庫的現實意義 6 第1篇 數據庫篇 第1章 非關系數據庫概述 13 1.1 引言 13 1.2 非關系數據庫的基本概念和技術 14 1.2.1 非關系數據庫的基本概念 15 1.2.2 非關系數據庫中的關鍵技術 16 1.3 非關系數據庫現狀 22 1.4 幾種典型的非關系數據庫 22 1.4.1 分布式結構化數據表BigTable 22 1.4.2 Amazon的平臺基礎存儲架構 Dynamo 29 1.4.3 BigTable和Dynamo的對比 分析 37 1.5 NoSQL的優勢與劣勢 38 1.6 TRIP全文數據庫系統 38 第2章 TRIP系統概述 39 2.1 TRIP系統基礎 39 2.1.1 TRIP系統構成 40 2.1.2 數據模型 42 2.1.3 數據組織 43 2.1.4 字段類型 44 2.1.5 TRIP管理員 45 2.1.6 控制文件 45 2.2 TRIP數據庫基礎 46 2.2.1 記錄與元記錄 46 2.2.2 文件結構 48 2.2.3 用戶操作界面 51 習題2 54 第3章 TRIP數據庫設計 55 3.1 數據庫設計TRIPclassic 55 3.1.1 數據庫基本屬性 56 3.1.2 字段定義 58 3.1.3 數據庫設計的保存、修改、 刪除與復制 63 3.1.4 庫組 64 3.2 數據庫設計—CCL命令方式 65 3.2.1 輸出數據庫結構 65 3.2.2 創建數據庫結構 67 3.3 數據庫設計—GUI方式 68 3.3.1 創建數據庫 68 3.3.2 字段定義 71 3.3.3 數據庫的修改、刪除和復制 72 3.4 敘詞表 72 3.4.1 敘詞表的概念和用途 72 3.4.2 敘詞表的基本元素 74 3.4.3 TRIP敘詞表結構 75 3.4.4 創建敘詞表步驟 76 習題3 77 第4章 數據庫的數據裝入與維護 79 4.1 批量導入數據 79 4.1.1 Tform文件格式 79 4.1.2 Tform數據的裝入與倒排 81 4.1.3 Tform數據建庫示例 81 4.2 在線錄入數據 83 4.2.1 錄入表單的設計 83 4.2.2 錄入表單的管理 85 4.2.3 數據在線錄入 86 4.3 數據庫的修改更新 86 4.3.1 錄入界面的在線修改 86 4.3.2 全局更新 87 4.3.3 利用Tform文件的批量更新 88 4.4 數據庫的拆分合并與轉移 90 4.4.1 拆分數據庫 90 4.4.2 合并數據庫 91 4.4.3 數據庫記錄的轉移 91 4.5 數據庫光盤 91 4.5.1 數據光盤與數據庫光盤 91 4.5.2 建立數據庫光盤的基本要求 92 4.5.3 數據庫光盤的創建步驟 92 習題4 93 第5章 TRIP數據庫的安全性控制 94 5.1 安全性概述 94 5.2 用戶和用戶組的權限管理 94 5.2.1 用戶 94 5.2.2 用戶組 97 5.3 數據庫的使用權限管理 100 5.3.1 數據庫授權—TRIPclassic 101 5.3.2 數據庫授權—GUI 102 5.3.3 數據庫所有權的轉移 104 5.4 數據備份和恢復 105 5.5 日志和審計 105 5.5.1 Tform文件的LOG文件 105 5.5.2 數據庫被檢索的日志 108 5.5.3 數據庫維護日志 108 習題5 109 第2篇 搜索引擎篇 第6章 TRIP的索引技術 113 6.1 采用倒排表的信息檢索 113 6.2 哈希法 114 6.3 索引文件內容 116 6.4 索引內容的存儲 117 習題6 118 第7章 TRIP數據庫檢索 119 7.1 TRIP數據庫檢索操作入門 119 7.2 基本檢索操作命令 121 7.2.1 帶運算符的檢索命令 121 7.2.2 在指定字段范圍的查找 121 7.2.3 截斷檢索 121 7.2.4 對數值、日期、時間的檢索 122 7.2.5 用記錄號檢索 123 7.2.6 二次查找——利用過程號進 一步查找 123 7.2.7 檢索結果的顯示 124 7.3 高級檢索操作命令 125 7.3.1 整個phrase子字段內容的 查找 125 7.3.2 一組字段的查找 126 7.3.3 查找字段內容重復的記錄 126 7.3.4 同一范圍內的查找 126 7.3.5 記錄“郵戳”的查找 127 7.3.6 多個數據庫的同時檢索 127 7.3.7 元組字段的查找 129 7.3.8 查找命令過程的存儲 130 習題7 130 第8章 搜索相關的其他功能 132 8.1 內容匯聚 132 8.2 索引詞瀏覽 135 8.3 詞義擴展 135 8.4 數值統計與數據分析 138 8.5 間接檢索 142 8.5.1 間接檢索概述 142 8.5.2 間接檢索的操作過程 142 8.5.3 間接檢索示例 143 8.6 詞表檢索 146 8.6.1 詞表檢索 147 8.6.2 詞表的調用顯示 148 8.6.3 用詞表的數據庫檢索 149 8.6.4 同義詞與跨語言查找 150 8.7 中文自動分詞 151 8.7.1 單漢字處理 151 8.7.2 中文自動分詞 152 8.7.3 分詞詞典及設置 153 8.7.4 分詞法選擇 154 習題8 156 第9章 TRIP數據庫的輸出格式 157 9.1 輸出模板的組成 157 9.2 創建輸出模板 158 9.2.1 輸出模板布局 159 9.2.2 背景文字 160 9.2.3 函數 161 9.2.4 頁面尺寸控制 168 9.2.5 輸出模板的生成、復制與 刪除 169 習題9 169 第3篇 應用開發篇 第10章 TRIP數據庫編程 173 10.1 TRIPnxp&TRIPjxp類庫介紹 173 10.2 會話 174 10.3 數據庫操作 175 10.4 數據操作 179 10.4.1 數據檢索 179 10.4.2 數據更新 184 10.5 用戶管理 189 10.6 用戶組管理 191 10.7 權限管理 192 10.8 執行CCL命令 193 習題10 195 第11章 TRIP數據庫編程實例 196 11.1 系統任務的提出和設計思路 196 11.1.1 數據庫設計 196 11.1.2 界面設計 197 11.2 主要模塊及實現 197 11.2.1 數據庫接口類DbKit 198 11.2.2 登錄模塊 199 11.2.3 記錄添加模塊 200 11.2.4 記錄刪除模塊 201 11.2.5 記錄修改模塊 202 11.2.6 記錄檢索模塊 203 11.2.7 數據的顯示和刷新 203 習題11 204 第12章 TRIP其他組件介紹 205 12.1 TRIP的主要產品 205 12.2 TRIPview 205 12.3 連接池 209 12.4 TRIPagent 212 12.4.1 TRIPagent介紹 212 12.4.2 TRIPagent基本概念 213 12.4.3 TRIPagent的使用 214 12.5 TRIP文件分類 218 12.6 TRIPgrid 221 12.6.1 作為存儲網格的TRIP 221 12.6.2 TRIP Web Service 222 12.6.3 管理TRIPgrid 222 習題12 223 附錄A CCL命令參考手冊 224 參考文獻 243 本書以TRIP數據庫為例,系統闡述了非關系數據庫的基礎理論、基本技術和基本方法。除引言外,全書包括3篇內容。引言部分回顧數據庫技術的發展歷史,闡述非結構化數據庫的現實意義;數據庫篇共5章,包括非關系數據庫概述、TRIP系統概述、TRIP數據庫設計、數據庫的裝入與維護和TRIP數據庫的安全性控制;搜索引擎篇共4章,包括TRIP的索引技術、TRIP數據庫檢索、搜索相關的其他功能和TRIP數據庫的輸出格式;應用開發篇共3章,包括TRIP數據庫編程、TRIP數據庫編程實例和TRIP其他組件介紹。
隨著互聯網和信息技術的發展,非結構化數據量呈幾何級數增長,尤其是隨著Web 2.0技術的流行,更加速了這種增長。如今大到互聯網、社交網、移動網,小至智能終端,到處充滿了非結構化數據;上至政府機關、企事業單位的計算機設備,下至個人計算機,隨處可見越積越多的各種格式電子文檔。信息社會已跨入大數據時代。
面對海量涌現的非結構化數據,如何有效地組織和管理?傳統的主流數據庫技術SQL實在難于應對,于是,2009年前后互聯網催生了NoSQL。此后又如雨后春筍般不斷涌現非結構化數據庫,于今已有百種之多。 雖然非結構化數據庫日益盛行,但是有關非結構化數據庫技術的文獻卻不多見,適于處理單位內部非結構化數據的技術資料難于尋獲。為了讓學生能夠緊隨技術前沿,中原工學院電子檔案技術研究所組織編寫有關非結構化數據庫方面的教材,并對本校計算機學院的3個專業開設了《非結構化數據庫技術及應用》選修課。通過三年來學生的選課及學習情況,我們感受到學生對非結構化數據庫技術的渴求。 本書編寫團隊的主要成員多年從事非結構化數據庫技術的研究及應用開發,有豐富的實踐經驗,一直緊跟國際前沿技術,通過引進、消化和吸收國內外非結構化數據庫的先進理念和先進技術,集中時間編寫了這本書,希望有所裨益。本書適合不同層次的讀者閱讀,也適合作為高校教材使用。除引言外,全書分為3篇,共12章,第一篇為數據庫篇,第二篇為搜索引擎篇,第三篇為應用開發篇;每章有教學提示和教學目標,并附有習題。書中例子代碼全部調試通過。 本書由練亞純擔任主編,鄭秋生、陶光毅、高艷霞為副主編。引言和第6章由練亞純編寫;第1章由王宗江編寫;第2章由徐飛編寫;第3章和附錄由高艷霞編寫;第4章由楊要科編寫;第5章由潘惠勇編寫;第7章由杜獻峰編寫;第8章由夏敏捷編寫;第9章由李娟編寫;第10章由高艷霞編寫;第11章由張慎武編寫;第12章由王宗江、潘惠勇、夏敏捷、高艷霞等共同編寫。練亞純、鄭秋生、陶光毅統稿。 由于非結構化數據庫技術可以參考的資料有限,加之作者水平有限、時間較緊,書中難免存在錯誤和不當之處,歡迎讀者批評指正。 作 者 |