|
-- 會員 / 註冊 --
|
|
|
|
知識圖譜:概念與技術 ( 簡體 字) |
作者:肖仰華 等 | 類別:1. -> 程式設計 -> 自然語言 |
譯者: |
出版社:電子工業出版社 | 3dWoo書號: 52196 詢問書籍請說出此書號!【有庫存】 NT售價: 590 元 |
出版日:1/1/2020 |
頁數:540 |
光碟數:0 |
|
站長推薦: |
印刷:黑白印刷 | 語系: ( 簡體 版 ) |
|
加入購物車 │加到我的最愛 (請先登入會員) |
ISBN:9787121371080 |
作者序 | 譯者序 | 前言 | 內容簡介 | 目錄 | 序 |
(簡體書上所述之下載連結耗時費功, 恕不適用在台灣, 若讀者需要請自行嘗試, 恕不保證) |
作者序: |
譯者序: |
前言:序
自2012年Google發布知識圖譜以來,知識圖譜技術飛速發展,其理論體系日趨完善,應用效果日益明顯。在知識圖譜技術的引領下,知識工程新的歷史篇章——大數據知識工程已初具輪廓;在知識圖譜技術的推動下,各行各業的智能化升級與轉型的宏偉畫卷正逐步展開。回溯半個多世紀,以物理符號系統為代表的人工智能符號主義理論思潮與以專家系統建設為核心的知識工程實踐相得益彰、大放異彩。再回溯到2000多年前,追根溯源,古希臘哲學三賢開創了偉大的邏輯思維時代,其思想直接或間接地影響了從符號主義到知識工程再到知識圖譜的歷史延承與發展。
發生在當下的以大數據、人工智能為代表的一系列技術革命很可能是人類誕生以來最為宏大也是影響最為深遠的技術革命。站在當下這一重要時間節點,回望過去,展望未來,每個親歷者都不免心潮澎湃,感慨時代變遷之偉大,個人沉浮之渺小。然而,偉大的時代往往是由星星點點的思想與細小而堅實的實踐鑄就而成的。本書就是這樣一支涓涓細流,愿其最終匯入時代的大江大河。
從鴉片戰爭時國門被迫打開,到五四運動時民眾自發覺醒,再到新中國成立后西方優質思想被積極引進,西學東漸的進程綿延不絕、持續至今。直到今天,我們對于整個西方思想的吸收與消化仍在進行。在某種程度上,知識圖譜技術及其背后的思想也源自西方人工智能思想。在當下中國的知識圖譜技術實踐過程中,簡單地消化與吸收西方人工智能思想已經難以滿足國家與社會的發展需求。在越來越多的應用領域和核心技術方面,我們需要來自中國的創新,需要形成中國自身的話語權與主導權。我國各行業的智能化發展對于原創性理論與技術提出了迫切需求,我國的研發不僅需要面向實際問題,更需要足夠前沿,才有可能支撐行業的智能化發展。我們必須從西方思想的傳聲筒轉變成自己思想體系的架構者與踐行者,言必稱西方應該成為過去時。研究環境的這一變化對于本書的編寫提出了全新的要求。本書希望在梳理西方思想體系與應用實踐的基礎之上,對發生在當下中國的一些前沿實踐、關鍵技術、實用方法,以及這些實踐背后的思想體系,進行全面的總結,為一線的從業人員、教學人員提供必要的理論與技術論支撐。
可以言說的即是可以思考的,可以思考的問題終究是簡單的問題。隨著人工智能的發展,越來越多難以言說的“難題”逐漸浮出水面,比如意識難題。突破思維的邊界對于解決人工智能難題而言顯得日益重要。縱觀歷史,任何一家之言終究會湮沒在歷史洪流之中。在此成書之際,筆者提醒讀者不要將自己的思維囿于任何一隅,即便某個思潮、某種技術、某個方法在當下如火如荼。如果將人工智能的實現視作一場曠日持久的戰爭,我們可能還要發起很多次沖鋒才能取得這場戰爭的決定性勝利。而每一次沖鋒都將是某一種思想、某一類技術在人工智能發展史中的一次華麗亮相。
肖仰華
2019年11月于復旦大學
前言
近年來,隨著知識圖譜技術研究與應用的深化,知識圖譜技術吸引了來自工業界與學術界的廣泛關注。知識圖譜領域涌現出大量的理論與技術研究成果,以及一批優秀的工程實踐案例。一方面,對于這些理論工作與工程實踐,需要進行系統性的梳理;另一方面,隨著研究與應用的深入,業界也迫切需要一本系統性的知識圖譜教材。鑒于此,本書編寫團隊投入巨大的資源與精力完成了本書。
本書的內容體系基本成型于2018年8月,從2017年到2019年,其先后兩次在復旦大學相關課程中進行講授,2018年8月和12月其分別在上海財經大學和北京理工大學面向全國公開講授,累計近千人次完成了課程的學習。從2018年年底至今,本書編寫組完成了書稿,并經多輪修改,最終形成大家手中的這個版本。
下面將對本書的編寫動機、行文思路、內容架構、內容選擇與使用方式等做簡要的介紹,以方便讀者了解本書的成書背景和使用方式。
編寫動機
大量的應用實踐需要有專業的圖書作為參考和指導,大量的學術成果需要有圖書進行系統的梳理,這些是作者團隊編寫本書的直接原因。除此之外,還有以下幾點原因需要說明。首先,知識圖譜已經成為一門獨立學科,設置在我國新增的人工智能學學科目錄下。建設一門新興學科,首先需要厘清這門學科的知識體系。而完成這一任務的第一步即是編寫一本系統性的知識圖譜教材。其次,知識圖譜作為一門工程學科,其具體方法大都來自計算機或人工智能的其他領域,比如自然語言處理、機器學習、數據庫,那么還有什么知識是這些傳統技術領域沒有涵蓋的呢?如果不澄清這一問題,知識圖譜圖書的編寫便是無源之水,我們只需要學習各個分支領域的知識即可;如果不澄清這一問題,知識圖譜圖書的編寫很容易變成言知識圖譜之名,行其他技術之實。下面對這一問題進行簡要回答。
知識圖譜作為一個大規模知識工程,是面向應用落地的,也是系統工程。這兩點決定了知識圖譜是典型的應用學科。一門面向應用的學科旨在解決現實世界的復雜問題。工程落地中最重要的問題在于選擇,在于策略。這就好比廚師做菜,食材原料多種多樣,至于每種食材是如何培育出來的,不是廚師主要關心的問題。廚師關心的是如何選擇好的食材,如何利用這些好的食材做出可口的菜肴。對于同樣的問題,不同的學科有著不同的解法。在當前的技術條件下,哪一個方法能更經濟、務實地解決問題,就是我們選擇“食材”的最高標準。有了食材之后,如何做成一道美味佳肴,則是擺在廚師面前的第二個問題。此時,策略、過程,也就是菜肴制作的工藝過程,則是決定最終成品質量的關鍵。因此,我們需要一本系統性的知識圖譜圖書,講授技術選型、策略選擇、過程優化、系統架構等內容。
也正因此,本書作者在構思以及行文寫作時,時刻提醒自己緊密圍繞知識圖譜開展知識體系的梳理,盡量突出知識圖譜與相關學科(特別是自然語言處理、語義網與數據庫等學科)的差別。如果不能清晰地界定知識圖譜與各分支學科的根本不同,毋寧少一本浪費讀者時間與金錢的讀物。
行文思路
本書的編寫力求體現以下基本原則。
重視對過程的闡述。
教學的過程不但需要陳述,更需要解釋。有些書強調對結果或者結論的傳授,側重于對知識體系的清晰梳理與知識的高效灌輸,但很少顧及學生的學習方式,忽略了對過程的闡述。因此,作者試圖在勾勒出知識圖譜學科知識體系的同時,盡可能地呈現出相關概念與技術發展的脈絡。
重視對架構的敘述。
從人才培養的角度而言,知識圖譜的落地不僅需要解決具體問題的工程師,更需要能做出合理抉擇與規劃的管理性人才,需要熟知人工智能領域各分支技術并能熟練掌握和利用這些技術的綜合性人才。知識圖譜的知識體系不僅包含模型與算法,更涉及思想與方法、策略與過程。技術細節固然重要,但是對于知識圖譜學科而言,對宏觀架構的把握更是不可或缺。為此,本書單列出第15章介紹具體技術之外的流程、策略與過程。每章的“概述”部分大多是對于該章內容宏觀基本面的介紹,閱讀這部分內容能對知識圖譜的全貌有基本的把握。
循序漸進、逐步深入。
本書在編寫時采取了逐層遞進的思路。比如在詞匯挖掘、實體識別、關系抽取等很多模塊中,都會涉及類似的模型與思路(諸如基于模式的抽取、基于學習模型的抽取等),那么先出現的章節往往側重于闡述這些問題的基本模型,而當后面的章節再次提及相關模型時,則會進一步深入介紹一些技術細節與數學細節。
問題驅動、應用引領。
全書堅持問題驅動的寫作思路,側重對于問題本身的分析與闡述。從問題出發闡釋所需的技術,便于讀者明確每個模型、技術、方案所能解決的問題范疇。每章開始的“內容提示”部分會告訴讀者,這一章將回答什么問題,其中的概念與技術能夠解決怎樣的實際問題。
內容架構
全書共五篇,由16章構成,其架構如圖1所示,力求涵蓋知識圖譜相關的基本概念與關鍵技術。
圖1 本書的架構
第1篇 基礎篇
包含前兩章。第1章介紹知識圖譜的基本概念、歷史沿革、研究意義、應用價值等。第2章介紹知識圖譜所必需的基礎知識,主要介紹與知識圖譜密切相關的知識表示、機器學習、自然語言處理的基本概念。
第2篇 構建篇
介紹知識圖譜的構建。大規模高質量知識圖譜的構建是整個知識圖譜技術落地的核心,因此也是整本書的重點。本篇的核心是第3章與第4章。在這兩章中,我們介紹了知識圖譜中知識獲取的兩個核心問題。其中一個是點的識別與建立,知識圖譜中的點可以是詞匯與實體,因此第3章重點介紹了詞匯挖掘與實體識別。有了知識圖譜中的點之后,建立點之間的關系是知識圖譜構建的核心問題。為此,第4章主要介紹了關系抽取(從文本中獲取關系實例)。
在此基礎上,第2篇進一步對兩類重要的知識圖譜,即概念圖譜(第5章)與百科圖譜(第6章)的構建展開了具體介紹。這兩類知識圖譜在知識圖譜技術發展歷程中有著突出地位,有很多實際應用。最后,第2篇再對其中的兩個專題:眾包構建(第7章)與質量控制(第8章)展開介紹。當前的知識圖譜構建還離不開人,如何把人力用好是第7章的主題。質量控制是知識圖譜構建的核心,第8章從質量視角再次盤點整個知識圖譜構建的全流程。
可以看出,我們在構建部分濃墨重彩,從構建的關鍵環節(詞匯挖掘、實體識別、關系抽取)、兩類重要知識圖譜的構建,以及構建的兩個專題等三個切面對知識圖譜構建進行了全方位的論述。其目的在于向讀者立體式地呈現知識圖譜構建的完整體系。這也從一個側面說明了知識圖譜知識體系的龐雜。
第3篇 管理篇
介紹知識圖譜的建模與存儲(第9章)、查詢與檢索(第10章)以及圖數據管理系統(第11章)。這一篇旨在從數據管理的角度系統闡述知識圖譜如何建模、如何存儲、如何查詢、如何檢索,以及如何實現系統性的高效管理。
第4篇 應用篇
把知識圖譜構建好、管理好的目的還是為了應用好。第4篇對于基于知識圖譜的應用技術展開介紹,包括搜索與推薦(第13章)、自然語言問答(第14章)。這些應用本質上都依賴基于知識圖譜的自然語言理解,因此這一專題也單獨成章(第12章)。
第5篇 實踐篇
知識圖譜實踐有哪些基本原則和最佳實踐(第15章),以及在知識圖譜應用過程中還存在哪些挑戰(第16章),都會在這一篇中回答。
內容選擇
本書力求全面介紹知識圖譜相關的重要概念與關鍵技術。選材的第一個考慮因素是內容與知識圖譜是否密切相關。本書將知識圖譜視作一類大數據驅動的、以自動化知識獲取為根本特點的新型知識工程。因此,盡量回避了屬于傳統知識工程范疇或者其他領域的內容,讀者可以參考其他相關圖書來學習它們。選材的第二個考慮因素是相關技術能否落地,或者具有落地的可能性。但凡前景不明、尚無明確落地可能性的技術,本書都選擇了刻意回避,以免誤導讀者。本書有兩項內容未涵蓋,特此說明如下。
第一,知識圖譜上的推理尚未單獨成章。符號知識的一個重要優點在于可以實現符號化推理,但是知識圖譜上的推理在本書中并未以單獨一章的篇幅加以介紹,這樣的處理出于以下幾點考慮。首先,本書對知識圖譜上的推理并非完全沒有討論,在書中的知識圖譜向量化表示以及知識圖譜上的查詢語言部分略有涉及。但是基于向量化表示的推理只是一種弱語義的推理,只能用作相關關系推理,無法勝任復雜語義推理任務。也正因此,大部分基于知識圖譜表示學習的推理只能用于是否存在關聯關系的預測(也就是鏈接預測)。其次,有些專家曾建議對于傳統符號推理展開介紹以彌補這一不足,然而知識圖譜作為大數據知識工程的代表有其應有之義,知識圖譜不應該盜用基于傳統符號的推理。因此,總體上作者傾向于認為知識圖譜上的推理還是一個有待深入研究的問題,其在實際應用落地中并未超出傳統知識工程的推理范疇,讀者可以參考傳統符號推理的相關圖書。
第二,知識圖譜上的結構挖掘尚未單獨成章。在很多領域,特別是金融、安全等相關領域,會建立實體之間的關聯網絡,并通過圖結構分析、識別風險因素。一些學者或者從業人員將其歸為知識圖譜的一種應用。事實上,這一思路是圖數據分析、復雜網絡分析領域的經典研究問題,早在“知識圖譜”一詞出現之前其就已經得到廣泛研究。只不過因為最近幾年各行業大數據準備工作完成,平臺基本成型,使得大規模圖分析成為可能。因此,本書并未涵蓋這一內容。讀者若對其感興趣,可以參考圖分析、復雜網絡分析相關的專業圖書。
使用方式
本書在內容編排上,力求每章均具備獨立性,同時各章之間又能組成有機整體。這一編排方式旨在讓每章能夠獨立地解決一類問題,而全書內容又不失系統性與完整性。除了第1章是基礎,其他任何一章,讀者都可以根據自身情況進行選擇性閱讀。比如,對于第2章,有相關基礎的讀者就可以直接跳過。“構建篇”的第3章和第4章是核心,而對于第5章和第6章,讀者則可以根據需要進行選擇性學習。書中的第7章、第8章、第12章、第16章是相對較新的專題,適合研究生、博士生層次的研討性教學。這幾章的內容很多都還只是一家之言,有著巨大的研究空間。
對于不同的讀者群體,本書可以有不同的閱讀方式。對于學生群體,高年級本科生可以選擇第1~4章、第9章、第10章、第13章、第14章進行學習。對于碩士生或者博士生,則可以進一步閱讀第5~8章、第12章、第16章。對于工業界從業人員,完全可以根據自己的業務需要選擇感興趣的內容閱讀,比如可以跳過第9章、第10章的技術介紹,直接了解圖數據管理系統的使用方法,也就是第11章的內容。知識圖譜涉及企業與行業的智能化轉型,這將是企業戰略決策的重要內容。對于很多從事此類工作的人員而言,急需在盡可能短的時間內對知識圖譜的全貌以及知識圖譜能解決什么問題有所了解。此類人員可以選擇第1章、第3~14章的概述,以及第15章、第16章進行學習。
最后需要說明的是,知識圖譜是一門綜合性強、涉及多學科的新型交叉學科。不同學科背景的學者看待知識圖譜有著不同的視角,很容易得出不同的觀點與結論。我們對待知識圖譜這樣的新興學科應該秉持開放包容、兼收并蓄的心態,靜待時間來檢驗真理。 |
內容簡介:知識圖譜是一種大規模語義網絡,已經成為大數據時代知識工程的代表性進展。知識圖譜技術是實現機器認知智能和推動各行業智能化發展的關鍵基礎技術。知識圖譜也成為大規模知識工程的代表性實踐,其學科日益完善。本書是一本系統介紹知識圖譜概念、技術與實踐的書籍。全書共五篇,由16章構成,力求涵蓋知識圖譜相關的基本概念與關鍵技術。“基礎篇”介紹知識圖譜的基本概念、內涵與外延、歷史沿革、應用價值,以及相關的基礎知識。“構建篇”重點介紹大規模高質量知識圖譜的自動化構建技術,涵蓋詞匯挖掘、實體識別、關系抽取及概念圖譜構建、百科圖譜構建、眾包構建與質量控制等專題。“管理篇”系統地闡述了知識圖譜建模與存儲、查詢與檢索,以及圖數據管理系統。“應用篇”對于基于知識圖譜的關鍵應用技術展開介紹,包括搜索與推薦、自然語言問答,以及基于知識圖譜的自然語言理解。“實踐篇”介紹知識圖譜實踐中的基本原則和有用實踐,初步討論了知識圖譜實踐中的開放性問題。 |
目錄:第1篇 基礎篇
第1章 知識圖譜概述 2
1.1 知識圖譜的基本概念 2
1.1.1 知識圖譜的狹義概念 3
1.1.2 知識圖譜的廣義概念 8
1.2 知識圖譜的歷史沿革 10
1.2.1 知識圖譜溯源 10
1.2.2 大數據知識工程 13
1.3 知識圖譜的研究意義 16
1.3.1 知識圖譜是認知智能的基石 16
1.3.2 知識引導成為解決問題的重要方式之一 19
1.4 知識圖譜的應用價值 20
1.4.1 數據分析 20
1.4.2 智慧搜索 21
1.4.3 智能推薦 22
1.4.4 自然人機交互 23
1.4.5 決策支持 23
1.5 知識圖譜的分類 24
1.5.1 知識圖譜中的知識分類 25
1.5.2 知識圖譜的領域特性 26
1.5.3 典型知識圖譜 30
本章小結 38
思考題 39
參考文獻 40
第2章 基礎知識 43
2.1 概述 43
2.2 知識表示 45
2.2.1 基本概念 45
2.2.2 知識圖譜的圖表示 47
2.2.3 知識圖譜的數值表示 49
2.2.4 其他相關知識表示 54
2.3 機器學習 64
2.3.1 機器學習的基本概念 65
2.3.2 深度學習概述 67
2.3.3 卷積神經網絡 70
2.3.4 循環神經網絡 71
2.3.5 注意力機制 72
2.4 自然語言處理 73
2.4.1 基本概念 74
2.4.2 文本的向量化表示 76
本章小結 78
思考題 79
參考文獻 80
第2篇 構建篇
第3章 詞匯挖掘與實體識別 84
3.1 概述 84
3.2 領域短語挖掘 86
3.2.1 問題描述 87
3.2.2 領域短語挖掘方法 88
3.2.3 統計指標特征 91
3.3 同義詞挖掘 95
3.3.1 概述 95
3.3.2 典型方法 96
3.4 縮略詞抽取 101
3.4.1 縮略詞的概念與形式 101
3.4.2 縮略詞的檢測與抽取 103
3.4.3 縮略詞的預測 105
3.5 實體識別 109
3.5.1 概述 109
3.5.2 傳統的NER方法 110
3.5.3 基于深度學習的NER方法 114
3.5.4 近期的一些方法 120
本章小結 121
思考題 122
參考文獻 122
第4章 關系抽取 127
4.1 概述 127
4.1.1 關系抽取的問題和方法分類 128
4.1.2 關系抽取常用數據集 130
4.1.3 關系抽取評估方法 131
4.2 基于模式的抽取 133
4.2.1 基于字符模式的抽取 134
4.2.2 基于語法模式的抽取 135
4.2.3 基于語義模式的抽取 135
4.2.4 自動化模式獲取:自舉法 136
4.2.5 基于模式抽取的質量評估 138
4.3 基于學習的抽取 139
4.3.1 基于監督學習的關系抽取 140
4.3.2 基于遠程監督學習的關系抽取 142
4.3.3 基于深度學習的關系抽取 144
4.4 開放關系抽取 150
4.4.1 TextRunner 151
4.4.2 ReVerb 152
4.4.3 Ollie 154
本章小結 154
思考題 156
參考文獻 157
第5章 概念圖譜構建 160
5.1 概述 160
5.1.1 常見的概念圖譜 163
5.1.2 概念圖譜的應用 166
5.2 isA關系抽取 168
5.2.1 基于在線百科的方法 169
5.2.2 基于模式的方法 170
5.2.3 中文概念圖譜的構建 172
5.3 isA關系補全 175
5.3.1 isA關系缺失的成因 176
5.3.2 基于isA關系傳遞性的概念圖譜補全 177
5.3.3 基于協同過濾思想的概念圖譜補全 179
5.4 isA關系糾錯 181
5.4.1 錯誤的成因 182
5.4.2 基于支持度的糾錯 183
5.4.3 基于圖模型的糾錯 184
本章小結 185
思考題 186
參考文獻 187
第6章 百科圖譜構建 189
6.1 概述 189
6.1.1 什么是百科圖譜 189
6.1.2 百科圖譜的意義 190
6.1.3 百科圖譜的分類 191
6.2 基于單源的百科圖譜構建 192
6.2.1 數據獲取 193
6.2.2 屬性抽取 195
6.2.3 關系構建 200
6.2.4 概念層級體系構建 201
6.2.5 實體分類 201
6.3 基于多源的百科圖譜融合 207
6.3.1 基于多個知識圖譜的融合方法 207
6.3.2 基于多源異構數據的融合方法 215
本章小結 216
思考題 217
參考文獻 217
第7章 知識圖譜的眾包構建 221
7.1 概述 221
7.2 知識型眾包的基本概念 223
7.3 知識型眾包研究的問題 226
7.3.1 What(對什么任務進行眾包) 226
7.3.2 Whom(將任務交予誰完成) 229
7.3.3 How(如何完成眾包) 230
7.4 基于眾包的知識圖譜構建與精化 235
7.4.1 本體構建階段的人工介入 235
7.4.2 知識圖譜構建階段的人工介入 237
7.4.3 知識圖譜精化階段的人工介入 242
本章小結 244
思考題 245
參考文獻
第8章 知識圖譜的質量控制 250
8.1 概述 251
8.1.1 知識圖譜質量評估的維度 251
8.1.2 知識圖譜質量評估的方法 253
8.1.3 知識圖譜質量控制全周期概覽 254
8.2 缺失知識的發現與補全 260
8.2.1 類型補全 260
8.2.2 關系補全 263
8.2.3 屬性值補全 268
8.3 錯誤知識的發現與糾正 270
8.3.1 錯誤實體類型檢測 271
8.3.2 錯誤實體關系檢測 271
8.3.3 錯誤屬性值檢測 273
8.4 過期知識的更新 274
8.4.1 基于更新頻率預測的更新機制 275
8.4.2 基于時間標簽的更新機制 276
8.4.3 基于熱點事件發現的更新機制 277
本章小結 278
思考題 279
參考文獻 280
第3篇 管理篇
第9章 知識圖譜的建模與存儲 286
9.1 概述 286
9.2 知識圖譜的數據模型 287
9.2.1 知識圖譜的三元組模型 287
9.2.2 知識圖譜的圖模型 291
9.3 知識圖譜的物理存儲 296
9.3.1 知識圖譜數據的基本操作 296
9.3.2 知識圖譜的關系表存儲 297
9.3.3 知識圖譜的圖存儲 302
9.3.4 分布式計算環境下的知識圖譜數據存儲 305
本章小結 309
思考題 310
參考文獻 310
第10章 知識圖譜的查詢與檢索 314
10.1 概述 314
10.2 查詢語言:SPARQL 315
10.2.1 簡單查詢 315
10.2.2 SPARQL查詢機制及知識圖譜上的推理 321
10.3 子圖查詢 324
10.3.1 子圖查詢基本知識 324
10.3.2 近似子圖查詢 326
10.3.3 Top-k查詢 331
10.3.4 索引結構 334
10.4 其他查詢 335
10.4.1 路徑查詢 335
10.4.2 關鍵詞查詢 337
10.4.3 社團搜索 339
本章小結 342
思考題 343
參考文獻 343
第11章 圖數據管理系統 347
11.1 概述 347
11.2 知識圖譜與圖數據管理系統 348
11.2.1 大圖管理的挑戰 350
11.2.2 圖數據管理系統的重要性 352
11.2.3 圖數據管理系統管理知識圖譜的挑戰 354
11.3 圖數據管理系統的基本架構和設計原則 357
11.4 典型的圖數據管理系統 360
11.4.1 通用圖數據管理系統 361
11.4.2 知識圖譜專用圖數據管理系統 364
11.4.3 圖數據管理系統使用實例 366
本章小結 370
思考題 371
參考文獻 371
第4篇 應用篇
第12章 基于知識圖譜的語言認知 374
12.1 概述 375
12.1.1 語言理解的挑戰 375
12.1.2 語言理解需要知識圖譜 376
12.1.3 語言理解的任務 377
12.2 實體理解 378
12.2.1 基本模型 379
12.2.2 局部實體鏈接分數 380
12.2.3 全局實體鏈接分數 381
12.2.4 模型計算 382
12.2.5 短文本實體鏈接 388
12.2.6 跨語言實體鏈接 389
12.3 概念理解 391
12.3.1 單實例概念理解 391
12.3.2 多實例概念理解 393
12.3.3 短語概念理解 395
12.3.4 關系對概念理解 397
12.3.5 概念理解應用舉例 398
12.4 屬性理解 399
本章小結 401
思考題 402
參考文獻 402
第13章 基于知識圖譜的搜索與推薦 405
13.1 概述 405
13.2 基于知識圖譜的搜索 408
13.2.1 搜索概述 408
13.2.2 搜索意圖理解 411
13.2.3 目標查找 413
13.2.4 結果呈現 413
13.2.5 實體探索 414
13.3 基于知識圖譜的推薦 419
13.3.1 推薦的基本問題與挑戰 419
13.3.2 基于知識圖譜的物品畫像 422
13.3.3 基于知識圖譜的用戶畫像 427
13.3.4 基于知識圖譜的跨領域推薦 429
13.3.5 基于知識圖譜的可解釋推薦 432
本章小結 433
思考題 435
參考文獻 435
第14章 基于知識圖譜的問答 438
14.1 概述 438
14.1.1 問答系統 438
14.1.2 KBQA 441
14.2 基于模板的KBQA 449
14.2.1 基于模板的意圖識別 449
14.2.2 基于模板的屬性關聯 451
14.3 基于圖模型的KBQA 453
14.3.1 監督學習方法 453
14.3.2 無監督方法 455
14.4 基于深度學習的KBQA 457
14.4.1 表示學習 458
14.4.2 分類模型 459
14.4.3 生成模型 461
本章小結 462
思考題 463
參考文獻 464
第5篇 實踐篇
第15章 知識圖譜實踐 468
15.1 概述 468
15.1.1 知識圖譜應用的推動力 469
15.1.2 知識圖譜應用與產業現狀 471
15.1.3 知識圖譜實踐的系統工程觀念 472
15.1.4 知識圖譜助力行業智能化的演進路徑 474
15.2 知識圖譜系統 476
15.2.1 知識圖譜系統的外部環境 476
15.2.2 知識圖譜系統的關鍵要素 477
15.2.3 知識圖譜系統的典型架構 479
15.3 知識圖譜工程 485
15.3.1 基本原則 486
15.3.2 過程模型 489
15.3.3 可行性分析 491
15.3.4 實踐建議 495
本章小結 499
思考題 499
參考文獻 500
第16章 開放性問題 501
16.1 知識表示 501
16.1.1 與其他知識表示相聯合的語義增強 501
16.1.2 過程語義增強 502
16.1.3 時空語義增強 503
16.1.4 跨模態語義增強 504
16.2 知識獲取 504
16.2.1 低成本知識獲取 505
16.2.2 復雜知識的獲取 506
16.2.3 知識獲取中的人機協作與評測 508
16.3 知識應用 509
16.3.1 知識圖譜上的推理 509
16.3.2 符號知識增強機器學習 510
16.3.3 基于知識圖譜的可解釋人工智能 511
16.3.4 知識圖譜的個性化問題 511
本章小結 512
思考題 513
參考文獻 513 |
序: |
|