大數據智能——互聯網時代的機器學習和自然語言處理技術 @ 3dWoo大學簡體電腦書店

	-- 會員 / 註冊 --
帳號：　密碼：　 \| 註冊 \| 忘記密碼

3/26 新書到！ 3/19 新書到！ 3/14 新書到！ 12/12 新書到！
	購書流程‧Q & A‧站務留言版‧客服信箱

│ 3ds Max│ Maya│ Rhino│ After Effects│ SketchUp│ ZBrush│ Painter│ Unity│

│ PhotoShop│ AutoCad│ MasterCam│ SolidWorks│ Creo│ UG│ Revit│ Nuke│

│ C#│ C│ C++│ Java│ 遊戲程式│ Linux│ 嵌入式│ PLC│ FPGA│ Matlab│

│ 駭客│ 資料庫│ 搜索引擎│ 影像處理│ Fluent│ VR+AR│ ANSYS│ 深度學習│

│ 單晶片│ AVR│ OpenGL│ Arduino│ Raspberry Pi│ 電路設計│ Cadence│ Protel│

│ Hadoop│ Python│ Stm32│ Cortex│ Labview│ 手機程式│ Android│ iPhone│


可查書名,作者,ISBN,3dwoo書號		詳細書籍分類

大數據智能——互聯網時代的機器學習和自然語言處理技術
( 簡體字)

作者：劉知遠,崔安頎等類別：1. -> 程式設計 -> 大數據
　　　2. -> 程式設計 -> 機器學習
　　　3. -> 程式設計 -> 自然語言

譯者：

出版社：電子工業出版社 3dWoo書號： 43221
詢問書籍請說出此書號！
【缺書】
NT售價： 245 元

出版日：1/1/2016

頁數：232

光碟數：0

站長推薦：

印刷：黑白印刷語系： ( 簡體版 )

加入購物車 │加到我的最愛
(請先登入會員)

ISBN：9787121276484

作者序　|　譯者序　|　前言　|　內容簡介　|　目錄　|　序

(簡體書上所述之下載連結耗時費功, 恕不適用在台灣, 若讀者需要請自行嘗試, 恕不保證)

作者序：

譯者序：

前言：
前言
天才并不是自生自長在深林荒野里的怪物，是由可以使天才生長的民眾產生、長育出
來的，所以沒有這種民眾，就沒有天才。
——魯迅
千淘萬漉雖辛苦，吹盡狂沙始到金。
——[唐]劉禹錫
大數據時代與人工智能
在進入21 世紀前后，很多人預測這將會是怎樣的世紀。有人說這將是生命科學的時代，
也有人說這將是知識經濟的時代，不一而足。現在15 年過去了，隨著互聯網的高速發展，
大量的事實強有力地告訴我們，這必將是大數據的時代，是智能信息處理的黃金時代。
自2012 年美國奧巴馬政府發布大數據研發倡議以來，關于大數據的研究與思考在全球
蔚然成風，已經有很多專著面世，既有側重趨勢分析的，如舍恩伯格和庫克耶的《大數據
時代》（盛楊燕和周濤教授譯），涂子沛的《大數據》和《數據之巔》，也有偏重技術講解的，
如萊斯科夫等人的《大數據》（王斌教授譯）、張俊林的《大數據日知錄》、楊巨龍的《大數
據技術全解》，等等。相信隨著大數據革命的不斷深入推進，會有更多的專著出版。
前人已對大數據的內涵進行過很多探討與總結，其中比較著名的是所謂的3V 定義：
大容量（Volume）、高速度（Velocity）和多形態（Variety）。3V 的概念最早于2001 年由麥
塔集團（Meta Group）分析員道格·萊尼（Doug Laney）提出，后來被高德納咨詢公司（Gartner）
正式用來描述大數據。此外還有很多研究者提出更多的V 來描述大數據，例如真實性
（Veracity），等等。既然有如此眾多珠玉在前，我們推出這本書，當然希望講一些不同的東
西，這點不同的東西就是智能。
人工智能一直是研究者們非常感興趣的話題，并且由于眾多科幻電影或小說作品的影
響而廣為人知。1946 年第一臺電子計算機問世之后不久，英國著名學者圖靈就發表了一篇
重要論文（題名《計算機器與智能》Computing Machinery and Intelligence），探討了創造具
有智能的機器的可能性，并提出了著名的“圖靈測試”，即如果一臺機器與人類進行對話，
能夠不被分辨出其機器的身份，那么就可以認為這臺機器具有了智能。自1956 年達特茅斯
研討會正式提出了“人工智能”的研究提案以來，人們開始了至今長達半個多世紀的曲折
探索。
我們且不去糾結“什么是智能”這樣哲學層面的命題（有興趣的讀者可以參閱羅素和
諾維格的《人工智能——一種現代方法》Artificial Intelligence: A Modern Approach 以及杰
夫·霍金斯的《智能時代》On Intelligence），而是先來談談人工智能與大數據有什么關系？
要回答這個問題，我們來看一個人是如何獲得智能的。一個呱呱墜地、只會哭泣的嬰兒，
最后長成思維健全的成人，至少要經歷十幾年與周圍世界交互和學習的過程。從降臨到這
個世界的那一刻起，嬰兒無時無刻不在通過眼睛、耳朵、鼻子、皮膚接收著這個世界的信
息：圖像、聲音、味覺、觸覺，等等。你有沒有發現，無論從數據的規模、速度還是形態
來看，這些信息無疑是典型的大數據。因此，人類習得語言、思維等智能的過程，就是從
大數據學習的過程。智能不是無源之水，它并不是憑空從人腦中生長出來的。同樣，人工
智能希望讓機器擁有智能，也需要以大數據作為學習的素材。可以說，大數據將是實現人
工智能的重要支撐，而人工智能是大數據研究的重要目標之一。
但是，在人工智能研究早期人們并不這樣認為。早在1957 年，由于人工智能系統在簡
單實例上的優越性能，研究者們曾信心滿懷地認為，10 年內計算機將能成為國際象棋冠軍，
而通過簡單的句法規則變換和詞典單詞替換就可以實現機器翻譯。事實證明，人們遠遠低
估了人類智能的復雜性。即使在國際象棋這樣規則和目標極為簡單清晰的任務上，直到40
年后的1997 年，由IBM 推出的深藍超級計算機才宣告打敗人類世界冠軍卡斯帕羅夫。而
在機器翻譯這樣更加復雜的任務（人們甚至連優質翻譯的標準都無法達成共識，并清晰地
告訴機器）上，計算機至今還無法與人類翻譯的水平相提并論。
當時的問題在于，人們遠遠低估了智能的深度和復雜度。智能是分不同層次的。對于
簡單的智能任務（如對有限句式的翻譯等），我們當然可以簡單制定幾條規則就能完成。但
是對于語言理解、邏輯推理等高級智能，簡單方法就束手無策了。
生物界從簡單的單細胞生物進化到人類的過程，也是智能不斷進化的過程。最簡單的
單細胞生物草履蟲，雖然沒有神經系統，卻已經能夠根據外界信號和刺激進行反應，實現
趨利避害，我們可以將其視作最簡單的智能。而巴甫洛夫關于的狗的條件反射實驗，則向
我們證明了相對更高級的智能水平，可以根據兩種外界信號（鈴聲與食物）的關聯關系，
實現簡單的因果推理，也就是能根據鈴聲推斷食物即將出現。人類智能則是智能的最高級
形式，擁有了語言理解、邏輯推理與想象等獨特的能力。我們可以發現，低級智能只需小規
模的簡單數據或規則的支持，而高級智能則需要大規模的復雜數據的支持。
同樣重要的，高級智能還需要獨特計算架構的支持。很顯然，人腦結構就與狗等動物
有著本質的不同，因此，即使將一只狗像嬰兒一樣撫育，也不能指望它能完全學會理解人
類的語言，并像人一樣思維。受到生物智能的啟示，我們可以總結出如圖0.1 所示的基本
結論，不同大小數據的處理，需要不同的計算框架，帶來不同級別的智能。
圖0.1 不同規模的數據需要不同的計算架構，產生不同級別的智能
人工智能是否要完全照搬人類智能的工作原理，目前仍然爭論不休。有人舉例，雖然
人們受到飛鳥的啟發發明了飛機，但其飛行原理（空氣動力學）卻與飛鳥有本質不同；同
樣，生物界都在用雙腳或四腿奔跑行走，人們卻發明了輪子和汽車實現快速移動。然而不
可否認，大自然無疑是我們最好的老師。人工智能固然不必完全復制人類智能，但是知己
知彼，方能百戰不殆。生物智能帶來的啟示已經在信息處理技術發展中得到了印證。谷歌
研究員、美國工程院院士Jeff Dean 曾對大數據作過類似結論：“對處理數據規模X 的合理
設計可能在10X 或100X 規模下就會變得不合理”（Right design at X may be very wrong at
10X or 100X.），也就是說，大數據處理也需要專門設計新穎的計算架構。而與人工智能密
切相關的機器學習、自然語言處理、圖像處理、語音處理等領域，近年來都在大規模數據
的支持下取得了驚人進展。我們可以確信地說，大數據是人工智能發展的必由之路。
大數據智能如何成真
雖然大數據是實現人工智能的重要支持，但如何實現大數據智能，卻并非顯而易見。
近年來隨著計算機硬件、大數據處理技術和深度學習等領域取得了突破性進展，涌現出一
批在技術上和商業上影響巨大的智能應用，這讓人工智能發展道路日益清晰起來。
大數據的價值并非水落石出這樣顯而易見。我們認為，近年來人工智能的突破性進展，
主要是在觸手可及的人類社會大數據、高性能的計算能力以及合理的智能計算框架的支持
下，方能披沙揀金實現大數據智能。
人類社會大數據觸手可及。如前所述，這是大數據的時代，互聯網的興起，手機等便
攜設備的普及，讓人類社會行為數據越來越多地匯聚到網上，觸手可及。這讓機器從這些
大數據中自動學習成為可能。但是，大數據（如大氣數據、地震數據等）并非現在才出現，
只是在過去我們限于計算能力和計算框架，難以從中萃取精華。因此，大數據智能的實現
還依賴以下兩個方面的發展。
（1）計算能力突飛猛進。受到摩爾定律的支配，近半個世紀以來，計算機的計算和存
儲能力一直在以令人目眩的速度提高。摩爾定律最早由英特爾（Intel）創始人之一戈登·摩
爾提出，基本思想是：保持價格不變的情況下，集成電路上可容納的元器件的數目大約每
隔18 到24 個月就會增加一倍，性能也將隨之提升一倍。也就是說，每一塊錢能買到的計
算機性能將每隔18 到24 個月提升一倍以上。雖然人們一直擔心，隨著微處理器器件尺寸
變小，摩爾定律會受到量子效應影響而失效。但至少從已有發展歷程來看，隨著多核、多
機并行等新框架的提出，計算機已經能夠較好地支持大規模數據處理所需的計算能力。
（2）計算架構返璞歸真。近年來，深度學習在圖像、語音和自然語言處理領域掀起了
一場革命，在圖像分類、語音識別等重要任務上取得了驚人的性能突破，在國際上催生了
蘋果Siri 等語音助手的出現，在國內則涌現了科大訊飛、Face++等高科技公司。然而我們
可能很難想象，深度學習的基礎“人工神經網絡”技術，此前曾長期處于無人問津的境地。
在深度學習興起以前，人工神經網絡常被人詬病存在可解釋性差、學習穩定性差、難以找
到最優解等問題。然而，正是由于大規模數據和高性能計算能力的支持，才讓以人工神經
網絡為代表的機器學習技術在大數據時代煥發出蓬勃生機。
人工智能的下一個里程碑
當下，以深度學習為代表的計算框架在很多具體任務上取得了巨大成績。甚至有媒體
和公眾已經開始恐慌人工智能取代人類的可能性。然而，從理性來看，深度學習的處理能
力和效率與人類大腦相比仍有巨大差距。因此，僅依靠大數據智能，并非孕育人工智能的
終極之道。隨著技術的進步和研究的深入，現有解決方案必然觸及無法逾越的天花板，進
入瓶頸期。
人腦擁有現有計算框架不可比擬的優勢。例如，雖然人腦中信號傳輸速度要遠低于計
算機中的信號速度，但是人腦在很多智能任務上的處理效率則遠高于計算機，例如在眾多
聲音中快速識別出叫自己名字的聲音，通過線條漫畫認出名人，復雜數學問題的推導求解，
快速閱讀理解一篇文章，等等。可以想象，在計算速度受限的條件下，人腦一定擁有某種
獨特的計算框架，才能完成這些嘆為觀止的智能任務，可謂大自然的鬼斧神工。
那么人工智能的下一個里程碑是什么呢？我猜想可能是神經科學及其相關學科。一直
以來，神經科學都在探索各種觀測大腦活動的工具和方法，并作出了大量的實證和建模工
作。隨著光控基因技術（optogenetics）和藥理基因技術（pharmacogenetics）等新技術的發
展，人們擁有了在時間和空間上更加精確控制和監測大腦活動的能力，從而有望徹底發現
人腦的神經機制。一旦人腦的神經機制被發現，有理由相信，人們可以迅速通過仿真等方
式，在計算機中實現類似甚至更高效的計算框架，從而推動實現人工智能的最終目標。此
外，量子計算、生物計算、新型芯片材料等領域的發展，都為我們展現出無限可能的未來。
當下，社會大數據、計算能力和計算框架三方面的發展融合產生出了大數據智能。我
們相信更大規模數據、更強計算能力和更合理計算框架的推出，會不斷推動人工智能向前
發展。然而，正如前幾年社會各界對物聯網、云計算的追捧，最近社會對大數據和人工智
能概念的炒作愈演愈烈，產生很多不切實際的幻想和泡沫。對于這個領域重新得到青睞，
我們當然感到欣慰。但是，也不妨多一些謹慎和冷靜。鑒古知今，回顧人工智能的曲折發
展史（《人工智能——一種現代方法》中有詳細介紹）我們看到，在過度的期望破滅之后，
隨之而來的往往就是嚴冬。現在大數據智能萬眾矚目，我們不妨心中默念凜冬將至。
事物總是在不斷自我否定中螺旋前進的，人工智能的探求之路也是如此。我們相信大數據
是獲得智能的必由之路，但現在的做法不見得就一定正確。多年之后，我們也許會用截然不同
的辦法處理大數據。然而這些都不重要，重要的在于一顆無論冷門熱門都執著的心、堅持不懈
的信念。就像現在深度學習領域的巨人Geoffrey Hinton、Yann LeCun 等學者，在這之前坐了十
幾年的冷板凳，研究成果屢屢被拒。對于真正的學者，研究領域冷門熱門也許都不重要，反而
會成為對從業者的試金石——只有在寒冬中堅持下來的種子，才能等到春天綻放。
關于本書
這本書并不想在已經火得發紫的大數據火堆上再添一把柴。這本書希望從人工智能這
個新的角度，總結大數據智能取得的成果，它的局限性以及未來可能的發展前景。
本書從大數據智能基礎和應用兩個方面展開介紹。
基礎部分有三章：第1 章以深度學習為例介紹大數據智能的計算框架，第2 章以知識
圖譜為例介紹大數據智能的知識庫；第3 章介紹大數據的計算處理系統。
在大數據智能的應用部分，我們選擇文本大數據作為主要場景進行介紹，主要原因在
于，語言是人類智能的集中體現，語言理解也是人工智能的終極目標，圖靈測試的設置是
以語言作為媒介的。應用部分有五章：第4 章介紹智能問答，第5 章介紹主題模型，第6
章介紹個性化與推薦，第7 章介紹情感分析與意見挖掘，第8 章介紹面向社會媒體內容的
分析應用。這基本涵蓋了文本大數據智能處理的主要應用場景。以后如有機會再版，還計
劃納入文檔摘要、計算廣告學等主題。
大數據智能仍然是個高速發展的領域。可以想象這本書出版的時候，很多內容已顯陳
舊。為了讓讀者能夠跟蹤這個領域的最前沿進展，本書專門設置后記，為初學者追蹤大數
據智能的最新學術材料提供建議。
個人學識有限，深怕在自己不擅長的領域說出外行話甚至錯誤連篇。因此，我邀請熟
識的同學朋友撰寫他們所擅長的章節。除了前言、第2 章、第8 章和后記由我操刀外，我
請同門師弟張開旭博士撰寫第1 章，清華大學計算機系統方向博士韓文弢撰寫第3 章，清
華大學信息檢索方向博士崔安頎撰寫第4、7 章，北京大學自然語言處理方向博士、現中國
人民大學信息學院教師趙鑫撰寫第5 章，清華大學個性化推薦方向博士生張永鋒同學撰寫
第6 章。他們都在相關領域開展了多年研究工作，發表過高水平論文。最后，我對全書做
了統稿和校對，北京郵電大學畢業的林穎同學在我們實驗室實習期間幫助我做了大量的書
稿整理工作。
致謝
本書能夠出版，無疑得到了很多人的支持和幫助。
首先，感謝這本書的幾位合作者張永鋒、崔安頎、張開旭、趙鑫和韓文弢，他們的熱
情、無私與認真，讓我相信這本書能夠真的為讀者提供及時有用的知識。
其次，感謝我的導師和領導清華計算機系的孫茂松教授，是他將我帶入了這個精彩紛
呈的研究領域，也是他為我提供了寬松的寫作環境，能夠讓這本書順利問世。
我還要感謝劉洋（清華大學）、付杰（新加坡國立大學）、來思惟（中科院自動化所）
等同事、同學和好友，在本書撰寫過程中提供了很多最新進展和熱情幫助。特別感謝林穎
同學所做的書稿整理和封面設計工作。
最后，我要特別感謝電子工業出版社副總編輯兼計算機分社社長郭立老師的熱情邀請
和大力支持，以及本書編輯、清華計算機系學長顧慧芳老師的不斷激勵和鼎力相助，讓我
鼓起勇氣敢于接下這個選題，也能在我拖延癥反復發作時耐心地等待，經過了兩年多時間
的醞釀、收集資料、研究分析以及整理撰寫，終于變成了你手中的這本書。
歡迎交流
當今世界，大數據智能是一個涉及非常廣泛、而且發展非常迅猛的領域，這個領域的
研究成果將幫助人類加速認識世界、探索宇宙，也將極大地影響到人們日常生活的方方面
面。因此，筆者想在從事學習和自然語言處理等基礎技術和最新進展研究工作的同時撰寫
一本介紹這一領域的科普書籍，作為拋磚引玉，旨在為需要了解與學習大數據智能技術的
朋友提供幫助，甚至加入到大數據智能分析這一充滿驚奇和魅力的領域中來。
當然，筆者盡量以開放的態度梳理每個方向的相關成果和進展，然而大數據智能日新
月異，而我們所知有限，難免有掛一漏萬之憾。如有重要進展或成果沒有被介紹到，絕非
作者故意為之，敬請大家批評指正。我們歡迎讀者對本書的任何反饋，無論是指出錯誤還
是改進建議，請直接發郵件給我：liuzy@tsinghua.edu.cn。我們會專門開辟網站維護勘誤清
單，如果本書有機會再出下一版的話，也會盡量改正所有發現的錯誤。
劉知遠博士
清華大學計算機科學與技術系助理研究員
2015 年8 月于北京清華園

內容簡介：
本書是一本介紹大數據智能分析的科普書籍，旨在讓更多的人了解和學習互聯網時代的機器學習和自然語言處理技術，以期讓大數據技術更好地為我們的生產和生活服務。全書包括大數據智能基礎和大數據智能應用兩個部分，共 8 章。大數據智能基礎部分有三章：第 1 章以深度學習為例介紹大數據智能的計算框架；第 2 章以知識圖譜為例介紹大數據智能的知識庫；第 3 章介紹大數據背后的計算處理系統。大數據智能應用部分有 5 章：第 4 章介紹智能問答，第 5 章介紹主題模型，第 6 章介紹個性化推薦系統，第 7 章介紹情感分析與意見挖掘，第 8 章介紹面向社會媒體大數據的語言使用分析及應用。最后在本書的后記部分為讀者追蹤大數據智能的最新學術材料提供了建議。

目錄：
第1 章深度學習——機器大腦的結構 1
1.1 概述 3
1.1.1 可以做酸奶的面包機——通用機器的概念 3
1.1.2 連接主義 5
1.1.3 用機器設計機器 6
1.1.4 深度網絡 6
1.1.5 深度學習的用武之地 7
1.2 從人腦神經元到人工神經元 8
1.2.1 生物神經元中的計算靈感 8
1.2.2 激活函數 9
1.3 參數學習 10
1.3.1 模型的評價 11
1.3.2 有監督學習 11
1.3.3 梯度下降法 12
1.4 多層前饋網絡 13
1.4.1 多層前饋網絡 14
1.4.2 后向傳播算法計算梯度 16
1.5 逐層預訓練 17
1.6 深度學習是終極神器嗎 19
1.6.1 深度學習帶來了什么 19
1.6.2 深度學習尚未做到什么 20
1.7 內容回顧與推薦閱讀 21
XII 目錄
1.8 參考文獻 21
第2 章知識圖譜——機器大腦中的知識庫 23
2.1 什么是知識圖譜 25
2.2 知識圖譜的構建 27
2.2.1 大規模知識庫 27
2.2.2 互聯網鏈接數據 28
2.2.3 互聯網網頁文本數據 29
2.2.4 多數據源的知識融合 29
2.3 知識圖譜的典型應用 30
2.3.1 查詢理解（Query Understanding） 30
2.3.2 自動問答（Question Answering） 32
2.3.3 文檔表示（Document Representation） 33
2.4 知識圖譜的主要技術 34
2.4.1 實體鏈指（Entity Linking） 34
2.4.2 關系抽取（Relation Extraction） 35
2.4.3 知識推理（Knowledge Reasoning） 37
2.4.4 知識表示（Knowledge Representation） 38
2.5 前景與挑戰 39
2.6 內容回顧與推薦閱讀 40
2.7 參考文獻 41
第3 章大數據系統——大數據背后的支撐技術 43
3.1 概述 45
3.2 高性能計算技術 46
3.2.1 超級計算機的組成 47
3.2.2 并行計算的系統支持 48
3.3 虛擬化和云計算技術 52
3.3.1 虛擬化技術 52
目錄 XIII
3.3.2 云計算服務 54
3.4 基于分布式計算的大數據系統 55
3.4.1 Hadoop 生態系統 55
3.4.2 Spark 61
3.4.3 典型的大數據基礎架構 63
3.5 大規模圖計算 63
3.5.1 分布式圖計算框架 64
3.5.2 高效的單機圖計算框架 65
3.6 NoSQL 66
3.6.1 MongoDB 簡介 67
3.7 內容回顧與推薦閱讀 69
3.8 參考文獻 70
第4 章智能問答——智能助手是如何煉成的 71
4.1 概述 73
4.2 問答系統的主要組成 77
4.3 文本問答系統 78
4.3.1 問題理解 78
4.3.2 知識檢索 81
4.3.3 答案生成 83
4.4 社區問答系統 84
4.4.1 社區問答系統的結構 85
4.4.2 相似問題檢索 86
4.4.3 答案過濾 86
4.5 多媒體問答系統 87
4.6 大型問答系統案例：IBM 沃森問答系統 89
4.6.1 沃森的總體結構 89
4.6.2 問題解析 90
4.6.3 知識儲備 90
XIV 目錄
4.6.4 檢索和候選答案生成 91
4.6.5 可信答案確定 92
4.7 內容回顧與推薦閱讀 93
4.8 參考文獻 94
第5 章主題模型——機器的智能摘要利器 97
5.1 概述 99
5.2 主題模型出現的背景 100
5.3 第一個主題模型潛在語義分析 102
5.4 第一個正式的概率主題模型 104
5.5 第一個正式的貝葉斯主題模型 105
5.6 LDA 的概要介紹 106
5.6.1 LDA 的延伸理解——主題模型廣義理解 109
5.6.2 模型求解 111
5.6.3 模型評估 112
5.6.4 模型選擇：主題數目的確定 113
5.7 主題模型的變形與應用 114
5.7.1 基于LDA 的模型變種 114
5.7.2 基于LDA 的典型應用 115
5.7.3 一個基于主題模型的新浪名人話題排行榜應用 118
5.8 內容回顧與推薦閱讀 122
5.9 參考文獻 123
第6 章個性化推薦系統——如何了解電腦背后的TA 129
6.1 概述 131
6.1.1 推薦系統的發展歷史 132
6.1.2 推薦無處不在 133
6.1.3 從千人一面到千人千面 133
6.2 個性化推薦的基本問題 134
6.2.1 推薦系統的輸入 135
目錄 XV
6.2.2 推薦系統的輸出 137
6.2.3 個性化推薦的形式化 137
6.2.4 推薦系統的三大核心問題 138
6.3 典型推薦算法淺析 139
6.3.1 推薦算法的分類 139
6.3.2 典型推薦算法介紹 140
6.3.3 基于矩陣分解的打分預測 146
6.3.4 推薦的可解釋性 151
6.3.5 推薦算法的評價 153
6.3.6 我們走了多遠 156
6.4 參考文獻 160
第7 章情感分析與意見挖掘——計算機如何了解人類情感 165
7.1 概述 167
7.2 情感分析的主要研究問題 172
7.3 情感分析的主要方法 175
7.3.1 構成情感和觀點的基本元素 175
7.3.2 情感極性與情感詞典 177
7.3.3 屬性－觀點對 182
7.3.4 情感分析 184
7.4 主要的情感詞典資源 188
7.5 內容回顧與推薦閱讀 189
7.6 參考文獻 190
第8 章面向社會媒體大數據的語言使用分析及應用 195
8.1 概述 197
8.2 面向社會媒體的自然語言使用分析 197
8.2.1 詞匯的時空傳播與演化 198
8.2.2 語言使用與個體差異 200
XVI 目錄
8.2.3 語言使用與社會地位 202
8.2.4 語言使用與群體分析 203
8.3 面向社會媒體的自然語言分析應用 206
8.3.1 社會預測 206
8.3.2 霸凌現象定量分析 207
8.4 未來研究的挑戰與展望 208
8.5 參考文獻 209
后記 214
國際學術組織、學術會議與學術論文 214
國內學術組織、學術會議與學術論文 216
如何快速了解某個領域的研究進展 217

序：