-- 會員 / 註冊 --  
 帳號:
 密碼:
  | 註冊 | 忘記密碼
3/26 新書到! 3/19 新書到! 3/14 新書到! 12/12 新書到!
購書流程Q & A站務留言版客服信箱
3ds MaxMayaRhinoAfter EffectsSketchUpZBrushPainterUnity
PhotoShopAutoCadMasterCamSolidWorksCreoUGRevitNuke
C#CC++Java遊戲程式Linux嵌入式PLCFPGAMatlab
駭客資料庫搜索引擎影像處理FluentVR+ARANSYS深度學習
單晶片AVROpenGLArduinoRaspberry Pi電路設計CadenceProtel
HadoopPythonStm32CortexLabview手機程式AndroidiPhone
可查書名,作者,ISBN,3dwoo書號
詳細書籍分類

用戶網絡行為畫像——大數據中的用戶網絡行為畫像分析與內容推薦應用

( 簡體 字)
作者:牛溫佳等類別:1. -> 程式設計 -> 大數據
譯者:
出版社:電子工業出版社用戶網絡行為畫像——大數據中的用戶網絡行為畫像分析與內容推薦應用 3dWoo書號: 43585
詢問書籍請說出此書號!

缺書
NT售價: 295

出版日:3/1/2016
頁數:236
光碟數:0
站長推薦:
印刷:黑白印刷語系: ( 簡體 版 )
加入購物車 加到我的最愛
(請先登入會員)
ISBN:9787121280702
作者序 | 譯者序 | 前言 | 內容簡介 | 目錄 | 
(簡體書上所述之下載連結耗時費功, 恕不適用在台灣, 若讀者需要請自行嘗試, 恕不保證)
作者序:

譯者序:

前言:

隨著大數據時代的到來,互聯網企業的競爭已經到了寸土必爭和群雄逐鹿的時代,如何能牢牢地黏住老用戶、吸引新用戶、讀懂用戶的偏好興趣和喜怒哀樂,這都是對企業發展至關重要甚至關乎生死存亡的問題。而為了解決這個問題,學界和業界一直是蠻拼的,積極從各個領域汲取理論,從人工智能、智能信息處理,細化到數據挖掘和機器學習,再后來就有了一個更加專用的術語——推薦系統。通俗地講,推薦就是發掘用戶集合和對象集合的語義關系,為用戶提供語義最相關的TOP-N對象集合,而語義關系就是能讀懂用戶偏好興趣的核心。因此,從業務來看,推薦系統是面向具體業務的交叉研究,無業務講推薦系統,感覺言之無物;從技術來講,沒有永遠一招鮮的技術,不同的數據、不同的場景就會有不同的結果;而從知識面上講,涉及的技術非常廣泛,可以大膽預言,推薦系統的研究還會包含更多其他領域的技術,因此是無止境的。
推薦系統在很多實際應用中已經被成功的開發和利用,例如Amazon和淘寶的猜你喜歡買、優酷等視頻網站的猜你喜歡看,甚至你在某網站搜索二手房后,你在逛某個論壇時,這些房屋的廣告都會追過來,推薦系統及相關技術如影隨形。很多大公司專門建立一個獨立的推薦系統研發或者數據分析師團隊,旨在提高服務智能化和拓展企業利潤空間,同時也可以大大增加用戶的滿意度。而小公司或者初創企業,其實也迫切需要推薦系統,但是往往會遇到投入成本過大的問題。這也是本書的一個初衷,希望可以幫助一些小企業技術人員快速地理解和部署簡單的推薦系統,以用戶畫像為核心,對相關算法有個初步理解和入門。而對于一些高深的推薦算法研究,我們不敢在國內外頂級學者的算法研究面前班門弄斧,更希望從推薦服務提供商的角度多暢談一下對用戶畫像的理解,對常見算法有個普及型和稍微深入的介紹,就已經達到本書的目的了。但實際上,用戶畫像其實是一個比較抽象的概念,粒度如何控制?是給一群人打上文藝男的標簽,還是直接給單個人打上文藝微胖男或者文藝知性女的標簽? 標簽間的關系是什么?一直喜歡看文藝電影的,此時此刻就一定想看文藝電影,是否一定要推薦文藝電影,還是推薦排行榜的美國大片效果更好?如何追求大客戶和小客戶的體驗差異化權衡(大客戶小個體模型,小客戶大群體模型)?這些都是特別有意思且值得深入研究的地方。但是從通用業務的角度,只要在統計方面發現用戶的黏性增加,廣告的單擊率和轉化率提升,這就算一個上線產品的基本成功點了,已經具備可以繼續深入優化的基礎。
目前市場上的相關書籍,將用戶畫像的描述或者隱藏在具體的算法中,或者簡單以用戶偏好的形式帶過,往往不是從單獨系統性的角度闡述的,或多或少導致用戶知道用戶畫像的意思,但是一方面理解起來深度不夠(如用戶每個時段的觀影穩定性定量是多少),另一方面不知道如何存儲、表示和實際使用。因此,本書希望言之有物,以視頻網站的用戶畫像為切入點,在廣度上也會覆蓋主流常見的推薦算法原理和技術介紹,給出了如何使用面向用戶畫像的高級推薦算法,并且通過具體案例的詳細描述和數據測試流程,對讀者的理解與實踐產生積極的指導意義。
本書側重針對視頻的個性化推薦系統相關技術,重視對以用戶畫像為核心的牽引,重視實際操作,點面結合,尤其是借鑒了我們在產業界做的一些具體線上項目流程和實施代碼,力求對推薦系統的持續發展提供借鑒和參考價值,貢獻綿薄力量。特別需要指出的是,在實踐部分,我們不會特別糾結算法的準確率(因為有了基礎推薦系統后可以對插件化的算法不斷改進和優化),而是重點敘述用什么開源模型,怎么快速搭建起來,有哪些基本配置和模塊,關鍵畫像模塊怎么構建;很多基本數據,怎么接入系統,怎么用;推薦怎么輸出,輸出數據是什么,怎么用;結合我們的服務器時間,對數據處理規模和推薦時間性能給出基本的參考。
本書分為上中下三篇,共13章。上篇為用戶畫像知識工程基礎,包括表征建模、畫像計算、存儲及各種更新維護等管理操作;中篇為推薦系統與用戶畫像,包括傳統協同過濾等經典推薦算法的介紹,以及涉及用戶畫像的推薦方法;下篇為應用案例分析,包括Netflix、阿里等數據競賽的經典數據案例,以及我們在具體工程開發過程的具體案例,分別從系統需求、總體結構、算法設計、運行流程及測試結果五個方面提供詳細案例指導。
最后,本書雖涉及視頻推薦系統的關鍵技術和相應的詳細應用分析,仍難以詳盡敘述理論和工程實現的方方面面。由于作者水平有限,不足之處在所難免,敬請廣大讀者批評指正,歡迎及時與出版社或作者聯系,我們將會及時在下一版中予以更新及補充。
本書由中科院信息工程研究所郭莉和譚建龍擔任顧問,在編寫過程中得到了中科院信息工程研究所萍、胡玥、王斌、劉慶云、時金橋、熊剛,北京交通大學閆子淇,北京郵電大學劉軍、鄭靜,澳大利亞Deakin大學Tianqing Zhu、Shaowu Liu,360奇虎科技的燕凱等各位學者和工程師的幫助和支持,在此向他們表示由衷感謝。在實驗環境方面,感謝北京云量數盟給予的實驗支持與幫助,感謝辛苗、牛奕涵對本書內容的啟發與指導,需要感謝的人太多,也特別感謝和致敬該領域的著名專家學者項亮。此外,本書中的部分內容參考了相關互聯網電商企業的推薦系統公開技術資料,再次感謝他們的精彩分享。
作 者
2016年1月
內容簡介:

如何能牢牢地黏住老用戶、吸引新用戶、讀懂用戶的偏好興趣和喜怒哀樂,這都是對企業發展至關重要甚至關乎生死存亡的問題,解決這個問題的方法就是推薦系統。本書分為上中下三篇,共13章,上篇為用戶畫像知識工程基礎,包括表征建模、畫像計算、存儲及各種更新維護等管理操作;中篇為推薦系統與用戶畫像,包括傳統協同過濾等經典推薦算法的介紹,以及涉及用戶畫像的推薦方法;下篇為應用案例分析,包括Netflix、阿里等數據競賽的經典數據案例,以及在具體工程開發過程的具體案例,分別從系統需求、總體結構、算法設計、運行流程及測試結果等五個方面提供詳細案例指導。

目錄:

上 篇
第1章 用戶畫像概述 3
1.1 用戶畫像數據來源 3
1.1.1 用戶屬性 5
1.1.2 用戶觀影行為 5
1.2 用戶畫像特性 5
1.2.1 動態性 5
1.2.2 時空局部性 6
1.3 用戶畫像應用領域 6
1.3.1 搜索引擎 6
1.3.2 推薦系統 7
1.3.3 其他業務定制與優化 7
1.4 大數據給用戶畫像帶來的機遇與挑戰 8
第2章 用戶畫像建模 9
2.1 用戶定量畫像 9
2.2 用戶定性畫像 10
2.2.1 標簽與用戶定性畫像 10
2.2.2 基于知識的用戶定性畫像分析 12
2.2.3 用戶定性畫像的構建 16
2.2.4 定性畫像知識的存儲 22
2.2.5 定性畫像知識的推理 26
2.3 本章參考文獻 29
第3章 群體用戶畫像分析 31
3.1 用戶畫像相似度 32
3.1.1 定量相似度計算 32
3.1.2 定性相似度計算 34
3.1.3 綜合相似度計算 35
3.2 用戶畫像聚類 36
第4章 用戶畫像管理 41
4.1 存儲機制 41
4.1.1 關系型數據庫 42
4.1.2 NoSQL數據庫 43
4.1.3 數據倉庫 45
4.2 查詢機制 46
4.3 定時更新機制 47
4.3.1 獲取實時用戶信息 47
4.3.2 更新觸發條件 48
4.3.3 更新機制 49
中 篇
第5章 視頻推薦概述 55
5.1 主流推薦方法的分類 56
5.1.1 協同過濾的推薦方法 56
5.1.2 基于內容的推薦方法 57
5.1.3 基于知識的推薦方法 59
5.1.4 混合推薦方法 60
5.2 推薦系統的評測方法 61
5.3 視頻推薦與用戶畫像的邏輯關系 61
第6章 協同過濾推薦方法 65
6.1 概述 65
6.2 關系矩陣及矩陣計算 67
6.2.1 U-U矩陣 67
6.2.2 V-V矩陣 70
6.2.3 U-V矩陣 72
6.3 基于記憶的協同過濾算法 74
6.3.1 基于用戶的協同過濾算法 75
6.3.2 基于物品的協同過濾算法 78
6.4 基于模型的協同過濾算法 81
6.4.1 基于隱因子模型的推薦算法 82
6.4.2 基于樸素貝葉斯分類的推薦算法 85
6.5 小結 88
6.6 本章參考文獻 88
第7章 基于內容的推薦方法 91
7.1 概述 91
7.2 CB推薦中的特征向量 94
7.2.1 視頻推薦中的物品畫像 94
7.2.2 視頻推薦中的用戶畫像 96
7.3 基礎CB推薦算法 97
7.4 基于TF-IDF的CB推薦算法 99
7.5 基于KNN的CB推薦算法 102
7.6 基于Rocchio的CB推薦算法 104
7.7 基于決策樹的CB推薦算法 106
7.8 基于線性分類的CB推薦算法 107
7.9 基于樸素貝葉斯的CB推薦算法 109
7.10 小結 111
7.11 本章參考文獻 111
第8章 基于知識的推薦方法 113
8.1 概述 113
8.2 約束知識與約束推薦算法 114
8.2.1 約束知識示例 114
8.2.2 約束滿足問題 115
8.2.3 約束推薦算法流程 117
8.3 關聯知識與關聯推薦算法 118
8.3.1 關聯規則描述 118
8.3.2 關聯規則挖掘 121
8.3.3 關聯推薦算法流程 123
8.4 小結 124
8.5 本章參考文獻 124
第9章 混合推薦方法 125
9.1 概述 125
9.2 算法設計層面的混合方法 126
9.2.1 并行式混合 126
9.2.2 整體式混合 129
9.2.3 流水線式混合 131
9.2.4 典型混合應用系統 133
9.3 混合式視頻推薦實例 136
9.3.1 MoRe系統概覽 136
9.3.2 MoRe算法介紹 137
9.3.3 MoRe算法混合 139
9.3.4 MoRe實驗分析 140
9.4 小結 142
9.5 本章參考文獻 142
第10章 視頻推薦評測 145
10.1 概述 145
10.2 視頻推薦試驗方法 146
10.2.1 在線評測 147
10.2.2 離線評測 149
10.2.3 用戶調查 150
10.3 視頻離線推薦評測指標 151
10.3.1 準確度指標 151
10.3.2 多樣性指標 159
10.4 小結 161
10.5 本章參考文獻 162
下 篇
第11章 系統層面的快速推薦構建 165
11.1 概述 165
11.2 本章主要內容 166
11.3 系統部署 166
11.3.1 Hadoop2.2.0系統部署 166
11.3.2 Hadoop運行時環境設置 169
11.3.3 Spark與Mahout部署 175
11.4 Mahout推薦引擎介紹 181
11.4.1 Item-based算法 181
11.4.2 矩陣分解 185
11.4.3 ALS算法 187
11.4.4 Mahout的Spark實現 190
11.5 快速實戰 193
11.5.1 概述 193
11.5.2 日志數據 194
11.5.3 運行環境 196
11.5.4 基于Mahout Item-based算法實踐 201
11.5.5 基于Mahout ALS算法實踐 205
11.6 小結 208
11.7 本章參考文獻 208
第12章 數據層面的分析與推薦案例 211
12.1 概述 211
12.2 本章主要內容 212
12.3 競賽內容和意義 212
12.3.1 競賽簡介 212
12.3.2 競賽任務和意義 213
12.4 客戶-商戶數據 215
12.4.1 數據描述 215
12.4.2 數據理解與分析 217
12.5 算法流程設計 219
12.5.1 特征提取 219
12.5.2 分類器設計 220
12.5.3 算法流程總結 222
12.6 小結 222
12.7 本章參考文獻 223
序: