3dwoo大學簡體電腦書店
用戶畫像:方法論與工程化解決方案
( 簡體 字)
作者:趙宏田類別:1. -> 程式設計 -> 綜合
出版社:機械工業出版社用戶畫像:方法論與工程化解決方案 3dWoo書號: 52468
詢問書籍請說出此書號!
有庫存
NT售價: 395
出版日:1/1/2020
頁數:256
光碟數:0
站長推薦:
印刷:黑白印刷語系: ( 簡體 字 )
ISBN:9787111635642 加入購物車加到我的最愛 (請先登入會員)
(簡體書上所述之下載連結耗時費功, 恕不適用在台灣, 若讀者需要請自行嘗試, 恕不保證, 繁體書的下載亦請直接連絡出版社)
前言
第1章 用戶畫像基礎1
1.1 用戶畫像是什么1
1.1.1 畫像簡介1
1.1.2 標簽類型3
1.2 數據架構4
1.3 主要覆蓋模塊5
1.4 開發階段流程7
1.4.1 開發上線流程7
1.4.2 各階段關鍵產出9
1.5 畫像應用的落地10
1.6 某用戶畫像案例11
1.6.1 案例背景介紹11
1.6.2 相關元數據12
1.6.3 畫像表結構設計16
1.7 定性類畫像21
1.8 本章小結22
第2章 數據指標體系23
2.1 用戶屬性維度23
2.1.1 常見用戶屬性23
2.1.2 用戶性別26
2.2 用戶行為維度27
2.3 用戶消費維度27
2.4 風險控制維度29
2.5 社交屬性維度30
2.6 其他常見標簽劃分方式31
2.7 標簽命名方式33
2.8 本章小結34
第3章 標簽數據存儲35
3.1 Hive存儲35
3.1.1 Hive數據倉庫35
3.1.2 分區存儲37
3.1.3 標簽匯聚39
3.1.4 ID-MAP41
3.2 MySQL存儲45
3.2.1 元數據管理45
3.2.2 監控預警數據47
3.2.3 結果集存儲47
3.3 HBase存儲50
3.3.1 HBase簡介50
3.3.2 應用場景52
3.3.3 工程化案例52
3.4 Elasticsearch存儲59
3.4.1 Elasticsearch簡介59
3.4.2 應用場景60
3.4.3 工程化案例64
3.5 本章小結67
第4章 標簽數據開發69
4.1 統計類標簽開發69
4.1.1 近30日購買行為標簽案例70
4.1.2 最近來訪標簽案例73
4.2 規則類標簽開發74
4.2.1 用戶價值類標簽案例75
4.2.2 用戶活躍度標簽案例79
4.3 挖掘類標簽開發84
4.3.1 案例背景84
4.3.2 特征選取及開發85
4.3.3 文本分詞處理86
4.3.4 數據結構處理89
4.3.5 文本TF-IDF權重90
4.3.6 樸素貝葉斯分類92
4.4 流式計算標簽開發95
4.4.1 流式標簽建模框架95
4.4.2 Kafka簡介96
4.4.3 Spark Streaming集成Kafka97
4.4.4 標簽開發及工程化99
4.5 用戶特征庫開發104
4.5.1 特征庫規劃105
4.5.2 數據開發107
4.5.3 其他特征庫規劃111
4.6 標簽權重計算112
4.6.1 TF-IDF詞空間向量112
4.6.2 時間衰減系數114
4.6.3 標簽權重配置115
4.7 標簽相似度計算116
4.7.1 案例場景116
4.7.2 數據開發118
4.8 組合標簽計算122
4.8.1 應用場景122
4.8.2 數據計算123
4.9 數據服務層開發124
4.9.1 推送至營銷系統125
4.9.2 接口調用服務127
4.10 GraphX圖計算用戶129
4.10.1 圖計算理論及應用場景129
4.10.2 數據開發案例132
4.11 本章小結135
第5章 開發性能調優137
5.1 數據傾斜調優137
5.2 合并小文件141
5.3 緩存中間數據143
5.4 開發中間表144
5.5 本章小結145
第6章 作業流程調度146
6.1 crontab命令調度146
6.2 Airflow工作平臺148
6.2.1 基礎概念149
6.2.2 Airflow服務構成150
6.2.3 Airflow安裝151
6.2.4 主要模塊功能151
6.2.5 工作流調度155
6.2.6 腳本實例155
6.2.7 常用命令行158
6.2.8 工程化調度方案158
6.3 數據監控預警161
6.3.1 標簽監控預警161
6.3.2 服務層預警162
6.4 ETL異常排查164
6.5 本章小結166
第7章 用戶畫像產品化167
7.1 即時查詢167
7.2 標簽視圖與標簽查詢169
7.3 元數據管理171
7.4 用戶分群功能173
7.5 人群分析功能175
7.6 本章小結177
第8章 用戶畫像應用178
8.1 經營分析178
8.1.1 商品分析178
8.1.2 用戶分析179
8.1.3 渠道分析180
8.1.4 漏斗分析185
8.1.5 客服話術186
8.1.6 人群特征分析186
8.2 精準營銷187
8.2.1 短信/郵件營銷187
8.2.2 效果分析188
8.3 個性化推薦與服務189
8.4 本章小結190
第9章 實踐案例詳解191
9.1 風控反欺詐預警191
9.1.1 應用背景191
9.1.2 用戶畫像切入點192
9.2 A/B人群效果測試193
9.2.1 案例背景194
9.2.2 用戶畫像切入點194
9.2.3 效果分析195
9.3 用戶生命周期劃分與營銷195
9.3.1 生命周期劃分196
9.3.2 不同階段的用戶觸達策略201
9.3.3 畫像在生命周期中的應用204
9.3.4 應用案例206
9.4 高價值用戶實時營銷209
9.4.1 項目應用背景209
9.4.2 用戶畫像切入點209
9.4.3 HBase應用場景小結209
9.5 短信營銷用戶211
9.5.1 案例背景211
9.5.2 畫像切入及其應用效果211
9.6 Session行為分析應用213
9.6.1 關于用戶行為分析213
9.6.2 案例背景218
9.6.3 特征構建219
9.6.4 分析方法與結論221
9.7 人群效果監測報表搭建228
9.7.1 案例背景228
9.7.2 邏輯梳理228
9.7.3 自動報表郵件237
9.8 基于用戶特征庫篩選目標人群239
9.8.1 案例背景239
9.8.2 應用方式及效果240
9.9 本章小結241
附錄 某產品用戶畫像項目規劃文檔242
這是一本從技術、產品和運營3個角度講解如何從0到1構建用戶畫像系統的著作,同時它還為如何利用用戶畫像系統驅動企業的營收增長給出了解決方案。作者有多年的大數據研發和數據化運營經驗,曾參與和負責多個億級規模的用戶畫像系統的搭建,在用戶畫像系統的設計、開發和落地解決方案等方面有豐富的經驗。



全書一共9章:

第1~6章主要講解了搭建用戶畫像系統需要掌握的概念、技術、流程、方法論等,包括用戶畫像的基礎知識、數據指標體系、標簽數據存儲、標簽數據開發、開發性能調優、作業流程調度等;

第7章講解了如何對用戶畫像進行產品化,為工程實踐提供解決方案;

第8章詳細講解了用戶畫像在經營分析、精準營銷和個性化推薦3個經典領域的應用;

第9章通過8個常見的場景講解了8個用戶畫像系統的落地案例,幫助讀者掌握如何利用用戶畫像系統來驅動企業的營收增長。
為什么寫這本書

我曾在知乎“數據智能”專欄下面不定期連載關于用戶畫像的文章,也曾在知乎開設過幾期live直播,還曾在天善智能等網課平臺開設過系列網課“用戶畫像解決方案”。在和同行業中對畫像感興趣的朋友們交流時,我發現大家雖然來自地產、煙草、零售、互聯網等不同行業,但所在公司對用戶畫像領域都有建設需求,而且大家對于指標體系、標簽作業效率(ETL)、標簽監控、實時計算、畫像產品化、業務應用場景和應用方式等方面都有進一步了解的興趣。所以我想對這些年做用戶畫像的經驗、踩過的“坑”進行梳理總結,為數據開發、數據分析、運營、用戶研究等崗位的工作人員提供一些參考。

在寫這份解決方案的一個個夜晚,我有時會想,科技和時代都在飛速發展,如果有一天我不做這一行了,該拿什么來回憶那些年奮斗的時光呢?2019年,我第3次從0到1開始搭建用戶畫像系統,從離線標簽開發、用戶數據分析、ETL調度、流式計算開發,到打通數據服務層、應用畫像數據服務業務方、獲得業務增長的反饋,這一路走過來,過程是痛苦的,收獲是豐富的。奮斗的日子固然多彩,回望一步步走過的路,謹以此書向那些不舍晝夜奔騰向前的日子致敬。

本書特色

開始做用戶畫像的時候我也不知道從何處下手,市面上介紹Hive、Spark、HBase、MySQL、數據倉庫等大數據相關技術的書籍很多,但是介紹用戶畫像搭建開發的書籍很少,甚至沒有。在沒有相關項目經驗的情況下,我不知道如何把這些大數據組件統籌起來搭建用戶畫像系統。直到這兩年,我才一邊開發畫像系統,一邊總結梳理,最終編纂成本書。

本書借助數據倉庫實現一套用戶畫像系統的方案。從實際工程案例出發,結合多業務場景,內容涵蓋開發離線批處理計算的標簽及流式計算標簽,為讀者的分析、開發、搭建用戶畫像系統,并借助該用戶畫像系統為運營人員制定運營用戶的策略提供端到端的解決方案。

一套好的解決方案需要包括以下幾個層面。

1)架構層:在畫像系統的架構層,本書首先介紹了畫像數據倉庫的架構,進一步介紹了數據存儲的技術選型,在什么場景下使用Hive、MySQL、HBase、Elasticsearch等工具存儲數據,用戶標簽開發、人群計算開發等相應數據開發層面的內容,以及整個項目的開發流程和各階段的關鍵產出。

2)流量層:介紹整個方案是如何運作起來的。本書主要涉及畫像系統的作業流程調度、數據倉庫和各業務系統的打通。

3)業務層:包括系統的前后端交互以及如何把這套系統應用在業務服務層面。本書通過用戶畫像產品化介紹了產品端和畫像系統的“代碼”層面是如何進行交互操作的。

4)方案價值:包括系統上線后如何服務于各業務場景產生業務價值以及有待進一步完善的地方。

以上幾個層面的內容構成了一套完整的用戶畫像解決方案,這也是本書各章節覆蓋的全部模塊。

數據的最終目的是走出數據倉庫,應用到業務系統和營銷系統中來驅動營收增長。

我在學習數據倉庫的時候學過Kimball的《數據倉庫工具箱》,其中關于數據倉庫的34個子系統的介紹對我影響很大,其對于如何解決特定問題并形成結構化思維有著系統的方法論與解決方案。雖然面對具體問題的處理方式是靈活且豐富多樣的,但是固定的結構化思維有利于快速找到突破口,形成良好的開端。

本書可以幫助讀者在用戶畫像領域形成一種體系化思維,在面對一個具體項目時不會無從下手。如何建立標簽指標體系?指標體系中包含哪些標簽?如何設計存儲畫像標簽的表結構?如何開發標簽?畫像系統中涉及哪些數據存儲工具?如何打通標簽數據到服務層?如何對畫像系統進行監控?如何對整個畫像系統進行調度?如何使畫像系統服務于業務場景來驅動增長?這些都是畫像系統的子模塊。

主要章節及內容

本書共9章,各章具體內容如下:

第1章:主要講用戶畫像的基礎知識,包括搭建用戶畫像系統需要覆蓋的模塊,開發階段流程,各階段的關鍵產出,以及數據倉庫架構、表結構的設計等內容。閱讀本章可以幫助讀者形成構建用戶畫像的一個整體化思想。

第2章:結合業務設定指標體系,本章針對案例背景,從常用的用戶屬性、行為、消費、風險控制這4個維度設定指標體系。本章提供的標簽可涵蓋大部分刻畫用戶畫像的應用場景,對于具體應用點,讀者可根據公司業務特性進行針對性的補充。

第3章:講解了標簽相關數據的存儲,包括Hive存儲、MySQL存儲、HBase存儲和Elasticsearch存儲。不同的存儲方式適用于不同的場景和業務需要。

第4章:也是本書的重點章節,書中介紹的標簽數據及相關腳本的開發是用戶畫像構建工作的重點。本章講解了對常見的統計類、規則類、挖掘類、流式計算類標簽以及用戶特征庫等與用戶相關的數據的開發,還進一步介紹了如何計算人群數據、打通數據到服務層通路的開發。通過GraphX圖計算用戶2度關系熟人的案例介紹了如何深度挖掘用戶間的關聯關系。本章對每一小節都進行了詳細的講解,并附有配套的代碼計算過程。

第5章:講解了開發過程中常見的數據傾斜調優、對小文件的讀取、緩存中間數據、開發中間表等調優工作。

第6章:講解了如何使用開源ETL工具Airflow實現畫像系統相關任務的工程化上線調度,以及對數據的監控預警和調度異常的排查。

第7章:畫像產品化是數據從數據倉庫走向業務服務的重要環節,畫像產品化可便于業務人員使用工具來分析用戶,將業務上定義的用戶群應用到各業務系統中提供服務。本章為數據產品人員、業務人員提供了解決方案的思路。

第8章:介紹了用戶畫像的應用場景,包括經營分析、精準營銷、個性化推薦等應用方向,方便業務人員、產品經理、數據分析師更好地了解用戶、觸達用戶。

第9章:通過場景化介紹用戶畫像實際應用的8個案例,清楚地展現了用戶畫像作為一種分析、觸達用戶的工具在實際業務上的應用方式和應用流程。

主要讀者對象

產品經理:由于崗位性質對技術不是特別熟悉,可重點關注第1、2、7、8、9章的內容。

數據分析師:可以從多個維度對用戶及用戶群進行分析,可重點關注第1、2、3、7、8、9章的內容。

運營人員:可重點關注第2、8、9章的內容,了解畫像系統涉及的指標體系、應用場景及應用策略。

數據開發人員:本書主要站在數據開發人員的角度對整個畫像系統進行系統化介紹。數據開發人員可完整閱讀本書各章的內容。

市場人員:借助畫像系統了解用戶群體的特征以及運營用戶群的策略方法,可重點關注第2、8、9章的內容。

勘誤和支持

由于水平有限,書中難免會存在疏漏之處,懇請讀者批評指正。為此,讀者可通過郵箱(892798505@qq.com)或微信(administer00001)反饋有關問題,我將盡全力為讀者進行解答。

致謝

感謝父母對我一路成長的支持。感謝機械工業出版社華章公司的楊福川老師和李藝老師,這是我第二次與兩位老師合作,每次合作與溝通總是那么愉快;感謝為本書寫推薦的朋友們,你們的專業建議讓本書更加精彩。最后,感謝過去一年中自己的每一分投入,不斷積累,將大數據在用戶畫像領域的工程化實現和應用方案編纂成書。
pagetop