R語言游戲數據分析與挖掘 ( 簡體 字) |
作者:謝佳標 著 | 類別:1. -> 程式設計 -> R語言 2. -> 程式設計 -> 綜合 |
譯者: |
出版社:機械工業出版社 | 3dWoo書號: 47100 詢問書籍請說出此書號!【有庫存】 NT售價: 395 元 |
出版日:6/1/2017 |
頁數:397 |
光碟數:0 |
|
站長推薦: |
印刷:黑白印刷 | 語系: ( 簡體 版 ) |
|
加入購物車 │加到我的最愛 (請先登入會員) |
ISBN:9787111573081 |
作者序 | 譯者序 | 前言 | 內容簡介 | 目錄 | 序 |
(簡體書上所述之下載連結耗時費功, 恕不適用在台灣, 若讀者需要請自行嘗試, 恕不保證) |
作者序: |
譯者序: |
前言:為什么要寫這本書
隨著大數據的概念越來越流行,越來越多的企業開始重視數據,期待從數據中尋找有價值的結論,以指導公司管理層決策,最終創造更大的價值。但是在游戲行業,數據分析的發展相對緩慢,很多游戲公司是在發現人口紅利消失后才逐漸重視數據,希望利用數據驅動產品。而在各種數據分析技術中,R語言作為一個可進行交互式數據分析和探索的強大平臺,擁有舉足輕重的作用。R語言的免費開源使得很多公司用它來處理數據、展示數據、分析數據、完成模型。
使用R語言可以進行游戲數據分析系統的搭建,可以對累積的海量游戲數據進行挖掘,找出其中的特征和規律。對于有志成為互聯網數據挖掘/分析師的讀者來說,R語言將成為他們未來必備的技能之一。
筆者在歷屆中國R語言會議演講時,都會遇到一些同學問類似這樣的問題:“是否學好數據挖掘工具就能勝任數據分析工作?”雖然這些學生都具備很好的理論和工具使用能力,但是缺乏對實際生產數據的處理能力,即學生們很少接觸到企業的真實數據,不知道如何將臟數據處理為可以建模的數據集。這也是筆者寫這本書的初衷。在本書中,筆者希望結合自己多年的數據挖掘實戰經驗,將R語言與游戲數據分析有機結合,真正做到“授之以漁”。
本書特色
本書從實際應用出發,結合實例及應用場景,通過對大量案例進行詳細闡述和深入分析,進而指導讀者在實際工作中通過R語言對游戲數據進行分析和挖掘。
本書的核心是游戲數據分析實戰,所以在案例講解過程中均會對分析結果進行業務解讀,進而幫助數據分析師提高“利用結果數據指導實際商務決策”的能力。
基于對業務的思考,本書從解決問題入手,以游戲為最佳切入點,輻射整個數據分析領域,并完成數據分析和挖掘建模工作,對其他行業的數據分析師如何做數據分析/挖掘也具有很大的啟發性。同時,本書內容涵蓋了R語言基礎、數據挖掘理論與實戰、交互式繪圖和Web網頁開發等,故也可以作為數據挖掘的入門書籍。
本書適用對象
游戲產品運營人員
游戲數據分析人員
各行各業的數據分析師
數據分析愛好者
具有數據分析背景的數據科學家
進行數據挖掘應用研究的科研人員
相關專業的在校生
如何閱讀本書
全書一共13章,分為三篇:基礎篇、實戰篇和提高篇。基礎篇介紹了游戲數據分析的基本理論知識、R語言的安裝與使用、R語言中的數據結構、常用操作和繪圖功能。實戰篇主要介紹了游戲數據的預處理、常用分析方法、玩家路徑分析和用戶分析。提高篇介紹了R語言圖形界面工具Rattle和Web開發框架shiny包。
第一篇是基礎篇(第1∼4章):第1章主要介紹了游戲數據分析的必要性和流程;第2章講解了R語言和RStudio的安裝及使用方法,并對數據對象和數據導入進行了介紹;第3章介紹了R語言繪圖基礎,包括常用圖形參數設置、低級繪圖函數和高級繪圖函數;第4章介紹了lattice和ggplot2繪圖包,并詳細介紹了一些基于R語言可用于生成交互式圖形的軟件包,包括rCharts、recharts、rbokeh、plotly等。
第二篇是實戰篇(第5∼11章):第5章介紹了游戲數據預處理常用的手段,包括數據抽樣、數據清洗、數據轉換和數據啞變量處理;第6章介紹了游戲數據分析的常用方法,包括指標數據可視化、游戲數據趨勢分析、游戲數據相關性分析和游戲數據中的降維技術;第7章介紹了事件點擊行為常用的漏斗分析和路徑分析;第8章介紹了留存指標的計算、留存率計算與預測、常用分類算法原理和模型評估;第9章介紹了常用用戶指標計算、LTV計算與預測、用戶物品購買關聯分析、基于用戶物品購買智能推薦和社會網絡分析;第10章介紹了渠道數據分析的必要性和對渠道用戶進行質量評級;第11章介紹了常用收入指標計算、利用用戶活躍度衡量游戲經濟狀況、RFM模型研究。
第三篇是提高篇(第12∼13章):第12章介紹了R語言的圖形界面工具Rattle,該工具能夠在圖形化的界面上完成數據導入、數據探索、數據可視化、數據建模和模型評估整個數據挖掘流程;第13章介紹了Web開發框架shiny包,使得R的使用者不必太了解CSS、JS,只需要了解一些HTML的知識就可以快速完成Web開發。
勘誤和支持
由于筆者的水平有限,書中難免會出現一些錯誤或者不準確的地方,懇請讀者批評指正。你可以把意見或建議直接發至我的郵箱(jiabiao1602@163.com)。如果你有什么問題,也可以發郵件來提問,我將盡力為讀者提供滿意的解答,期待你們的反饋。書中全部數據及源代碼都可以從GitHub網站(登錄網站https://github.com/jiabiao 1602/Game_DataMining_With_R或掃描下方二維碼)進行下載。
致謝
首先,感謝樂逗游戲CEO陳湘宇的支持,讓筆者能把這幾年在游戲行業中的一些數據挖掘實戰寫進本書,使讀者能完整地看到如何對原始的數據源進行清洗轉換以達到建模需求。書中介紹了對游戲行業付費用戶行為研究的幾種模型算法,相信對其他行業進行付費用戶挖掘分析也可以起到很好地借鑒作用。
其次,感謝機械工業出版社華章公司副總編楊福川的信任,同時,也要感謝編輯李藝審閱本書的全部章節,有了他們的支持、鼓勵和幫助,本書才能得以順利出版。
最后,感謝家人,感謝你們一直以來的理解、陪伴和支持。
謹以此書獻給我最親愛的家人以及眾多R語言的愛好者和數據分析師們! |
內容簡介:這是一部從大數據技術和游戲業務雙重維度講解如何利用結果數據指導商業決策的實戰性著作,由樂逗游戲高級數據分析師撰寫,是他近10年數據分析與挖掘經驗的總結。
傳統的數據分析類圖書重技術而輕業務,本書二者并重:技術方面,以游戲數據的分析與挖掘為核心,輻射游戲數據處理的各個環節,系統講解游戲數據分析與挖掘的技術、方法論和工具;業務方面,所有案例的講解過程中都對相關業務進行了重點解讀,旨在加深數據分析師對游戲業務的理解和思考,從而更好地利用R語言技術解決游戲數據處理中的各種復雜問題。
基礎篇(第1~4章)
主要講解了游戲數據分析的流程,以及游戲數據分析所需要掌握的R語言技術和相關工具(軟件包)的使用方法,這是利用R語言進行數據分析必備的基礎。
實戰篇(第5~11章)
詳細講解了游戲數據的預處理、常用分析方法、玩家路徑分析和用戶數據分析等核心內容,包含游戲數據分析全流程的技巧和方法論,以及對游戲業務的深入思考。
提高篇(第12~13章)
詳細介紹了R語言的圖形界面工具Rattle和Web開發框架shiny包的使用,能幫助數據分析師們解決更復雜的問題。 |
目錄:前言
第一篇 基礎篇
第1章 什么是游戲數據分析2
1.1 為什么要對游戲進行分析2
1.2 游戲數據分析的流程3
1.3 數據分析師的能力要求4
1.3.1 數據處理能力5
1.3.2 數據挖掘能力6
1.3.3 數據應用能力8
1.4 小結8
第2章 必備R語言基礎9
2.1 開發環境準備和快速入門9
2.1.1 R語言簡介9
2.1.2 R的安裝10
2.1.3 其他輔助工具10
2.1.4 R快速入門12
2.2 數據對象19
2.2.1 向量20
2.2.2 矩陣與數組24
2.2.3 列表和數據框27
2.3 數據導入30
2.3.1 利用RStudio導入30
2.3.2 文本文件的導入32
2.3.3 Excel文件的導入33
2.3.4 數據庫文件的導入34
2.3.5 網絡數據的爬取38
2.4 小結42
第3章 R語言繪圖重要技術43
3.1 常用圖形參數43
3.1.1 顏色元素43
3.1.2 文字元素46
3.1.3 點元素46
3.1.4 線元素48
3.2 低級繪圖函數48
3.2.1 標題48
3.2.2 坐標軸50
3.2.3 圖例52
3.2.4 網格線52
3.2.5 點54
3.2.6 文字54
3.2.7 線55
3.3 高級繪圖函數57
3.3.1 散點圖58
3.3.2 氣泡圖59
3.3.3 線圖60
3.3.4 柱狀圖62
3.3.5 餅圖62
3.3.6 直方圖和密度圖63
3.3.7 Q-Q圖65
3.3.8 箱線圖66
3.3.9 莖葉圖66
3.3.10 點圖67
3.3.11 馬賽克圖67
3.4 小結69
第4章 高級繪圖工具70
4.1 lattice包繪圖工具70
4.1.1 繪圖特色70
4.1.2 基本圖形77
4.2 ggplot2包繪圖工具93
4.2.1 從qplot開始93
4.2.2 ggplot作圖96
4.2.3 ggthemes主題包101
4.3 交互式繪圖工具103
4.3.1 rCharts包104
4.3.2 recharts包108
4.3.3 rbokeh包118
4.3.4 plotly包119
4.3.5 googleVis包122
4.3.6 其他基于htmlwidgets包開發的交互包124
4.4 小結132
第二篇 實戰篇
第5章 游戲數據預處理134
5.1 數據抽樣134
5.1.1 數據抽樣的必要性134
5.1.2 類失衡處理方法:SMOTE135
5.1.3 數據隨機抽樣:sample函數138
5.1.4 數據等比抽樣:createData-Partition函數139
5.1.5 用于交叉驗證的樣本抽樣142
5.2 數據清洗143
5.2.1 缺失值判斷及處理144
5.2.2 異常值判斷處理152
5.3 數據轉換158
5.3.1 產生衍生變量158
5.3.2 數據分箱159
5.3.3 數據標準化轉換160
5.4 數據啞變量處理162
5.5 小結165
第6章 游戲數據分析的常用方法166
6.1 游戲數據可視化166
6.1.1 單指標數據可視化166
6.1.2 雙指標數據可視化167
6.1.3 三指標數據可視化167
6.2 游戲數據趨勢分析169
6.2.1 同比、環比169
6.2.2 趨勢線擬合170
6.2.3 時間序列數據預測171
6.3 游戲數據相關分析179
6.3.1 相關分析基本原理179
6.3.2 相關關系可視化181
6.3.3 活躍時間段相關分析184
6.4 游戲數據中的降維技術186
6.4.1 主成分及因子分析基本原理186
6.4.2 對應分析基本原理188
6.4.3 玩家偏好分析188
6.5 小結191
第7章 漏斗模型與路徑分析192
7.1 漏斗模型與路徑分析的主要區別和聯系192
7.2 漏斗模型193
7.2.1 漏斗模型的主要應用場景193
7.2.2 分析案例:新手教程漏斗模型194
7.3 路徑分析197
7.3.1 路徑分析的主要應用場景197
7.3.2 路徑分析的主要算法198
7.3.3 分析案例:游戲點擊事件路徑分析202
7.4 小結208
第8章 留存分析209
8.1 指標概述209
8.1.1 用戶留存209
8.1.2 流失分析211
8.2 留存率的分析及預測212
8.2.1 留存率曲線213
8.2.2 留存率預測曲線213
8.2.3 優化預測曲線216
8.3 用戶流失預測218
8.3.1 分類及模型評估220
8.3.2 活躍用戶流失預測233
8.4 小結238
第9章 用戶分析239
9.1 用戶分類239
9.1.1 新老用戶240
9.1.2 活躍用戶241
9.1.3 用戶習慣243
9.2 LTV244
9.2.1 LTV的定義244
9.2.2 LTV的預測244
9.3 用戶物品購買關聯分析247
9.3.1 常用關聯規則算法248
9.3.2 R中的實現250
9.3.3 案例:對用戶購買物品進行關聯分析251
9.4 基于用戶物品購買智能推薦259
9.4.1 智能推薦模型構建及評估259
9.4.2 案例:對用戶物品購買進行智能推薦262
9.5 社會網絡分析264
9.5.1 網絡圖的基本概念264
9.5.2 網絡圖的R語言實現266
9.5.3 R與Gephi的結合270
9.5.4 案例:分析用戶物品購買分類275
9.6 小結279
第10章 渠道分析280
10.1 渠道分析的意義280
10.2 建立渠道數據監控體系282
10.2.1 構建數據分析指標283
10.2.2 建立渠道數據監控體系287
10.3 渠道用戶質量評級293
10.3.1 渠道用戶質量評級的背景和目的293
10.3.2 渠道用戶質量打分模型293
10.3.3 分析案例:渠道用戶質量打分294
10.4 小結298
第11章 收入分析299
11.1 宏觀收入分析299
11.2 游戲經濟與用戶關系分析302
11.2.1 背景及數據302
11.2.2 數據探索分析303
11.2.3 模型構建308
11.3 RFM模型研究310
11.3.1 RFM模型研究背景及原理310
11.3.2 案例:付費用戶RFM模型研究312
11.3.3 RFM模型的不足及改進314
11.4 小結316
第三篇 提高篇
第12章 Rattle:可視化數據挖掘工具318
12.1 Rattle簡介及安裝318
12.1.1 Rattle簡介318
12.1.2 Rattle安裝319
12.2 功能預覽319
12.3 數據導入320
12.3.1 導入CSV數據321
12.3.2 導入ARFF數據325
12.3.3 導入ODBC數據326
12.3.4 R Dataset—導入其他數據源328
12.3.5 導入RData File數據集330
12.3.6 導入Library數據332
12.4 數據探索333
12.4.1 數據總體概況333
12.4.2 數據分布探索335
12.4.3 相關性338
12.4.4 主成分341
12.4.5 交互圖343
12.5 數據建模348
12.5.1 聚類分析348
12.5.2 關聯規則352
12.5.3 決策樹354
12.5.4 隨機森林356
12.6 模型評估360
12.6.1 混淆矩陣360
12.6.2 風險圖360
12.6.3 ROC曲線及相關曲線361
12.6.4 模型得分數據集361
12.7 小結364
第13章 快速搭建游戲數據分析平臺365
13.1 shiny快速入門365
13.2 shinydashboard包375
13.3 案例一:搭建數據可視化原型379
13.4 案例二:用戶細分及付費預測平臺388
13.5 案例三:渠道用戶打分平臺395
13.6 小結402 |
序: |