Python數據分析與數據化運營第2版 @ 3dWoo大學簡體電腦書店

	-- 會員 / 註冊 --
帳號：　密碼：　 \| 註冊 \| 忘記密碼

3/26 新書到！ 3/19 新書到！ 3/14 新書到！ 12/12 新書到！
	購書流程‧Q & A‧站務留言版‧客服信箱

│ 3ds Max│ Maya│ Rhino│ After Effects│ SketchUp│ ZBrush│ Painter│ Unity│

│ PhotoShop│ AutoCad│ MasterCam│ SolidWorks│ Creo│ UG│ Revit│ Nuke│

│ C#│ C│ C++│ Java│ 遊戲程式│ Linux│ 嵌入式│ PLC│ FPGA│ Matlab│

│ 駭客│ 資料庫│ 搜索引擎│ 影像處理│ Fluent│ VR+AR│ ANSYS│ 深度學習│

│ 單晶片│ AVR│ OpenGL│ Arduino│ Raspberry Pi│ 電路設計│ Cadence│ Protel│

│ Hadoop│ Python│ Stm32│ Cortex│ Labview│ 手機程式│ Android│ iPhone│


可查書名,作者,ISBN,3dwoo書號		詳細書籍分類

Python數據分析與數據化運營第2版
( 簡體字)

作者：宋天龍　著類別：1. -> 程式設計 -> Python

譯者：

出版社：機械工業出版社 3dWoo書號： 51313
詢問書籍請說出此書號！
【缺書】
NT售價： 645 元

出版日：6/1/2019

頁數：545

光碟數：0

站長推薦：

印刷：黑白印刷語系： ( 簡體版 )

加入購物車 │加到我的最愛
(請先登入會員)

ISBN：9787111627760

作者序　|　譯者序　|　前言　|　內容簡介　|　目錄　|　序

(簡體書上所述之下載連結耗時費功, 恕不適用在台灣, 若讀者需要請自行嘗試, 恕不保證)

作者序：

譯者序：

前言：
為什么要寫這本書

隨著商業競爭形勢的日益嚴峻，企業需要不斷尋找提高利潤率、降低成本、提高產出價值的有效方法，而數據化運營恰好是滿足企業這一需求的關鍵武器。數據化運營包含了運營和數據兩種要素，前者需要較多的業務經驗，而后者對數據分析提出了更高的要求。只有把二者結合起來，在技能、經驗和技術的支持下，數據化運營才能在企業內部真正落地、生根、發芽。

對數據化運營而言，各企業普遍關注的結構化數據分析、挖掘的場景非常豐富，例如銷售預測、會員生命周期維護、商品結構分析等，這些普遍的共同認知為本書提供了接地氣的基礎。但除了這些“傳統內容”外，還有很多非結構化的數據主題，它們在數據化運營過程中的作用越來越重要，例如主題挖掘、圖片分析、文本挖掘、圖像識別、語音識別等，這些內容拓展了數據化運營發揮價值的場景基礎。

Python作為數據工作領域的關鍵武器之一，具有開源、多場景應用、快速上手、完善的生態和服務體系等特征，這些特征使其在數據分析與數據化運營的任何場景中都能游刃有余；即使在其為數不多的短板功能上，Python仍然可以基于“膠水”的特征，引入對應的第三方工具、庫、程序等來實現全場景、全應用的覆蓋。在海量數據背景下，Python對超大數據規模的支持性能、數據分析處理能力、建模的專業程度及開發便捷性的綜合能力方面要遠遠高于其他工具。因此，Python幾乎是數據化運營工作的不二之選。

縱觀整個國內技術書籍市場，有關Python的書籍不少，但普遍都是基于工具層面的介紹，且側重于工具本身的方法、參數、調用、實例，與真正實踐結合的較少；而有關數據化運營的書籍，目前市場上還為數不多，現有的數據化運營方面的書籍大多是基于Excel等工具的入門級別的分析類書籍。因此，本書結合Python和數據化運營兩個方面，在數據分析工作流程和數據化運營主題結合的基礎上，通過指標、模型、方法、案例配合工具的形式，詳細介紹了如何使用Python來支持數據化運營，尤其是傳統工具無法滿足的應用場景。

本書第1版上市后，得到來自各行各業很多好友和讀者的支持和反饋，在此致以感謝！第2版在第1版基礎上做了很多優化甚至重寫，還新增了很多內容。

優化以及重寫的內容

全部代碼基于Python 3做優化或重寫，書中的Python版本是Python 3.7。

基于Jupyter做調試、分析和應用，更適合數據分析師的應用場景，包括探索性分析、數據預處理、結果可視化展示、交互式演示等。

網頁數據解析中基于Class做功能封裝和處理，便于以網頁對象為主體的數據工作。

PIL/Pollow的替換和方法應用介紹，多用于圖像處理工作。

第4章數據挖掘的案例部分，每一個案例都經過重寫，并增加了很多知識點，以實際案例為需求，實際應用數據挖掘算法做建模和分析應用。

Matplotlib調用3D圖形展示多個維度的信息，并可通過拖曳展示不同角度下數據的分布情況。

第5章第1個案例是RFM代碼的重構，以及針對不同分組的精細化運營策略的制定。

第5章第2個案例是基于嵌套Pipeline和FeatureUnion復合數據工作流的營銷響應預測，并基于復合（兩層管道）的Pipeline做數據工作流管理。

第6章第2個案例是基于集成算法GBDT和RandomForest的投票組合模型的異常檢測，GBDT和RandomForest是兩個典型的代表模型“準確度”和“穩定度”的算法，這種兼顧“準”和“穩”的模型搭配更符合實際需求。

第7章基于自動節點樹的數據異常原因來下探分析樹形圖的內容和可視化，優化了代碼和樣式，可視化效果更好，并能獲得更多信息，包括維度分解過程、主因子、其他因子和潛在因子等。

新增的內容

基于Anaconda的Python環境的安裝和配置，更方便初學者快速搭建Python應用環境。

Jupyter基礎工具的用法，包括安裝、啟動、基礎操作、魔術命令、新內核安裝和使用、執行shell命令、擴展和插件使用、系統基礎配置等。

基于Pandas的get_dummies做標志轉換，即OneHotEncode轉換。

特征選擇的降維中新增feature_selection配合SelectPercentile、VarianceThreshold、RFE、SelectFromModel做特征選擇。

特征轉換的降維中新增PCA、LDA、FA、ICA這幾個數據轉換和降維的具體方法。

特征組合的降維中新增基于GBDT、PolynomialFeatures、gplearn的genetic方法做組合特征。

第4章的分類算法中新增使用XGboost做分類應用，以及配合graphviz輸出矢量圖形。

pyecharts的數據可視化的應用和操作，尤其是關聯關系圖的應用。

Python通過rpy2調用R程序，實現關聯算法的挖掘，包括直接執行程序文件、代碼段、變量使用等。

Python通過rpy2調用auto.airma實現自動ARIMA的應用，降低Python在時間序列算法應用時的門檻。

自動化學習：增加了對于自動化數據挖掘與機器學習的理論、流程、知識和應用庫介紹，并基于TPOT做自動化回歸和分類學習案例演示。

我希望能盡自己的微薄之力，將過往所學、所感、所知提煉出來供更多人了解。如果讀者能從本書中感悟一二，我將倍感欣慰；如果讀者能將其用于工作實踐，這將是本書以及數據工作之福！

讀者對象

本書旨在提供有關數據與運營的綜合知識的介紹和應用，雖然基礎工具是Python，但本書并沒有就Python基礎規則和語法做詳細介紹，因此希望讀者具有一定的Python基礎。相信我，只要你認真看過Python教學視頻（網絡上有很多），只需大概2個小時就能具備這種基礎。

本書對讀者的知識背景沒有特定要求，書中的內容都盡量言簡意賅、深入淺出。本書適合以下幾類讀者閱讀：

企業運營人員。本書的核心命題就是運營，其中涉及會員運營、商品運營、流量運營和內容運營四大主題，無論運營人員希望獲得運營知識，還是希望獲得數據分析和挖掘方法，都可以從書中找到。

數據分析師。毫無疑問，數據分析師是本書的核心受眾群體之一，書中介紹的數據抽取、預處理和分析挖掘經驗一定能為數據分析師帶來很多“不一樣”的收獲，每個運營主題下的小技巧、模型和案例更能激發數據分析師的靈感—原來數據工作還能這樣做。

Python工程師。坦白講，本書不是一本專門介紹Python語法、規則的書籍。但Python作為一種“萬能”工具，在數據分析和挖掘領域具有舉足輕重的地位，對于任何一位工作領域中涉及數據（或大數據）的Python工程師來說，本書的價值會成倍增長。書中對Python數據處理、計算和挖掘庫的應用介紹，以及對有關工具庫的用法、注意點和小知識的介紹一定會使Python工程師的工作和能力更上一層樓。

數據挖掘工程師。數據分析與挖掘在實際運營中都是不分家的，本書沒有冠以“挖掘”之名，但并不意味著沒有挖掘（或機器學習）算法。本書第4章基本都是圍繞常用算法展開的知識介紹，其中各個算法類的“大坑”都是筆者多年經驗的總結；在運營主題的案例中幾乎都用到了算法來解決實際問題。除了基本的數據挖掘以外，本書還涉及自然語言處理、日志處理、文本挖掘、圖像處理等相關知識。

如何閱讀本書

本書內容從邏輯上共分為兩大部分，第一部分是有關數據分析類的主題，第二部分是有關數據化運營的主題。

第一部分包括第1～4章和附錄，主要介紹了Python和數據化運營的基本知識、數據來源獲取、數據預處理，以及數據分析和挖掘的關鍵經驗。其中：

第1章是Python和數據化運營的基本知識介紹。

第2章對傳統的結構化和非結構化數據來源及獲取、讀取和解析進行了介紹，包括數據文件、數據庫、API、流式數據、外部公開數據等，也提到了如何讀取網頁、文本、圖片、視頻、語音等類型的數據。

第3章總結了10個有關數據化運營過程的數據預處理經驗，涵蓋了常見的數據清洗、標志轉換、數據降維、樣本不均衡、數據源沖突、抽樣、共線性、相關性分析、數據標準化、數據離散化等內容，并在擴展內容中簡單介紹了有關網頁、日志、圖像、自然語言的文本預處理工作，作為拓展知識閱讀。

第4章總結了數據分析、挖掘和網站分析方法的8個主題類，內容涵蓋聚類、回歸、分類、關聯、異常檢測、時間序列、路徑分析、漏斗分析、歸因分析、熱力圖分析及其他統計分析相關話題，各個類別中都以關鍵經驗為基礎，圍繞應用誤區、注意事項和應用方法展開詳細介紹。

第二部分包括第5～9章，分別介紹了會員運營、商品運營、流量運營和內容運營四大主題，以及提升數據化運營價值的方法。在每個數據化運營主題中都包含了基本知識、關鍵指標、應用場景、數據分析模型、數據分析小技巧、數據分析“大實話”及兩個應用案例。

基本知識：有關運營主題的基本內涵、價值、用途等方面的介紹。

關鍵指標：運營主題的主要評估和矩陣指標，按類別拆分和歸納。

應用場景：總結數據對于運營的價值落地在哪些場景中。

數據分析模型：“大型”的數據分析方法，包括統計分析、數據挖掘、網站分析、數學模型。

數據分析小技巧：“小型”的數據分析方法，看起來相對簡單但非常有效。

數據分析“大實話”：有關運營或數據分析的潛在規律的解釋及介紹。

應用案例：每個運營主題都包含兩個應用案例，基本上每個案例的應用算法和技巧都不相同，目的是呈現不同算法在不同場景下的差異化應用。

除了以上內容外，以下信息是對本書中涉及特定內容的解釋和說明。

漸進式的內容：本書的Python代碼和實現部分，在不同章節可能會具有不同的代碼風格，包括定義規則、注釋、功能實現等，這是因為筆者試圖遵循循序漸進的原則，先介紹功能實現，然后再介紹其他的備選方案，以及規范、原則等來輔助Python的實現。這樣做一方面是希望盡量多地展示解決同一類問題的不同方法，讓讀者能根據自身實際情況選擇最“合適”的用法示例；另一方面是因為，考慮到可能有很多讀者不具備較強的Python基礎知識，筆者不希望一上來就讓這些讀者感覺到使用Python會受到各種“條條框框”的限制，從而打擊他們使用Python的信心，畢竟，能實現功能需求是第一位的。

內容延伸：本書第1～4章都有內容延伸章節，其內容是有關非結構化主題的讀取、分析、處理。由于每個主題展開來都能寫成一本書，因此僅在內容延伸中拋磚引玉，有興趣的讀者可以了解和學習。

相關知識點：本書很多章節中都有“相關知識點”部分，其內容是關于特定工具、知識、算法、庫等方面的較為詳細的介紹，充當了本書的知識堡壘。

本章小結：每章的結尾都有“本章小結”，在小結中包含4部分內容。

內容小結：有關本章內容的總結。

重點知識：本章需要讀者重點掌握的知識和內容。

外部參考：本章提到但是無法詳細介紹的內容，有興趣的讀者可以基于外部參考構建自己的知識圖譜。

應用實踐：基于本章內容給出在實踐中落地的建議。

提示：對于知識點的重要提示和應用技巧，相對“相關知識點”而言，每條提示信息內容量較少，一般都是經驗類的總結。

注意：特定知識需要引起注意的點，這些注意點是應用過程中需要避免的“大坑”。

特定名詞的混用：本書提到了庫和包、模型和算法等詞，雖然有含義差異，但書中并沒有劃清它們的界限，因此在很多時候它們都是等價的。
致謝

在本書撰寫過程中，得到了來自多方的指導、幫助和支持。

首先，感謝彭亮先生和史研先生。彭亮先生使我感受到什么是高度和專注，并促使我的數據工作從真正意義上步入正途。史研先生對于大數據的廣博認知和敏銳洞察力，讓我有更多機會深入到不同的數據分支，去探索未曾了解的領域。

其次，感謝機械工業出版社華章分社第二事業部的楊福川老師，楊老師在我出版了兩本書之后鼓勵我繼續撰寫本書，并為本書的撰寫提供了方向和思路指導。另外，感謝全程參與審核、校驗等工作的李藝老師及其他背后默默支持的出版工作者，他們的辛勤付出保證了本書的順利面世。

再次，感謝在各個數據項目和工作中提供支持的領導、朋友、伙伴，尤其是田學鋒，他是我的良師益友，他有著非比尋常的視野、胸懷和獨到的見解，在我的人生道路上給予了我非常多的指導和啟迪。還要感謝跟我一起工作的小伙伴（排名不分先后）：龐程程、徐子東、趙光娟、王成、呂兆星、鄭傳峰、楊曉鵬、陳駿、江濤、曹佳佳、麻建昕、史曉春、楊勇等。

最后，感謝我的父母、家人和朋友，尤其是我的夫人姜麗女士，是她在我寫書的這段期間把家里的一切料理得井井有條，使得我有精力完成本書的全部撰寫工作。

謹以此書獻給熱愛數據工作并為之奮斗的朋友們，愿大家身體健康、生活美滿、事業有成！

宋天龍（Tony Song）

內容簡介：
這是一本將數據分析技術與數據使用場景深度結合的著作，從實戰角度講解了如何利用Python進行數據分析和數據化運營。

暢銷書全新、大幅升級，第1版近乎100%的好評，第2版不僅將Python升級到了最新的版本，而且對具體內容進行了大幅度的補充和優化。作者是有10余年數據分析與數據化運營的資深大數據專家，書中對50余個數據工作流知識點、14個數據分析與挖掘主題、4個數據化運營主題、8個綜合性案例進行了全面的講解，能讓數據化運營結合數據使用場景360°落地。

全書一共9章，分為兩個部分：

第一部分（第1-4章） Python數據分析與挖掘

首先介紹了Python和數據化運營的基本知識，然后詳細講解了Python數據獲取（結構化和非結構化）、預處理、分析和挖掘的關鍵技術和經驗，包含10大類預處理經驗、14個數據分析與挖掘主題，50余個知識點。

第二部分（第5~9章） Python數據化運營

這是本書的核心，詳細講解了會員運營、商品運營、流量運營和內容運營4大主題，以及提升數據化運營價值的方法。每個運營主題中都包含了基本知識、評估指標、應用場景、數據分析模型、數據分析小技巧、數據分析大實話以及2個綜合性的應用案例。

------

添加作者微信（TonySong2013）可在線獲取實時解答，同時加入本書溝通群（作者拉入群），交流更多數據工作的感悟和心得并認識更多同行從業者；本書提供案例數據和源代碼（中文注釋）下載，供讀者實操時使用。

目錄：
前言
第1章　Python和數據化運營1
1.1　用Python做數據化運營1
1.1.1　Python是什么1
1.1.2　數據化運營是什么2
1.1.3　Python用于數據化運營5
1.2　數據化運營所需的Python相關工具和組件5
1.2.1　Python程序6
1.2.2　Python交互環境Jupyter7
1.2.3　Python第三方庫23
1.2.4　數據庫和客戶端29
1.2.5　SSH遠程客戶端30
1.3　內容延伸：Python的OCR和tensorflow31
1.3.1　OCR工具：Tesseract-ocr31
1.3.2　機器學習框架：TensorFlow31
1.4　第1個用Python實現的數據化運營分析實例、銷售預測32
1.4.1　案例概述32
1.4.2　案例過程32
1.4.3　案例小結36
1.5　本章小結37
第2章　數據化運營的數據來源40
2.1　數據化運營的數據來源類型40
2.1.1　數據文件40
2.1.2　數據庫41
2.1.3　API42
2.1.4　流式數據43
2.1.5　外部公開數據43
2.1.6　其他來源44
2.2　使用Python獲取運營數據44
2.2.1　從文本文件讀取運營數據44
2.2.2　從Excel獲取運營數據55
2.2.3　從關系型數據庫MySQL讀取運營數據57
2.2.4　從非關系型數據庫MongoDB讀取運營數據64
2.2.5　從API獲取運營數據68
2.3　內容延伸：讀取非結構化網頁、文本、圖像、視頻、語音72
2.3.1　從網頁中獲取運營數據72
2.3.2　讀取非結構化文本數據73
2.3.3　讀取圖像數據74
2.3.4　讀取視頻數據78
2.3.5　讀取語音數據81
2.4　本章小結85
第3章　10條數據化運營不得不知道的數據預處理經驗87
3.1　數據清洗：缺失值、異常值和重復值的處理87
3.1.1　數據列缺失的4種處理方法87
3.1.2　不要輕易拋棄異常數據89
3.1.3　數據重復就需要去重嗎90
3.1.4　代碼實操：Python數據清洗92
3.2　將分類數據和順序數據轉換為標志變量100
3.2.1　分類數據和順序數據是什么100
3.2.2　運用標志方法處理分類和順序變量101
3.2.3　代碼實操：Python標志轉換101
3.3　大數據時代的數據降維104
3.3.1　需要數據降維的情況104
3.3.2　基于特征選擇的降維105
3.3.3　基于特征轉換的降維106
3.3.4　基于特征組合的降維112
3.3.5　代碼實操：Python數據降維114
3.4　解決樣本類別分布不均衡的問題123
3.4.1　哪些運營場景中容易出現樣本不均衡124
3.4.2　通過過抽樣和欠抽樣解決樣本不均衡124
3.4.3　通過正負樣本的懲罰權重解決樣本不均衡124
3.4.4　通過組合/集成方法解決樣本不均衡125
3.4.5　通過特征選擇解決樣本不均衡125
3.4.6　代碼實操：Python處理樣本不均衡125
3.5　數據化運營要抽樣還是全量數據128
3.5.1　什么時候需要抽樣128
3.5.2　如何進行抽樣129
3.5.3　抽樣需要注意的幾個問題130
3.5.4　代碼實操：Python數據抽樣131
3.6　解決運營數據的共線性問題135
3.6.1　如何檢驗共線性135
3.6.2　解決共線性的5種常用方法136
3.6.3　代碼實操：Python處理共線性問題137
3.7　有關相關性分析的混沌139
3.7.1　相關和因果是一回事嗎139
3.7.2　相關系數低就是不相關嗎139
3.7.3　代碼實操：Python相關性分析140
3.8　標準化，讓運營數據落入相同的范圍141
3.8.1　實現中心化和正態分布的Z-Score141
3.8.2　實現歸一化的Max-Min142
3.8.3　用于稀疏數據的MaxAbs142
3.8.4　針對離群點的RobustScaler142
3.8.5　代碼實操：Python數據標準化處理142
3.9　離散化，對運營數據做邏輯分層145
3.9.1　針對時間數據的離散化145
3.9.2　針對多值離散數據的離散化146
3.9.3　針對連續數據的離散化146
3.9.4　針對連續數據的二值化147
3.9.5　代碼實操：Python數據離散化處理147
3.10　內容延伸：非結構化數據的預處理151
3.10.1　網頁數據解析151
3.10.2　網絡用戶日志解析159
3.10.3　圖像的基本預處理164
3.10.4　自然語言文本預處理169
3.11　本章小結172
第4章　跳過運營數據分析和挖掘的“大坑”174
4.1　聚類分析174
4.1.1　當心數據異常對聚類結果的影響175
4.1.2　超大數據量時應該放棄K均值算法175
4.1.3　聚類不僅是建模的終點，更是重要的中間預處理過程177
4.1.4　高維數據上無法應用聚類嗎178
4.1.5　如何選擇聚類分析算法179
4.1.6　案例：客戶特征的聚類與探索性分析179
4.2　回歸分析196
4.2.1　注意回歸自變量之間的共線性問題197
4.2.2　相關系數、判定系數和回歸系數之間是什么關系197
4.2.3　判定系數是否意味著相應的因果聯系197
4.2.4　注意應用回歸模型時研究自變量是否產生變化198
4.2.5　如何選擇回歸分析算法198
4.2.6　案例：大型促銷活動前的銷售預測199
4.3　分類分析206
4.3.1　防止分類模型的過擬合問題207
4.3.2　使用關聯算法做分類分析207
4.3.3　用分類分析來提煉規則、提取變量、處理缺失值208
4.3.4　類別劃分：分類算法和聚類算法都是好手209
4.3.5　如何選擇分類分析算法210
4.3.6　案例：用戶流失預測分析與應用210
4.4　關聯分析221
4.4.1　頻繁規則不一定是有效規則221
4.4.2　不要被啤酒尿布的故事禁錮你的思維222
4.4.3　被忽略的“負相關”模式真的毫無用武之地嗎223
4.4.4　頻繁規則只能打包組合應用嗎224
4.4.5　關聯規則的序列模式224
4.4.6　使用Python和R分別實現商品交叉銷售分析225
4.5　異常檢測分析240
4.5.1　異常檢測中的“新奇檢測”模式241
4.5.2　將數據異常與業務異常相分離241
4.5.3　面臨維度災難時，異常檢測可能會失效241
4.5.4　異常檢測的結果能說明異常嗎241
4.5.5　案例：網站廣告流量的異常識別與檢測242
4.6　時間序列分析253
4.6.1　如果有自變量，為什么還要用時間序列253
4.6.2　時間序列不適合商業環境復雜的企業254
4.6.3　時間序列預測的整合、橫向和縱向模式255
4.6.4　案例：未來10天的整體銷售預測255
4.7　路徑、漏斗、歸因和熱力圖分析267
4.7.1　不要輕易相信用戶的頁面訪問路徑269
4.7.2　如何將路徑應用于更多用戶行為模式的挖掘270
4.7.3　為什么很多數據都顯示了多渠道路徑的價值很小271
4.7.4　點擊熱力圖真的反映了用戶的點擊喜好嗎271
4.7.5　為什么歸因分析主要存在于線上的轉化行為272
4.7.6　漏斗分析和路徑分析有什么區別273
4.8　其他數據分析和挖掘的忠告274
4.8.1　不要忘記數據質量的驗證274
4.8.2　不要忽視數據的落地性274
4.8.3　不要把數據陳列當作數據結論275
4.8.4　數據結論不要產生于單一指標276
4.8.5　數據分析不要預設價值立場276
4.8.6　不要忽視數據與業務的需求沖突問題277
4.9　內容延伸1：非結構化數據的分析與挖掘278
4.9.1　詞頻統計278
4.9.2　詞性標注281
4.9.3　關鍵字提取284
4.9.4　文本聚類286
4.10　內容延伸2：AutoML—自動化數據挖掘與機器學習289
4.10.1　自動化數據挖掘與機器學習概述289
4.10.2　TPOT自動化學習簡介290
4.10.3　使用TPOT做自動化學習292
4.11　本章小結298
第5章　會員數據化運營300
5.1　會員數據化運營概述300
5.2　會員數據化運營關鍵指標301
5.2.1　會員整體指標301
5.2.2　會員營銷指標301
5.2.3　會員活躍度指標303
5.2.4　會員價值度指標305
5.2.5　會員終生價值指標305
5.2.6　會員異動指標306
5.3　會員數據化運營應用場景307
5.3.1　會員營銷307
5.3.2　會員關懷307
5.4　會員數據化運營分析模型307
5.4.1　會員細分模型307
5.4.2　會員活躍度模型309
5.4.3　會員價值度模型309
5.4.4　會員流失預測模型310
5.4.5　會員特征分析模型311
5.4.6　營銷響應預測模型312
5.5　會員數據化運營分析小技巧313
5.5.1　使用留存分析做新用戶質量分析313
5.5.2　使用AARRR做App用戶生命周期分析314
5.5.3　借助動態數據流關注會員狀態的輪轉315
5.5.4　使用協同過濾算法為新會員分析推送個性化信息316
5.6　會員數據化運營分析的“大實話”318
5.6.1　企業“不差錢”，還有必要做會員精準營銷嗎318
5.6.2　用戶滿意度取決于期望和給予的匹配程度319
5.6.3　用戶不購買就是流失了嗎319
5.6.4　來自調研問卷的用戶信息可信嗎320
5.6.5　不要盲目相信二八法則321
5.7　案例：基于RFM的精細化用戶管理322
5.7.1　案例背景322
5.7.2　案例主要應用技術322
5.7.3　案例數據323
5.7.4　案例過程323
5.7.5　案例數據結論337
5.7.6　案例應用和部署341
5.7.7　案例注意點341
5.7.8　案例引申思考342
5.8　案例：基于嵌套Pipeline和Fea-tureUnion復合數據工作流的營銷響應預測342
5.8.1　案例背景342
5.8.2　案例主要應用技術343
5.8.3　案例數據343
5.8.4　案例過程344
5.8.5　案例數據結論353
5.8.6　案例應用和部署353
5.8.7　案例注意點354
5.8.8　案例引申思考355
5.9　本章小結355
第6章　商品數據化運營357
6.1　商品數據化運營概述357
6.2　商品數據化運營關鍵指標357
6.2.1　銷售指標357
6.2.2　促銷活動指標360
6.2.3　供應鏈指標361
6.3　商品數據化運營應用場景363
6.3.1　銷售預測363
6.3.2　庫存分析363
6.3.3　市場分析363
6.3.4　促銷分析364
6.4　商品數據化運營分析模型364
6.4.1　商品價格敏感度模型364
6.4.2　新產品市場定位模型365
6.4.3　銷售預測模型366
6.4.4　商品關聯銷售模型367
6.4.5　異常訂單檢測368
6.4.6　商品規劃的最優組合368
6.5　商品數據化運營分析小技巧370
6.5.1　使用層次分析法將定量與定性分析結合370
6.5.2　通過假設檢驗做促銷拉動分析373
6.5.3　使用BCG矩陣做商品結構分析374
6.5.4　巧用4P分析建立完善的商品運營分析結構376
6.6　商品數據化運營分析的“大實話”376
6.6.1　為什么很多企業會以低于進價的價格大量銷售商品376
6.6.2　促銷活動真的是在促進商品銷售嗎378
6.6.3　用戶關注的商品就是要買的商品嗎379
6.6.4　提供的選擇過多其實不利于商品銷售380
6.7　案例：基于Gradient Boosting的自動超參數優化的銷售預測381
6.7.1　案例背景381
6.7.2　案例主要應用技術381
6.7.3　案例數據381
6.7.4　案例過程382
6.7.5　案例數據結論389
6.7.6　案例應用和部署389
6.7.7　案例注意點389
6.7.8　案例引申思考389
6.8　案例：基于集成算法GBDT和RandomForest的投票組合模型的異常檢測390
6.8.1　案例背景390
6.8.2　案例主要應用技術390
6.8.3　案例數據391
6.8.4　案例過程391
6.8.5　案例數據結論397
6.8.6　案例應用和部署398
6.8.7　案例注意點398
6.8.8　案例引申思考399
6.9　本章小結400
第7章　流量數據化運營402
7.1　流量數據化運營概述402
7.2　八大流量分析工具402
7.2.1　Adobe Analytics403
7.2.2　Webtrekk Suite403
7.2.3　Webtrends403
7.2.4　Google Analytics404
7.2.5　IBM Coremetrics404
7.2.6　百度統計404
7.2.7　Flurry404
7.2.8　友盟405
7.2.9　如何選擇第三方流量分析工具405
7.3　流量采集分析系統的工作機制408
7.3.1　流量數據采集409
7.3.2　流量數據處理411
7.3.3　流量數據應用412
7.4　流量數據與企業數據的整合413
7.4.1　流量數據整合的意義413
7.4.2　流量數據整合的范疇414
7.4.3　流量數據整合的方法414
7.5　流量數據化運營指標415
7.5.1　站外營銷推廣指標415
7.5.2　網站流量數量指標417
7.5.3　網站流量質量指標418
7.6　流量數據化運營應用場景421
7.6.1　流量采購421
7.6.2　流量分發423
7.7　流量數據化運營分析模型423
7.7.1　流量波動檢測423
7.7.2　渠道特征聚類425
7.7.3　廣告整合傳播模型425
7.7.4　流量預測模型428
7.8　流量數據化運營分析小技巧429
7.8.1　給老板提供一頁紙的流量dashboard429
7.8.2　關注趨勢、重要事件和潛在因素是日常報告的核心431
7.8.3　使用從細分到多層下鉆數據分析431
7.8.4　通過跨屏追蹤解決用戶跨設備和瀏覽器的訪問行為432
7.8.5　基于時間序列的用戶群體過濾434
7.9　流量數據化運營分析的“大實話”436
7.9.1　流量數據分析的價值其實沒那么大436
7.9.2　如何將流量的實時分析價值最大化437
7.9.3　營銷流量的質量評估是難點工作438
7.9.4　個性化的媒體投放仍然面臨很多問題438
7.9.5　傳統的網站分析方法到底缺少了什么439
7.10　案例：基于自動節點樹的數據異常原因下探分析444
7.10.1　案例背景444
7.10.2　案例主要應用技術444
7.10.3　案例數據445
7.10.4　案例過程446
7.10.5　案例數據結論459
7.10.6　案例應用和部署460
7.10.7　案例注意點460
7.10.8　案例引申思考461
7.11　案例：基于自動K值的KMeans廣告效果聚類分析461
7.11.1　案例背景461
7.11.2　案例主要應用技術462
7.11.3　案例數據462
7.11.4　案例過程463
7.11.5　案例數據結論474
7.11.6　案例應用和部署475
7.11.7　案例注意點476
7.11.8　案例引申思考477
7.12　本章小結477
第8章　內容數據化運營480
8.1　內容數據化運營概述480
8.2　內容數據化運營指標481
8.2.1　內容質量指標481
8.2.2　SEO類指標481
8.2.3　內容流量指標482
8.2.4　內容互動指標482
8.2.5　目標轉化指標483
8.3　內容數據化運營應用場景484
8.3.1　內容采集484
8.3.2　內容創作484
8.3.3　內容分發485
8.3.4　內容管理485
8.4　內容數據化運營分析模型485
8.4.1　情感分析模型485
8.4.2　搜索優化模型 486
8.4.3　文章關鍵字模型486
8.4.4　主題模型487
8.4.5　垃圾信息檢測模型488
8.5　內容數據化運營分析小技巧488
8.5.1　通過AB測試和多變量測試找到最佳內容版本488
8.5.2　通過屏幕瀏覽占比了解用戶到底看了頁面多少內容490
8.5.3　通過數據分析系統與CMS打通實現個性化內容運營491
8.5.4　將個性化推薦從網站應用到App端494
8.6　內容數據化運營分析的“大實話”495
8.6.1　個性化內容運營不僅是整合CMS和數據系統495
8.6.2　用戶在著陸頁上不只有跳出和繼續兩種狀態495
8.6.3　“人工組合”的內容運營價值最大化并非不能實現496
8.6.4　影響內容點擊率的因素不僅有位置497
8.7　案例：基于潛在狄利克雷分配的內容主題挖掘498
8.7.1　案例背景498
8.7.2　案例主要應用技術498
8.7.3　案例數據498
8.7.4　案例過程498
8.7.5　案例數據結論506
8.7.6　案例應用和部署507
8.7.7　案例注意點507
8.7.8　案例引申思考508
8.8　案例：基于多項式貝葉斯的增量學習的文本分類508
8.8.1　案例背景508
8.8.2　案例主要應用技術508
8.8.3　案例數據509
8.8.4　案例過程509
8.8.5　案例數據結論517
8.8.6　案例應用和部署517
8.8.7　案例注意點517
8.8.8　案例引申思考517
8.9　本章小結518
第9章　數據化運營分析的終極秘籍520
9.1　撰寫出彩的數據分析報告的5個建議520
9.1.1　完整的報告結構520
9.1.2　精致的頁面版式521
9.1.3　漂亮的可視化圖形523
9.1.4　突出報告的關鍵信息524
9.1.5　用報告對象習慣的方式撰寫報告525
9.2　數據化運營支持的4種擴展方式526
9.2.1　數據API526
9.2.2　數據模型526
9.2.3　數據產品527
9.2.4　運營產品527
9.3　提升數據化運營價值度的5種途徑528
9.3.1　數據源：不只有結構化的數據528
9.3.2　自動化：建立自動工作機制529
9.3.3　未卜先知：建立智能預警模型529
9.3.4　智能化：向BI-AI的方向走530
9.3.5　場景化：將數據嵌入運營環節之中531
9.4　本章小結531
附錄533
附錄A　公開數據集533
附錄B　Python數據工具箱540

序：