-- 會員 / 註冊 --  
 帳號:
 密碼:
  | 註冊 | 忘記密碼
3/26 新書到! 3/19 新書到! 3/14 新書到! 12/12 新書到!
購書流程Q & A站務留言版客服信箱
3ds MaxMayaRhinoAfter EffectsSketchUpZBrushPainterUnity
PhotoShopAutoCadMasterCamSolidWorksCreoUGRevitNuke
C#CC++Java遊戲程式Linux嵌入式PLCFPGAMatlab
駭客資料庫搜索引擎影像處理FluentVR+ARANSYS深度學習
單晶片AVROpenGLArduinoRaspberry Pi電路設計CadenceProtel
HadoopPythonStm32CortexLabview手機程式AndroidiPhone
可查書名,作者,ISBN,3dwoo書號
詳細書籍分類

業務可視化分析: 從問題到圖形的Tableau方法(全彩)

( 簡體 字)
作者:喜樂君類別:1. -> 程式設計 -> Tableau
譯者:
出版社:電子工業出版社業務可視化分析: 從問題到圖形的Tableau方法(全彩) 3dWoo書號: 55036
詢問書籍請說出此書號!

缺書
NT售價: 695

出版日:8/1/2021
頁數:356
光碟數:0
站長推薦:
印刷:黑白印刷語系: ( 簡體 版 )
加入購物車 加到我的最愛
(請先登入會員)
ISBN:9787121417641
作者序 | 譯者序 | 前言 | 內容簡介 | 目錄 | 
(簡體書上所述之下載連結耗時費功, 恕不適用在台灣, 若讀者需要請自行嘗試, 恕不保證)
作者序:

譯者序:

前言:

自序
賦予可視化靈魂:
基于業務分析的新思考
與筆者的上一本書《數據可視化分析:Tableau 原理與實踐》(以下簡稱《數據可視化分析》)的出版相隔整一年,我們又見面了。感謝每位讀者的熱心支持,筆者也將付出真誠與所有。這本書不僅僅是過去一年的新知識點,更包括了筆者在數據分析領域掙扎多年后對思考體系的重新梳理和突破。作為《數據可視化分析》的姊妹篇,本書在某些體系上更加基礎、完整,在一些知識上又更加深入和進階。
在這里,筆者簡單介紹一下本書的緣起、闡述方法、知識結構等內容。
1.緣起
在《數據可視化分析》一書中,筆者總結多年學習、培訓和實施服務的經驗,介紹了Tableau的完整知識體系,以及基于Tableau 知識框架的問題分析方法、數據準備的多層模型,特別是基于“層次”(LOD)的計算體系。該書上市后,多謝各位讀者的口口相傳,在Tableau 的小圈子里流傳尚好,而筆者也借加印穿插補充了一些知識要點,并勘誤校訂。不過,該書的可視化闡述過于簡單,這與筆者的藝術感欠缺、知識積累不夠有直接關系。
綜觀各種可視化圖形,不管是Tableau Public 上的,還是借助Python 可視化庫實現的,在筆者看來,絢爛的形式背后大多遠離了數據的土壤——業務環境。可視化的目的是業務與決策,應以業務為背景、從問題出發、以可視化方法輔助決策(見本書第2 章)。
同時,作為Tableau 重要的代理商和服務提供商之一,筆者在過去一年中有幸認識了很多客戶,筆者驚奇地發現,原來大公司面臨的困境和中小公司其實并無二致,甚至“組織慣性”更大、更難以改變。借助于自己多年前的業務背景,筆者極力向客戶推廣可視化表象之上的業務探索與結構化分析。在客戶服務過程中,寥寥幾個“結構化分析”案例總能打動業務人員的心——他們都曾有類似的想法,但是受限于工具,從來沒有實現過。
在2020 年下半年給紅塔集團、平安普惠等客戶提供培訓和咨詢服務時,筆者就開始醞釀本書的框架。筆者有幾個非常明確的期望,希望借助本書實現:
(1)專注業務分析方法,闡述更加完整的邏輯體系,特別是基于“第一字段分類”的問題分析方法、基于層次的結構化分析方法(見第3 章)。
(2)基于“第二字段分類”的可視化邏輯,“可視化是由點線面構成的圖形”,但更重要的是圖形類型及其對應的業務意義;業務分析是自問題到圖形的過程,而非自數據到圖形的過程(見第4章)。
(3)從業務場景出發,分門別類介紹問題的類型與圖形邏輯,同時引導更多的業務用戶從“三圖一表”的基本圖形,借分布分析和相關性分析的特位分析走向“結構化分析”。結構化分析是本書最重要的歸宿,是筆者熱切希望每一位讀者、用戶都能深入理解的內容,借助相關的簡單案例,在你的用戶中獲得“哇喔”的驚喜。
2021 年上半年,在為長隆集團提供咨詢服務的過程中,筆者在分享“數據準備與性能優化”時,獲得了“第三字段分類”的關鍵靈感。本書付梓前夕,筆者特意突出了這個內容(見3.4 節),雖然內容簡單,但這將是之后新書的主題“數據準備與分析模型”的邏輯起點。
為此,本書盡可能站在業務用戶的角度,延續“原理性思考”的底色,闡述如何從問題出發,從業務經驗出發,沿著特定的邏輯,掌握業務分析的完整體系和方法。每個人都能經過刻意練習掌握這些方法,之后再與本行業的業務經驗結合,成為高級業務分析師。
2.本書的闡述方法
本書的精彩,首先來自體系框架和闡述方式;其次才是工具帶來的想象力。
大學畢業及之后多年,筆者跟隨王思悅教授學習“發明創造與創新思維”差不多十年了。課程中有一個讓筆者銘記一生的例子:帶橡皮的鉛筆與羊角錘。王教授精彩地闡述了如何通過“同中之異”“異中之同”的角度創造性地總結多個事物背后的特征,從而讓筆者邁向創新之路。帶橡皮的鉛筆一端能寫、一端能擦,羊角錘一端能敲、一端可拔,功能相克,這是二者的“異中之同”。而二者又有顯著的差異,前者是“材料上的互克”,后者卻是“結構上的互克”,此為“同中之異”。這個例子筆者反復聽了很多年,每次都有新的收獲,如今終于可以換一種方式表達出來。
在本書中,筆者將用上述思考方法,總結多年業務分析和客戶服務經驗中的“同中之異”和“異中之同”,構建整本書的邏輯體系,比如:
? Excel 透視圖、SQL 聚合查詢、Tableau 拖曳分析之間的相同點是什么(問題的結構和聚合過程是相同的,見第2 章)?不同點又是什么(展現方式不同,即可視化基礎,見第3 章)?__
? 條形圖、折線圖、餅圖作為簡單圖形背后的相同點是什么(結果分析為主)?分布分析和相關性分析的相同點又是什么(特征分析為主)?從結果分析、特征分析再往前,就是二者結合的結構化分析。
? 簡單問題和復雜問題因何不同,又因何關聯在一起?如何用邏輯方法構建復雜問題和高級問題的結構?層次是問題分析的關鍵,多個層次的相關性就是結構化分析的關鍵。
以上是本書暗含的脈絡。經由“同中之異”“異中之同”的普適性原理與方法,幫助所有人快速進入可視化業務分析的廣闊天地,再根據問題的不同類型,闡述不同分支的前進之路。
這種構建方法的好處是能在案例之后直抵原理,幫助讀者舉一反三、觸類旁通,從而成為高級的業務分析師;而其缺點就是需要一定的理解能力,畢竟這也是筆者十年之功,歷經多個行業的點滴總結。
當然,在看似復雜的體系背后,筆者并沒有重新創造什么知識,無非是采納百家之長,然后組合創新的結果(就像克里斯坦森所言)。五音可以譜曲,五色創造絢爛,哪怕只有五種圖形,借助于原理性的理解和業務的表述方法,也可以深刻地展示數據背后的業務規律。
“圖片最偉大的價值在于它迫使我們注意到從未預見到的事物。”
——《探索性數據分析》,1998
在這個過程中,業務問題是指引,是方向,是北斗星。有一個“因指見月”的典故,教導我們不能執著于名相(“手指”)而忘記了修行的覺悟(“月亮”),就像匆忙得只記得賺錢而忘記了生活。業務分析何嘗不是如此?
3.本書的知識結構
本書從業務出發,從問題出發,穿插必要的分析知識和圖形概念,最后以高級分析結尾。其中重點解釋業務分析方法、可視化構建方法、主要的問題類型與擴展邏輯、業務中的結構化分析方法等,具體如下。
第1 篇,介紹業務分析的重要性,以及問題分析的方法與可視化分析基礎。
第1 章,通過一個小故事,介紹傳統企業普遍面臨的困境。
第 2 章,介紹數據分析如何成為連接數據資產到價值決策的橋梁。這個橋梁中有兩個關鍵詞:問題和圖形。問題決定圖形的類型與意義,圖形是問題的載體。基本可視化、交互探索可視化和結構化分析層層遞進,越來越靠近業務的本質。
第3 章,介紹問題分析的方法。介紹適用于所有行業、普遍場景的結構化問題思考方法、過程思考方法,并努力將一些技術領域的專業詞匯變成普及型的業務知識。
第4 章,介紹可視化分析的構建邏輯與通用方法。脫離具體的圖形,介紹可視化的構成、字段屬性、圖形的邏輯意義,以及適用于每種圖形的可視化繪制路徑和方向。
第2 篇,介紹可視化分析的常見圖形及其業務延伸形式。
第5 章,介紹本書“從問題到圖形的方法”的思考來源,以及主流的幾種可視化選擇路徑。第6 章∼第12 章,分別介紹排序與對比、時間序列、占比、文本表、分布分析、相關性分析、地理空間可視化共7 個主要的問題類型,以及每一類問題對應的基本圖形、復雜圖形和高級圖形樣式。
第3 篇,介紹從單一可視化分析走向高級分析的交互與結構化分析。
第13 章,介紹“樣本范圍”相關的控制要素,并重點介紹在“樣本范圍”中引用另一個層次的問題分析。以購物籃關聯分析為例,對比了篩選、集和計算3 種實現方法。
第14 章,本書最重要的升華,介紹了“結構化分析”的業務背景、問題類型、典型案例,以及與之相反的可視化方向。
第15 章,分享了如何成為一名優秀的業務分析師(商業分析師)的個人經驗和建議。
在各個章節中,穿插了業務分析的案例和思考方法,限于篇幅,不能完整介紹每一步的細節,需要讀者在“技藝”方面多加練習和探索。
卓越的思考一定是超越工具的,但最好的思考只有在最佳的工具中才能盡情綻放。本書配圖主要基于Tableau Desktop 完成,部分環節輔以Excel 與SQL 作為對比理解。
4.本書的長遠希望
“業務分析師”或“商業分析師”作為一個全新的職業,在互聯網、電商等行業中越來越重要;而每一個傳統行業,都值得用類似的思維重建對數據的理解和數據分析框架——正如很多人所說,“數字化時代,所有的行業都值得重做一遍”,不管是賣菜、水電公共事業,還是制造汽車、火箭,這是我們這一代人的幸運和機會。很多傳統公司在猶豫是否購買哪怕一套Tableau 時,它已經為此付費了(只是換一種方式,比如重復勞動、沉沒成本等)。
在這個快速變化的時代,很多人被守舊的思維和工具所困,所以“忙而無功”;很多IT 部門陷入“終日碌碌”,而業務部門依然覺得他們“無所作為”的困境——不是每個人不努力,只是他們在做不擅長的事情。筆者希望為樂意改變的個人和單位提供一條看得見的轉型之路。基于可視化分析的業務分析,是適用于任何企業的“數字化轉型”的窗口。__
數據是資產,已經是無可置疑的了,因為數據被稱為“21 世紀的石油”。
如果有人希望從IT 人員轉型為業務分析師(商業分析師),如果有人希望從業務人員成長為更優秀的業務經理(跨界的業務經理),那么筆者希望這本書能提供給他們一些捷徑,并減少筆者所經歷的苦痛和糾結。業務分析首先應該關注思維方法,其次才是工具實現。
不管你是否在用Tableau,本書都將提供超越軟件本身的靈感。借此,希望讀者能找到適合自己的成長之路。
畢竟,作為新時代的從業者,我們不僅僅是公司中的一員、家庭中的一員,更重要的是“自己的CEO”,正如德魯克所言:
“知識工作者必須成為自己的首席執行官……不僅要清楚自己的優點和缺點,也知道自己是怎樣學習新知識和與別人共事的,并且還明白自己的價值觀是什么、自己又能在哪些方面做出最大貢獻。
因為只有當所有的工作都從自己的長處著眼時,你才能真正做到卓爾不群。”
5.鳴謝
本書的構想最早源自紅塔集團玉溪卷煙廠高宇雷先生的提議,他建議筆者多分享一些“可視化的制作方法”;之后在給平安普惠的多次培訓中,本書脈絡逐步完善,并在2021 年春節期間集中完成。
2021 年4 月,為了驗證本書的邏輯框架,筆者又在上海組織了6 天的課程,完整、深入地分享
了本書的細節,并獲得了一些寶貴的改進線索。感謝參與的每一位朋友,以及來自上海杉達學院(提供了活動場地)、上海交通大學、華東師范大學、上海對外經貿大學等多位老師和學生的聆聽。
感謝多年來每一位客戶的支持和理解,作為一名“創業型知識分子”,客戶給了筆者最大的理解和支持,這是筆者成長的土壤,也是這本書創作的動力。特別感謝百勝中國唐小強先生為本書做出的貢獻,他是完整閱讀本書的首位讀者。
感謝Tableau,它讓筆者感受到了“文思泉涌”的激情和熱愛。2021 年有幸成為全球Tableau ZenMaster 的一員,讓筆者倍感榮幸。這本書也是筆者對這項榮譽的最好回饋。雖然本書在努力脫離工具闡述分析方法,但在Tableau 面前,筆者永遠要保持謙遜——筆者只是一具傳遞知識的“皮囊”,而Tableau 才是激活筆者力量、賦予筆者能量的寶劍。
感謝多位Tableau 大師,特別是Ken Flerlage、Andy Kriebel、Alexander Mou 、Jeffrey Shaffer 等多位Tableau Zen Master,讀者可以在Tableau Public 上領略他們的絕佳作品,本書多有引用。
感謝與筆者同時入圍Tableau Zen Master,同時還是中國首位Tableau Ambassador 的Wendy(汪士佳)女士;筆者誠邀Wendy 為本書設計封面,她的回饋遠超筆者的預期。不管是筆者所代表的理性之路,還是Wendy 所代表的藝術家之路,Tableau 都會是你最好的伙伴。
感謝電子工業出版社的石倩編輯,因緣際會合作至今,她是兩本書背后的默默功臣;每次圖書加印,她都耐心地讓筆者的書更加完美——不管是修改錯別字、升級插圖,還是協助筆者重寫某些章節。本書的未來也是如此,每一次加印,都是一次或大或小的升級,這也是我們對待知識的態度。
感謝家人,在筆者匆匆忙忙的人生路上,他們理解了筆者的一切。
感謝喜樂的人生;人生美好。
內容簡介:

對廣大的業務分析師而言,業務分析(或者稱為商業分析)應該從業務和問題出發,可視化是實現的方法,輔助決策是最終的目的。本書以業務分析為起點,介紹了“樣本范圍、問題描述和問題答案”的解析方法,以及聚合過程、連續與離散的字段分類,共同作為業務分析、可視化分析的理論基礎。本書借助敏捷BI工具Tableau,詳細介紹了7種基本問題類型(排序、時序、占比、文本、分布、相關性、地理)及其對應的基本圖形,并介紹了基于標記、坐標軸、參考線、計算的增強分析方法。本書的目的是讓讀者從“三圖一表”的結果分析,經由分布和相關性的特征分析,走向業務分析中的關鍵領域——多個問題的結構化分析。
目錄:

第1 篇 從業務和問題出發的可視化體系
第1 章 我的故事:業務分析需要可視化 2
1.1 生活/工作面前,我們都一樣 . 2
1.2 帶著問題啟程 6
第2 章 奠基:業務可視化分析的價值 . 7
2.1 古往今來,分析的終極目的是輔助決策 7
2.2 決策:獲得信息、做出判斷 10
2.3 簡單可視化:幫助領導更快地獲得信息 11
2.4 交互可視化:可視化是假設驗證的工具 14
2.5 高級可視化:分布、相關性分析與結構化分析 16
2.6 Tableau:敏捷BI 助力決策分析 18
第3 章 地平線:問題分析的方法與數據基礎 . 20
3.1 問題的結構化分析與“第一字段分類” 21
3.2 分析的動態過程:聚合是本質 23
3.2.1 Excel 數據透視表:拖曳即聚合 23
3.2.2 SQL 的聚合查詢:窗口式查詢 24
3.2.3 Tableau VizQL 可視化聚合查詢 . 26
3.3 行級別明細數據是聚合的起點,是分析的原料 27
3.3.1 數據表中包含的數據常識:數據類型與分類 . 27
3.3.2 理解數據表行級別的業務邏輯及其唯一性 . 34
3.3.3 聚合度是以數據表行級別為基準點的、衡量問題層次高低的尺度 . 37
3.4 直接聚合:基于行級別的直接聚合類型 40
3.4.1 描述規模:總和、平均值、計數 . 40
3.4.2 描述數據的波動程度:方差和標準差 . 41
3.4.3 關注個體、走向分布:百分位函數及最大值、最小值、中位數 . 44
3.5 從數據到問題的關鍵:“第三字段分類” 47
3.5.1 第三字段分類:行級別計算與聚合計算 . 47
3.5.2 理解聚合計算中的典型代表:“比值聚合” . 49
3.6 間接聚合:基于視圖聚合的二次聚合 50
3.6.1 “復雜問題”的兩個方向特征 . 50
3.6.2 基于直接聚合的二次聚合:大數據的OLAP 分析 51
3.7 從問題分析視角看數據分析的發展階段 57
3.7.1 小數據時代的多角度明細展示 . 57
3.7.2 數據統計時代的聚合匯總 57
3.7.3 大數據時代的結構化分析 58
第4 章 啟程:可視化構建方法與擴展路徑 60
4.1 從聚合到圖形:第二字段分類與圖形構成要素 60
4.1.1 可視化坐標空間:坐標系與坐標軸 . 62
4.1.2 “第二字段分類”與坐標軸. 63
4.1.3 可視化視覺模式與圖形類型. 70
4.1.4 可視化的意義描述 74
4.2 7 種主要的問題類型及其主要圖形 . 75
4.2.1 傳統三大圖及其局限性 76
4.2.2 文本表:側重度量指標的高密度展現 . 78
4.2.3 分布分析的三大典型圖形 78
4.2.4 相關性:散點圖與雙軸折線圖 . 82
4.2.5 地理位置可視化 83
4.3 從基本問題類型到復雜圖形的延伸方法綜述 85
4.3.1 從問題分析到圖形增強分析的完整路徑 . 85
4.3.2 基于行列的空間擴展:分區與矩陣 . 86
4.3.3 基于標記的增強分析:分層繪制方法 . 89
4.3.4 基于坐標軸的擴展:雙軸、同步與多軸的合并處理 . 96
4.3.5 基于參考線的擴展:增加視圖聚合的二次聚合 . 97
第2 篇 問題的7 種基本類型與可視化方法
第5 章 從問題到圖形的可視化邏輯 . 102
5.1 從問題到圖形的啟蒙與進化 102
5.1.1 《用圖表說話》中的三步走方法 . 102
5.1.2 “問題的字段解析方法”與基本問題類型 . 103
5.2 可視化圖形分類方法與可視化過程 105
5.2.1 FT 可視化詞典 . 105
5.2.2 Data Points 中的數據可視化過程 107
5.2.3 Abela 的“圖形推薦”邏輯 108
5.2.4 面向IT 的Echarts 分類與Tableau . 109
第6 章 排序與對比(部分與部分) . 111
6.1 基本條形圖與多個離散維度條形圖 111
6.1.1 并排條形圖(side-by-side bar):離散字段并排構成分區 . 112
6.1.2 條形圖矩陣:離散字段交叉構成矩陣 . 113
6.1.3 矩陣實例:日歷矩陣條形圖. 114
6.1.4 堆疊條形圖:你喜歡喝什么咖啡 . 116
6.1.5 比例條形圖:把堆疊條形圖轉化為占比分析 . 118
6.2 包含多個度量坐標軸的條形圖 119
6.2.1 字段重要性遞減的多種布局方式 . 119
6.2.2 考慮字段關系的雙軸布局方式 . 120
6.2.3 并排條形圖:多個絕對值度量字段的對比 . 122
6.2.4 重疊條形圖:多個絕對值度量字段的包含關系 . 124
6.3 字段類型和屬性對可視化的影響 125
6.3.1 字段類型和屬性對顏色的影響 . 125
6.3.2 “絕對值”與比值:字段屬性對標記選擇的影響 . 127
6.4 坐標軸的調整與組合 128
6.4.1 默認零點:除非必要,謹慎更改 . 129
6.4.2 坐標軸“倒序”:有些數據越大越差 . 129
6.4.3 絕對值刻度與百分位刻度 130
6.4.4 從“等距坐標軸”到“不等距坐標軸” . 131
6.4.5 棒棒糖圖:虛擬雙軸 132
6.5 以條形圖為底色的進階與高級圖形 133
6.5.1 靶心圖:在排序基礎上增加對比關系 . 133
6.5.2 “進度條”:展示單一對比關系的條形圖變種 . 135
6.5.3 結構化分析實例:條形圖的“高級化” . 138
第7 章 時間序列與序列相關性 140
7.1 時間序列的構成 140
7.2 折線圖的多種延伸形式 141
7.2.1 時間的層次與連續/離散屬性 . 141
7.2.2 并排折線圖和矩陣折線圖 143
7.2.4 多維度折線圖、堆疊面積圖、百分比堆疊面積圖 . 144
7.2.3 包含時序的柱狀圖與結構化分析 . 147
7.3 包含多個度量的時間序列 149
7.3.1 時間序列中的雙軸與柱狀圖. 149
7.3.2 雙軸的改變:柱狀圖與折線圖的結合 . 150
7.3.3 基于公共基準的多軸合并 151
7.4 時間序列與條形圖的結合:甘特圖及其變種 152
7.4.1 標準甘特圖:沿著連續日期延伸 . 152
7.4.2 股票蠟燭圖:兩個甘特圖的重疊 . 154
7.4.3 跨度圖:“偽裝的甘特圖樣式” . 155
7.4.4 階梯圖:以階梯方式表達“跨度” . 157
7.5 日期的高級轉化:絕對日期與相對日期 159
7.5.1 原理:何為絕對和相對時間軸 . 159
7.5.2 “公共基準”案例:產品在不同時間段的業績對比 . 160
7.5.3 “公共基準”案例:客戶復購分析 . 163
7.6 時序分析中度量的處理與高級圖形 166
7.6.1 聚合度量的累計匯總處理 166
7.6.2 絕對值與同比雙軸圖:同比或環比的比率 . 167
7.6.3 排序圖:絕對值轉化為相對排序 . 168
7.6.4 高級案例:地平線圖——借助高級計算處理度量 . 170
7.7 坡面圖:次序字段的前后變化 174
7.8 在趨勢中增加對比關系:雙折線增加陰影區 175
第8 章 占比(部分與總體占比) . 179
8.1 占比問題類型與餅圖 179
8.2 樹狀圖:占比與層次關系 181
8.3 初級:餅圖作為輔助圖形查看結構 184
8.4 中級:結合計算自定義分組及其占比 186
8.4.1 行級別分組:使用組和行級別計算自定義分組 . 186
8.4.2 特定層次的分組:使用集和高級計算動態分組 . 187
8.5 中級:使用多種方法展示類別的占比 189
8.5.1 方法一:使用“隱藏”功能分析單一類別占比 . 189
8.5.2 方法二:使用“行級別計算”分析單一類別占比 . 190
8.5.3 方法三:使用“篩選和高級計算”分析單一類別占比 . 191
8.6 高級圖形:環形圖、旭日圖、南丁格爾玫瑰圖 192
8.6.1 環形圖:最簡單的雙層次結構 . 192
8.6.2 旭日圖:雙層占比 193
8.6.3 南丁格爾玫瑰圖及個人建議. 194
第9 章 文本表及其延伸形式 196
9.1 文本表的關鍵場景:最高聚合與“總分結構” 196
9.2 交叉表的優勢與推薦場景 198
9.3 讓交叉表更實用:增加可視化修飾的方法 200
9.3.1 典型交叉表的樣式與說明 200
9.3.2 簡易法:基于度量名稱的顏色修飾 . 201
9.3.3 簡易法:基于單一度量的突出顯示表 . 203
9.3.4 高級法:基于坐標軸和標記的“文本自定義” . 204
9.3.5 高級法:使用自定義字段邏輯控制形狀或其他 . 208
9.4 讓簡單豐富起來:善用工具提示與儀表板互動 209
9.5 文字云與氣泡圖:不常使用和不推薦的圖形 211
9.6 總結:用好“三圖一表”,展開業務面紗 212
第10 章 大數據的關鍵:超越個體、走向分布 . 214
10.1 從個體分析到分布分析 214
10.2 直方圖:分布分析第一圖 215
10.2.1 簡單直方圖:使用數據桶(bin)在數據表行級別創建直方圖 216
10.2.2 高級直方圖:使用高級聚合計算和數據桶生成直方圖區間 . 217
10.2.3 基于RFM 模型的客戶分布分析 219
10.3 箱線圖:離散分布與異常發現 221
10.4 帕累托圖:特殊的頭部集中分布 222
10.4.1 橫軸百分位處理:將離散維度序列轉化為連續百分位坐標軸 . 224
10.4.2 縱軸累計百分比處理:連續度量的百分位轉化 . 224
10.4.3 空間分類處理:帕累托圖的顏色分類和互動篩選 . 225
10.5 自定義分布分析:參考線與參考分布模型 227
10.5.1 使用多條“百分比”參考線構建區間 . 228
10.5.2 自定義百分位分布區間 229
10.5.3 分位數分布區間 230
10.5.4 標準差分布與“質量控制圖”和“六西格瑪區間” . 230
第11 章 超越經驗,走向探索:廣義相關性分析 . 234
11.1 散點圖與參考分區:波士頓矩陣 234
11.2 中級:散點圖矩陣和“散點圖松散化” 237
11.3 高級:用皮爾遜系數生成相關值矩陣 241
11.4 層次關系:多個維度字段之間的結構關系. 244
11.5 次序字段的流向分析:漏斗圖和桑基圖 247
11.5.1 漏斗圖(上):基于次序字段的變化 . 247
11.5.2 漏斗圖(下):基于度量值的變化 . 250
11.5.3 桑基圖:多階段的流向變化(簡要) . 252
11.6 瀑布圖:多個數值的依賴關系 253
11.7 雷達圖:多角度的綜合關系 256
11.8 相關性或因果關系:基于空間的流行病學案例 . 259
第12 章 特殊的分布:地理空間分析 . 264
12.1 地理空間和地理圖層 264
12.2 點圖與熱力圖:地理空間分布 265
12.3 符號地圖與填充地圖 267
12.4 自定義地理空間與空間矩陣 270
12.4.1 為數據點增加緩沖區 270
12.4.2 自定義地理空間:“化學元素周期表” . 271
12.4.3 高級案例:使用表計算自定義空間矩陣 . 272
12.5 路徑地圖:兩種數據結構,兩種繪制方式 274
12.6 地理空間圖形的說明 275
第3 篇 超越:從可視化分析走向結構化洞察
第13 章 樣本控制與假設驗證:交互 . 279
13.1 在Excel、SQL、Tableau 中構建分析樣本 . 279
13.1.1 Excel 與SQL 中的靜態篩選 . 279
13.1.2 在Tableau 中創建篩選的基本方法 281
13.2 樣本控制的形式與歸類 282
13.2.1 快速篩選器的常見形式與優先級 . 282
13.2.2 關聯篩選器和共用篩選器 285
13.3 基于中間變量的高級樣本控制 286
13.4 樣本控制的高級形式:指定層次的條件篩選 289
13.4.1 指定層次條件篩選的3 種方式 . 289
13.4.2 購物籃關聯分析的樣本解讀——量化篩選條件 . 290
13.5 性能:邏輯計算位置對篩選的影響 293
13.5.1 篩選的本質與篩選的標準位置 . 293
13.5.2 在聚合過程中間接篩選的“非標準操作”及其代價 . 295
13.5.3 不同篩選方法的高級分類與適用場景 . 296
第14 章 從表象到本質:結構化分析是業務可視化分析的靈魂 . 299
14.1 結構化分析是通往業務探索的必由之路 299
14.1.1 結構化分析是業務復雜性的要求 . 300
14.1.2 結構化分析的基本形式 301
14.2 可視化分析中常見的層次及其組合關系 303
14.2.1 行級別層次、問題層次及聚合度 . 303
14.2.2 結構化分析的基本類型 305
14.3 結構化分析的幾種典型場景和案例 305
14.3.1 交易的利潤結構分析:主視圖引入行級別層次的聚合 . 305
14.3.2 客戶的利潤結構分析:主視圖引入更低層次的聚合 . 307
14.3.3 客戶矩陣分析:當前視圖層次引入獨立層次的聚合 . 309
14.3.4 環形圖:當前視圖層次引入更高聚合度層次的聚合 . 310
14.4 結構化分析的高級形式:嵌套LOD 的多遍聚合 313
14.4.1 客戶購買力:使用嵌套LOD 完成多遍聚合 . 313
14.5 通用的層次分析方法 316
14.5.1 結構化分析與“問題結構” . 316
14.5.2 層次分析的4 個步驟 317
14.6 和結構化分析相反的“努力”方法 318
14.6.1 “形式大于內容”的圖形 318
14.6.2 缺乏代表性和意義的指標 321
14.6.3 缺乏互動性的圖表 321
14.6.4 不符合直覺的設計 322
第15 章 歸來:成為優秀的業務分析師的個人建議 . 323
15.1 好奇、探索和持續學習的欲望,是前進的源泉 323
15.2 學習理解原理,方能舉一反三、事半功倍 324
15.3 深入理解業務,方能立于不敗之地 325
15.4 分析要從明細開始,過度整理會遠離真相 326
15.6 循序漸進,不要好高騖遠 328
后記&參考資料 . 330
序: