|
-- 會員 / 註冊 --
|
|
|
|
精通Tableau 2019 ( 簡體 字) |
作者:[美]德米特里·阿諾辛 等著 劉洋 譯 | 類別:1. -> 程式設計 -> Tableau |
譯者: |
出版社:清華大學出版社 | 3dWoo書號: 52109 詢問書籍請說出此書號!【缺書】 NT售價: 745 元 |
出版日:11/1/2019 |
頁數:448 |
光碟數:0 |
|
站長推薦: |
印刷:黑白印刷 | 語系: ( 簡體 版 ) |
|
加入購物車 │加到我的最愛 (請先登入會員) |
ISBN:9787302540762 |
作者序 | 譯者序 | 前言 | 內容簡介 | 目錄 | 序 |
(簡體書上所述之下載連結耗時費功, 恕不適用在台灣, 若讀者需要請自行嘗試, 恕不保證) |
作者序: |
譯者序: |
前言:Tableau是近期頗為流行的商業智能(BI)解決方案,并以其強大的交互式數據可視化而著稱。本書涵蓋了業界專家提供的有效案例,以幫助讀者學習Tableau 2019.x,并掌握其中的各項技能。 本書包含了豐富的內容,如Tableau數據提取、Tableau Desktop高級計算、創建儀表板、數據處理技術、敘述故事、高級過濾機制、可視化技術以及基于真實案例的預測分析等。 本書將從Tableau的基本功能講起,一直講到Linux上的復雜操作。此外,讀者還將通過R語言、Python語言和各種API了解Tableau的高級特性。其間,任務的復雜性將會逐漸增加,讀者將通過豐富的案例掌握這些高級功能。同時,本書還介紹了用于優化BI任務的故障排除技術。 此外,讀者還將學習利用最新的Tableau Prep為數據分析過程準備數據。在閱讀完本書后,讀者可通過Tableau的各種特性來處理BI任務。 適用讀者 本書面向數據分析人員、數據可視化和BI用戶,并向他們提供基于Tableau的快速解決方案。 本書內容 第1章主要介紹了Tableau的基礎知識,讀者將熟悉Tableau的界面和基本任務,如創建簡單的圖、表和過濾機制,并理解Tableau語義層面的內容。所有這一切都將在市場調查所搜集的真實數據的基礎上進行。 第2章將通過人口普查數據講解Tableau中數據的操控方式,包括添加數據源、連接數據源以及二者間的混合操作。另外,本章還將介紹如何使用Tableau Pivot功能,并設置工作簿的語義層以滿足任務的要求,其中包括度量和維度間的轉換、連續和離散以及別名編輯等。 第3章討論如何利用提取提升Tableau儀表板的性能。其中涉及不同的Tableau文件格式類型和提取類型。相應地,本章引入了Tableau的最新內存數據引擎技術,該技術于2017年10月發布且速度驚人。此處將通過詳細的步驟講解如何利用Hyper劃分數據集,從而提高分析速度,并通過聚合提取、減少維度、提取過濾器、增加提取刷新和交叉數據連接優化Tableau儀表板的性能。 第4章討論Tableau Desktop的其他各項功能,如表計算、計算字段、參數、集合、分組和細節級別表達式,并通過豐富的案例幫助讀者掌握Tableau Desktop的各種操作技能,從簡單的表計算到相對高級的細節級別表達式,從而提升Tableau開發人員的技術水平。本章將使用真實的市場數據以及與人口數據相關的地理空間用例。 第5章將講解過濾器,并在第1章的基礎上進行擴展。其間將使用源自食品包裝工業的數據,其中將涉及數據過濾器、度量過濾器、前N項過濾器、表計算過濾器以及動作過濾器。另外,本章還將討論如何管理多個過濾器間的關系。 第6章主要講解儀表板設計技術。本章將引入儀表板這一概念并討論儀表板的設計過程。通過與互聯網應用相關的真實數據,將創建一個基本的儀表板,其中添加了自定義格式和某些高級功能。除此之外,讀者還將了解可視化的角色以及正確的布局設計的重要性,進而使用Tableau創建美觀的儀表板。最后,本章還將構建一個自服務儀表板。 第7章將探討利用數據講述故事,其中將使用來自汽車工業的真實業務數據,學習如何使用Tableau的相關功能,以一種吸引人的、用戶可訪問的方式講述故事,同時保證傳達信息的準確性。 第8章將利用Tableau Desktop創建高級可視化結果。本章不僅限于Tableau中的Show Me特性,還將深入討論高級可視化技術,以使儀表板故事更加出眾。針對各種可視化效果,本章將通過多個案例和推薦的最佳實踐方案對其加以創建。相關案例包括識別具有重要影響的數據元素;針對不同分類創建一段時間內的排名,并通過可視化方式跟蹤機構的實現目標;比較多個度量間的性能。針對每種可視化效果,本章將采用多個不同的數據集,如美國足球聯盟數據集、醫院客戶滿意度數據集、美國各州大學排名數據集、股票價格數據集、二氧化碳排放量數據集、Y18 PMMR支出和預算數據集,等等。 第9章將在第8章的基礎上討論多個案例,包括比較89%∼90%范圍內包含較高數值的類別、確定流中的主要因素、創建部分與整體間的關系、從視覺上消除Alaska Effect。本章將針對各種可視化效果采用不同的數據集,涉及足球聯盟數據、維基百科點擊流數據、ITA市場調研數據、零售銷售市場利潤和成本數據,以及美國各州人口分布數據。 第10章將考查可視化數據的重要性—無論它的大小、種類和速度怎樣。大數據的可視化方案十分重要,數據的存儲、準備和查詢成本均較為高昂。對此,組織機構需要利用結構化良好的數據源以及最佳實踐方案直接對大數據進行查詢。本章將著手解決大數據可視化面臨的挑戰,其間將使用到Hadoop、S3、Athena和Redshift Spectrum,并探討如何針對大數據部署Tableau。 第11章將使用源自健康調查活動中的真實數據,針對預測機制和R數據包的集成討論Tableau的內建功能。讀者將學習在簡單和復雜數據集上執行回歸分析,并對統計測試結果予以正確的解釋。此外,本章還將介紹如何實現時序模型。在本章結尾,讀者將考查基于機器學習的回歸示例。 第12章闡述了基于Tableau的高級數據分析并與R語言實現集成。通過來自電信、汽車、銀行和快速消費品行業的真實數據,讀者將學習如何發現數據的底層結構、判斷市場趨勢、對相似案例進行分類,以及如何在較大的數據集上推斷結果。此外,本章還介紹了如何識別和解釋數據中不尋常的情形。 第13章將討論Tableau Server及其功能,其中涉及Windows和Linux環境下的Tableau Server的部署和下載。另外,讀者還將學習如何創建、監視和調度Tableau Server備份。隨后,本章討論了服務器應用過程中的監測機制,以及基于Tabcmd和Tabadmin的Tableau Server自動化機制。整體而言,本章旨在在Tableau Server上實現自動更新,發布Tableau儀表板,并針對受限訪問打造適宜的安全措施。 第14章討論Tableau Desktop和Tableau Server的故障診斷機制,并對遇到的問題提供相應的處理步驟,其中包括性能診斷、技術診斷和日志。 第15章介紹了Tableau的新產品Tableau Prep,該產品旨在快速地對數據進行整合,并構建和清理相關的分析數據。 第16章介紹了Tableau Server和現代ETL工具Matillion間的集成。讀者將學習如何針對Linux環境安裝ETL工具,并構建ETL管線和Tableau Server活動間的集成方案,如刷新提取和導出PDF。該方案適用于任何ETL工具。 背景知識 在軟件方面,讀者需要下載Tableau 2019.x。同時,讀者還應理解與BI和Tableau相關的一些基本概念。
|
內容簡介:本書詳細闡述了與Tableau 2019.x相關的基本解決方案,主要包括Tableau數據操控、Tableau數據提取、Tableau Desktop高級計算、Tableau桌面高級過濾機制、創建儀表板、利用Tableau講述故事、Tableau可視化、Tableau高級可視化、Tableau大數據應用、Tableau預測分析、Tableau高級預測分析、部署Tableau Server、Tableau故障診斷、利用Tableau Prep分析數據、基于Tableau的ETL最佳實踐方案等內容。此外,本書還提供了相應的示例、代碼,以幫助讀者進一步理解相關方案的實現過程。 本書適合作為高等院校計算機及相關專業的教材和教學參考書,也可作為相關開發人員的自學教材和參考手冊。 |
目錄:第1章開啟Tableau之旅1 1.1技術需求1 1.2Tableau簡介1 1.3連接數據2 1.4利用ShowMe構建條形圖4 1.5構建文本表8 1.6添加過濾器10 1.7添加顏色13 1.8構建樹形圖18 1.9構建一幅地圖20 1.10構建雙軸地圖23 1.11自定義工具提示信息28 第2章Tableau數據操控33 2.1技術需求33 2.2簡介34 2.3連接數據源34 2.4添加二級數據源39 2.5數據混合44 2.6數據合并48 2.7使用TableauPivot50 2.8準備數據54 第3章Tableau數據提取61 3.1簡介61 3.2Tableau中的各種文件格式61 3.3創建數據源提取64 3.4配置增量提取68 3.5升級至Hyper71 3.6利用跨數據庫連接創建提取73 3.7利用TableauServer診斷提取75 第4章TableauDesktop高級計算77 4.1技術需求77 4.2簡介78 4.3創建計算后的字段78 4.4實現快速表計算82 4.5創建并使用分組85 4.6創建并使用集合89 4.7生成并使用參數93 4.8實現細節級別表達式98 4.9使用自定義地理編碼100 4.10使用多邊形進行分析104 第5章Tableau桌面高級過濾機制107 5.1技術需求107 5.2簡介107 5.3實現前N項過濾器108 5.4向上下文中添加過濾器111 5.5創建度量過濾器113 5.6創建日期范圍過濾器116 5.7創建相對日期過濾器119 5.8實現表計算過濾器122 5.9實現動作過濾器127 第6章創建儀表板133 6.1技術需求133 6.2簡介133 6.3創建儀表板134 6.4格式化儀表板138 6.5設置過濾器142 6.6設置跨多個數據源的過濾器148 6.7添加高亮動作152 6.8設置布局156 6.9構建自服務儀表板160 第7章利用Tableau講述故事169 7.1技術需求169 7.2簡介169 7.3編寫一個Tableau故事169 7.4設置Story的敘事內容174 7.5選擇正確的圖表184 7.6編寫有效的標題186 7.7推薦和執行摘要187 7.8格式化Story190 第8章Tableau可視化197 8.1技術需求197 8.2簡介197 8.3雙軸瀑布圖197 8.4Pareto圖203 8.5Bump圖211 8.6Sparklines圖217 8.7Donut圖226 8.8Motion圖232 第9章Tableau高級可視化237 9.1技術需求237 9.2簡介237 9.3Lollipop圖237 9.4Sankey圖241 9.5Marimekko圖260 9.6Hex-Tile圖269 9.7Waffle圖273 第10章Tableau大數據應用283 10.1技術需求283 10.2簡介284 10.3連接至AmazonRedshift284 10.4發布AmazonRedshift集群286 10.5連接Redshift集群288 10.6向Redshift集群中加載樣本數據290 10.7利用Tableau連接Redshift291 10.8生成Tableau報告293 10.9調試Redshift以提升Tableau性能295 10.10連接至AmazonRedshiftSpectrum298 10.11連接至Snowflake301 10.12使用SnowSQLCLI302 10.13將Tableau連接至Snowflake304 10.14連接大數據305 10.15訪問半結構化數據307 10.16連接AmazonElasticMapReduce和ApacheHive310 10.17創建樣本數據312 10.18連接Tableau和ApacheHive314 第11章Tableau預測分析317 11.1技術需求317 11.2簡介317 11.3基本預測和統計推斷318 11.4預測包含異常值的數據集322 11.5在Tableau中使用R語言327 11.6基于多元回歸的預測332 11.7基于隨機森林的回歸334 11.8時序預測339 第12章Tableau高級預測分析345 12.1技術需求345 12.2簡介346 12.3執行細分分析346 12.4發現數據集的潛在結構351 12.5從離散變量中提取數據結構358 12.6基于樹形方法的數據挖掘361 12.7識別數據中的異常現象366 第13章部署TableauServer371 13.1技術需求371 13.2簡介371 13.3在Windows環境下部署TableauServer372 13.4部署至TableauServer388 13.5利用AWS在Linux環境中部署TableauServer394 13.6Tabcmd401 第14章Tableau故障診斷405 14.1技術需求405 14.2簡介405 14.3性能記錄機制405 14.4性能診斷和最佳實踐方案410 14.5基于日志的故障診斷415 第15章利用TableauPrep分析數據421 15.1簡介421 15.2技術需求421 15.3安裝TableauPrep422 15.4利用TableauPrep構建第一個流424 15.5與大數據協同工作432 第16章基于Tableau的ETL最佳實踐方案441 16.1簡介441 16.2技術需求443 16.3MatillionETL入門443 16.4在Linux上發布Tabcmd444 16.5創建Matillion共享作業446
|
序: |
|