-- 會員 / 註冊 --  
 帳號:
 密碼:
  | 註冊 | 忘記密碼
3/26 新書到! 3/19 新書到! 3/14 新書到! 12/12 新書到!
購書流程Q & A站務留言版客服信箱
3ds MaxMayaRhinoAfter EffectsSketchUpZBrushPainterUnity
PhotoShopAutoCadMasterCamSolidWorksCreoUGRevitNuke
C#CC++Java遊戲程式Linux嵌入式PLCFPGAMatlab
駭客資料庫搜索引擎影像處理FluentVR+ARANSYS深度學習
單晶片AVROpenGLArduinoRaspberry Pi電路設計CadenceProtel
HadoopPythonStm32CortexLabview手機程式AndroidiPhone
可查書名,作者,ISBN,3dwoo書號
詳細書籍分類

可視化分析與SAS實現

( 簡體 字)
作者:朱繼輝 劉政 竇運濤 邱威 著類別:1. -> 程式設計 -> Tableau
譯者:
出版社:機械工業出版社可視化分析與SAS實現 3dWoo書號: 49475
詢問書籍請說出此書號!

缺書
NT售價: 345

出版日:7/1/2018
頁數:230
光碟數:0
站長推薦:
印刷:黑白印刷語系: ( 簡體 版 )
加入購物車 加到我的最愛
(請先登入會員)
ISBN:9787111604075
作者序 | 譯者序 | 前言 | 內容簡介 | 目錄 | 
(簡體書上所述之下載連結耗時費功, 恕不適用在台灣, 若讀者需要請自行嘗試, 恕不保證)
作者序:

譯者序:

前言:

比利時的佛蘭芒族地理學家和地圖學家亞伯拉罕·奧特柳斯,在研究了一個世紀以來環球旅行探險家們撰寫的資料后,于1570年在比利時的安特衛普繪制了世界上第一張現代地圖集《世界概貌》,即把各種地理上的復雜數據通過圖示的方法展示給人們。26年后,奧特柳斯提出了“大陸漂移學說”的設想。后來,我們還可以在地圖上顯示人口分布數據,世界宗教分布,世界人民喜歡什么運動的分布,到今天的網民的分布,各國人民喜愛的網站分布,各種調研統計的數據分布,等等。

1812年夏,俄法戰爭爆發,拿破侖開始進攻俄國,在戰爭中遭受了災難性損失,1813年以失敗告終。法國工程師Charles Joseph Minard于1869年11月20日,在巴黎創作完成了一張在信息圖界有里程碑地位的“拿破侖1812—1813年俄國大進軍的人員損失圖”。信息圖以真實地圖為背景,起于波蘭–俄國邊境,止于莫斯科。他在圖中使用了6個變量的數據:拿破侖軍隊的數量、行軍路線、氣溫、地理位置、行軍到特定地點的時間和距離。線條寬度代表拿破侖的軍隊人數,黃色表示進攻路線,黑色表示撤退的路線。開始東征時有約42萬大軍,到達莫斯科時剩余約10萬人,最終返回約1萬多人。圖中下面部分的溫度折線圖描繪了撤退途中的溫度變化,最低溫度達到-37.5攝氏度。 對比軍隊規模在撤退途中的階梯狀銳減的轉折點與對應的溫度變化,排除了當地發生過戰役事件后,我們可以直觀地推斷出撤退時導致士兵死亡的最大原因是氣溫。

這兩張圖是數據可視化的經典案例。通過一張圖,就把無數的數據匯集在一起,將數據之間的各種聯系直觀地展示出來,從而揭示出了很多內在的含義。想象一下在當時的環境下,完全用手工的方式把如此多的代表不同維度的數據按照一定的構思匯集在一起,是何等煩瑣、艱難、耗時。

20世紀60年代人類就實現了用計算機來做統計分析運算,但是到了80年代才實現了計算機的圖形化顯示、可視化的數據展示。這也僅僅是在數字列表的基礎上增加了顯示簡單圖形的功能。到了21世紀,計算機技術和互聯網技術獲得了長足的發展,各種應用也越趨廣泛,特別是電子商務、社交媒體、移動應用和ERP的廣泛應用,極大地促進了數據的增長,而且數據的種類繁多,非結構化的數據占主要分量,由此對數據分析的能力提出了前所未有的挑戰。為了應對這些挑戰,人們發明了存儲這些數據的平臺Hadoop, 處理大量數據的高性能分析技術,開發了新的模型和算法處理非結構化數據,用新的計算機圖形學技術與模型來展示它們各種內在的關系。我們可以看到,今天我們對統計分析軟件的要求與過去已經有了很大的區別。那么這些區別包括哪些內容呢?

傳統的統計分析軟件主要是分析結構化的數據,這些數據都是存儲在關系數據庫、純文本、Excel等文件中。今天數據種類以非結構化的數據偏多,而且過去的關系數據庫已經無法存儲這些數據,無論是存儲數據量上,還是數據種類上都無法滿足要求。Hadoop既支持分布式存儲,又支持非結構化數據存儲。因此,我們新的統計分析軟件不但要支持傳統的數據存儲軟件,也要支持Hadoop。

過去要分析的數據量相對來說都比較小,計算時間基本上是可以接受的(即使需要花費幾個小時)。但是,今天的數據量有時候幾天都不一定能計算出結果來。這就要求我們在計算技術上有新的突破。SAS使用了網格分布式計算技術,把計算步驟和數據都分成塊,用不同的計算器件,不同的CPU多線程地進行計算,然后把結果合起來;用庫內分析技術,把對數據的分析計算放到數據庫內來進行,減少了對數據的提取和傳輸過程;用內存分析技術,把由硬盤讀取和存放數據的過程改到了由內存讀取和存放數據。這三項技術中的任何一項都可以極大地提高數據分析速度,三項技術合而為一,可以獲得震撼性的效果,使得實時分析成為可能。過去的數據量小,很容易查看,了解數據屬性。要查看今天的數據就要困難許多,我們將這一過程稱為數據探索。探索的過程,不僅僅是翻看數據,還要試探性地做一些分析結果的展示,整個的探索過程要流暢,不能有明顯的延遲。現在的高性能分析技術完全可以做到。

傳統統計分析展示的圖表通常都是餅圖、直方圖、折線圖、散點圖、柱狀圖、箱式圖、儀表盤等。雖然這些圖表也是人們經常會用到的圖示,但是如今已經遠遠不夠了。今天的可視化技術還可以展示流程圖、衍生分支圖、氣泡圖、矩形樹圖、面積圖、樹狀圖、各種地圖、詞云、瀑布圖、漏斗圖、網絡結構圖等種類繁多的圖形,以滿足不同的展示和分析需求。

SAS作為統計分析軟件的領導者,早在2012年就發布了可視化分析軟件“Visual Analytics”,簡稱VA。2016年,SAS又推出了Viya,新一代的云上數據分析平臺,而VA成為所有在Viya上運行的行業解決方案的模板。VA是基于高性能分析技術的,支持Hadoop,其可視化功能涵蓋了整個數據分析的全生命周期,并且簡單、易用,給用戶帶來全新的數據分析體驗。VA還提供了21種可視化視圖和分析方法,支持對結構化、半結構化和非結構化數據的可視化分析,支持多用戶的信息共享和移動技術。SAS在高級分析領域占有絕對的領先地位,因此,VA不僅支持普通商務智能級別的分析,還支持高級分析,就是支持全級別的數據分析,這也是SAS可視化分析產品與其他廠家不一樣的地方。

本書比較全面地介紹了可視化分析的基本概念、技術組成和產品的架構。通過本書的學習,讀者除了可以了解可視化的知識以外,還可以學習可視化分析的基本方法。本書特別適合于那些希望通過簡潔、快速的方法就能夠進行數據管理,進行數據探索;無須寫代碼就能進行數學建模;設計各種實用報表方便決策的數據分析人員和相應的管理人員。對于進入數據分析的初級人員,本書也是一本不錯的指南。

本書共8章。前兩章主要介紹可視化分析的基本概念和技術。第3∼6章涉及整個數據分析的生命周期。第3章介紹數據管理;第4章介紹了報表的制作;第5章介紹商務智能分析;第6章介紹統計分析和數據建模。最后兩章是可視化的基本應用。第7章介紹可視化反欺詐方面的內容;第8章介紹可視化的企業級部署。

本書的完成,來自于整個創作團隊的辛勤耕作。大家利用自己的休息時間,一遍一遍地查閱資料,構思內容,完成配圖,才使得本書得以和各位讀者見面。在這里我要衷心地感謝大家的付出和各位家庭的支持。感謝那些以各種方式為本書的完成提供了幫助的同事和朋友。

SAS公司在過去的40多年里,為行業貢獻了各種里程碑式的產品,包括我們在書中要給大家介紹的可視化分析產品。在這里我們要感謝SAS公司開發的優秀產品,感謝公司提供的工作學習環境和各種資料,以及對出版本書的支持。

最后,要特別感謝機械工業出版社華章公司的編輯們。感謝他們對于本書出版的指導和幫助。



劉政  

2018年5月于北京
內容簡介:

在計算機誕生之前,數據的可視化行為就已經應用在各個領域中,如等高線圖、磁力線圖、天像圖等。如今的大數據時代,面對錯綜復雜、形式多樣、規模龐大的數據,如何利用計算機的強大運算能力快速提取商業信息?如何將統計分析和預測建模的方法應用在數據挖掘中?如何使用立體的、動態的、實時的、交互的等多種方式來展現復雜的科學模型?這些成了眾多數據分析師希望了解和掌握的內容。SAS作為全球頂級數據分析的領導者,融合多個領域的專業人士協同工作,開發了強有力的大數據可視化產品,幫助企業深入挖掘大數據中的商業價值。本書通過介紹SAS可視化分析家族產品的商業應用來探討其中的答案。同時,本書還會通過案例闡述SAS的可視化分析技術,以及商業實施中的部署和應用。

本書的主要內容和特色:

? 理論與豐富多彩的實例相結合。本書從可視化分析的概念講起,從理論和實踐兩方面介紹了可視化分析每一個層次是如何實現的,并且都配合實際案例介紹SAS可視化分析的實踐。書中各章節內容都相對獨立,從業人員和相關讀者可以根據自身需要,通讀或精度某一部分。

? 內容新穎。本書提出的可視化分析不同于其他側重于報表分析和數據查詢的可視化分析。本書重點在于講述如何進行分析,并且首次介紹了SAS可視化分析解決方案的實際應用和實施架構,使讀者不僅對可視化分析的概念有了全面清晰的認知,并且充分了解SAS可視化分析在實際項目中的實踐。

? 可讀性好。本書能讓讀者在較短時間內系統掌握SAS可視化分析軟件的基本知識,以及如何利用SAS的可視化分析軟件進行商業實施。通過對本書的學習,讀者可以獨立地在SAS的相關領域進行深入研究和提高。

? 實用性強。本書總結和歸納了多年商業實施中的經驗,以實際案例幫助讀者掌握各種工具、面板和操作的使用方法,應對實際工作需要,快速學以致用。
目錄:

前言
第1章 可視化分析概論 1
1.1 可視化分析的意義 1
1.2 數據可視化分析興起的背景 3
1.3 數據分析的可視化與分析的不同層次 4
1.3.1 數據獲取與數據轉換 4
1.3.2 高級分析與模型開發 5
1.3.3 分析結果展現與模型應用 5
1.4 可視化分析面臨的挑戰與應對 6
1.4.1 可視化分析面臨的挑戰 6
1.4.2 SAS的可視化分析實現 7
1.5 本章小結 9
第2章 SAS可視化分析技術概述 10
2.1 SAS數據可視化分析的平臺基礎 10
2.2 SAS可視化分析家族成員、主要功能和相互聯系 11
2.2.1 SAS可視化分析 12
2.2.2 SAS 可視化統計 13
2.2.3 SAS 可視化調查 14
2.2.4 SAS可視化數據挖掘和機器學習 15
2.2.5 相互聯系 16
2.3 SAS可視化分析功能概述 17
2.3.1 數據導入 17
2.3.2 數據處理 18
2.3.3 數據分析 18
2.3.4 基于Web的報表設計 22
2.4 SAS數據可視化分析的展望 24
2.5 本書內容概述 24
2.6 本章小結 24
第3章 SAS Visual Analytics的數據訪問和準備 25
3.1 認識數據源 26
3.1.1 單一文件類型 26
3.1.2 數據庫和大數據存儲 27
3.2 使用Administrator管理LASR服務器 27
3.2.1 創建LASR服務器 29
3.2.2 創建并配置HDFS目錄 32
3.2.3 啟動LASR服務器 33
3.2.4 加載單一SAS數據集 34
3.2.5 加載HDFS數據 35
3.2.6 高級數據管理 38
3.3 準備數據的最佳實踐 39
3.4 如何使用Visual Data Builder準備數據 42
3.4.1 使用Visual Data Builder的場景 42
3.4.2 導入數據 43
3.4.3 表查詢和表連接 46
3.4.4 導入Information Map查詢 50
3.4.5 追加表 52
3.4.6 創建LASR星型表 53
3.5 本章小結 56
第4章 標準報表與定制化報表分析 57
4.1 SAS Visual Analytics Designer和Visual Analytics Graph Builder介紹 57
4.1.1 SAS Visual Analytics Designer 57
4.1.2 SAS Visual Analytics Graph Builder 57
4.2 創建標準報表 58
4.2.1 使用各類報表對象 58
4.2.2 在SAS Visual Analytics Designer中處理和分析數據 58
4.2.3 報表過濾,報表交互,報表鏈接 62
4.2.4 使用報表中的參數 68
4.3 創建定制化報表 71
4.4 共享報表 72
4.5 本章小結 74
第5章 鉆取查詢與儀表盤 75
5.1 創建鉆取查詢報表 76
5.1.1 創建層次,生成鉆取查詢報表 76
5.1.2 編輯層次,更新鉆取查詢報表 80
5.1.3 創建時間層次,生成鉆取查詢報表 82
5.1.4 從可視化圖形中創建層次 82
5.2 創建儀表盤 83
5.3 本章小結 84
第6章 可視化統計分析與預測模型 85
6.1 SAS Visual Statistics介紹 85
6.2 SAS Visual Statistics用戶界面以及架構 86
6.3 探索性數據分析 87
6.3.1 探索性數據分析簡介 87
6.3.2 SAS Visual Statistics實現探索性數據分析 88
6.4 線性回歸模型 90
6.4.1 線性回歸模型簡介 91
6.4.2 SAS Visual Statistics線性回歸可視化分析 92
6.4.3 SAS Visual Statistics線性回歸模型舉例 95
6.5 邏輯回歸 101
6.5.1 邏輯回歸模型簡介 101
6.5.2 SAS Visual Statistics邏輯回歸可視化分析 103
6.5.3 SAS Visual Statistics邏輯回歸模型舉例 104
6.6 廣義線性模型 107
6.6.1 廣義線性模型簡介 107
6.6.2 SAS Visual Statistics廣義線性模型可視化分析 107
6.6.3 SAS Visual Statistics廣義線性模型舉例 108
6.7 決策樹 110
6.7.1 決策樹模型簡介 110
6.7.2 SAS Visual Statistics決策樹可視化分析 112
6.7.3 SAS Visual Statistics決策樹模型舉例 113
6.8 聚類 116
6.8.1 聚類分析簡介 116
6.8.2 SAS Visual Statistics聚類可視化分析 117
6.8.3 SAS Visual Statistics聚類分析舉例 117
6.9 模型比較和模型評分 120
6.9.1 模型比較 120
6.9.2 模型比較可視化界面 120
6.9.3 模型評分 122
6.10 本章小結 123
第7章 可視化調查 124
7.1 SAS Visual Investigator介紹 124
7.2 SAS Visual Investigator的主要功能和系統架構 125
7.3 SAS Visual Investigator在預防違規或犯罪領域的應用 126
7.3.1 從警報管理中發現高風險活動 127
7.3.2 通過實體分析發現風險活動的誘因 129
7.4 SAS Visual Investigator在金融欺詐及反洗錢領域的應用 136
7.4.1 生成警報信息 137
7.4.2 在警報控制臺中發現風險 140
7.4.3 搜索實體并進行初步調查 141
7.4.4 在工作區中進行詳盡調查 142
7.4.5 使用時間滑塊進行深度挖掘 147
7.5 SAS Visual Investigator在法律、政府和社會管理方面的應用 151
7.5.1 基于匯總報告評估風險 152
7.5.2 持續的個案監控 155
7.6 本章小結 159
第8章 SAS可視化分析技術的企業級部署和應用 160
8.1 企業級部署 160
8.1.1 架構設計 161
8.1.2 大規模并行處理部署要點 175
8.1.3 后配置、驗證、調優 186
8.2 企業級應用的管理和安全 199
8.2.1 管理概述 199
8.2.2 操作計算服務器 215
8.2.3 環境監控 218
8.2.4 安全 224
8.3 本章小結 236
序: