-- 會員 / 註冊 --  
 帳號:
 密碼:
  | 註冊 | 忘記密碼
3/26 新書到! 3/19 新書到! 3/14 新書到! 12/12 新書到!
購書流程Q & A站務留言版客服信箱
3ds MaxMayaRhinoAfter EffectsSketchUpZBrushPainterUnity
PhotoShopAutoCadMasterCamSolidWorksCreoUGRevitNuke
C#CC++Java遊戲程式Linux嵌入式PLCFPGAMatlab
駭客資料庫搜索引擎影像處理FluentVR+ARANSYS深度學習
單晶片AVROpenGLArduinoRaspberry Pi電路設計CadenceProtel
HadoopPythonStm32CortexLabview手機程式AndroidiPhone
可查書名,作者,ISBN,3dwoo書號
詳細書籍分類

基于Apache Kylin構建大數據分析平臺

( 簡體 字)
作者:蔣守壯類別:1. -> 程式設計 -> 綜合
譯者:
出版社:清華大學出版社基于Apache Kylin構建大數據分析平臺 3dWoo書號: 45988
詢問書籍請說出此書號!

缺書
NT售價: 345

出版日:1/1/2017
頁數:260
光碟數:0
站長推薦:
印刷:黑白印刷語系: ( 簡體 版 )
加入購物車 加到我的最愛
(請先登入會員)
ISBN:9787302454526
作者序 | 譯者序 | 前言 | 內容簡介 | 目錄 | 
(簡體書上所述之下載連結耗時費功, 恕不適用在台灣, 若讀者需要請自行嘗試, 恕不保證)
作者序:

譯者序:

前言:

自2011年下半年開始,我就一直關注Apache開源社區,側重點放在大數據方面的成熟框架和產品。在這期間,陸續研究過Hadoop、Hive、HBase、Mahout、Kafka、Flume、Storm,以及近兩年很火的Spark和Flink等,和很多從事大數據的朋友一樣,經歷過無數的夜晚,對著電腦屏幕逐行研究這些源代碼,同時也看到無數的開源愛好者和技術專家加入Hadoop開源社區,貢獻自己的力量,日復一日,樂此不疲。
談起大數據,不得不提Hadoop,如今其早已發展成為了大數據處理的事實標準。Hadoop誕生于2005年,其受到Google的兩篇論文(GFS和MapReduce)的啟發。起初,Hadoop只是用來支撐Nutch搜索引擎的項目,從2006年開始,Hadoop脫離了Nutch,成為了Apache的頂級項目,無論是在學術界還是工業界都得到了迅猛的發展。
如今已是2016年了,Hadoop十周歲了,這十年期間圍繞其核心組件(HDFS、MapReduce、Yarn)陸續出現了一批工具,用來豐富Hadoop生態圈,解決大數據各方面的問題,這其中就包括Apache Kylin。
ApacheKylin(麒麟)是由eBay 研發并貢獻給開源社區的Hadoop上的分布式大規模聯機分析(OLAP)平臺,它提供Hadoop之上的SQL查詢接口及多維分析能力以支持大規模數據,能夠處理TB乃至PB級別的分析任務,能夠在亞秒級查詢巨大的Hive表,并支持高并發。Apache Kylin于2014年10月開源,并于當年11月成為Apache孵化器項目,是eBay第一個貢獻給Apache軟件基金會的項目,也是第一個由中國團隊完整貢獻到Apache的項目,在這里對Apache Kylin的中國團隊表示感謝,感謝貢獻如此出色的大數據分析平臺。
從去年開始接觸Apache Kylin,我感覺很親切,也很驚喜。當前研究的版本為0.7.1,也就是Kylin加入Apache孵化器項目后的第一個Apache發行版本,雖然當時的Kylin存在一些問題,但是其基于Hadoop設計的框架還是很有創意和特色的。經過一年多的發展,截至目前,Apache Kylin的版本已經發展到1.5.3,并且從1.5版本開始,Apache Kylin進行了重構,支持可擴展架構,支持更多的數據源、構建引擎和存儲引擎,構建算法不斷優化,支持與更多的可視化工具集成等。
如今,Apache Kylin已被應用在eBay、Exponential、京東、美團、明略數據、網易及其他公司。越來越多的大數據團隊開始選擇Apache Kylin作為公司大數據分析平臺的組成部分,滿足其海量數據的多維指標實時查詢分析。通過很多社區的交流分享,我發現不少朋友對Apache Kylin沒有一個整體的認識,在使用過程中出現各種各樣的問題,打擊自信心,他們急切希望能有一本全面介紹Apache Kylin的書籍。因為我經常在博客和社區分享Apache Kylin實戰方面的一些經驗,所以很多朋友鼓勵我能夠寫一本比較全面介紹Apache Kylin的書籍,幫助更多的愛好者更好地加入Apache Kylin的社區,并在生產環境中進行實踐。剛開始比較猶豫,畢竟寫書需要花費大量的時間和精力,而且要對讀者負責,容不得半點馬虎。后來有社區的幾個朋友給我打電話勸說,以及清華大學出版社的夏毓彥編輯一再鼓勵,還有家人的支持,我就下定決心寫這本書,目的只有一個,就是希望讀者能夠通過這本書,對Apache Kylin有一個完整的認識,掌握各方面的技能,并最終應用在自己公司的生產環境中。
本書內容
這是一本全面介紹Apache Kylin的書籍,包括環境搭建、案例實戰演示、源碼分析、Cube優化等,此外還會涉及數據倉庫、數據模型、OLAP、數據立方體等方面的知識。通過本書系統性學習和實戰操作,朋友們將能夠達到基于Apache Kylin搭建企業級大數據分析平臺,并熟練掌握使用Apache Kylin多維度地分析海量數據,最終通過可視化工具展示結果。
受眾人群
本書適合從事Hadoop、HBase、Hive和Kylin等方面工作的人員參考閱讀,最好能掌握一點OLAP、數據立方體等數據倉庫方面的知識。但是我相信這本書也適合任何想從事大數據方面工作的程序員和架構師。
代碼規范和下載
本書中會涉及大量的Linux Shell命令,這些命令都是在CentOS操作系統上執行成功的,對于其他的一些Linux系統也同樣適用,如有不適用的,可以查閱資料,修改命令以符合對應的操作系統。
由于本人的寫作能力有限,可能有些章節內容考慮并不全面,或者版本升級導致某些章節部分內容不是最新的。為了更好地為讀者服務,我特意建立了一個QQ群:118152802,讀者有關本書的任何問題,我都會及時給朋友們答復,謝謝支持。
致謝
這本書的面世,得到了很多朋友的鼎力相助,在這里感謝所有幫助我完成這本書的人。
感謝公司的同事們,特別感謝項同德和萬文兵兩位項目經理給予的支持和鼓勵,感謝施健健給予的技術支持和幫助。
感謝CSDN和cnblogs博客中優秀的文章給予的技術支持。
感謝清華大學出版社所有為本書的出版和發行付出了辛勤勞動的人們。
最后,我要感謝我的家人,給予我的不懈支持。感謝父母幫我們照顧調皮搗蛋的寶寶;感謝妻子一如既往地照顧我的生活,給予我充足的時間用來寫作。沒有家人的支持和照顧,我是不可能完成這本書。




作者
2016年10月
內容簡介:

Apache Kylin是一個開源的分布式分析引擎,提供Hadoop之上的SQL查詢接口及多維分析(OLAP)能力以支持超大規模數據,最初由eBay公司開發并貢獻至開源社區。它能在亞秒內查詢巨大的Hive表。
本書分為21章,詳細講解Apache Kylin概念、安裝、配置、部署,讓讀者對Apache Kylin構建大數據分析平臺有一個感性認識。同時,本書從應用角度,結合Dome和實例介紹了用于多維分析的Cube算法的創建、配置與優化。最后還介紹了Kyligence公司發布KAP大數據分析平臺,對讀者有極大的參考價值。
本書適合大數據技術初學者、大數據分析人員、大數據架構師等,也適合用于高等院校和培訓學校相關專業師生教學參考。
目錄:

第一部分ApacheKylin基礎部分

第1章ApacheKylin前世今生3

1.1ApacheKylin的背景3

1.2ApacheKylin的應用場景3

1.3ApacheKylin的發展歷程4

第2章ApacheKylin前奏7

2.1事實表和維表7

2.2星型模型和雪花型模型7

2.2.1星型模型7

2.2.2雪花型模型8

2.2.3星型模型示例8

2.3OLAP9

2.3.1OLAP分類9

2.3.2OLAP的基本操作10

2.4數據立方體(DataCube)11

第3章ApacheKylin工作原理和體系架構12

3.1Kylin工作原理12

3.2Kylin體系架構13

3.3Kylin中的核心部分:Cube構建15

3.4Kylin的SQL查詢16

3.5Kylin的特性和生態圈16

第4章搭建CDH大數據平臺18

4.1系統環境和安裝包19

4.1.1系統環境19

4.1.2安裝包的下載20

4.2準備工作:系統環境搭建21

4.2.1網絡配置(CDH集群所有節點)21

4.2.2打通SSH,設置ssh無密碼登錄(所有節點)21

4.3正式安裝CDH:準備工作29

4.4正式安裝CDH5:安裝配置30

4.4.1CDH5的安裝配置30

4.4.2對Hive、HBase執行簡單操作39

第5章使用Kylin構建企業大數據分析平臺的4種部署方式41

5.1Kylin部署的架構41

5.2Kylin的四種典型部署方式42

第6章單獨為Kylin部署HBase集群44

第7章部署Kylin集群環境58

7.1部署Kylin的先決條件58

7.2部署Kylin集群環境61

7.3為Kylin集群搭建負載均衡器70

7.3.1搭建Nginx環境70

7.3.2配置Nginx實現Kylin的負載均衡73

第二部分ApacheKylin進階部分

第8章Demo案例實戰77

8.1SampleCube案例描述77

8.2SampleCube案例實戰78

8.2.1準備數據78

8.2.2構建Cube81

第9章多維分析的Cube創建實戰89

9.1Cube模型89

9.2創建Cube的流程90

9.2.1步驟一:Hive中事實表,以及多張維表的處理90

9.2.2步驟二:Kylin中建立項目(Project)95

9.2.3步驟三:Kylin中建立數據源(DataSource)95

9.2.4步驟四:Kylin中建立數據模型(Model)98

9.2.5步驟五:Kylin中建立Cube104

9.2.6步驟六:BuildCube114

9.2.7步驟七:查詢Cube118

第10章BuildCube的來龍去脈120

10.1流程分析120

10.2小結134

第三部分ApacheKylin高級部分

第11章Cube優化137

第12章備份Kylin的Metadata142

12.1Kylin的元數據142

12.2備份元數據143

12.3恢復元數據146

第13章使用Hive視圖147

13.1使用Hive視圖147

13.2使用視圖實戰149

第14章Kylin的垃圾清理153

14.1清理元數據153

14.2清理存儲器數據154

第15章JDBC訪問方式157

第16章通過RESTful訪問Kylin161

第17章Kylin版本之間升級179

17.1從1.5.2升級到最新版本1.5.3179

17.2從1.5.1升級到1.5.2版本180

17.3從Kylin1.5.2.1升級到Kylin1.5.3實戰181

17.4補充內容187

第18章大數據可視化實踐189

18.1可視化工具簡述189

18.2安裝KylinODBC驅動190

18.3通過Excel訪問Kylin192

18.4通過PowerBI訪問Kylin194

18.4.1安裝配置PowerBI194

18.4.2實戰操作198

18.5通過Tableau訪問Kylin199

18.6Kylin+Mondrian+Saiku205

18.7實戰演練:通過Saiku訪問Kylin211

18.7.1第一個Schema例子:myproject_pvuv_cube的演示211

18.7.2第二個Schema例子:kylin_sales_cube的演示219

18.7.3Saiku使用的一些問題223

18.8通過ApacheZepplin訪問Kylin229

18.9通過Kylin的“Insight”查詢232

第19章使用StreamingTable構建準實時Cube236

第20章快速數據立方算法251

20.1快速數據立方算法概述251

20.2快速數據立方算法優點和缺點253

20.3獲取FastCubing算法的優勢254

第四部分ApacheKylin的擴展部分

第21章大數據智能分析平臺KAP257

21.1大數據智能分析平臺KAP概述257

21.2KAP的安裝部署259

序: