-- 會員 / 註冊 --  
 帳號:
 密碼:
  | 註冊 | 忘記密碼
3/26 新書到! 3/19 新書到! 3/14 新書到! 12/12 新書到!
購書流程Q & A站務留言版客服信箱
3ds MaxMayaRhinoAfter EffectsSketchUpZBrushPainterUnity
PhotoShopAutoCadMasterCamSolidWorksCreoUGRevitNuke
C#CC++Java遊戲程式Linux嵌入式PLCFPGAMatlab
駭客資料庫搜索引擎影像處理FluentVR+ARANSYS深度學習
單晶片AVROpenGLArduinoRaspberry Pi電路設計CadenceProtel
HadoopPythonStm32CortexLabview手機程式AndroidiPhone
可查書名,作者,ISBN,3dwoo書號
詳細書籍分類

Hadoop金融大數據分析

( 簡體 字)
作者:王小寧類別:1. -> 程式設計 -> 雲計算
   2. -> 程式設計 -> 大數據
譯者:
出版社:電子工業出版社Hadoop金融大數據分析 3dWoo書號: 46484
詢問書籍請說出此書號!

缺書
NT售價: 295

出版日:3/1/2017
頁數:176
光碟數:0
站長推薦:
印刷:黑白印刷語系: ( 簡體 版 )
加入購物車 加到我的最愛
(請先登入會員)
ISBN:9787121310515
作者序 | 譯者序 | 前言 | 內容簡介 | 目錄 | 
(簡體書上所述之下載連結耗時費功, 恕不適用在台灣, 若讀者需要請自行嘗試, 恕不保證)
作者序:

譯者序:

前言:

譯者序

從 2013年暑假接觸 Hadoop到現在已有 3年,我清楚地記得第一個偽分布式弄了近 10天才跑出來第一個 WordCount,期間太多的 Bug已經把我搞得神魂顛倒,好在最后“成功”了。至此,我與 Hadoop 結下了不解之緣。剛開始用中國人民大學數據挖掘中心的十幾臺機器搭建了第一個 Hadoop集群,而后發展成兩臺服務器各包括 20臺機器的集群。Hadoop的版本也從 1.2.0發展到 2.6.0,隨后幫助中國人民大學統計與調查中心搭建了自己的 Hadoop集群。
“巧婦難為無米之炊”,再優秀的工具沒有數據也只能是一個擺設,好在我們在做項目的過程中不時地有新的數據加入,也為我們進一步的學習和研究打下了基礎。我們集群的組件也從單純的 Hadoop增加到 Hive、HBase、 Mahout和 Spark。這幾個組件都是比較流行的,我們在使用過程中也體會到了這些組件優于傳統數據分析工具的特點。隨著數據采集量的增多,也使得很多公司為我們提供了一些可進行分布式計算的平臺環境,充分利用這些資源,會為我們的研究和工作錦上添花。
感謝電子工業出版社的編輯給了我一次這么好的機會,也希望本書能為金融行業的同仁帶來一定的收獲。金融行業的數據可以說是最有價值的數據,其數據量大、價值高,從這些數據中提取價值是提升業務收入的一個重要手段。面對日益增長的數據量,傳統的數據分析工具已經很難滿足這些需求,新的開源工具可為我們解決這些問題。文中列舉了很多現實中的例子及實現方案,為我們進一步挖掘數據的價值提供了一種思路。
王小寧 2016年


前 言

數據正以驚人的速度增加,而公司要么疲于應付,要么急于利用這些數據進行分析。Hadoop是一個優秀的開源框架,可以應付這些大數據問題。
在過去的幾年里,我一直在金融部門使用 Hadoop,但在使用的過程中,一直沒有發現有關 Hadoop在金融應用中的任何案例資源或書籍。我遇到的關于 Hadoop、Hive或一些 MapReduce模式的書籍大都是用各種各樣的方式統計單詞數量或分析 Twitter信息。
我寫這本書旨在解釋 Hadoop和其他相關產品在處理金融案例大數據中的基本應用。在書中,介紹了很多案例并提供了一個非常實用的方法。
這本書包含什么
第 1章,大數據回顧。本章包含大數據概覽、前景和技術演變,也介紹了 Hadoop架構的基本知識、組成部分和分布式框架。如果你之前已經了解 Hadoop,這一章可以忽略。
第 2章,金融服務中的大數據。本章將延伸到站在一個金融機構的角度去看大數據。主要介紹大數據在金融部門的演進故事,在項目落地時的一些挑戰,以及利用相關工具和技術處理金融案例的應用。
第 3章,在云端使用 Hadoop。本章包含大數據在云端使用的概覽,以及基于端到端數據處理的樣本投資組合風險模擬項目。
第 4章,使用 Hadoop進行數據遷移。本章討論了將歷史數據從傳統數據源遷到 Hadoop上的幾種常用項目。
第 5章,入門。本章包含了一個非常大的企業數據平臺的實施項目,以支持各種風險和監管要求。
第 6章,變得有經驗。本章給出了實時分析的概覽和檢測欺詐交易的樣本項目。
第 7章,深入擴展 Hadoop的企業級應用。本章包含的主題擴展到 Hadoop在公司中的使用,如企業數據湖、 Lambda架構和數據管理。還介紹了更多基本的財務案例與簡短的解決方案。
第 8章,Hadoop的快速增長。本章討論了 Hadoop分布式架構的升級周期,并用最佳實踐和標準完成此書。

閱讀這本書你需要哪些基礎知識
因為 Hadoop是一個數據處理和分析的技術框架,因此在數據庫、項目和分析工具上有一些經驗對讀者會有幫助。
這本書是一個入門指南,包含了大量外部引用的大數據產品。因此,如果在任何時候需要深入了解 Hadoop,我們鼓勵讀者參考書中提到的外部資源。

哪些人適合讀這本書
本書主要面向致力于使用 Hadoop的金融部門工作人員,包含數據項目開發人員、分析師、架構師和管理人員。
它也有助于來自其他行業最近轉換或想將業務領域轉向金融部門的技術專業人士。
內容簡介:

在互聯網+時代,數據是炙手可熱的重要資源,網絡使用基礎的提升,數據流量增大,用戶需求多樣化和多變對架構設計提出嚴峻考驗,而Hadoop為快速響應用戶需求提供了重要技術支撐。作者Rajiv Tiwari從事數據研究近15年,在Hadoop應用方面有許多實戰經驗,他通過實際案例幫助讀者學習如何借助Hadoop來處理巨大數據信息,對于開發者、分析師、架構師、管理者等都具有很好的指導。

目錄:

第 1章 大數據回顧. .... 1
大數據是什么 ..... 1
數據量 .... 2
數據速度 .... 2
數據類型 .... 3
大數據技術的演進 ..... 3
過去 ...... 3
現在 ...... 4
未來 ...... 5
大數據愿景 ..... 5
存儲 ...... 6
NoSQL ..... 6
NoSQL數據庫類型 .... 7
資源管理 .... 7
數據治理 .... 8
批量計算 .... 8
實時計算 .... 8
數據整合工具 .... 9
機器學習 .... 9
商務智能和可視化 .... 9
大數據相關的職業 .... 10
Hadoop架構 .....11
HDFS集群 .... 12
MapReduce V1 .... 14
MapReduce V2——YARN .... 15
Hadoop生態圈簡介 .... 18
馴服大數據 .... 18
Hadoop——英雄 ..... 19
HDFS——Hadoop分布式系統 .... 19
Hadoop版本 .... 23
發行版——本地部署 .... 25
發行版——云端 .... 27
總結 ..... 28

第 2章 金融服務中的大數據.. 29
各個行業的大數據使用情況 ... 29
衛生保健 .... 30
人類科學 .... 30
電信 .... 31
在線零售商 .... 31
為什么金融部門需要大數據 ... 31
金融部門的大數據應用案例 ... 34
HDFS上的數據歸檔 .... 34
監管 .... 35
欺詐檢測 .... 35
交易數據 .... 36
風險管理 .... 36
客戶行為預測 .... 36
情感分析——非結構化 .... 36
其他應用案例 .... 37
金融大數據的演進過程 ... 37
應該如何學習金融大數據 ... 41
把你的數據上傳到 HDFS上 ... 41
從 HDFS上查詢數據 ... 42
在 Hadoop上的 SQL... 43
實時 .... 44
數據治理和運營 .... 44
ETL工具 ..... 45
數據分析和商業智能 .... 45
金融大數據的實現 ..... 46
關鍵挑戰 .... 46
克服挑戰 .... 47
總結 ..... 50

第 3章 在云端使用 Hadoop... 51
大數據云的故事 ..... 51
原因 .... 52
時機 .... 53
收獲 .... 54
項目細節——在云中進行風險模擬 .... 54
解決方案 .... 55
現實世界 .... 55
目標世界 .... 57
數據轉換 .... 60
數據分析 .... 62
總結 ..... 63

第 4章 使用 Hadoop進行數據遷移. ... 65
項目細節——歸檔你的交易數據 .... 65
解決方案 .... 67
項目第一階段——分裂交易數據到數據倉庫和 Hadoop .. 68
項目第二階段——完成數據從關系型數據倉庫到 Hadoop的遷移 . 77
總結 ..... 83

第 5章 入門. ... 85
項目詳細信息——風險和監管報告 .... 86
解決方案 .... 87
現實世界 .... 87
目標世界 .... 88
數據收集 .... 89
數據轉換 .... 97
數據分析 .....112
總結 ......116

第 6章 變得有經驗. .... 117
實時大數據 ....117
項目細節——識別欺詐交易 ...119
解決方案 .... 120
現實世界 .... 120
目標世界 .... 120
馬爾科夫鏈模型執行——批處理模式 .. 121
數據收集 .... 126
數據轉換 .... 128
總結 ..... 132

第 7章 深入擴展 Hadoop的企業級應用.. 133
擴展開來——實際上的水平 .... 134
更多的大數據使用案例 ... 135
使用案例——再談欺詐問題 .... 136
解決方案 .... 136
使用案例——用戶投訴 .... 137
解決方案 .... 137
使用案例——算法交易 .... 137
解決方案 .... 138
使用案例——外匯交易 .... 138
解決方案 .... 138
使用案例——基于社交媒體的交易數據 .. 139
解決方案 .... 139
使用案例——非大數據 .... 140
解決方案 .... 140
數據湖 ..... 140
Lambda架構 ..... 143
大數據管理 ..... 144
Apache Falcon概覽 .... 146
安全性 ..... 147
總結 ..... 149

第 8章 Hadoop的快速增長... 151
Hadoop發行版的升級周期 .... 151
最佳實踐和標準 ..... 154
環境 .... 154
與 BI和 ETL工具的集成 .... 155
提示 .... 155
新的趨勢 ..... 157
總結 ..... 158
序: