|
-- 會員 / 註冊 --
|
|
|
|
Spark學習手冊 Learning Spark ( 繁體 字) |
作者:Holden Karau, Andy Konwinski, Patrick We | 類別:1. -> 程式設計 -> Spark |
譯者:許致軒 |
出版社:歐萊禮圖書 | 3dWoo書號: 45094 詢問書籍請說出此書號!【缺書】 NT定價: 520 元 折扣價: 411 元
|
出版日:9/1/2016 |
頁數:269 |
光碟數:0 |
|
站長推薦: |
印刷:黑白印刷 | 語系: ( 繁體 版 ) |
|
加入購物車 │加到我的最愛 (請先登入會員) |
ISBN:9789864760466 |
作者序 | 譯者序 | 前言 | 內容簡介 | 目錄 | 序 |
(簡體書上所述之下載連結耗時費功, 恕不適用在台灣, 若讀者需要請自行嘗試, 恕不保證) |
作者序: |
譯者序: |
前言: |
內容簡介:現今無論在任何領域,資料都逐漸地變大,你該如何有效率的對他們進行處理?此書介紹了Apache Spark,一個開放原始碼叢集運算系統。它使資料可以更快速的寫入以及執行。藉由Spark,你可以透過簡易的Python,Java,或是Scala的API進行快速的大量資料處理。
此書為Spark的開發者親自撰寫,可以讓資料科學家以及工程師立即應用書中的知識展開工作。讀者將學會如何透過數行的程式碼進行一個平行處理的工作。本書涵蓋了基礎的批次工作到串流處理以及機器學習等相關的應用。
?讓讀者可以快速地了解Spark,例如:分散式資料集、記憶體快取、以及交互式介面等。 ?利用Spark內建的強大資料庫,包含Spark SQL、Spark Streaming以及MLib。 ?使用一個Spark程式框架即可取代混合多種工具如Hive、Hadoop、Mahout以及Strom。 ?學習透過Spark進行交互式、批次、以及串流式的應用程式開發 ?與諸多資料來源進行連接,包含HDFS、HIVE、JSON以及S3 ?學習資料切割以及共享變數等進階議題
“本書是我在大數據處理應用程式指南推薦書單中的第一名” --Ben. Lorica資料科學家主席, O’Reilly Media
|
目錄:Chapter 1 Spark 資料分析導論 Chapter 2 下載及開始使用 Spark Chapter 3 RDD程式撰寫 Chapter 4 鍵值對 RDD 操作 Chapter 5 存取資料 Chapter 6 進階 Spar k程式撰寫 Chapter 7 在叢集執行 Spark Chapter 8 Spark 調校與除錯 Chapter 9 Spark SQL Chapter 10 Spark streaming Chapter 11 MLlib 機器學習函式庫
|
序: |
|