|
-- 會員 / 註冊 --
|
|
|
|
Kafka技術內幕 圖文詳解Kafka源碼設計與實現 ( 簡體 字) |
作者:鄭奇煌 | 類別:1. -> 程式設計 -> Kafka |
譯者: |
出版社:人民郵電出版社 | 3dWoo書號: 47990 詢問書籍請說出此書號!【有庫存】 NT售價: 595 元 |
出版日:11/1/2017 |
頁數:703 |
光碟數:0 |
|
站長推薦: |
印刷:黑白印刷 | 語系: ( 簡體 版 ) |
|
加入購物車 │加到我的最愛 (請先登入會員) |
ISBN:9787115469380 |
作者序 | 譯者序 | 前言 | 內容簡介 | 目錄 | 序 |
(簡體書上所述之下載連結耗時費功, 恕不適用在台灣, 若讀者需要請自行嘗試, 恕不保證) |
作者序: |
譯者序: |
前言: |
內容簡介: Kafka自LinkedIn開源以來就以高性能、高輸送量、分散式的特性著稱,本書以0.10版本的源碼為基礎,深入分析了Kafka的設計與實現,包括生產者和消費者的消息處理流程,新舊消費者不同的設計方式,存儲層的實現,協調者和控制器如何確保Kafka集群的分散式和容錯特性,兩種同步集群工具MirrorMaker和uReplicator,流處理的兩種API以及Kafka的一些高級特性等。
《Kafka技術內幕 圖文詳解Kafka源碼設計與實現》適合Kafka開發人員閱讀。
|
目錄: 第1章 Kafka入門 1 1.1 Kafka流式資料平臺 1 1.2 Kafka的基本概念 3 1.2.1 分區模型 3 1.2.2 消費模型 4 1.2.3 分散式模型 5 1.3 Kafka的設計與實現 6 1.3.1 檔案系統的持久化與資料傳輸效率 6 1.3.2 生產者與消費者 8 1.3.3 副本機制和容錯處理 10 1.4 快速開始 11 1.4.1 單機模式 12 1.4.2 分散式模式 14 1.4.3 消費組示例 16 1.5 環境準備 18 第2章 生產者 22 2.1 新生產者用戶端 22 2.1.1 同步和非同步發送消息 23 2.1.2 用戶端消息發送執行緒 29 2.1.3 用戶端網路連線物件 31 2.1.4 選擇器處理網路請求 35 2.2 舊生產者用戶端 43 2.2.1 事件處理器處理用戶端發送的消息 44 2.2.2 對消息集按照節點和分區進行整理 46 2.2.3 生產者使用阻塞通道發送請求 48 2.3 服務端網路連接 49 2.3.1 服務端使用接收器接受用戶端的連接 50 2.3.2 處理器使用選擇器的輪詢處理網路請求 53 2.3.3 請求通道的請求佇列和回應佇列 56 2.3.4 Kafka請求處理執行緒 58 2.3.5 服務端的請求處理入口 58 2.4 小結 60 第3章 消費者:高級API和低級API 61 3.1 消費者啟動和初始化 67 3.1.1 創建並初始化消費者連接器 69 3.1.2 消費者用戶端的執行緒模型 70 3.1.3 重新初始化消費者 72 3.2 消費者再平衡操作 73 3.2.1 分區的所有權 74 3.2.2 為消費者分配分區 75 3.2.3 創建分區資訊物件 78 3.2.4 關閉和更新拉取執行緒管理器 80 3.2.5 分區資訊物件的偏移量 80 3.3 消費者拉取資料 82 3.3.1 拉取執行緒管理器 82 3.3.2 抽象拉取執行緒 87 3.3.3 消費者拉取執行緒 90 3.4 消費者消費消息 94 3.4.1 Kafka消息流 94 3.4.2 消費者反覆運算消費消息 95 3.5 消費者提交分區偏移量 97 3.5.1 提交偏移量到ZK 98 3.5.2 提交偏移量到內部主題 99 3.5.3 連接偏移量管理器 101 3.5.4 服務端處理提交偏移量的請求 103 3.5.5 緩存分區的偏移量 106 3.6 消費者低級API示例 108 3.6.1 消息消費主流程 109 3.6.2 找出分區的主副本 112 3.6.3 獲取分區的讀取偏移量 113 3.6.4 發送拉取請求並消費消息 116 3.7 小結 117 3.7.1 消費者執行緒模型 117 3.7.2 再平衡和分區分配 119 第4章 新消費者 121 4.1 新消費者用戶端 125 4.1.1 消費者的訂閱狀態 125 4.1.2 消費者輪詢的準備工作 134 4.1.3 消費者輪詢的流程 138 4.1.4 消費者拉取消息 146 4.1.5 消費者獲取記錄 149 4.1.6 消費消息 160 4.2 消費者的網路用戶端端輪詢 161 4.2.1 非同步請求 162 4.2.2 非同步請求高級模式 169 4.2.3 網路用戶端端輪詢 184 4.3 心跳任務 188 4.3.1 發送心跳請求 188 4.3.2 心跳狀態 189 4.3.3 運行心跳任務 191 4.3.4 處理心跳結果的示例 192 4.3.5 心跳和協調者的關係 193 4.4 消費者提交偏移量 195 4.4.1 自動提交任務 195 4.4.2 將拉取偏移量作為提交偏移量 197 4.4.3 同步提交偏移量 201 4.4.4 消費者的消息處理語義 202 4.5 小結 206 第5章 協調者 210 5.1 消費者加入消費組 211 5.1.1 中繼資料與分區分配器 212 5.1.2 消費者的加入組和同步組 213 5.1.3 主消費者執行分配任務 220 5.1.4 加入組的準備、完成和監聽器 224 5.2 協調者處理請求 229 5.2.1 服務端定義發送回應結果的回檔方法 229 5.2.2 消費者和消費組中繼資料 232 5.2.3 協調者處理請求前的條件檢查 236 5.2.4 協調者調用回檔方法發送回應給用戶端 237 5.3 延遲的加入組操作 242 5.3.1 “準備再平衡” 242 5.3.2 延遲操作和延遲緩存 244 5.3.3 嘗試完成延遲的加入操作 246 5.3.4 消費組穩定後,原有消費者重新加入消費組 250 5.3.5 消費組未穩定,原有消費者重新加入消費組 251 5.4 消費組狀態機 254 5.4.1 再平衡操作與監聽器 254 5.4.2 消費組的狀態轉換 262 5.4.3 協調者處理“加入組請求” 264 5.4.4 協調者處理“同步組請求” 274 5.4.5 協調者處理“離開組請求” 276 5.4.6 再平衡超時與會話超時 278 5.4.7 延遲的心跳 282 5.5 小結 290 第6章 存儲層 293 6.1 日誌的讀寫 293 6.1.1 分區、副本、日誌、日誌 分段 294 6.1.2 寫入日誌 297 6.1.3 日誌分段 305 6.1.4 讀取日誌 315 6.1.5 日誌管理 329 6.1.6 日誌壓縮 336 6.2 服務端處理讀寫請求 348 6.2.1 副本管理器 351 6.2.2 分區與副本 362 6.3 延遲操作 373 6.3.1 延遲操作介面 374 6.3.2 延遲操作與延遲緩存 383 6.3.3 延遲緩存 391 6.4 小結 400 第7章 控制器 402 7.1 Kafka控制器 402 7.1.1 控制器選舉 403 7.1.2 控制器上下文 406 7.1.3 ZK監聽器 408 7.1.4 分區狀態機和副本狀態機 410 7.1.5 刪除主題 430 7.1.6 重新分配分區 436 7.1.7 控制器的網路通道管理器 445 7.2 服務端處理LeaderAndIsr請求 448 7.2.1 創建分區 449 7.2.2 創建主副本、備份副本 451 7.2.3 消費組中繼資料遷移 463 7.3 中繼資料緩存 468 7.3.1 服務端的中繼資料緩存 472 7.3.2 用戶端更新中繼資料 473 7.4 Kafka服務關閉 483 7.5 小結 487 第8章 基於Kafka構建資料流程管道 490 8.1 Kafka集群同步工具:MirrorMaker 490 8.1.1 單機類比資料同步 491 8.1.2 資料同步的流程 493 8.2 Uber集群同步工具:uReplicator 498 8.2.1 Apache Helix介紹 498 8.2.2 Helix控制器 501 8.2.3 Helix工作節點 504 8.3 Kafka連接器 505 8.3.1 連接器的使用示例 507 8.3.2 開發一個簡單的連接器 510 8.3.3 連接器的架構模型 515 8.3.4 Herder的實現 520 8.3.5 Worker的實現 524 8.3.6 配置存儲與狀態存儲 530 8.3.7 連接器與任務的實現 550 8.4 小結 565 第9章 Kafka流處理 569 9.1 低級Processor API 569 9.1.1 流處理應用程式示例 569 9.1.2 流處理的拓撲 575 9.1.3 流處理的執行緒模型 580 9.1.4 狀態存儲 613 9.2 高級流式DSL 636 9.2.1 DSL應用程式示例 636 9.2.2 KStream和KTable 638 9.2.3 連接操作 665 9.2.4 視窗操作 672 9.3 小結 684 第10章 高級特性介紹 686 10.1 用戶端配額 686 10.2 消息與時間戳記 692 10.3 交易處理 699 10.4 小結 703
|
序: |
|