-- 會員 / 註冊 --  
 帳號:
 密碼:
  | 註冊 | 忘記密碼
3/26 新書到! 3/19 新書到! 3/14 新書到! 12/12 新書到!
購書流程Q & A站務留言版客服信箱
3ds MaxMayaRhinoAfter EffectsSketchUpZBrushPainterUnity
PhotoShopAutoCadMasterCamSolidWorksCreoUGRevitNuke
C#CC++Java遊戲程式Linux嵌入式PLCFPGAMatlab
駭客資料庫搜索引擎影像處理FluentVR+ARANSYS深度學習
單晶片AVROpenGLArduinoRaspberry Pi電路設計CadenceProtel
HadoopPythonStm32CortexLabview手機程式AndroidiPhone
可查書名,作者,ISBN,3dwoo書號
詳細書籍分類

SRE生存指南:系統中斷響應與正常運行時間最大化

( 簡體 字)
作者:馮文輝類別:1. -> 程式設計 -> 綜合
譯者:
出版社:電子工業出版社SRE生存指南:系統中斷響應與正常運行時間最大化 3dWoo書號: 51738
詢問書籍請說出此書號!

缺書
NT售價: 395

出版日:9/1/2019
頁數:244
光碟數:0
站長推薦:
印刷:黑白印刷語系: ( 簡體 版 )
加入購物車 加到我的最愛
(請先登入會員)
ISBN:9787121371769
作者序 | 譯者序 | 前言 | 內容簡介 | 目錄 | 
(簡體書上所述之下載連結耗時費功, 恕不適用在台灣, 若讀者需要請自行嘗試, 恕不保證)
作者序:

譯者序:

前言:

總會在某個時候,軟件開發人員所開發的站點會遭遇噩夢般的無法訪問的故障——客戶說他們已經連續幾個小時無法訪問你的網站了;當你在睡覺時,沒有顧客能夠購買網站上正在銷售的T恤;或者在一年中最重要的銷售日里,所有服務器都因承受不了高負載而崩潰了。
這本書適合誰
本書面向希望提高公司軟件可靠性的軟件開發人員和運維人員。本書將向你介紹一個致力于提高軟件可靠性的基本框架,并使你深入了解站點可靠性工程這個領域。對于已經經歷過重大系統服務中斷的工程師和開發人員來說,這是你希望擁有的書。對于那些幸運地沒有經歷過服務中斷噩夢的工程師和開發人員,現在就買這本書吧!
這本書涵蓋了哪些內容
第1章 簡介,探討了SRE領域相對較新的發展狀況,并概述了用于本書的可供上手實踐的框架。
第2章 監控,討論了在監控時使用的工具和方法。在本章之后,一個很好的實驗就是設置對服務的監控,即使它們只是為測試而編寫的虛假服務,你也應該去監控它們隨著時間是否有所變化。
第3章 事故響應,解釋了該如何應對中斷,并讓團隊為最壞的情況做好準備。本章還專注于圍繞團隊協作建立即時響應與輪換的最佳實踐系統,以及構建流程以盡量減輕由生產事故造成的壓力。
第4章 事后回顧,讓你能為自己、你的團隊和你的組織撰寫事后回顧報告,以促進事后回顧。本章還討論了要收集的數據,以及如何借助通信跟蹤未來的工作。
第5章 測試和發布,回顧了有關測試和發布的常見實踐方案。
第6章 容量規劃,介紹了一些有關預算的基礎知識,并討論了如何為基礎架構的擴容制訂計劃。
第7章 構建工具,討論了如何從提高響應力的角度來編寫軟件,還探討了如何發現新項目,如何定義這些項目及如何規劃它們。然后,討論了如何實施這些項目并進行軟件的長期維護,以及如何反思自己所做的工作。
第8章 用戶體驗,概述了有關用戶體驗和用戶測試的基礎知識,并討論了安全性和性能預算問題。
第9章 網絡基礎,幫助你深入了解網絡基礎知識。
第10章 Linux和云基礎,介紹了Linux和常見云服務的基礎知識。
本書配套資源
?本書中所有用Go語言編寫的代碼都基于Go 1.10版本。讀者可以到其官網獲取最新的版本。
?本書中所有用Ruby語言編寫的代碼都基于Ruby 2.5版本。讀者可以到其官網獲取最新的版本。
本書使用的約定
本書中使用了一些文本約定。
代碼塊示例如下。
"hello world"
end
當希望讀者注意代碼塊中的特定部分時,相關的行或項目將以粗體顯示,示例如下。
"hello world"
end
end
粗體:表示第一次出現的新術語、重要單詞。例如,會出現如下所示的文本。
服務水平指標 Service Level Indicator(SLI)可能是業務最重要的指標。

這種圖標表示警告或重要說明。

這種圖標表示提示和技巧。
內容簡介:

站點可靠性工程(Site Reliability Engineering,簡稱SRE)是一個令人興奮的新興領域,它專注于如何確保系統穩定、可靠地運行。本書基于一個金字塔層次結構模型,深入淺出地介紹了關于SRE 的方方面面,涉及監控、事故響應與回顧、測試與發布、容量規劃、開發、用戶體驗設計,以及貫穿其中的溝通技巧。本書是SRE 工程師、DevOps 工程師、運維工程師和系統管理員不可或缺的參考資料;軟件架構師、軟件工程師、用戶體驗設計師也能從本書中獲取關于SRE 的相關知識。
目錄:

1 簡介 1
SRE簡史 2
SRE是什么 3
關于這本書 7
以SRE作為新項目的框架 9
小結 12
2 監控 13
為什么要監控 13
檢測應用程序 16
度量什么 23
SLIs、SLOs和錯誤預算簡介 26
錯誤預算 27
收集和保存監控數據 29
輪詢應用程序 29
推送應用程序 32
展示監控信息 35
任意查詢 35
圖表 36
儀表板 37
聊天機器人 38
管理和維護監控數據 38
溝通 39
他們知道有監控嗎 39
小結 40
參考資料 41
3 事故響應 42
什么是事故 43
什么是事故響應 45
警報 47
什么時候發起警報 48
怎么發出警報 49
向誰發出警報 54
隨時待命 55
溝通 57
事故指揮系統 59
在哪里溝通 61
恢復系統 61
警報解除 63
小結 64
4 事后回顧 65
什么是事后回顧 65
為什么寫事后回顧報告 66
何時寫事后回顧報告 68
開展事故分析 69
如何寫事后回顧報告 71
總結 71
影響 72
時間 73
根本原因 74
行動項 75
附錄 77
停止事后指責 77
舉行事后回顧會議 79
分析以往的事后回顧報告 80
MTTR與MTBF 81
警報疲勞 81
討論過去的服務中斷 81
小結 82
參考資料 82
5 測試和發布 83
測試 84
測試內容 87
發布 100
何時發布 101
回滾 104
自動化 104
持續 105
小結 106
6 容量規劃 107
企業財務簡介 108
為什么需要規劃 110
風險管理與期望管理 111
定義一個規劃 112
當前的容量是多少 113
何時達到容量極限 115
應該如何更改容量 119
執行規劃 125
架構——性能變化的根源 126
技術作為利潤中心和采購 128
小結 128
7 構建工具 129
尋找項目 131
定義項目 133
RDD 133
設計文檔 136
項目計劃 138
例子 139
回顧會與站會 141
工作分配 142
構建項目 143
關于編寫代碼的建議 143
關注點分離 144
長期工作 145
筆記本 148
文檔與維護項目 149
小結 150
8 用戶體驗 151
設計和用戶體驗簡介 155
現實世界的交互設計 157
用戶測試 160
挑選一種體驗 161
設計測試 162
尋找要測試的人 162
開發者體驗 163
工具經驗 164
績效預算 164
安全性 166
身份認證 167
授權 168
風險概況 168
網絡釣魚 169
ACM道德準則 170
小結 171
參考資料 172
9 網絡基礎 173
互聯網 173
發送一個HTTP請求 175
DNS 175
以太網和TCP/IP 179
HTTP 186
curl與wget 189
網絡監控工具 194
netstat 194
nc 195
tcpdump 196
小結 197
參考資料 197
10 Linux和云基礎 198
Linux基礎 198
一切皆是文件 199
進程是什么 206
syscalls 207
構建自己的工具 213
云基礎 214
虛擬機 215
容器 216
負載均衡 218
自動伸縮 219
存儲 219
隊列與發布/訂閱 220
伸縮單元 221
架構面試示例 222
小結 226
參考資料 226
序: