-- 會員 / 註冊 --  
 帳號:
 密碼:
  | 註冊 | 忘記密碼
3/26 新書到! 3/19 新書到! 3/14 新書到! 12/12 新書到!
購書流程Q & A站務留言版客服信箱
3ds MaxMayaRhinoAfter EffectsSketchUpZBrushPainterUnity
PhotoShopAutoCadMasterCamSolidWorksCreoUGRevitNuke
C#CC++Java遊戲程式Linux嵌入式PLCFPGAMatlab
駭客資料庫搜索引擎影像處理FluentVR+ARANSYS深度學習
單晶片AVROpenGLArduinoRaspberry Pi電路設計CadenceProtel
HadoopPythonStm32CortexLabview手機程式AndroidiPhone
可查書名,作者,ISBN,3dwoo書號
詳細書籍分類

算法與數據中臺:基于Google、Facebook與微博實踐

( 簡體 字)
作者:詹盈類別:1. -> 程式設計 -> 綜合
譯者:
出版社:電子工業出版社算法與數據中臺:基于Google、Facebook與微博實踐 3dWoo書號: 53218
詢問書籍請說出此書號!

缺書
NT售價: 445

出版日:8/1/2020
頁數:328
光碟數:0
站長推薦:
印刷:黑白印刷語系: ( 簡體 版 )
加入購物車 加到我的最愛
(請先登入會員)
ISBN:9787121392887
作者序 | 譯者序 | 前言 | 內容簡介 | 目錄 | 
(簡體書上所述之下載連結耗時費功, 恕不適用在台灣, 若讀者需要請自行嘗試, 恕不保證)
作者序:

譯者序:

前言:

推薦語
數據中臺在很多企業已經得到了較好的實踐并產生了巨大的收益。隨著機器學習,特別是深度學習的快速發展和工業化落地,通過對算法技術與大數據技術進行統一的規劃和建設,我們能夠將傳統的數據中臺升華為智能數據中臺,并進一步賦能給前臺業務來進行智能化改造。本書對于智能數據中臺著墨甚多,內容非常全面,從大數據的線下(offline)處理,過渡到近線(near-line)半實時模型更新,再到在線(online)實時服務,對相關解決方案進行了全景式的解析。更為難得的是,作者還介紹了在中美一流企業的親身經歷和成功實踐,這些內容具有高度的可借鑒性,強烈建議互聯網行業的廣大從業人員閱讀。
SHAREit合伙人、COO 王超

強大的中臺是互聯網公司的核心競爭力。本書內容由淺入深,從基礎架構到核心算法,從理論到實踐,再結合作者多年在Google、Facebook和新浪微博的工作經驗,是難得的技術指南。
Facebook信息流中臺負責人 毛昀

在這個人工智能蓬勃發展的時代,一個可靠、可延展、易用的中臺,對于大規模數據的處理、建模、預測及業務發展至關重要。本書深入淺出地介紹了算法和數據中臺的核心基礎,同時結合作者在國內外一線互聯網公司的實際工作經驗,系統地講解了中臺的搭建。從業者通讀本書,既能夠獲取關于中臺的基礎知識,也能夠得到有益的啟發和有針對性的經驗。
Uber Eats技術負責人 呂飛
本書有別于市場上眾多的數據中臺類圖書,是一本關于算法與數據中臺技術的“百科全書”,內容包括中臺技術的基礎設施、在線算法服務、機器學習平臺、分布式數據庫系統、大數據平臺,還有具體的實踐案例。本書包羅萬象,講解深入淺出,是算法與數據中臺技術研發人員的參考指南。
Google DoubleClick視頻廣告技術中臺負責人 朱祖韜

以大數據為核心的數據技術早已對各行各業的發展產生了巨大的推動作用。近年來,隨著機器學習,特別是深度學習的蓬勃發展和工業化落地,我們已然從大數據時代進入了數據智能時代。本書對數據技術和算法技術,以及背后的中臺建設和實踐案例進行了深入探討與剖析,是一本頗具指導價值和內容稀缺性的佳作。
網易前技術副總裁、Strava CTO 劉彥東

本書有別于目前市面上已有的數據中臺或技術中臺相關著作,作者將機器學習算法和數據技術作為一個有機整體進行了解讀,并在剖析具體案例的基礎上介紹了 Google、Facebook 和新浪微博等知名互聯網公司的實踐經驗,這些內容是相當有洞見的。特此推薦給互聯網行業的從業者及對中臺技術感興趣的讀者。
北京大學計算機系研究員 許辰人

技術中臺化已成為很多行業的潮流。本書系統介紹了算法與數據中臺的技術架構和算法原理,展示了多家一線互聯網公司的架構方案,為中臺技術體系搭建提供了寶貴的參考。
好未來教育集團AI平臺負責人、資深算法科學家 楊非

機器學習技術,以及支撐其發展的數據處理技術,早已在諸多領域發揮了不可替代的作用。正如本書中所述,通過技術沉淀及數據整合,通用的算法能力和數據能力可以被復用到諸多不同的業務場景當中并產生巨大的收益。本書翔實地介紹了中臺建設的背景和意義,并對與算法和數據相關的中臺建設實踐進行了深入探討,這些技術要點和實踐經驗頗具代表意義,相信讀者能從中獲得啟發。
快手副總裁、短視頻推薦負責人 連喬
人工智能應用及其背后的算法、技術,在人們生產生活的各個場景中變得愈發重要。小到智能手機里的人臉解鎖,大到智慧醫療或者智慧工廠,都有它們的身影。本書充分結合國內外知名互聯網企業的實踐,圍繞算法技術和數據技術進行了詳盡探討,為從業者提供了可借鑒的經驗。
商湯科技副總裁 張少霆

中臺概念在互聯網公司中正日益普及。然而,構建實用化的數據中臺和超大規模的機器學習中臺并非易事,它對系統設計者及開發者的算法和工程能力要求很高。本書從算法和工程等多個維度翔實地介紹了如何設計實用化的大規模機器學習中臺、數據中臺,以及中外一線互聯網公司的實踐。作者在大規模機器學習系統構建方面具備非常豐富的實踐經驗,所以本書體現出算法與工程并重、理論與實踐兼顧的特點,這是很難得的,在此誠摯向大家推薦此書。
新浪微博AI Lab機器學習團隊負責人 張俊林

大部分互聯網企業都會依存于數據,無論是從數據到洞見,指導業務的發展方向,還是從數據到算法,優化用戶價值漏斗。為了積累和提升這些能力,很多發展到一定階段的企業,都會選擇把核心的數據和算法能力沉淀到中臺。如何建立中臺能力?本書凝聚了國內外互聯網企業的優秀經驗,為讀者回答了這個問題并提供了寶貴的經驗。
滴滴高級總監 郭飛

隨著海量數據在各行各業的飛速積累,大數據和算法中臺相關技術在很多行業應用中產生了很大影響。本書不僅系統介紹了與大數據和算法中臺技術相關的基礎知識與系統,難得的是,還詳細描述了其在互聯網行業不同場景下的實踐,對于那些希望了解中臺技術的相關專業在校學生和行業從業者,本書是非常難得的學習材料。
騰訊AI Lab機器學習中心總監 黃俊洲

本書每一章都可以獨立成篇,各章之間從基礎到應用循序漸進,內容既全面又相對獨立。作者集合其多年在中美一流大公司的開發經驗傾力打造,本書定將成為該領域中一本不可或缺的技術指南。
美國特拉華大學計算機與信息科學系助理教授 彭曦
數據智能正在從特權變為普惠,如何讓業務智能化是每個公司都面臨的挑戰。本書系統化闡述了算法、算法平臺、數據庫和大數據平臺,并且通過在業界領先的推薦廣告等系統中的實踐詳細解釋了中臺的應用。相信這些典型系統會給讀者帶來啟發,開啟產品的智能之門。
阿里巴巴研究員 蔣曉偉

作者以其在全球知名互聯網企業的親身體驗和深厚的技術底蘊,展現了理論與實踐的完美結合。本書系統地刻畫了一個個經典的實踐案例,深入淺出地介紹了算法和數據中臺技術在當今頂尖互聯網科技企業中的應用與發展,是了解算法和數據中臺技術及其應用的佳作。
太平人壽CIO、谷歌及貝爾實驗室前科學家 熊明

算法和數據對于許多互聯網公司來說不可或缺,它們是眾多產品和業務進行智能化升級的重要支撐。本書翔實地闡述了算法和數據之間的緊密關系,并依據作者多年在世界一流互聯網公司的工作經驗,對中臺建設方案和相關實踐案例進行了深入探討。這些內容具有高度的借鑒意義和啟發性,相信讀者在閱讀之后能夠從中獲得新的感悟,并因地制宜地將相關技術和經驗應用到實際的項目開發當中。
Facebook Ads分發技術負責人 潘科

推薦序
數據智能作為新基建中的核心領域,具備前所未有的變革能力,它正在對現有的生產生活方式、商業模式甚至經濟結構產生著巨大的推動作用。算法技術與數據技術的深度結合是實現數據智能的基礎。以機器學習為代表的人工智能,逐漸發展成為當今最為主流和最具影響力的算法技術。它不僅在推薦、搜索和廣告等經典的互聯網業務中完美地證明了自己的價值,而且在解決現實生產和生活中的實際問題上,也逐漸彰顯出了不可替代的巨大能力。在機器學習被不斷地實踐和應用的過程中,數據技術特別是大數據領域的相關技術,也取得了長足進步,并成為機器學習算法賴以生存的土壤。數據智能領域的技術進步,和互聯網本身的蓬勃發展是密不可分的,兩者相互促進,相輔相成。技術的進步不僅可以為已有互聯網產品的智能化升級和改造進行賦能,它也是許多新興互聯網業務得以開展的基石,而互聯網的發展則為算法技術與數據技術的實踐和進化提供了廣闊的舞臺。
新浪微博作為全球最大的中文社交媒體平臺,不僅具有海量的用戶規模和平臺內容,而且具有社交性和媒體性這兩大突出特點。面對不斷增長的博文信息及愈加豐富的用戶行為,新浪微博一直以來都致力于利用數據技術和算法技術來驅動業務發展和產品迭代。在多年的中臺建設過程中,微博平臺已經基本實現了數據的共享及通用能力的復用。當下,無論是微博推薦流、視頻推薦和微博熱搜等用戶產品,還是超級粉絲通和粉絲頭條等廣告產品,都離不開技術中臺的強有力支持。特別地,在中臺建設過程中沉淀下來的數據技術和算法技術,已經成為各個產品和業務進行智能化升級和個性化改造的核心推動力。
本書作者充分結合了中外知名互聯網企業的實踐經驗,對較為通用的算法技術、數據技術,以及背后的中臺建設歷程進行了較為詳盡的介紹和總結。在此基礎上,本書還對推薦系統、計算廣告,以及本地生活服務這三個經典互聯網業務中的實際產品進行了案例剖析,這些內容頗具實踐價值和指導意義。本書文筆流暢,具有廣闊的技術視野,內容頗具深度,是一本優秀的參考讀物,特此推薦給互聯網以及信息產業的相關從業人員。
——新浪微博CTO 劉子正

前言
成書背景
在中美各大互聯網企業的中臺戰略實施過程中,人們對中臺建設的目標逐步形成了原則性共識。大家普遍希望通過中臺戰略來實現數據整合、技術沉淀、能力共享和功能復用,并期望以此為切入點來引領組織架構的升級和重塑,從而大幅度提高研發效率、執行效率、組織效率和決策效率。毫無疑問,一個可靠且強大的中臺可以為各種前臺業務進行賦能,以便支撐它們進行快速試錯、快速決策和能力提升。
在紛繁復雜的技術中臺體系里,算法中臺和數據中臺是緊密聯系的。算法對于挖掘數據的內在規律并充分發揮數據的潛在價值有著決定性意義,而數據又決定了算法的效果上限,并且大部分算法的生產過程離不開數據計算平臺的有力支撐。由此可見,將算法中臺與數據中臺作為一個有機整體來進行技術規劃、技術建設和實際應用具有充足的合理性和非凡的現實意義,這既是許多知名互聯網公司的實踐方式,也是本書創作的初衷和意義。
我們在對 Google、Facebook、新浪微博及滴滴出行等多家世界知名互聯網企業的具體實踐進行總結的基礎上,圍繞算法與數據中臺的功能價值、構建思路、技術體系、實踐案例和應用前景進行了深入講解與剖析。我們建議并殷切希望讀者帶著思考來進行閱讀,從而形成自己對于中臺戰略以及算法與數據中臺的理解,并將書中符合自身需要的經驗復用到日常的工作、學習和研究當中。
本書內容
本書分為 3 大部分,共 9 章,全面介紹了算法與數據中臺的產生背景、技術體系和實踐案例。
第 1 章對互聯網企業的中臺戰略,特別是與算法技術和數據技術相關聯的技術中臺進行了背景分析和案例簡介,并闡明了算法與數據中臺的重要價值以及應用前景。
第 2 ~ 6 章對算法與數據中臺的技術體系進行了深入剖析,并圍繞基礎設施平臺、在線算法平臺、機器學習平臺、分布式數據庫平臺和大數據平臺這幾個核心的組成部分進行了詳盡的技術探討。
第 7 ~ 9 章選擇推薦系統、計算廣告和網約車平臺這三個經典的互聯網業務場景進行了案例分析,以便通過具體的應用實踐來加深讀者對于算法與數據中臺的理解。
目標讀者
? 互聯網行業,特別是從事個性化系統、計算廣告、大數據平臺及技術中臺建設的相關從業人員。作者希望本書能夠為業界同行帶來一定的感悟和啟發,并希望書中部分成功的實踐經驗可以因地制宜地被推廣和應用到更多的日常工作與研究當中。
? 對機器學習、深度學習、大數據和分布式計算感興趣且有一定理論基礎的讀者。本書可以幫助這類讀者對相關的技術要點和實施方案進行系統化的梳理,并引導他們對感興趣的技術話題進行深入學習。
? 計算機專業的高年級本科生、研究生和博士生。本書具有廣闊的技術視野且語言平實,有助于在校學生加深對計算機學科中的相關理論、技術和應用的理解,從而幫助他們構建一套較為完整的知識體系。
交流溝通
算法技術和數據技術的發展可謂日新月異、一日千里,而作者的精力和水平有限,因此本書內容難免有一些紕漏甚至錯誤。誠懇地邀請所有讀者將閱讀過程中所遇到的問題和困惑,以及建設性的改進意見反饋給我們,作者定當在力所能及的范圍內第一時間回復有價值的郵件信息。
誠懇致謝
成書過程是艱辛的,十分感謝在本書的創作和出版過程中給予幫助、支持和鼓勵的所有領導、同事、業界同行以及出版社的工作人員,祝大家心想事成。特別地,感謝毛鐳在審稿和校對過程中給予的幫助與支持。
詹盈
中國北京 / 美國紐約
2020 年 7 月
內容簡介:

本書作者依據在Google、Facebook、新浪微博及滴滴出行等中美一流互聯網公司的實際工作經歷,對算法技術、數據技術,以及圍繞它們進行的技術中臺建設實踐進行了全面的探討,并在此基礎上對信息流推薦、計算廣告及智能出行等核心互聯網業務進行了案例剖析。本書具有廣闊的技術視野,內容頗具深度,既適合互聯網行業的技術從業者閱讀,也適合計算機相關專業的高年級本科生、研究生閱讀。通過閱讀本書,讀者能加深對機器學習、深度學習、大數據、分布式系統及技術中臺等相關領域的認知與理解,并從中獲得一定的啟發和可借鑒的經驗。
目錄:

第1章 算法與數據中臺概述 1
1.1 中臺的背景和意義 1
1.2 算法與數據中臺的功能價值 3
1.3 算法與數據中臺的技術體系 4
1.4 算法與數據中臺的實踐場景 6
1.5 算法與數據中臺的應用前景 7
1.6 本章總結 8
第2章 中臺技術之基礎設施 10
2.1 研發效率系統 10
2.1.1 代碼組織和構建 11
2.1.2 代碼審查和任務管理 13
2.1.3 持續集成 15
2.1.4 通用壓測平臺 17
2.2 服務通信系統 19
2.2.1 跨進程通信框架 20
2.2.2 服務注冊與發現 21
2.2.3 服務治理 24
2.3 監控報警系統 25
2.3.1 通用系統架構 25
2.3.2 指標計算模型 26
2.3.3 開源解決方案 27
2.4 鏈路跟蹤系統 29
2.4.1 應用場景與設計目標 30
2.4.2 系統架構 30
2.5 本章總結 32
第3章 中臺技術之在線算法系統 33
3.1 物料檢索系統 34
3.1.1 倒排檢索 35
3.1.2 倒排索引實例 37
3.1.3 相似檢索 38
3.1.4 相似檢索實例 40
3.1.5 模型粗排 40
3.2 模型預估服務 41
3.2.1 整體架構 42
3.2.2 多框架支持 43
3.2.3 模型上線 44
3.2.4 在線預估 45
3.2.5 異構設備 46
3.2.6 性能優化 47
3.2.7 效果監控 49
3.3 策略機制引擎 50
3.3.1 整體架構 50
3.3.2 計算流解釋器 51
3.3.3 Lua 解釋器 52
3.4 集群管理平臺 53
3.4.1 多租戶架構 53
3.4.2 集群動態管理 54
3.4.3 集群性能監控 57
3.4.4 配置動態分發 59
3.5 效果評估系統 60
3.5.1 背景介紹 61
3.5.2 設計模式 61
3.5.3 系統架構 62
3.5.4 指標計算 64
3.6 本章總結 65
第4章 中臺技術之機器學習平臺 66
4.1 機器學習平臺簡介 66
4.1.1 機器學習的研發流程 67
4.1.2 機器學習的研發挑戰 69
4.1.3 機器學習的研發技術 69
4.2 傳統機器學習算法 73
4.2.1 線性算法 73
4.2.2 因子分解機算法 77
4.2.3 決策樹算法 81
4.3 深度學習算法 84
4.3.1 發展簡史 85
4.3.2 神經元模型 86
4.3.3 神經網絡模型 87
4.3.4 神經網絡的算法原理 88
4.4 模型框架基本原理 94
4.4.1 分布式計算架構 94
4.4.2 并行計算的同步機制 99
4.4.3 梯度更新算法 102
4.5 層結構的模型框架 108
4.5.1 Caffe 109
4.5.2 DistBelief 110
4.5.3 WBLEngine 112
4.5.4 小結 116
4.6 數據流結構的模型框架 116
4.6.1 TensorFlow 116
4.6.2 PyTorch 122
4.6.3 小結 126
4.7 復合結構的模型框架 126
4.7.1 場景特點 126
4.7.2 設計思路 127
4.7.3 架構與實現 128
4.7.4 性能優化 131
4.7.5 小結 132
4.8 機器學習平臺簡介 132
4.8.1 單業務線開發階段 132
4.8.2 平臺化建設階段 133
4.8.3 業界知名產品 134
4.9 新浪微博 WBL 機器學習平臺 135
4.9.1 用戶操作界面 136
4.9.2 管理中心 138
4.9.3 數據中心 140
4.9.4 調度中心 141
4.9.5 智能中心 144
4.9.6 模型中心 145
4.10 本章總結 147
第5章 中臺技術之分布式數據庫 148
5.1 分布式數據庫概述 148
5.1.1 SQL 數據庫 148
5.1.2 NoSQL 數據庫 149
5.1.3 NewSQL 數據庫 150
5.2 分布式數據庫技術 150
5.2.1 ACID 理論 151
5.2.2 CAP 理論 151
5.2.3 BASE 理論 153
5.2.4 數據分片策略 154
5.2.5 數據復制策略 157
5.2.6 Gossip 協議 158
5.2.7 分布式一致性協議 160
5.2.8 分布式事務協議 167
5.3 分布式數據庫產品 170
5.3.1 Redis 170
5.3.2 Google BigTable 170
5.3.3 Google Spanner 173
5.4 LaserDB 分布式數據庫 177
5.4.1 系統架構 178
5.4.2 數據模型 179
5.4.3 分片策略 180
5.4.4 批量加載 181
5.4.5 同步機制 182
5.4.6 高可用架構 184
5.4.7 高性能方案 185
5.5 LaserDB 應用案例分析 188
5.5.1 數據緩存 188
5.5.2 特征服務 189
5.5.3 向量存儲 190
5.5.4 樣本拼接 190
5.6 本章總結 191
第6章 中臺技術之大數據平臺 192
6.1 大數據平臺概述 192
6.1.1 大數據的特點 192
6.1.2 大數據平臺的技術棧 193
6.2 分布式協調系統 194
6.2.1 Google Chubby 195
6.2.2 Apache ZooKeeper 196
6.2.3 Consul 197
6.3 集群管理系統 199
6.3.1 Google Borg 200
6.3.2 Kubernetes 202
6.3.3 Apache YARN 203
6.4 分布式文件系統 205
6.4.1 Google GFS 205
6.4.2 Apache HDFS 207
6.4.3 Dropbox MagicPocket 209
6.5 消息管道系統 210
6.5.1 Google PubSub 211
6.5.2 Apache Kafka 213
6.6 分布式計算系統 214
6.6.1 MapReduce 214
6.6.2 Apache Spark 216
6.6.3 Apache Flink 218
6.6.4 Apache Beam 220
6.7 數據倉庫與分布式查詢系統 221
6.7.1 Google BigQuery 222
6.7.2 Apache Hive 223
6.7.3 Facebook Presto 224
6.7.4 Facebook Scuba 226
6.8 本章總結 227
第7章 中臺實踐之推薦系統 228
7.1 推薦系統的背景簡介 228
7.1.1 場景概況 229
7.1.2 整體架構 230
7.1.3 推薦思路 233
7.2 推薦系統的算法模型 235
7.2.1 GBDT-LR 融合模型 235
7.2.2 Wide & Deep 模型 237
7.2.3 DeepFM 模型 238
7.2.4 雙塔模型 238
7.2.5 多任務模型 239
7.2.6 算法的發展趨勢 241
7.3 推薦系統的效果度量 244
7.3.1 體驗指標 244
7.3.2 算法指標 245
7.4 Facebook 信息流推薦簡介 250
7.4.1 數據分發系統 251
7.4.2 特征服務 252
7.4.3 索引系統 254
7.4.4 預估與排序服務 255
7.4.5 實時樣本拼接服務 256
7.4.6 模型訓練平臺 257
7.5 本章總結 258
第8章 中臺實踐之數字廣告 259
8.1 數字廣告的背景簡介 259
8.1.1 核心概念 260
8.1.2 合約廣告 261
8.1.3 競價廣告 262
8.1.4 程序化交易廣告 263
8.2 數字廣告系統架構 264
8.2.1 業務平臺 265
8.2.2 算法與數據中臺 265
8.3 數字廣告系統中的數據管理 266
8.3.1 站內數據 267
8.3.2 站外數據 267
8.4 數字廣告系統中的受眾定向 268
8.4.1 內容定向 268
8.4.2 用戶標簽定向 269
8.4.3 定制化標簽定向 269
8.4.4 社交關系定向 270
8.4.5 智能定向 270
8.5 數字廣告系統中的策略機制 270
8.5.1 流量預測 271
8.5.2 在線分配 271
8.5.3 頻次控制 272
8.5.4 平滑投放 272
8.5.5 探索策略 273
8.5.6 智能出價 274
8.5.7 廣告競價 276
8.5.8 反作弊機制 277
8.6 本章總結 277
第9章 中臺實踐之網約車平臺 278
9.1 業務簡介 279
9.1.1 業務背景 279
9.1.2 運作流程 281
9.1.3 用戶體驗 281
9.2 技術架構 282
9.2.1 分層系統架構 282
9.2.2 業務中臺 283
9.2.3 算法與數據中臺 285
9.3 打車定價場景 286
9.3.1 場景描述 286
9.3.2 價格動態下浮策略 287
9.3.3 價格動態上浮策略 289
9.3.4 小結 290
9.4 打車排隊場景 290
9.4.1 場景描述 290
9.4.2 排隊時間預估策略 291
9.4.3 小結 292
9.5 打車安全場景 292
9.5.1 場景描述 292
9.5.2 安全策略 293
9.5.3 小結 294
9.6 本章總結 294
參考文獻 295
序: