-- 會員 / 註冊 --  
 帳號:
 密碼:
  | 註冊 | 忘記密碼
3/26 新書到! 3/19 新書到! 3/14 新書到! 12/12 新書到!
購書流程Q & A站務留言版客服信箱
3ds MaxMayaRhinoAfter EffectsSketchUpZBrushPainterUnity
PhotoShopAutoCadMasterCamSolidWorksCreoUGRevitNuke
C#CC++Java遊戲程式Linux嵌入式PLCFPGAMatlab
駭客資料庫搜索引擎影像處理FluentVR+ARANSYS深度學習
單晶片AVROpenGLArduinoRaspberry Pi電路設計CadenceProtel
HadoopPythonStm32CortexLabview手機程式AndroidiPhone
可查書名,作者,ISBN,3dwoo書號
詳細書籍分類

機器學習互聯網業務安全實踐

( 簡體 字)
作者:王帥,吳哲夫類別:1. -> 程式設計 -> 機器學習
譯者:
出版社:電子工業出版社機器學習互聯網業務安全實踐 3dWoo書號: 51741
詢問書籍請說出此書號!

有庫存
NT售價: 640

出版日:9/1/2019
頁數:512
光碟數:0
站長推薦:
印刷:黑白印刷語系: ( 簡體 版 )
加入購物車 加到我的最愛
(請先登入會員)
ISBN:9787121355684
作者序 | 譯者序 | 前言 | 內容簡介 | 目錄 | 
(簡體書上所述之下載連結耗時費功, 恕不適用在台灣, 若讀者需要請自行嘗試, 恕不保證)
作者序:

譯者序:

前言:

推薦序一
2016年3月,AlphaGo戰勝李世石,人工智能一下子又成為被廣泛討論的熱門話題。這兩年人工智能發展得非常快,深度學習為語音、文本和圖像處理帶來了很多突破。機器學習在各種業務場景中有很重要的應用價值。市面上介紹機器學習的書有不少,介紹互聯網業務安全的書也有一些,但是介紹機器學習在互聯網業務安全領域實踐的書,并不多。
本書開篇概述了互聯網業務安全的內涵,接著就進入正題介紹機器學習的內容,從機器學習的入門知識到模型再到具體工程的實施,讓缺少相關經驗的讀者能夠比較容易地順著這個思路了解對應內容。后面的章節更多的是圍繞具體業務安全工作而展開的,內容十分豐富。更重要的是,這些都是兩位作者在實際業務場景中的實戰經驗的總結。從我個人的角度看,這些在業務場景中積累的經驗更加寶貴,就好比是真的上了戰場而且打了勝仗的高手所分享的經驗,彌足珍貴。
希望本書能夠給讀者帶來更多的幫助。
——曾憲杰 蘑菇街副總裁

推薦序二
當我突然收到王帥同學的《機器學習互聯網業務安全實踐》初稿時,既感到驚訝也感到佩服。驚訝的是,在我印象中還是個毛頭小伙子的他,已經能拿著自己的著作出現在我面前。佩服的是,寫書畢竟是一件非常繁雜辛苦的事情,王帥同學雖然研究生畢業才5年,但卻有勇氣也樂意在繁忙的工作之余,花功夫將理論知識和自己的實踐經驗總結成書,造福讀者。
回想起來,王帥讀研期間一直都是一位發展全面、表現優秀的學生。學習成績好,自不必說,他是2010年從哈爾濱工業大學保送到華中科技大學圖像所(2013年已與自控系合并為自動化學院)讀研的,讀研期間課程成績名列前茅。最突出的是他的科研動手能力,那段時間我們剛好承擔了一項國家工程的關鍵技術攻關任務,由于問題的特殊性,幾乎沒有可參考借鑒的資料,而且時間緊、任務重,王帥作為主力承擔了其中的兩項研究工作,均圓滿完成任務,得到單位的好評。另一方面,王帥還是當時圖像所研究生會的主席,積極為同學服務,把所里的學生工作開展得有聲有色,除了組織日常的學術交流活動,文體活動也舉辦得豐富多彩,拿了學校不少的獎,很有影響力。
這幾年,人工智能在媒體的高度關注下熱度爆棚,技術發展極為迅速,新思想、新方法、新算法層出不窮,應用領域也在不斷擴大。如果僅靠在學校學習的知識,顯然是不能適應這個領域日新月異的發展的,每一個技術人員在工作中都必須有很強的自學能力,不斷提高自身素質,才能跟上技術發展的步伐。顯然,王帥做到了不斷學習、不斷進步。他能寫這本書就是最好的證明。
這本書的意義不僅僅在于王帥同學對自己的前期工作做了很好的總結,更重要的是,業務安全是一個充滿激烈對抗的領域,如何應對黑灰產對互聯網平臺的攻擊是每一位相關技術從業者都需要思考的問題,本書對于那些剛入職場、剛進入業務安全領域的新人來說,具有很強的指導意義,能讓他們很快將書本知識和實際應用相連接,盡快達到工作要求。當然,這本書將機器學習理論與業務安全相結合,也能讓這個領域的從業者受到啟發,具有“拋磚引玉”的作用。
最后,希望王帥同學戒驕戒躁,繼續努力,為機器學習在業務安全領域中的應用做出更多貢獻。
——曹治國 教授,華中科技大學自動化學院院長

序言一
寫下本文的此刻,我正坐在從杭州前往北京的G40次列車上,準備參加第二天在北京理工大學舉辦的MLA 2017會議。北京是我開始參加工作的地方,也是我第一次實習的地方,對于北京,我是很有感情的。而對于杭州,則懷著難以名狀的情愫,從古至今,無數文人墨客在此留下印記,其中李叔同先生的“未能拋得杭州去,一半勾留是此湖”給我的印象最為深刻。所以2015年春節后,我毅然從百度離開加入蘑菇街(現在的美麗聯合集團,簡稱美聯),在反作弊團隊工作。工作的方向也從搜索算法策略轉到了業務安全算法策略。我們的團隊從最初僅有反作弊相關算法策略,到現在機器學習算法能夠服務于主要的業務安全場景,算法技術的迭代與優化歷經了近3年的時間。雖然與BATJ等巨頭相比,我們的體量還有較大的差距,但是“麻雀雖小,五臟俱全”,當前我們的業務安全算法策略體系基本涵蓋了統計機器學習方法、深度學習方法和復雜網絡的相關算法。
在2018年51CTO組織的WOT峰會 和唯品會組織的城市沙龍上海站 中,我們的團隊都分享了在美聯業務安全場景中使用機器學習方法的一些心得體會和實踐經驗,收到了較好的反響。在會議期間,我們和同行們針對當前所面臨的問題做了深入的交流。而我個人也在CSDN的博客上發表文章,剖析和分享生產環境中涉及的一些算法原理知識。正是因為這些文章,電子工業出版社的張春雨先生輾轉找到我,希望我能寫一本關于如何在業務安全中應用機器學習的書籍。說實話,一開始我是非常“緊張”的,一是考慮到業務安全的范圍實在太大,自己平時接觸的工作還是有一定的局限的;二是機器學習這個領域內的經典圖書很多,李航博士的《統計學習方法》和周志華老師的《機器學習》(俗稱“西瓜書”)都廣受好評,我來寫書豈不是班門弄斧?而與張春雨先生深入溝通后,我逐漸打消了顧慮,也明確了本書的定位。
幸運的是,我們團隊內新加入的蓋世(花名)同學對于此事非常感興趣,再加上其個人在機器學習領域也積累了不少經驗,所以我們一拍即合,欣然接受了張春雨先生的邀請,決定為互聯網業務安全中的機器學習技術做一點小小的貢獻。
本書旨在為工程技術人員提供一份在業務安全中實踐機器學習技術的入門指南,內容包括業務的背景、機器學習算法的原理、算法的實現與優化,以及在生產環境中算法的上線與迭代方法。如果我們踩過的“坑”和積淀的經驗能夠為相關從業者帶來一些啟發,我們就心滿意足了。
此時列車剛開過濟南西站,窗外已經是茫茫黑夜,正如黑灰產和“羊毛黨”們所處的隱蔽之處。與這些不法分子對抗是業務安全從業者的職責,而機器學習技術也許就是劃破這黑暗的一束光,為我們贏得勝利帶來可能。希望此書可以讓這束光愈加明亮。
——王帥

序言二
作為一個科班出身的計算機從業人員,深知在機器學習領域摸爬滾打的不易。在山東大學學習期間,我學的是軟件工程,對編程有濃厚的興趣,陳竹敏老師認可我的才能,并讓我參加與美國得克薩斯州大學的合作項目,還推薦我繼續讀研究生。在讀研的兩年期間,北大的楊雅輝老師對我的學習給予了極多的指導。后來,我又跟隨微軟亞洲研究院的袁進輝老師學習,收獲良多,從一個動手能力極弱的“小白”成長為能熟練編寫代碼的機器學習工程師。現在從業三年,也指導了許多學弟、學妹進入職場,希望自己也能像我的老師們一樣無私地傳授知識。
回想自己學習機器學習的經歷,感慨良多。本科畢業時,盡管已經學習了《微積分》《線性代數》《離散數學》《數理統計》《計算機組成原理》《編譯原理》《操作系統》《算法導論》《運籌學》等教材,我卻并沒有見到這些本應有極高價值的書本知識在實際工作中發揮多大的作用,因此十分迷茫。當時陳竹敏老師推薦我繼續深造,從此折節讀書,半載后來到夢寐以求的學府——北京大學。感謝我的室友,他們的專業(自然語言處理和機器學習)對我產生了極大的影響,也終于看到了自己投入時間學習的課程知識能夠發揮的價值。為了不至于落后周圍人太多,我深居簡出,自學了《數值分析》《測度論》《代數》《統計學》《貝葉斯統計》《圖論》《矩陣論》《凸優化》等教材,并且了解與學習了衍生的應用學科知識,研讀《機器學習》《密碼學》《應用回歸分析》《組合數學》等書籍。工作以后,雖然有很多想要深入學習的細分理論知識,買了《實變函數與泛函分析》《博弈論》《拓撲學》等圖書,但是一直苦于沒有足夠的時間,這些書籍已經在書架上落灰了。
上面羅列了一些教材,其實是想給在校的學生朋友學習機器學習提供一個書單。當然,紙上學來終覺淺,絕知此事要躬行,任何理論知識只有在實際場景中應用或實驗,才能加深理解。
作為一個機器學習領域的新人,我也在不斷認真學習機器學習的理論,希望能夠在工作中充分應用所學知識。我曾在傳統行業工作,后來進入大數據領域,在電商行業摸爬滾打。我覺得人應該腳踏實地,無論身處何種行業,都應該在一個專業領域深入地學習。現在,我已經是一個父親,肩上的責任越來越重,但是我十分感恩。感謝家人,讓我學會了真誠待人,享受生活中的一切美好。
——吳哲夫

前言
機器學習學科的發展大體經歷了規則學習、統計學習、深度學習這三大階段。從最早的結構化的人機賽棋,到廣泛領域的知識問答,再到當下紅極一時的自動駕駛等工業領域,機器學習已經被成功應用到模式識別、數據挖掘、自然語言處理、人工智能、語音識別、圖像識別等各個領域,并且被綜合應用到信息檢索、生物信息技術、自動駕駛、無人機、AR/VR、醫療、教育等各個行業。
機器學習的很多方法在原理上是相通的,只不過適用的領域不同。機器學習的能力比較強大,應用范圍廣泛,要解決的問題多且繁雜,因此并不存在一個適用于所有問題的結構化方法。這就要求機器學習工程師具備較高的素質,除了掌握計算機科學基礎的三個方面的知識(系統、軟件、理論),還要對機器學習算法有深入的了解,只有這樣才可以搭建出一個適用于工業界應用的好框架。
基礎決定深度。一般來講,機器學習由模型(建模)、策略(學習方法)、算法(實現)三部分組成,叫作機器學習三要素。這三部分層層遞進,推理的難度逐漸增加,對人的要求也不一樣:在建模過程中需要有理解能力,在設計學習方法時需要有數學推理能力,最終將學習方法實現為算法時需要有轉化能力。當然,一些資深的程序員或者ACM(Association for Computing Machinery)競賽的參賽者,本身有非常強的代碼理解能力,這些能力能幫助他們理解算法,并進一步理解機器學習的過程。
要想成為一名優秀的機器學習工程師,必須有良好的數學基礎。在本科階段學習的數值分析、線性代數、概率與統計、離散數學等課程知識,對于理解大多數模型來說已經足夠了。概率與統計及離散數學是理解模型的基礎,線性代數決定了你實現算法的能力,數值分析決定了推衍過程。然而,如果希望更深入地理解模型算法的實現原理、掌握和學習更多的模型,還需要學習矩陣論、優化論、泛函分析、貝葉斯統計、模糊數學等方面的知識。
在工業界,很多時候大家只是使用模型,最低的要求就是理解模型的輸入、中間過程和輸出。要快速掌握并使用模型,關鍵在于理解模型的適用條件,這樣才能構造出符合模型要求的特征。客觀地講,并沒有不好的模型,只有沒有構造好的特征。這也牽扯到模型的適用性問題,有些任務可能非常難以轉化成模型最適用的問題,因為有時候如果強制使用某種模型,可能需要對于任務與特征本身有深刻的理解,以及長時間的浸淫。
很多時候,我們并不一定要選擇最合適的模型,究其原因:一是我們所選擇的模型可能并不需要特別復雜的轉化就可以用于此種問題;二是機器學習工程師不一定有時間對某個行業進行深入的分析和研究,提取出適用于模型的各種特征;三是強制使用某種模型可能會導致轉化問題本身就是一個復雜的問題,需要對結構進行大量修改以及在工程上提供支持。由于業界競爭激烈,有時候我們需要的是快速迭代,因此這時更關鍵的是選擇一個基本適用的模型,先驗證得到問題的可解性和baseline,然后再不斷優化。
本書適合那些從其他編程領域轉入機器學習領域的工程師閱讀,幫助他們快速掌握模型及其應用。本書假設讀者已掌握微積分、概率論、線性代數以及離散數學的基礎知識。書中簡單介紹了機器學習的基本概念及其背后的數學原理,以機器學習在業務安全領域的應用為線,詳細講解如何將機器學習應用到業務安全工作中,對一些模型的策略和算法進行了深入介紹。
本書第2章、第3章中的一些數學基礎知識(定義、原理等),引用自國內外名校采用的本科與研究生教材,筆者按照自己學習機器學習的路線對這些知識進行了編排,并統一了數學符號,方便大家快速了解或查詢。
限于篇幅,本書只列出必需的數學基礎知識,僅對某些定理給出了證明,并加入筆者的解釋,幫助大家理解。機器學習是一門與數學聯系十分緊密的學科,因此筆者更愿意用符號、公式和算法語言來介紹相應的內容,希望大家能通過定義理解函數,通過算法語言理解算法本身,培養看公式比看文字更高效的能力。希望大家能夠理解算法的原理,了解如何恰當地將機器學習應用到實際場景中,既拋出問題,又給出筆者積累的解決問題的思路。最后還要強調,數學是基礎,數學概念字字珠璣,請大家認真理解,在此基礎上你甚至能創造屬于自己的算法。
鑒于寫作時間倉促以及篇幅有限,書中有些地方的講解可能比較晦澀或者不夠全面,盡管筆者竭盡所能,有些疏漏也在所難免,希望大家能夠在發現問題后第一時間聯系筆者,筆者會在再版時更正,在此先表示感謝。下圖所示為機器學習算法工程師需要具備的技能樹。
內容簡介:

互聯網產業正在從IT時代邁入DT時代(數據時代),同時互聯網產業的繁榮也催生了黑灰產這樣的群體。那么,在數據時代應該如何應對互聯網業務安全威脅?機器學習技術在互聯網業務安全領域的應用正是答案。本書首先從機器學習技術的原理入手,自成體系地介紹了機器學習的基礎知識,從數學的角度揭示了算法模型背后的基本原理;然后介紹了互聯網業務安全所涉及的重要業務場景,以及機器學習技術在這些場景中的應用實踐;最后介紹了如何應用互聯網技術棧來建設業務安全技術架構。作者根據多年的一線互聯網公司從業經驗給出了很多獨到的見解,供讀者參考。本書既適合機器學習從業者作為入門參考書,也適合互聯網業務安全從業者學習黑灰產對抗手段,幫助他們做到知己知彼,了解如何應用機器學習技術來提高與黑灰產對抗的能力。
目錄:

第1章 互聯網業務安全簡述 1
1.1 互聯網業務安全現狀 1
1.2 如何應對挑戰 4
1.3 本章小結 6
參考資料 6
第2章 機器學習入門 8
2.1 相似性 9
2.1.1 范數 9
2.1.2 度量 12
2.2 矩陣 20
2.2.1 線性空間 20
2.2.2 線性算子 24
2.3 空間 33
2.3.1 內積空間 33
2.3.2 歐幾里得空間(Euclid space) 34
2.3.3 酉空間 37
2.3.4 賦范線性空間 38
2.3.5 巴拿赫空間 39
2.3.6 希爾伯特空間 43
2.3.7 核函數 44
2.4 機器學習中的數學結構 46
2.4.1 線性結構與非線性結構 46
2.4.2 圖論基礎 47
2.4.3 樹 56
2.4.4 神經網絡 62
2.4.5 深度網絡結構 80
2.4.6 小結 95
2.5 統計基礎 96
2.5.1 貝葉斯統計 96
2.5.2 共軛先驗分布 99
2.6 策略與算法 106
2.6.1 凸優化的基本概念 106
2.6.2 對偶原理 120
2.6.3 非線性規劃問題的解決方法 129
2.6.4 無約束問題的最優化方法 134
2.7 機器學習算法應用的經驗 145
2.7.1 如何定義機器學習目標 145
2.7.2 如何從數據中獲取最有價值的信息 149
2.7.3 評估模型的表現 154
2.7.4 測試效果遠差于預期怎么辦 156
2.8 本章小結 159
參考資料 160
第3章 模型 163
3.1 基本概念 163
3.2 模型評價指標 166
3.2.1 混淆矩陣 167
3.2.2 分類問題的基礎指標 167
3.2.3 ROC曲線與AUC 171
3.2.4 基尼系數 173
3.2.5 回歸問題的評價指標 175
3.2.6 交叉驗證 175
3.3 回歸算法 177
3.3.1 最小二乘法 177
3.3.2 脊回歸 181
3.3.3 Lasso回歸線性模型 181
3.3.4 多任務Lasso 181
3.3.5 L1、L2正則雜談 182
3.4 分類算法 183
3.4.1 CART算法 183
3.4.2 支持向量機 186
3.5 降維 188
3.5.1 貝葉斯網絡 189
3.5.2 主成分分析 195
3.6 主題模型LDA 198
3.6.1 馬爾可夫鏈蒙特卡羅法 198
3.6.2 貝葉斯網絡與生成模型 199
3.6.3 學習方法在LDA中的應用 206
3.7 集成學習方法(Ensemble Method) 215
3.7.1 Boosting方法 216
3.7.2 Bootstrap Aggregating方法 220
3.7.3 Stacking方法 221
3.7.4 小結 222
參考資料 223
第4章 機器學習實踐的基礎包 226
4.1 簡介 226
4.2 Python機器學習基礎環境 228
4.2.1 Jupyter Notebook 228
4.2.2 Numpy、Scipy、Matplotlib和pandas 231
4.2.3 scikit-learn、gensim、TensorFlow和Keras 250
4.3 Scala的基礎庫 266
4.3.1 Zeppelin 266
4.3.2 Breeze 267
4.3.3 Spark MLlib 276
4.4 本章小結 281
參考資料 282
第5章 機器學習實踐的金剛鉆 283
5.1 簡介 283
5.2 XGBoost 284
5.3 Prediction IO(PIO) 287
5.3.1 部署PIO 287
5.3.2 機器學習模型引擎的開發 294
5.3.3 機器學習模型引擎的部署 296
5.3.4 PIO系統的優化 297
5.4 Caffe 298
5.5 TensorFlow 304
5.6 BigDL 306
5.7 本章小結 308
參考資料 308
第6章 賬戶業務安全 310
6.1 背景介紹 310
6.2 賬戶安全保障 312
6.2.1 注冊環節 312
6.2.2 登錄環節 314
6.3 聚類算法在賬戶安全中的應用 315
6.3.1 K-Means算法 315
6.3.2 高斯混合模型(GMM) 317
6.3.3 OPTICS算法和DBSCAN算法 326
6.3.4 應用案例 331
6.4 本章小結 334
參考資料 334
第7章 平臺業務安全 335
7.1 背景介紹 335
7.2 電商平臺業務安全 338
7.3 社交平臺業務安全 343
7.4 復雜網絡算法在平臺業務安全中的應用 346
7.4.1 在電商平臺作弊團伙識別中的應用 346
7.4.2 在識別虛假社交關系中的應用 351
7.5 本章小結 353
參考資料 354
第8章 內容業務安全 355
8.1 背景介紹 355
8.2 如何做好內容業務安全工作 357
8.2.1 面臨的挑戰 357
8.2.2 部門協作 358
8.2.3 技術體系 359
8.3 卷積神經網絡在內容業務安全中的應用 361
8.3.1 人工神經網絡(Artificial Neural Network) 361
8.3.2 深度神經網絡(Deep Neural Network) 367
8.3.3 卷積神經網絡(Convolutional Neural Network) 379
8.3.4 應用案例 392
8.4 本章小結 405
參考資料 405
第9章 信息業務安全 406
9.1 背景介紹 406
9.2 反欺詐業務 407
9.3 反爬蟲業務 412
9.3.1 驗證問題的可分性 412
9.3.2 提升模型效果 413
9.4 循環神經網絡在信息安全中的應用 414
9.4.1 原始RNN(Vanilla RNN) 414
9.4.2 LSTM算法及其變種 415
9.4.3 應用案例 419
9.5 本章小結 429
參考資料 430

第10章 信貸業務安全 432
10.1 背景介紹 432
10.2 信貸業務安全簡介 434
10.3 分類算法在信貸業務安全中的應用 438
10.3.1 典型分類算法的介紹 438
10.3.2 應用案例:邏輯回歸模型在信貸中風控階段的應用 463
10.4 本章小結 468
參考資料 469
第11章 業務安全系統技術架構 470
11.1 整體介紹 470
11.2 平臺層 471
11.3 數據層 473
11.4 策略層 474
11.5 服務層 480
11.6 業務層 481
11.7 本章小結 484
參考資料 484
第12章 總結與展望 486
12.1 總結 486
12.2 展望 487
參考資料 489
后記一 490
后記二 491
本書常見數學符號定義 492
序: