-- 會員 / 註冊 --  
 帳號:
 密碼:
  | 註冊 | 忘記密碼
3/26 新書到! 3/19 新書到! 3/14 新書到! 12/12 新書到!
購書流程Q & A站務留言版客服信箱
3ds MaxMayaRhinoAfter EffectsSketchUpZBrushPainterUnity
PhotoShopAutoCadMasterCamSolidWorksCreoUGRevitNuke
C#CC++Java遊戲程式Linux嵌入式PLCFPGAMatlab
駭客資料庫搜索引擎影像處理FluentVR+ARANSYS深度學習
單晶片AVROpenGLArduinoRaspberry Pi電路設計CadenceProtel
HadoopPythonStm32CortexLabview手機程式AndroidiPhone
可查書名,作者,ISBN,3dwoo書號
詳細書籍分類

大數據時代的算法:機器學習、人工智能及其典型實例

( 簡體 字)
作者:劉凡平類別:1. -> 程式設計 -> 大數據
   2. -> 程式設計 -> 機器學習
   3. -> 程式設計 -> 人工智慧
譯者:
出版社:電子工業出版社大數據時代的算法:機器學習、人工智能及其典型實例 3dWoo書號: 45942
詢問書籍請說出此書號!

缺書
NT售價: 245

出版日:1/1/2017
頁數:220
光碟數:0
站長推薦:
印刷:黑白印刷語系: ( 簡體 版 )
加入購物車 加到我的最愛
(請先登入會員)
ISBN:9787121304293
作者序 | 譯者序 | 前言 | 內容簡介 | 目錄 | 
(簡體書上所述之下載連結耗時費功, 恕不適用在台灣, 若讀者需要請自行嘗試, 恕不保證)
作者序:

譯者序:

前言:

致 謝
本書的內容來自于我對日常學習和工作的總結,我要感謝本人曾經的導師于炯教授、葉勇教授,以及在微軟和百度工作時的前輩王明雨、何紹建、黃誠,正是你們對我的悉心指導,才能使我有能力和勇氣寫出這本書,無論你們在哪里,凡平永遠心存感激。當然還有那些曾經一起學習的同學、共事的朋友,你們曾經給予我很多無私的幫助,使我在和你們相處的過程中能夠快速成長,感謝一路上有你們的陪伴,正是有你們,沿途的風景才格外美麗。
感謝英國的Peter Boden先生,雖然我們素未謀面,但是你卻一直支持我們團隊去實現自己的夢想,并連續兩年無償支持我們在Github開源社區的項目。在開源項目中,我們實現了不少有一定難度的算法,如果沒有你的支持,也許我們不能正常完成相關的研發任務,更不可能去挑戰搜索引擎中各類算法,尤其在人工智能領域的算法,對你的感激之情溢于言表。
感謝我的創業伙伴魏琪,當我提出我們一起研究人工智能技術時,你毫不猶豫地選擇了和我一起艱苦創業。無論處在創業的何種困難期,你總是為團隊加鼓氣,你踏實和認真的工作態度讓我欽佩不已,感謝你為本書的技術細節提出了真知灼見的修改意見,還有我一起工作的同學和朋友都對本書提出了改進意見,對此也表示深深的感謝。
感謝北京源智天下公司的吉老師及電子工業出版社的各位編輯,對本書的內容都給予了極大的幫助,對本書的出版也付出了辛苦汗水。
衷心感謝我的家人,感謝你們在過去一年中對我的理解和支持,為我營造了一個良好的寫作環境,并鼓勵我堅持認真寫作,使本書能夠順利完成。
本書編寫過程中還得到了很多朋友的支持和幫助,限于篇幅,雖然不能一一對你們表示感謝,但是我對你們一樣表示感激。
最后,感謝這個時代給予每位有理想的人,賦予實現人生價值的機會!




前 言
中國在很早就開始了算法研究,如《周髀算經》、《九章算術》這類最具歷史的算法書籍,以及后來的唐宋元明清各歷史朝代也出現了如《一位算法》、《算法緒論》、《算法全書》、《算法統宗》等一系列算法名著,算法已經成為各行各業的基礎研究。
本書通過介紹在互聯網行業中經常涉及的算法包括排序算法、查找算法、資源分配算法、路徑分析算法、相似度分析算法,以及與機器學習相關的算法包括分類算法、聚類算法、預測與估算算法、決策算法、關聯規則分析算法及推薦算法。本書是一本算法領域內的技術手冊,涵蓋數十種算法,不僅使讀者深入了解各類算法的基本理論,還從應用的角度為讀者提供大量實例,使讀者能夠快速、高效進階各類算法,并能夠熟練應用到將來的工作實踐中。
本書特色
本書不僅將目前工程應用中主流的基礎算法和機器學習算法都做了詳盡的介紹,還囊括了當前熱門算法內容,如分類算法、聚類算法、推薦算法等。本書充分利用了最新算法的應用研究結果,從實例的角度為讀者展現一個清晰的算法應用,不拘泥于算法枯燥的理論,更多地從實用價值、工程價值的角度呈現給讀者。
本書中的算法可以廣泛應用于各個領域,可以在自然語言處理研究、數據分析與挖掘、商務智能、廣告與商品推薦等領域中深入應用。作者秉承數據結合算法產生價值的理論體系,在介紹算法的同時與數據緊密關聯,并結合多年實際工作經驗,將算法的內容闡述淋漓盡致。本書中的算法研究在當前甚至未來相當一段時間內都具有很高的實際意義。
本書結構
本書按照由淺入深、循序漸進的順序對現代搜索引擎原理和實現進行介紹。全書共分為兩大部分,共十個章節。第一部分主要針對基礎領域算法的介紹和應用,包含第1章到第4章;第二部分主要針對機器學習領域算法的理論認識和實例解析,包含第5章到第10章。全書各章的主要內容如下。
第1章 算法基礎
本章從算法的分析類型,如從分治法、動態規劃、回溯法、分支限界法、貪心法,入手開始介紹算法內容,不僅如此還分析了算法的性能,并介紹了概率論與數理統計基礎部分的內容。同時,還對算法中常用的距離計算算法、排序算法及字符串壓縮編碼也做了完整介紹。
第2章 數據查找與資源分配算法
本章以數據的查找和資源分配作為突破口,介紹了常用的數值查找算法,如二分查找算法、分塊查找及哈希查找算法。除此之外,還介紹了常見的字符串查找算法及在海量數據中的查找算法:布隆過濾器和倒排索引查找。介紹了資源分配算法,包括常用的銀行家算法和背包問題的解決算法。
第3章 路徑分析算法
本章介紹的內容主要集中在路徑規劃算法上,包括基于Dijkstra算法、Floyd算法、A*算法的路徑分析方法。除了介紹傳統的路徑規劃算法外,還介紹了維特比算法在概率中的路徑選擇,以及最長公共子串、最長公共子序列問題的求解算法。整個內容涵蓋了絕大部分的路徑選擇算法。
第4章 相似度分析算法
本章介紹的內容主要集中在相似內容的分析理論和應用,從簡單的Jaccard相似系數開始入手,逐步深入到MinHash相似性算法,以及后續的向量空間模型,向量空間模型已經成為眾多算法的基礎理論。后續還深入介紹了余弦相似性算法和基于語義主題模型的語義相似度計算方法,以及基于SimHash的指紋碼重復值驗證算法。
第5章 數據分類算法
本章集中介紹了數據分類算法的解決方案,從簡單易于理解的樸素貝葉斯模型開始,由淺入深地介紹AdaBoost分類器及支持向量機,它們都是數據分類的有效解決方案,還對機器學習的相關基礎知識做了概要介紹。最后還介紹了K鄰近算法在數據分類中的應用。
第6章 數據聚類算法
本章介紹了數據聚類的相關算法,其中,無監督的聚類算法目前是研究比較熱門的領域。首先介紹了傳統的基于系統聚類的方法;然后介紹了基于距離計算的K-Means聚類算法及基于密度的DBSCAN算法;最后還介紹了基于BIRCH算法的聚類分析,通過聚類特征及聚類特征實現數據聚類。
第7章 數據預測與估算算法
本章介紹了數據的預測和估算的算法體系和應用范例,從產生式模型和判別式模型入手介紹各類模型的方法論。首先介紹了基于最大似然估計的預測算法,以及基于線性回歸的方法、最大期望算法;然后介紹了基于隱馬爾科夫模型的問題預測模型;最后介紹了基于隱馬爾科夫模型的條件隨機場模型。
第8章 數據決策分析算法
本章對數據決策的分析方法做了詳細介紹,主要圍繞決策樹的理論基礎展開介紹。首先介紹了基于ID3算法的決策樹分析,包括信息熵、信息增益等;然后介紹了基于ID3算法擴展的C4.5算法及分類回歸樹模型;最后還介紹了隨機森林在決策分類中的應用。介紹過程中包含了大量實例。
第9章 數據關聯規則分析算法
本章主要介紹了關聯規則分析方法的理論和實踐。Apriori算法作為最常用的關聯規則分析算法已經被廣泛應用到各個領域,本章也對Apriori算法進行了深入的介紹,并對和Apriori算法同等重要的FP-Growth算法也通過實例做了詳細介紹。本章最后還介紹了利用倒排文件思想的Eclat算法。
第10章 數據與推薦算法
本章主要介紹了數據與推薦算法中的應用關系,推薦算法作為目前各行各業最熱門的算法之一,已經應用非常廣泛。本章介紹了基于物品本身屬性關系的Item-Based協同過濾推薦算法,以及基于人群的User-Based協同過濾推薦算法。除此之外,還介紹了基于流行度和潛在因子的推薦算法,以及推薦算法的效果評估相關內容。
本書通過對數據與算法相關理論介紹和應用,將理論和實際應用結合,并闡述了各個算法的應用場景及算法復雜度,使讀者對算法的理解不僅停留在表面。由淺入深地將基礎算法和機器學習算法成熟應用到各個領域,達到游刃有余的狀態。但因為每個算法都存在一定的缺點,所以希望讀者能充分了解、掌握各個算法,將算法的作用發揮到極致。
除此之外,讀者也能夠從本書中快速、高效地從大量數據中找出所需要的數據或其他信息,這在大數據時代起到了非常重要的作用,給讀者帶來極大的便利。
讀者對象
? 適合對基本算法和機器學習算法有興趣的讀者。
? 適合于對數據分析和統計學有興趣的讀者。
? 適合于對算法有研究的基礎算法、機器學習工程師。
? 適合互聯網行業的不同層次從業者。
? 適合于在校學習的軟件或計算機專業的大學生。
內容簡介:

本書介紹在互聯網行業中經常涉及的算法,包括排序算法、查找算法、資源分配算法、路徑分析算法、相似度分析算法,以及與機器學習相關的算法,包括數據分類算法、聚類算法、預測與估算算法、決策算法、關聯規則分析算法及推薦算法。本書涉及的相關算法均為解決實際問題中的主流算法,對于工作和學習都有實際參考意義。本書是一本算法領域內的技術參考書籍,涵蓋數十種算法,通過由淺入深的介紹基礎算法和機器學習算法相關理論和應用,闡述了各個算法的應用場景及算法復雜度,使讀者對算法的理解不只是停留在表面,還從應用的角度提供了大量實例,使讀者能夠快速、高效進階各類算法,并能夠熟練應用到將來的工作實踐中。

目錄:

第1章 算法基礎 1
1.1 基礎算法分析類型 1
1.1.1 分治法 1
1.1.2 動態規劃法 2
1.1.3 回溯法 3
1.1.4 分支限界法 4
1.1.5 貪心法 4
1.2 算法性能分析 5
1.3 概率論與數理統計基礎 6
1.4 距離計算 8
1.4.1 歐氏距離 8
1.4.2 馬氏距離 9
1.4.3 曼哈頓距離 9
1.4.4 切比雪夫距離 9
1.4.5 閔氏距離 9
1.4.6 海明距離 10
1.5 排序算法 10
1.5.1 快速排序 11
1.5.2 歸并排序 11
1.5.3 堆排序 13
1.5.4 基數排序 15
1.5.5 外排序 16
1.6 字符壓縮編碼 17
1.6.1 哈夫曼編碼 17
1.6.2 香農-范諾編碼 21
1.7 本章小結 24
第2章 數據查找與資源分配算法 25
2.1 數值查找算法 25
2.1.1 二分搜索算法 25
2.1.2 分塊查找 27
2.1.3 哈希查找 28
2.2 字符串查找算法 30
2.2.1 Knuth-Morris-Pratt算法 31
2.2.2 Boyer-Moore算法 34
2.2.3 Sunday算法 37
2.3 海量數據中的查找 39
2.3.1 基于布隆過濾器查找 39
2.3.2 倒排索引查找 41
2.4 銀行家算法 43
2.5 背包問題 45
2.5.1 0-1背包問題 45
2.5.2 部分背包問題 47
2.6 本章小結 47
第3章 路徑分析算法 49
3.1 基于Dijkstra算法的路徑分析 49
3.1.1 應用示例:極地探險 49
3.1.2 基于Dijkstra的最短路徑規劃 50
3.2 基于Floyd算法的路徑分析 53
3.2.1 應用示例:任意兩個城市之間的最短路徑 53
3.2.2 Floyd原理 54
3.2.3 基于Floyd算法計算兩個城市最短距離 56
3.3 基于A*算法的路徑搜索 58
3.3.1 應用實例:繞過障礙區到達目的地 58
3.3.2 A*算法與最短距離計算 59
3.4 基于維特比算法的概率路徑 61
3.4.1 應用實例:推斷天氣狀態 61
3.4.2 維特比算法思想 62
3.4.3 計算天氣狀態 62
3.5 最長公共子序列問題 64
3.5.1 概要 64
3.5.2 最長公共子串 64
3.5.3 最長公共子序列原理 66
3.5.4 實例:求兩字符串的最長公共子序列 66
3.6 本章小結 68
第4章 相似度分析算法 69
4.1 應用實例:海量網頁相似度分析 69
4.2 基于Jaccard相似系數的相似度計算 70
4.2.1 計算流程 70
4.2.2 狹義Jaccard相似系數 71
4.2.3 廣義Jaccard相似系數 71
4.3 基于MinHash的相似性算法 71
4.3.1 與Jaccard相似性關系 71
4.3.2 計算網頁文本相似性過程 72
4.4 向量空間模型 73
4.4.1 詞袋模型 73
4.4.2 TF-IDF算法 74
4.5 基于余弦相似性算法的相似度分析 76
4.5.1 原理基礎 76
4.5.2 公式解析 77
4.5.3 計算網頁文本相似性過程 77
4.6 基于語義主題模型的相似度算法 78
4.7 基于SimHash算法的指紋碼 80
4.7.1 SimHash引入 81
4.7.2 SimHash的計算流程 81
4.7.3 計算重復信息 83
4.8 相似度算法的差異性 84
4.9 本章小結 85
第5章 數據分類算法 86
5.1 基于樸素貝葉斯分類器 86
5.1.1 有監督分類與無監督分類 87
5.1.2 應用實例:識別車厘子與櫻桃 88
5.1.3 分類流程歸納 91
5.1.4 應用擴展:垃圾郵件識別 92
5.1.5 常用評價指標 96
5.2 基于AdaBoost分類器 100
5.2.1 AdaBoost概述 100
5.2.2 AdaBoost算法具體流程 101
5.2.3 AdaBoost算法的應用實例 102
5.2.4 AdaBoost算法的優點 105
5.3 基于支持向量機的分類器 105
5.3.1 線性可分與線性不可分 106
5.3.2 感知器 107
5.3.3 支持向量機 108
5.4 基于K鄰近算法的分類器 109
5.4.1 應用實例:電影觀眾興趣發現 109
5.4.2 核心思想 109
5.4.3 電影觀眾興趣發現 110
5.5 本章小結 113
第6章 數據聚類算法 115
6.1 采用系統聚類法 115
6.1.1 概述 116
6.1.2 最短距離法 117
6.1.3 重心聚類法 119
6.1.4 動態聚類法 120
6.2 基于K-Means聚類算法 122
6.2.1 應用實例:新聞聚類 122
6.2.2 邏輯流程 123
6.2.3 實現新聞聚類分析 124
6.2.4 K-Means++ 128
6.2.5 K-中心點聚類算法 129
6.2.6 ISODATA聚類算法 130
6.3 基于密度的DBSCAN算法 131
6.4 基于BIRCH算法的聚類分析 133
6.4.1 聚類特征 133
6.4.2 聚類特征樹 134
6.5 聚類與分類差異 135
6.6 本章小結 136
第7章 數據預測與估算算法 137
7.1 產生式模型與判別式模型 137
7.2 基于最大似然估計的預測 138
7.3 基于線性回歸的估算 140
7.3.1 概要 140
7.3.2 最小二乘法 141
7.4 基于最大期望算法分析 143
7.5 基于隱馬爾科夫模型預測 144
7.5.1 應用實例:高溫天氣與行為概率 144
7.5.2 原理分析 145
7.5.3 高溫天氣與行為概率 147
7.6 基于條件隨機場的序列預測 151
7.6.1 應用實例 151
7.6.2 原理分析 151
7.6.3 條件隨機場的優缺點 153
7.7 本章小結 154
第8章 數據決策分析算法 155
8.1 基于ID3算法的決策分析 156
8.1.1 信息量 156
8.1.2 信息熵 156
8.1.3 信息增益 157
8.1.4 ID3算法流程 157
8.1.5 ID3算法的應用 157
8.2 基于C4.5算法的分類決策樹 159
8.2.1 概要 159
8.2.1 應用實例 159
8.3 基于分類回歸樹的決策劃分 161
8.3.1 概要 162
8.3.2 應用實例:決策劃分 163
8.3.2 剪枝 164
8.4 基于隨機森林的決策分類 168
8.4.1 隨機森林的特點 169
8.4.2 隨機森林的構造方法 169
8.4.3 應用實例:決定車厘子的售價層次 170
8.5 本章小結 172
第9章 數據關聯規則分析算法 174
9.1 基于Apriori算法的關聯項分析 174
9.1.1 應用實例:超市的貨架擺放問題 175
9.1.2 基本概要 175
9.1.3 算法原理 176
9.1.4 有效擺放貨架 176
9.2 基于FP-Growth算法的關聯性分析 179
9.2.1 構建FP樹 179
9.2.2 頻繁項分析 181
9.2.3 與Apripri算法比較 184
9.3 基于Eclat算法的頻繁項集挖掘 184
9.4 本章小結 185
第10章 數據與推薦算法 187
10.1 概要 187
10.1.1 推薦算法發展 188
10.1.2 協同過濾推薦 189
10.2 基于Item-Based協同過濾推薦 190
10.2.1 Item-Based基本思想 190
10.2.2 Slope One實例:基于評分推薦 190
10.3 基于User-Based協同過濾推薦 193
10.3.1 應用實例:根據人群的推薦 194
10.3.2 User-Based與Item-Based對比 197
10.4 基于潛在因子算法的推薦 198
10.4.1 應用實例:新聞推薦 198
10.4.2 流行度與推薦 200
10.5 推薦算法與效果評價 201
10.6 本章小結 203
序: