|
-- 會員 / 註冊 --
|
|
|
|
數據挖掘與分析 概念與算法 ( 簡體 字) |
作者:[美]穆罕默德·扎基(Mohammed J. Zaki),[巴西]小瓦格納·梅拉 | 類別:1. -> 程式設計 -> 數據挖掘 |
譯者: |
出版社:人民郵電出版社 | 3dWoo書號: 47615 詢問書籍請說出此書號!【缺書】 NT售價: 645 元 |
出版日:8/1/2017 |
頁數:505 |
光碟數:0 |
|
站長推薦: |
印刷:黑白印刷 | 語系: ( 簡體 版 ) |
|
加入購物車 │加到我的最愛 (請先登入會員) |
ISBN:9787115458421 |
作者序 | 譯者序 | 前言 | 內容簡介 | 目錄 | 序 |
(簡體書上所述之下載連結耗時費功, 恕不適用在台灣, 若讀者需要請自行嘗試, 恕不保證) |
作者序: |
譯者序: |
前言: |
內容簡介: |
目錄:第1章 資料採擷與分析 1 1.1 數據矩陣 1 1.2 屬性 2 1.3 資料的幾何和代數描述 3 1.3.1 距離和角度 5 1.3.2 均值與總方差 8 1.3.3 正交投影 9 1.3.4 線性無關與維數 10 1.4 數據:概率觀點 12 1.4.1 二元隨機變數 17 1.4.2 多元隨機變數 20 1.4.3 隨機抽樣和統計量 21 1.5 資料採擷 22 1.5.1 探索性資料分析 23 1.5.2 頻繁模式挖掘 24 1.5.3 聚類 24 1.5.4 分類 25 1.6 補充閱讀 26 1.7 習題 26 第一部分 資料分析基礎 第2章 數值屬性 28 2.1 一元變數分析 28 2.1.1 數據居中度度量 29 2.1.2 數據離散度度量 32 2.2 二元變數分析 35 2.2.1 位置和離散度的度量 36 2.2.2 相關性度量 37 2.3 多元變數分析 40 2.4 資料規範化 44 2.5 正態分佈 46 2.5.1 一元正態分佈 46 2.5.2 多元正態分佈 47 2.6 補充閱讀 50 2.7 習題 51 第3章 類別型屬性 53 3.1 一元分析 53 3.1.1 伯努利變數(Bernoulli variable) 53 3.1.2 多元伯努利變數 55 3.2 二元分析 61 3.3 多元分析 69 3.4 距離和角度 74 3.5 離散化 75 3.6 補充閱讀 77 3.7 習題 78 第4章 圖數據 79 4.1 圖的概念 79 4.2 拓撲屬性 83 4.3 中心度分析 86 4.3.1 基本中心度 86 4.3.2 Web中心度 88 4.4 圖的模型 96 4.4.1 Erd s-Renyi隨機圖模型 98 4.4.2 Watts-Strogatz小世界圖模型 101 4.4.3 Barabasi-Albert無標度模型 104 4.5 補充閱讀 111 4.6 習題 112 第5章 核方法 114 5.1 核矩陣 117 5.1.1 再生核映射 118 5.1.2 Mercer核映射 120 5.2 向量核 122 5.3 特徵空間中的基本核操作 126 5.4 複雜物件的核 132 5.4.1 字串的譜核 132 5.4.2 圖節點的擴散核 133 5.5 補充閱讀 137 5.6 習題 137 第6章 高維數據 139 6.1 高維對象 139 6.2 高維體積 141 6.3 超立方體的內接超球面 143 6.4 薄超球面殼的體積 144 6.5 超空間的對角線 145 6.6 多元正態的密度 146 6.7 附錄:球面體積的推導 149 6.8 補充閱讀 153 6.9 習題 153 第7章 降維 156 7.1 背景知識 156 7.2 主成分分析 160 7.2.1 最優線近似 160 7.2.2 最優二維近似 163 7.2.3 最優r維近似 167 7.2.4 主成分分析的幾何意義 170 7.3 核主成分分析 172 7.4 奇異值分解 178 7.4.1 奇異值分解的幾何意義 179 7.4.2 奇異值分解和主成分分析之間的聯繫 180 7.5 補充閱讀 182 7.6 習題 182 第二部分 頻繁模式挖掘 第8章 項集挖掘 186 8.1 頻繁項集和關聯規則 186 8.2 頻繁項集挖掘演算法 189 8.2.1 逐層的方法:Apriori演算法 191 8.2.2 事務識別字集的交集方法:Eclat演算法 193 8.2.3 頻繁模式樹方法:FPGrowth演算法 197 8.3 生成關聯規則 201 8.4 補充閱讀 203 8.5 習題 203 第9章 項集概述 208 9.1 最大頻繁項集和閉頻繁項集 208 9.2 挖掘最大頻繁項集:GenMax演算法 211 9.3 挖掘閉頻繁項集:Charm演算法 213 9.4 非可導項集 215 9.5 補充閱讀 220 9.6 習題 221 第10章 序列挖掘 223 10.1 頻繁序列 223 10.2 挖掘頻繁序列 224 10.2.1 逐層挖掘:GSP 225 10.2.2 垂直序列挖掘:Spade 226 10.2.3 基於投影的序列挖掘:PrefixSpan 228 10.3 基於尾碼樹的子串挖掘 230 10.3.1 尾碼樹 230 10.3.2 Ukkonen線性時間演算法 233 10.4 補充閱讀 238 10.5 習題 239 第11章 圖模式挖掘 242 11.1 同形和支撐 242 11.2 候選生成 245 11.3 gSpan演算法 249 11.3.1 擴展和支撐計算 250 11.3.2 權威性測試 255 11.4 補充閱讀 256 11.5 習題 257 第12章 模式與規則評估 260 12.1 規則和模式評估的度量 260 12.1.1 規則評估度量 260 12.1.2 模式評估度量 268 12.1.3 比較多條規則和模式 270 12.2 顯著性核對總和置信區間 273 12.2.1 產生式規則的費希爾精確檢驗 273 12.2.2 顯著性的置換檢驗 277 12.2.3 置信區間內的自助抽樣 282 12.3 補充閱讀 284 12.4 習題 285 第三部分 聚類 第13章 基於代表的聚類 288 13.1 K-means 演算法 288 13.2 核K-means 292 13.3 期望最大聚類 295 13.3.1 一維中的EM 297 13.3.2 d維中的EM 300 13.3.3 極大似然估計 305 13.3.4 EM方法 309 13.4 補充閱讀 311 13.5 習題 312 第14章 層次式聚類 315 14.1 預備知識 315 14.2 聚合型層次式聚類 317 14.2.1 簇間距離 317 14.2.2 更新距離矩陣 321 14.2.3 計算複雜度 322 14.3 補充閱讀 322 14.4 習題 323 第15章 基於密度的聚類 325 15.1 DBSCAN 演算法 325 15.2 核密度估計 328 15.2.1 一元密度估計 328 15.2.2 多元密度估計 331 15.2.3 最近鄰密度估計 333 15.3 基於密度的聚類:DENCLUE 333 15.4 補充閱讀 338 15.5 習題 339 第16章 譜聚類和圖聚類 341 16.1 圖和矩陣 341 16.2 基於圖的割的聚類 347 16.2.1 聚類目標函數:比例割與歸—割 349 16.2.2 譜聚類演算法 351 16.2.3 最大化目標:平均割與模組度 354 16.3 瑪律可夫聚類 360 16.4 補充閱讀 366 16.5 習題 367 第17章 聚類的驗證 368 17.1 外部驗證度量 368 17.1.1 基於匹配的度量 369 17.1.2 基於熵的度量 372 17.1.3 成對度量 375 17.1.4 關聯度量 378 17.2 內部度量 381 17.3 相對度量 388 17.3.1 分簇穩定性 394 17.3.2 聚類趨向性 396 17.4 補充閱讀 400 17.5 習題 401 第四部分 分類 第18章 基於概率的分類 404 18.1 貝葉斯分類器 404 18.1.1 估計先驗概率 404 18.1.2 估計似然 405 18.2 樸素貝葉斯分類器 409 18.3 K最近鄰分類器 412 18.4 補充閱讀 414 18.5 習題 415 第19章 決策樹分類器 416 19.1 決策樹 417 19.2 決策樹演算法 419 19.2.1 分割點評估度量 420 19.2.2 評估分割點 422 19.3 補充閱讀 429 19.4 習題 429 第20章 線性判別分析 431 20.1 最優線性判別 431 20.2 核判別分析 437 20.3 補充閱讀 443 20.4 習題 443 第21章 支持向量機 445 21.1 支持向量和間隔 445 21.2 SVM:線性可分的情況 450 21.3 軟間隔SVM:線性不可分的情況 454 21.3.1 鉸鏈誤損 455 21.3.2 二次誤損 458 21.4 核SVM:非線性情況 459 21.5 SVM訓練演算法 462 21.5.1 對偶解法:隨機梯度上升 463 21.5.2 原始問題解:牛頓優化 467 21.6 補充閱讀 473 21.7 習題 473 第22章 分類的評估 475 22.1 分類性能度量 475 22.1.1 基於列聯表的度量 476 22.1.2 二值分類:正類和負類 479 22.1.3 ROC分析 482 22.2 分類器評估 487 22.2.1 K折交叉驗證 487 22.2.2 自助抽樣 488 22.2.3 置信區間 489 22.2.4 分類器比較:配對t檢驗 493 22.3 偏置-方差分解 495 22.4 補充閱讀 503 22.5 習題 504
|
序: |
|