-- 會員 / 註冊 --  
 帳號:
 密碼:
  | 註冊 | 忘記密碼
3/26 新書到! 3/19 新書到! 3/14 新書到! 12/12 新書到!
購書流程Q & A站務留言版客服信箱
3ds MaxMayaRhinoAfter EffectsSketchUpZBrushPainterUnity
PhotoShopAutoCadMasterCamSolidWorksCreoUGRevitNuke
C#CC++Java遊戲程式Linux嵌入式PLCFPGAMatlab
駭客資料庫搜索引擎影像處理FluentVR+ARANSYS深度學習
單晶片AVROpenGLArduinoRaspberry Pi電路設計CadenceProtel
HadoopPythonStm32CortexLabview手機程式AndroidiPhone
可查書名,作者,ISBN,3dwoo書號
詳細書籍分類

R語言數據挖掘

( 簡體 字)
作者:(哈薩克斯坦)貝特·麥克哈貝爾類別:1. -> 程式設計 -> R語言
   2. -> 程式設計 -> 數據挖掘
譯者:
出版社:機械工業出版社R語言數據挖掘 3dWoo書號: 45497
詢問書籍請說出此書號!

缺書
NT售價: 245

出版日:10/1/2016
頁數:201
光碟數:0
站長推薦:
印刷:黑白印刷語系: ( 簡體 版 )
加入購物車 加到我的最愛
(請先登入會員)
ISBN:9787111547693
作者序 | 譯者序 | 前言 | 內容簡介 | 目錄 | 
(簡體書上所述之下載連結耗時費功, 恕不適用在台灣, 若讀者需要請自行嘗試, 恕不保證)
作者序:

譯者序:

前言:

內容簡介:

本書介紹了關聯規則、分類、聚類分析、異常值探測、數據流挖掘、時間序列、圖形挖掘、網絡分析、文本挖掘和網絡分析等流行的數據挖掘算法,給出了具體算法以及這些算法的偽代碼和R語言實現。本書可以作為統計學、計算機等相關專業高年級本科生或研究生的教材,也可以作為數據分析和挖掘等相關研究人員的參考資料。
目錄:

譯者序
作者簡介
審校者簡介
前言
致謝
第1章 預備知識 1
1.1 大數據 2
1.2 數據源 3
1.3 數據挖掘 4
1.3.1 特征提取 4
1.3.2 總結 4
1.3.3 數據挖掘過程 5
1.4 社交網絡挖掘 7
1.5 文本挖掘 9
1.5.1 信息檢索和文本挖掘 10
1.5.2 文本挖掘預測 10
1.6 網絡數據挖掘 10
1.7 為什么選擇R 12
1.8 統計學 12
1.8.1 統計學與數據挖掘 13
1.8.2 統計學與機器學習 13
1.8.3 統計學與R語言 13
1.8.4 數據挖掘中統計學的局限性 13
1.9 機器學習 13
1.9.1 機器學習方法 14
1.9.2 機器學習架構 14
1.10 數據屬性與描述 15
1.10.1 數值屬性 16
1.10.2 分類屬性 16
1.10.3 數據描述 16
1.10.4 數據測量 17
1.11 數據清洗 18
1.11.1 缺失值 18
1.11.2 垃圾數據、噪聲數據或異常值 19
1.12 數據集成 19
1.13 數據降維 20
1.13.1 特征值和特征向量 20
1.13.2 主成分分析 20
1.13.3 奇異值分解 20
1.13.4 CUR分解 21
1.14 數據變換與離散化 21
1.14.1 數據變換 21
1.14.2 標準化數據的變換方法 22
1.14.3 數據離散化 22
1.15 結果可視化 23
1.16 練習 24
1.17 總結 24
第2章 頻繁模式、關聯規則和相關規則挖掘 25
2.1 關聯規則和關聯模式概述 26
2.1.1 模式和模式發現 26
2.1.2 關系或規則發現 29
2.2 購物籃分析 30
2.2.1 購物籃模型 31
2.2.2 Apriori算法 31
2.2.3 Eclat算法 35
2.2.4 FP-growth算法 37
2.2.5 基于最大頻繁項集的GenMax算法 41
2.2.6 基于頻繁閉項集的Charm算法 43
2.2.7 關聯規則生成算法 44
2.3 混合關聯規則挖掘 46
2.3.1 多層次和多維度關聯規則挖掘 46
2.3.2 基于約束的頻繁模式挖掘 47
2.4 序列數據集挖掘 48
2.4.1 序列數據集 48
2.4.2 GSP算法 48
2.5 R語言實現 50
2.5.1 SPADE算法 51
2.5.2 從序列模式中生成規則 52
2.6 高性能算法 52
2.7 練習 53
2.8 總結 53
第3章 分類 54
3.1 分類 55
3.2 通用決策樹歸納法 56
3.2.1 屬性選擇度量 58
3.2.2 決策樹剪枝 59
3.2.3 決策樹生成的一般算法 59
3.2.4 R語言實現 61
3.3 使用ID3算法對高額度信用卡用戶分類 61
3.3.1 ID3算法 62
3.3.2 R語言實現 64
3.3.3 網絡攻擊檢測 64
3.3.4 高額度信用卡用戶分類 66
3.4 使用C4.5算法進行網絡垃圾頁面檢測 66
3.4.1 C4.5算法 67
3.4.2 R語言實現 68
3.4.3 基于MapReduce的并行版本 69
3.4.4 網絡垃圾頁面檢測 70
3.5 使用CART算法判斷網絡關鍵資源頁面 72
3.5.1 CART算法 73
3.5.2 R語言實現 74
3.5.3 網絡關鍵資源頁面判斷 74
3.6 木馬程序流量識別方法和貝葉斯分類 75
3.6.1 估計 75
3.6.2 貝葉斯分類 76
3.6.3 R語言實現 77
3.6.4 木馬流量識別方法 77
3.7 垃圾郵件識別和樸素貝葉斯分類 79
3.7.1 樸素貝葉斯分類 79
3.7.2 R語言實現 80
3.7.3 垃圾郵件識別 80
3.8 基于規則的計算機游戲玩家類型分類和基于規則的分類 81
3.8.1 從決策樹變換為決策規則 82
3.8.2 基于規則的分類 82
3.8.3 序列覆蓋算法 83
3.8.4 RIPPER算法 83
3.8.5 計算機游戲玩家類型的基于規則的分類 85
3.9 練習 86
3.10 總結 86
第4章 高級分類算法 87
4.1 集成方法 87
4.1.1 Bagging算法 88
4.1.2 Boosting和AdaBoost算法 89
4.1.3 隨機森林算法 91
4.1.4 R語言實現 91
4.1.5 基于MapReduce的并行版本 92
4.2 生物學特征和貝葉斯信念網絡 92
4.2.1 貝葉斯信念網絡算法 93
4.2.2 R語言實現 94
4.2.3 生物學特征 94
4.3 蛋白質分類和k近鄰算法 94
4.3.1 kNN算法 95
4.3.2 R語言實現 95
4.4 文檔檢索和支持向量機 95
4.4.1 支持向量機算法 97
4.4.2 R語言實現 99
4.4.3 基于MapReduce的并行版本 99
4.4.4 文檔檢索 100
4.5 基于頻繁模式的分類 100
4.5.1 關聯分類 100
4.5.2 基于判別頻繁模式的分類 101
4.5.3 R語言實現 101
4.5.4 基于序列頻繁項集的文本分類 102
4.6 基于反向傳播算法的分類 102
4.6.1 BP算法 104
4.6.2 R語言實現 105
4.6.3 基于MapReduce的并行版本 105
4.7 練習 106
4.8 總結 107
第5章 聚類分析 108
5.1 搜索引擎和k均值算法 110
5.1.1 k均值聚類算法 111
5.1.2 核k均值聚類算法 112
5.1.3 k模式聚類算法 112
5.1.4 R語言實現 113
5.1.5 基于MapReduce的并行版本 113
5.1.6 搜索引擎和網頁聚類 114
5.2 自動提取文檔文本和k中心點算法 116
5.2.1 PAM算法 117
5.2.2 R語言實現 117
5.2.3 自動提取和總結文檔文本 117
5.3 CLARA算法及實現 118
5.3.1 CLARA算法 119
5.3.2 R語言實現 119
5.4 CLARANS算法及實現 119
5.4.1 CLARANS算法 120
5.4.2 R語言實現 120
5.5 無監督的圖像分類和仿射傳播聚類 120
5.5.1 仿射傳播聚類 121
5.5.2 R語言實現 122
5.5.3 無監督圖像分類 122
5.5.4 譜聚類算法 123
5.5.5 R語言實現 123
5.6 新聞分類和層次聚類 123
5.6.1 凝聚層次聚類 123
5.6.2 BIRCH算法 124
5.6.3 變色龍算法 125
5.6.4 貝葉斯層次聚類算法 126
5.6.5 概率層次聚類算法 126
5.6.6 R語言實現 127
5.6.7 新聞分類 127
5.7 練習 127
5.8 總結 128
第6章 高級聚類分析 129
6.1 電子商務客戶分類分析和DBSCAN算法 129
6.1.1 DBSCAN算法 130
6.1.2 電子商務客戶分類分析 131
6.2 網頁聚類和OPTICS算法 132
6.2.1 OPTICS算法 132
6.2.2 R語言實現 134
6.2.3 網頁聚類 134
6.3 瀏覽器緩存中的訪客分析和DENCLUE算法 134
6.3.1 DENCLUE算法 135
6.3.2 R語言實現 135
6.3.3 瀏覽器緩存中的訪客分析 136
6.4 推薦系統和STING算法 137
6.4.1 STING算法 137
6.4.2 R語言實現 138
6.4.3 推薦系統 138
6.5 網絡情感分析和CLIQUE算法 139
6.5.1 CLIQUE算法 139
6.5.2 R語言實現 140
6.5.3 網絡情感分析 140
6.6 觀點挖掘和WAVE聚類算法 140
6.6.1 WAVE聚類算法 141
6.6.2 R語言實現 141
6.6.3 觀點挖掘 141
6.7 用戶搜索意圖和EM算法 142
6.7.1 EM算法 143
6.7.2 R語言實現 143
6.7.3 用戶搜索意圖 143
6.8 客戶購買數據分析和高維數據聚類 144
6.8.1 MAFIA算法 144
6.8.2 SURFING算法 145
6.8.3 R語言實現 146
6.8.4 客戶購買數據分析 146
6.9 SNS和圖與網絡數據聚類 146
6.9.1 SCAN算法 146
6.9.2 R語言實現 147
6.9.3 社交網絡服務 147
6.10 練習 148
6.11 總結 148
第7章 異常值檢測 150
7.1 信用卡欺詐檢測和統計方法 151
7.1.1 基于似然的異常值檢測算法 152
7.1.2 R語言實現 152
7.1.3 信用卡欺詐檢測 153
7.2 活動監控——涉及手機的欺詐檢測和基于鄰近度的方法 153
7.2.1 NL算法 153
7.2.2 FindAllOutsM算法 153
7.2.3 FindAllOutsD算法 154
7.2.4 基于距離的算法 155
7.2.5 Dolphin算法 156
7.2.6 R語言實現 157
7.2.7 活動監控與手機欺詐檢測 157
7.3 入侵檢測和基于密度的方法 157
7.3.1 OPTICS-OF算法 159
7.3.2 高對比度子空間算法 159
7.3.3 R語言實現 160
7.3.4 入侵檢測 160
7.4 入侵檢測和基于聚類的方法 161
7.4.1 層次聚類檢測異常值 161
7.4.2 基于k均值的算法 161
7.4.3 ODIN算法 162
7.4.4 R語言實現 162
7.5 監控網絡服務器的性能和基于分類的方法 163
7.5.1 OCSVM算法 163
7.5.2 一類最近鄰算法 164
7.5.3 R語言實現 164
7.5.4 監控網絡服務器的性能 164
7.6 文本的新奇性檢測、話題檢測與上下文異常值挖掘 164
7.6.1 條件異常值檢測算法 165
7.6.2 R語言實現 166
7.6.3 文本的新奇性檢測與話題檢測 166
7.7 空間數據中的集體異常值 167
7.7.1 路徑異常值檢測算法 167
7.7.2 R語言實現 167
7.7.3 集體異常值的特征 168
7.8 高維數據中的異常值檢測 168
7.8.1 Brute-Force算法 168
7.8.2 HilOut算法 168
7.8.3 R語言實現 169
7.9 練習 169
7.10 總結 169
第8章 流數據、時間序列數據和序列數據挖掘 171
8.1 信用卡交易數據流和STREAM算法 171
8.1.1 STREAM算法 172
8.1.2 單通道法聚類算法 173
8.1.3 R語言實現 174
8.1.4 信用卡交易數據流 174
8.2 預測未來價格和時間序列分析 175
8.2.1 ARIMA算法 176
8.2.2 預測未來價格 176
8.3 股票市場數據和時間序列聚類與分類 176
8.3.1 hError算法 177
8.3.2 基于1NN分類器的時間序列分類 178
8.3.3 R語言實現 178
8.3.4 股票市場數據 178
8.4 網絡點擊流和挖掘符號序列 179
8.4.1 TECNO-STREAMS算法 179
8.4.2 R語言實現 181
8.4.3 網絡點擊流 181
8.5 挖掘事務數據庫中的序列模式 181
8.5.1 PrefixSpan算法 182
8.5.2 R語言實現 182
8.6 練習 182
8.7 總結 182
第9章 圖挖掘與網絡分析 183
9.1 圖挖掘 183
9.1.1 圖 183
9.1.2 圖挖掘算法 184
9.2 頻繁子圖模式挖掘 184
9.2.1 gPLS算法 184
9.2.2 GraphSig算法 184
9.2.3 gSpan算法 185
9.2.4 最右路徑擴展和它們的支持 185
9.2.5 子圖同構枚舉算法 186
9.2.6 典型的檢測算法 186
9.2.7 R語言實現 186
9.3 社交網絡挖掘 186
9.3.1 社區檢測和Shingling算法 187
9.3.2 節點分類和迭代分類算法 188
9.3.3 R語言實現 188
9.4 練習 188
9.5 總結 188
第10章 文本與網絡數據挖掘 189
10.1 文本挖掘與TM包 190
10.2 文本總結 190
10.2.1 主題表示 191
10.2.2 多文檔總結算法 192
10.2.3 最大邊緣相關算法 193
10.2.4 R語言實現 193
10.3 問答系統 194
10.4 網頁分類 194
10.5 對報刊文章和新聞主題分類 195
10.5.1 基于N-gram的文本分類算法 195
10.5.2 R語言實現 197
10.6 使用網絡日志的網絡使用挖掘 197
10.6.1 基于形式概念分析的關聯規則挖掘算法 198
10.6.2 R語言實現 198
10.7 練習 198
10.8 總結 199
附錄 算法和數據結構 200
序: