3dwoo大學簡體電腦書店
R語言數據分析項目開發實戰
( 簡體 字)
作者:[印]戈皮·薩博拉曼尼 著 楊崇珉 譯類別:1. -> 程式設計 -> R語言
出版社:清華大學出版社R語言數據分析項目開發實戰 3dWoo書號: 51881
詢問書籍請說出此書號!
有庫存
NT售價: 545
出版日:9/1/2019
頁數:306
光碟數:0
站長推薦:
印刷:黑白印刷語系: ( 簡體 字 )
ISBN:9787302533641 加入購物車加到我的最愛 (請先登入會員)
(簡體書上所述之下載連結耗時費功, 恕不適用在台灣, 若讀者需要請自行嘗試, 恕不保證, 繁體書的下載亦請直接連絡出版社)
第1章關聯規則挖掘1
1.1理解推薦系統2
1.1.1事務2
1.1.2加權事務3
1.1.3Web應用程序3
1.2零售商用例和數據4
1.3關聯規則挖掘6
1.4關聯銷售營銷活動22
1.4.1杠桿效應25
1.4.2確信度26
1.5加權關聯規則挖掘27
1.6基于超鏈接的主題搜索(HITS)34
1.7負關聯規則41
1.8規則的可視化45
1.9封裝49
1.10本章小結56
第2章基于內容的模糊邏輯推薦系統57
2.1基于內容的推薦系統58
2.2新聞聚合器用例和數據62
2.3設計基于內容的推薦引擎67
2.3.1構建相似度索引69
2.3.2搜索機制75
2.4完整的R代碼94
2.5本章小結101
第3章協同過濾機制102
3.1協同過濾102
3.1.1基于內存的方案104
3.1.2基于模型的方案104
3.1.3隱因子模型方案106
3.2recommenderlab數據包107
3.3用例和數據111
3.4設計并實現協同過濾機制120
3.4.1評級矩陣120
3.4.2標準化121
3.4.3隨機劃分訓練集和測試集123
3.4.4訓練模型125
3.5完整的R代碼136
3.6本章小結142
第4章基于深度神經網絡的時序數據143
4.1時序數據144
4.1.1非季節性時序145
4.1.2季節性時序146
4.1.3回歸問題147
4.2深度神經網絡150
4.2.1前向循環152
4.2.2反向循環153
4.3MXNet數據包153
4.4MXNet中的符號編程155
4.4.1softmax激活函數159
4.4.2用例和數據162
4.4.3基于時序預測的深度網絡163
4.5訓練-測試集劃分165
4.6完整的R代碼177
4.7本章小結185
第5章Twitter文本情感分類186
5.1核密度估計187
5.2Twitter文本191
5.3情感分類192
5.3.1字典方法192
5.3.2機器學習方法193
5.3.3當前方案193
5.4基于字典的評級機制194
5.5文本預處理197
5.5.1詞頻逆文檔頻率(TFIDF)方案199
5.5.2DeltaTDIDF200
5.6構建情感分析分類器202
5.7整合RShiny應用程序206
5.8完整的R代碼210
5.9本章小結215
第6章記錄鏈接—隨機和機器學習方案216
6.1用例216
6.2使用RecordLinkage217
6.2.1特征生成218
6.2.2字符串比較221
6.2.3語音特征222
6.3隨機記錄鏈接223
6.3.1期望最大化方法223
6.3.2基于權重的方法229
6.4基于機器學習的記錄鏈接232
6.4.1無監督學習233
6.4.2監督學習234
6.5構建RShiny應用程序239
6.6完整的R代碼242
6.6.1特征生成242
6.6.2期望最大化方法244
6.6.3基于權重的方法245
6.6.4機器學習方法246
6.6.5RShiny應用程序247
6.7本章小結249
第7章流式數據聚類分析250
7.1流式數據及其面臨的挑戰250
7.1.1邊界問題251
7.1.2漂移問題251
7.1.3單路處理252
7.1.4實行性252
7.2流式聚類252
7.3流數據包253
7.3.1數據流數據253
7.3.2作為靜態模擬器的DSD254
7.3.3連接至內存、文件或數據庫的DSD259
7.3.4in-flight操作261
7.3.5將DSD連接至真實的數據流261
7.3.6數據流任務261
7.4用例和數據266
7.4.1速度層267
7.4.2批處理層267
7.4.3蓄水池采樣270
7.5完整的R代碼272
7.6本章小結274
第8章分析并理解網絡276
8.1R語言中的圖277
8.1.1頂點的度280
8.1.2頂點強度280
8.1.3鄰接矩陣280
8.1.4R中的更多網絡281
8.1.5頂點的中心度282
8.1.6節點的遠度和近度282
8.1.7計算節點間的最短路徑283
8.1.8圖的隨機遍歷283
8.2用例和數據283
8.3數據準備285
8.4商品網絡分析289
8.5編寫RShiny應用程序296
8.6完整的R代碼302
8.7本章小結307
本書詳細闡述了與數據分析相關的基本解決方案,主要包括關聯規則挖掘、基于內容的模糊邏輯推薦系統、協同過濾機制、基于深度神經網絡的時序數據、Twitter文本情感分類、記錄鏈接—隨機和機器學習方案、流式數據聚類分析、分析并理解網絡等內容。此外,本書還提供了相應的示例、代碼,以幫助讀者進一步理解相關方案的實現過程。
本書既可作為高等院校計算機及相關專業的教材和教學參考書,也可作為相關開發人員的自學教材和參考手冊。
本書向讀者介紹了如何利用R數據包處理數據分析等問題,其中包含了針對各類數據分析的不同R數據包的功能,并幫助讀者使用正確的數據包實現相關任務。其中,每章將從頭開始構建一個完整項目,進而幫助讀者更好地理解如何構建端到端的預測分析解決方案。本書涵蓋了不同的主題,包括利用R語言構建深度學習網絡、流數據分析、情緒分類以及推薦系統。
本書內容
第1章:關聯規則挖掘。通過事務處理數據構建推薦系統,并對關聯銷售和促銷行為進行識別。
第2章:基于內容的模糊邏輯推薦系統。將處理推薦系統中的“冷啟動”問題,并嘗試通過模糊集方案解決包含多相似度的排名問題。
第3章:協同過濾機制。將對推薦系統的協同過濾機制引入不同的方案。
第4章:基于深度神經網絡的時序數據。討論MXNet R,即R語言中的深度學習數據包。本章將利用MXNet構建一個深連接網絡,進而預測股票收盤價格。
第5章:Twitter文本情感分類。將考查R語言中Twitter數據的處理能力,并引入了一種全新的情緒分類方式,即Delta Tfidf。除此之外,還將利用基于樸素貝葉斯算法的核密度估計對情緒進行分類。
第6章:記錄鏈接—隨機和機器學習方案。主要討論數據管理方面的問題,以及如何利用recordLinkage數據包在R語言中對此加以處理。
第7章:流式數據聚類分析。將解決R語言中的流數據處理、流數據集群、在線/離線集群模型等問題。
第8章:分析并理解網絡。通過igraph數據包執行R中的圖分析,同時利用圖算法解決產品網絡分析等問題。
軟件環境
首先需要安裝R。此外,本書代碼采用R version 3.3.1(single candle版本)并在Mac OS達爾文15.6.0環境下編寫,同時兼容于Linux和Windows操作系統。R代碼的編寫和編譯則在RStudio version 0.99.491編輯器中完成。
適用讀者
本書將引領讀者利用R語言以及高級、高效的數據分析方法解決實際應用問題。因此,讀者應了解一些與R語言和數據分析相關的一些基本概念。
讀者可根據下列步驟下載代碼文件:
? 利用電子郵件地址和密碼登錄或注冊我們的網站。
? 單擊SUPPORT選項卡。
? 單擊Code Downloads & Errata。
? 在Serach文本框中輸入書名。
? 搜索需要下載代碼文件的書名。
? 從下拉菜單中選擇本書的購買方式。
? 單擊Code Download按鈕。
當文件下載完畢后,確保使用下列最新版本軟件解壓文件夾:
? Windows系統下的WinRAR/7-Zip。
? Mac系統下的Zipeg/iZip/UnRarX。
? Linux系統下的7-Zip/PeaZip。
另外,讀者還可訪問GitHub獲取本書的代碼包,對應網址s。此外,讀者還可訪問以了解豐富的代碼和視頻資源。
勘誤表
盡管我們在最大程度上做到盡善盡美,但錯誤依然在所難免。如果讀者發現謬誤之處,無論是文字錯誤抑或是代碼錯誤,還望不吝賜教。對此,讀者可訪問選取對應書籍,單擊Errata Submission Form超鏈接,并輸入相關問題的詳細內容。
版權須知
一直以來,互聯網上的版權問題從未間斷,Packt出版社對此類問題異常重視。若讀者在互聯網上發現本書任意形式的副本,請告知網絡地址或網站名稱,我們將對此予以處理。關于盜版問題,讀者可發送郵件。
問題解答
若讀者對本書有任何疑問,均可發送郵件,我們將竭誠為您服務。
pagetop