-- 會員 / 註冊 --  
 帳號:
 密碼:
  | 註冊 | 忘記密碼
3/26 新書到! 3/19 新書到! 3/14 新書到! 12/12 新書到!
購書流程Q & A站務留言版客服信箱
3ds MaxMayaRhinoAfter EffectsSketchUpZBrushPainterUnity
PhotoShopAutoCadMasterCamSolidWorksCreoUGRevitNuke
C#CC++Java遊戲程式Linux嵌入式PLCFPGAMatlab
駭客資料庫搜索引擎影像處理FluentVR+ARANSYS深度學習
單晶片AVROpenGLArduinoRaspberry Pi電路設計CadenceProtel
HadoopPythonStm32CortexLabview手機程式AndroidiPhone
可查書名,作者,ISBN,3dwoo書號
詳細書籍分類

R語言與數據挖掘

( 簡體 字)
作者:張良均 謝佳標 楊 坦 肖 剛 黃 博 陳玉輝 萬正勇 著類別:1. -> 程式設計 -> R語言
   2. -> 程式設計 -> 數據挖掘
譯者:
出版社:機械工業出版社R語言與數據挖掘 3dWoo書號: 44705
詢問書籍請說出此書號!

缺書
NT售價: 295

出版日:7/1/2016
頁數:297
光碟數:0
站長推薦:
印刷:黑白印刷語系: ( 簡體 版 )
加入購物車 加到我的最愛
(請先登入會員)
ISBN:9787111540526
作者序 | 譯者序 | 前言 | 內容簡介 | 目錄 | 
(簡體書上所述之下載連結耗時費功, 恕不適用在台灣, 若讀者需要請自行嘗試, 恕不保證)
作者序:

譯者序:

前言:

為什么要寫本書

R語言是什么?

R是一種適用于統計分析計算和圖像處理的語言,受S語言和Scheme語言影響發展而來。早期R是基于S語言的一個GNU項目,所以也可以當作S語言的一種實現,通常用S語言編寫的代碼都可以不做任何修改地在R環境下運行。R的語法來自Scheme,作為一款誕生于20世紀90年代的語言,R已經成為S統計編程語言的一類實現方式。

R編程語言在數字分析與機器學習領域已經成為一款重要的工具。隨著機器逐步成為愈發核心的數據生成器,該語言的人氣也一路攀升。正如Tiobe、PyPL以及Redmonk等編程語言人氣排名所指出,R語言所受到的關注程度正在快速提升。Rexer Analytics發布的2013年數據挖掘人員調查顯示,70%的數據挖掘人員使用R軟件進行分析工作,其中有24%將其作為主要工具。這些結果類似于 2013 年KDnuggets調查的結果,該調查指出有61%的響應者表示正在使用R處理分析、數據挖掘和數據科學工作。相比前一年,這一比例上升了16%。

R語言有一些明顯的優勢:

1)R語言作為一款開源軟件,是完全免費的,對比昂貴的SPSS和SAS等統計軟件,這無疑是一個巨大的優勢。

2)R語言擁有一個龐大的社區來進行維護,龐大的軟件包生態系統無疑是R語言最為突出的優勢之一。

3)R語言具備可擴展能力且擁有豐富的功能選項,幫助開發人員構建自己的工具及方法,從而順利實現數據分析。

4)R語言簡單易學。雖與C語言之類的程序設計語言已差別很大(比如語言結構相對松散,使用變量前不需要明確正式定義變量類型等),但仍保留了程序設計語言的基礎邏輯與自然的語言風格。

從R的普及來看,國外的普及度要明顯好于國內,與盜版Windows的泛濫會影響Linux在中國的普及一樣,破解的MATLAB與SPSS的存在也影響了R在中國的使用。但在國外高校的統計系,R幾乎是一門必修的語言,具有統治性的地位。在工業界,作為互聯網公司翹楚的Google內部也有不少工程使用R進行數據分析工作。隨著數據挖掘在國內的發展,國內對R語言的需求必將隨之一起發展。

總的來說,R語言是一款用于統計分析、數據可視化和預測建模的數據分析軟件,它不單單只是一門語言,更是一個數據計算與分析的環境。R支持幾乎所有數據分析所需的數據處理、統計模型和圖表,支持大量的第三方功能包,涵蓋了從統計計算到機器學習,從金融分析到生物信息,從社會網絡分析到自然語言處理,從各種數據庫各種語言接口到高性能計算模型等內容。隨著大數據時代的來臨,數據挖掘將更加廣泛地滲透到各行各業中去,而R語言作為數據挖掘里的熱門工具,將會有更多其他行業的人加入到R語言的使用者行列中來。R語言的使用課程成為高校中數學與統計學專業的重要課程將是必然的趨勢。

本書特色

本書從實際應用出發,結合實例及應用場景,深入淺出地介紹了R語言應用的相關知識:R語言的安裝及使用、數據對象與數據讀寫、常用數據管理、圖形探索、高級繪圖工具及常用的建模算法在R語言中的實現方式。書中以R語言的函數應用為主,先介紹了函數的應用場景及使用格式,再給出函數的應用實例,最后對函數的運行結果做出了解釋,將掌握函數應用的所需知識點按照實際使用的流程展示出來。
TipDM 張良均〈大數據挖掘產品與服務〉

本書適用對象

開設有數據挖掘課程的高校教師和學生。

目前國內不少高校將數據挖掘引入本科教學中,在數學、計算機、自動化、電子信息、金融等專業開設了數據挖掘技術相關的課程,但目前這一課程的教學工具仍然為SPSS、SAS等傳統統計工具,并沒有使用R語言作為挖掘工具。本書提供了有關R語言的從安裝到使用的一系列知識,將能有效指導高校教師和學生使用R語言工具進行數據挖掘。

數據挖掘開發人員。

這類人員可以在理解數據挖掘應用需求和設計方案的基礎上,結合書中提供的R語言的使用方法快速實現數據挖掘應用的編程。

進行數據挖掘應用研究的科研人員。

許多科研院所為了更好地對科研工作進行管理,紛紛開發了適應自身特點的科研業務管理系統,并在使用過程中積累了大量的科研信息數據。R語言可以提供一個優異的環境對這些數據進行挖掘分析應用。

關注高級數據分析的人員。

R語言作為一個專業的數據分析軟件,能為數據分析人員提供可靠的依據。

如何閱讀本書

本書主要分為三個部分,基礎篇、建模應用篇和Rattle篇。基礎篇介紹了有關R語言的安裝與使用、R語言中的數據結構、常用操作和繪圖功能等基礎功能。建模應用篇主要介紹了目前在數據挖掘中常用的建模方法在R語言中的實現函數,并對輸出結果進行了解釋,有助于讀者快速掌握應用R語言進行分析挖掘建模的方法。讀者可結合本書提供的示例代碼及數據進行上機實驗,快速掌握R語言的使用方法。

第一部分是基礎篇(第1∼5章),第1章主要介紹了R語言及圖形操作工具RStudio的安裝及使用方法,第2章對R語言中的數據類型和數據對象及不同格式的數據讀入和導出R語言進行了介紹,第3章描述了R語言中對數據所能做的常用操作,包括變量的重命名、缺失值分析、排序、隨機抽樣等,第4、5章主要對R語言的繪圖功能進行了介紹,涵蓋常用圖形如散點圖、直方圖、條形圖、箱線圖等,且一并介紹了一些基于R語言的可用于生成交互式圖形的軟件包。

第二部分是建模應用篇(第6∼10章),主要對數據挖掘中常用算法的函數在R語言中的使用方法及其結果進行了介紹,涵蓋了目前數據挖掘的5大類算法,包括分類與預測、聚類分析、關聯規則、智能推薦和時間序列。按照從模型建立到模型評價架構的順序進行介紹,使讀者能熟練地掌握從建模到對模型評價的完整建模過程。

第三部分是Rattle篇(第11章),介紹了一個R語言的圖形界面工具Rattle,此工具能夠在一個圖形化的界面上對本書介紹的R語言功能進行操作,使讀者能更好地體驗到使用R語言進行數據挖掘的整個流程。
致謝

本書編寫過程中得到了廣大高校師生的大力支持,在此謹向華南農業大學、華南師范大學、廣東工業大學、廣東技術師范學院、華南理工大學、韓山師范學院、中山大學、貴州師范學院等單位給予支持的領導及師生致以深深的謝意。

在本書編輯和出版過程中還得到了參與“泰迪杯”全國數據挖掘挑戰賽的眾多師生及機械工業出版社楊福川老師無私的幫助與支持,在此一并表示感謝。
內容簡介:

內容簡介
這是一本適合教學和零基礎自學的R語言與數據挖掘教程,即便完全沒有R語言編程基礎和數據挖掘基礎,根據本書中的理論知識和上機實踐,你也能迅速掌握如何使用R語言進行數據挖掘的方法。本書已經被多所高校預定為教材,為了便于教學,書中還提供了大量的上機實驗和教學資源。
基礎篇(1~5章),主要包括R語言及圖形操作工具RStudio的安裝及使用方法,數據類型和數據對象,數據預處理的常用操作(包括數據重命名、缺失值分析、排序、隨機抽樣等),繪圖功能(包括散點圖、直方圖、條形圖、箱線圖等)。
建模應用篇(6~10章),主要介紹了數據挖掘中常用算法的函數在R語言中的使用方法及其結果,涵蓋了目前數據挖掘的5大類算法,包括分類與預測、聚類分析、關聯規則、智能推薦和時間序列。按照從模型建立到模型評價架構的順序進行介紹,使讀者能熟練地掌握從建模到對模型評價的完整建模過程。
Rattle篇(11章),介紹了R語言的圖形界面工具Rattle,此工具能夠在一個圖形化的界面上對本書所介紹的R語言功能進行操作,使讀者能更好地體驗到使用R語言進行數據挖掘的整個流程。
書中配套提供了原始樣本數據文件及對應章節示例代碼。每個章節有對應的練習實驗,讀者可通過完成對應的練習,迅速掌握R語言的用法和數據挖掘的方法。
目錄:

前 言

第一部分 基礎篇

第1章 R語言的安裝與使用 2

1.1 R安裝與升級 3

1.2 R使用入門 4

1.2.1 R操作界面 4

1.2.2 RStudio窗口介紹 5

1.2.3 R常用操作 6

1.3 R數據分析包 8

1.4 配套資源使用說明 10

1.5 小結 10

1.6 上機實驗 10

第2章 數據對象與數據讀寫 12

2.1 數據類型 12

2.2 數據結構 16

2.2.1 向量 16

2.2.2 矩陣 19

2.2.3 數組 24

2.2.4 數據框 25

2.2.5 因子 28

2.2.6 列表 31

2.3 數據文件的讀寫 34

2.3.1 鍵盤輸入數據 34

2.3.2 讀取不同格式的數據 35

2.3.3 從其他統計軟件獲取數據 37

2.3.4 從數據庫獲取數據 37

2.3.5 從網頁獲取數據 39

2.4 小結 40

2.5 上機實驗 40

第3章 R語言常用數據管理 42

3.1 變量的重命名 42

3.2 缺失值分析 45

3.3 數據排序 46

3.4 隨機抽樣 48

3.5 數值運算函數 49

3.6 字符串處理 52

3.7 文本分詞 56

3.8 apply函數族 62

3.9 數據整合 65

3.10 控制流 68

3.11 函數的編寫 71

3.12 小結 72

3.13 上機實驗 73

第4章 圖形探索 75

4.1 圖形元素 76

4.1.1 顏色 76

4.1.2 點 80

4.1.3 文本 82

4.1.4 線條 86

4.1.5 圖例 91

4.1.6 坐標軸 92

4.2 圖形組合 94

4.3 圖形保存 97

4.4 圖形函數 98

4.5 小結 116

4.6 上機實驗 116

第5章 高級繪圖工具 117

5.1 lattice包繪圖工具 117

5.1.1 繪圖特色 117

5.1.2 基本圖形 122

5.2 ggplot2包繪圖工具 135

5.2.1 從qplot開始 135

5.2.2 ggplot作圖 137

5.3 交互式繪圖工具簡介 142

5.3.1 rCharts包 143

5.3.2 recharts包 147

5.3.3 googleVis包 147

5.3.4 htmlwidgets包 148

5.3.5 shiny包 153

5.4 小結 163

5.5 上機實驗 163

第二部分 建模應用篇

第6章 分類與預測 166

6.1 回歸分析 166

6.2 決策樹 175

6.2.1 C4.5算法 176

6.2.2 CART算法 178

6.2.3 C5.0算法 180

6.3 人工神經網絡 181

6.4 KNN算法 183

6.5 樸素貝葉斯分類 185

6.6 其他分類與預測算法函數 187

6.7 分類與預測算法評價 192

6.8 小結 196

6.9 上機實驗 196

第7章 聚類分析 198

7.1 K-Means聚類分析函數 199

7.2 層次聚類算法 204

7.3 其他聚類分析函數 207

7.4 小結 211

7.5 上機實驗 212

第8章 關聯規則 213

8.1 Apriori關聯規則 214

8.2 小結 226

8.3 上機實驗 226

第9章 智能推薦 228

9.1 智能推薦模型構建 228

9.2 智能推薦模型評價 232

9.3 小結 235

9.4 上機實驗 235

第10章 時間序列 237

10.1 ARIMA模型 237

10.2 其他時間序列模型 245

10.3 小結 250

10.4 上機實驗 251

第三部分 Rattle篇

第11章 可視化數據挖掘工具Rattle 254

11.1 Rattle簡介及其安裝 254

11.1.1 Rattle簡介 254

11.1.2 Rattle安裝 254

11.2 功能預覽 255

11.3 數據導入 256

11.3.1 導入CSV數據 256

11.3.2 導入ARFF數據 261

11.3.3 導入ODBC數據 262

11.3.4 R Dataset——導入其他數據源 264

11.3.5 導入RData File數據集 267

11.3.6 導入Library數據 268

11.4 數據探索 269

11.4.1 數據總體概況 269

11.4.2 數據分布探索 272

11.4.3 相關性 275

11.4.4 主成分 277

11.4.5 交互圖 278

11.5 數據建模 283

11.5.1 聚類分析 283

11.5.2 關聯規則 288

11.5.3 決策樹 291

11.5.4 隨機森林 293

11.6 模型評估 296

11.6.1 混淆矩陣 296

11.6.2 風險圖 296

11.6.3 ROC圖及相關圖表 297

11.6.4 模型得分數據集 298

11.7 小結 299

11.8 上機實驗 299

參考資料 301
序: