-- 會員 / 註冊 --  
 帳號:
 密碼:
  | 註冊 | 忘記密碼
3/26 新書到! 3/19 新書到! 3/14 新書到! 12/12 新書到!
購書流程Q & A站務留言版客服信箱
3ds MaxMayaRhinoAfter EffectsSketchUpZBrushPainterUnity
PhotoShopAutoCadMasterCamSolidWorksCreoUGRevitNuke
C#CC++Java遊戲程式Linux嵌入式PLCFPGAMatlab
駭客資料庫搜索引擎影像處理FluentVR+ARANSYS深度學習
單晶片AVROpenGLArduinoRaspberry Pi電路設計CadenceProtel
HadoopPythonStm32CortexLabview手機程式AndroidiPhone
可查書名,作者,ISBN,3dwoo書號
詳細書籍分類

R語言:實用數據分析和可視化技術

( 簡體 字)
作者:〔美〕 賈里德P.蘭德(Jared P. Lander) 著類別:1. -> 程式設計 -> R語言
譯者:
出版社:機械工業出版社R語言:實用數據分析和可視化技術 3dWoo書號: 41424
詢問書籍請說出此書號!

缺書
NT售價: 395

出版日:5/1/2015
頁數:315
光碟數:0
站長推薦:
印刷:黑白印刷語系: ( 簡體 版 )
加入購物車 加到我的最愛
(請先登入會員)
ISBN:9787111499619
作者序 | 譯者序 | 前言 | 內容簡介 | 目錄 | 
(簡體書上所述之下載連結耗時費功, 恕不適用在台灣, 若讀者需要請自行嘗試, 恕不保證)
作者序:

譯者序:

前言:

生活中數據應用變得越來越普遍,我們需要新的和更好的工具來應對這個趨勢。在傳統情況下,處理數據的方式一般有兩種:一是簡單輕便的,使用像Excel 或 SPSS 這樣的工具做定量分析;二是復雜繁重的,利用C++這樣的工具進行高性能分析。隨著個人計算機性能的提高,產生了一種既交互又強健有效的折中方法。個人在自己的計算機上以探索性的方式所做的分析,很快就會轉變為傳遞到支撐高級業務流程的服務器的東西。這便是R、Python和其他腳本語言的領域。

R語言是由奧克蘭大學的 Robert Gentleman 教授和Ross Ihaka教授于1993年開發的,其源自于貝爾實驗室John Chambers 所開發的S語言。它是一種高水平語言,最初的目的是進行交互式運算,即使用者輸入一個命令得到一個結果,然后再輸入下一個命令。它已經發展成為一種語言,這種語言也可以嵌入系統和解決復雜的問題。

除了轉換數據和分析數據,R語言還能很方便地產生令人驚喜的圖形和報告。它現在已經成為一個完整的體系,可以用于數據分析、提取和轉換,模型擬合,描述推斷,預測,繪圖以及給出報告結果。

自2000年末期以來,R語言的普及就像飛升的火箭一路飆升,它已經走出了學術界,進入銀行業、銷售業、制藥業、政界、基因組學等其他許多領域。R語言的很多新用戶以前都使用一些低級編譯語言程序,比如C++和其他的統計包(例如SAS或SPSS),還有些之前使用“800磅重的大猩猩”—— Excel。這時期相應的軟件包的數量迅速飆升,這些軟件包是預先寫好的代碼庫,用于擴展R的功能。

盡管R有時會讓初學者感到畏懼,特別是那些沒有編程經驗的人,但是我發現用編程分析來代替操作,學習過程很快就變得容易得多,而且更方便、更可靠。這正是我的目標:讓學習變得更快、更容易。

這本書內容的安排和布局是按照我在研究生院學習R時希望能夠被教導的方式來實現的。綜合來說,這本書的目錄是結合我在哥倫比亞大學所教的一門數據科學課程所形成的。這并不是意味著覆蓋R的每一個細枝末節,而在于用20%的功能去完成80%的工作。本書的內容包括如下章節。

第1章涉及從哪里下載R,如何安裝不同的操作系統以及32位和64位版本的問題。該章還給出了安裝R的路徑的一些建議。

第2章的內容包括如何整合RStudio和Git,比如RStudio的個人定制和連接。

第3章涉及如何定位、安裝和加載R語言包。

第4章詳細說明變量的類型,如數字、字符、日期以及向量。該章還簡要介紹了調用函數和尋找函數文件的功能。

第5章介紹最強大和常用的一些數據結構,如數據框、矩陣和列表。

第6章的內容涉及讀取數據到R中。數據在分析之前必須讀入R。目前有許多方法來讀入數據,包括CSV格式文件的數據和數據庫。

第7章的內容涉及統計圖形。圖形是數據初步分析和交流結果的一個關鍵部分。R語言能用其強大的繪圖工具繪制出美麗的圖形。該章將詳細介紹基本繪圖和ggplot2。

第8章介紹使用自定義的函數,可重復性分析往往變得更加容易。該章討論結構、參數和返回規則。

第9章介紹如何使用if和ifelse以及復雜的語句控制程序的流程。

第10章介紹使用for和while循環迭代。雖然這些通常令人沮喪,但是知道它們很

重要。

第11章的內容涉及群組操作。一個比循環更好的選擇是向量化。向量化并沒有用循環去遍歷數據,而是一次性,操作所有元素,這是更有效的,其主要使用apply函數和plyr包。

第12章介紹數據整理。合并多個數據集,無論是通過疊加還是加入,通常有必要重塑數據。除了像rbind、cbind和merge這些基本的工具,plyr包和reshape2包也提供了解決問題的很好的辦法。

第13章介紹操作字符串。多數人不會將字符數據和統計聯系起來,但它是一個重要的數據形式。R提供了大量工具來處理字符串,包括合并字符串和從中提取信息。該章將會正式詳細地介紹這些內容。

第14章介紹概率分布。全面回顧正態分布、二項分布和泊松分布。你需要記下許多分布的函數形式和表達式。

第15章涉及基本統計。該章介紹了統計學的一些基礎知識,例如均值、標準差和t-檢驗。

第16章介紹線性模型。線性模型是統計中最強大和最常用的工具,該章將會詳細地介紹。

第17章涉及廣義線性模型。線性模型的擴展包括logistic回歸和泊松回歸。該章還會介紹生存分析。

第18章介紹模式診斷。用殘差、AIC準則、交叉驗證、自助法和逐步變量選擇來決定模型的質量以及變量選擇。

第19章介紹正則化和壓縮。使用彈性網格和貝葉斯方法來防止過度擬合。

第20章涉及非線性模型。當線性模型不合適時,非線性模型是一個很好的解決方案。該章將討論非線性最小二乘、樣條函數、廣義可加模型、決策樹和隨機森林。

第21章介紹時間序列和自相關。分析單變量和多變量時間序列數據的方法。

第22章涉及聚類。通過K-均值和分層聚類等多種方法來聚類,即對數據進行分組。

第23章涉及用knitr包進行可重復性(reproducibility)、報告和幻燈片展示。在R中很容易用knitr、LATEX和Markdown產生報告、幻燈片和網頁。

第24章涉及創建R包。R包是非常便攜、可重用的代碼。隨著devtools包和Rcpp包的出現,構建R包已經簡單得令人難以置信。

附錄A包含進一步學習R的一系列資源,以及相互討論的一系列社區。

這本書中的大量文本都是R代碼或運行代碼的結果。代碼和運行結果通常在文本和集合中以特殊的字體單獨分開,下面給出一個例子。不同代碼的不同部分用不同灰度的文字表示。行代碼開始于“>”,如果代碼連續需要折行,則第二行以“+”開始。



學習R是一個很愉悅的過程,能讓生活中許多工作變得容易得多。希望我們能一起來享受學習R的過程。
內容簡介:

開源R軟件,你可以構建強大的統計模型來解決許多極具挑戰性的難題。對非統計學家來說,一直以來R都難于學習和使用,市面上很多介紹R語言的書籍都假設讀者具有足夠的預備知識,但本書則不同。
本書融合資深數據科學家Jared P. Lander在教授R語言上的豐富經驗,通過大量實例,詳細講解R語言的核心功能。對剛接觸統計程序和模型的人來說,本書是一套堪稱完美的教程,其內容的組織結構使得學習R語言變得簡單和直觀。本書集中介紹R 20%的功能,但這20%的功能足以完成80%的現代數據工作。

通過閱讀本書,你將學到:
運用R處理數學問題:變量類型、向量、調用函數等
功能強大、常用的數據結構:數據框、矩陣和列表
創建直觀的統計圖形
編寫自定義函數
分組操作提高效率
合并和重塑多個數據集
使用R的工具操作字符串和正則表達式
創建正態分布、二項分布和泊松分布
基本統計信息編程:均值、標準差以及t-檢驗
建立線性、廣義線性和非線性模型
評估模型和變量選擇的質量
使用彈性網和貝葉斯方法防止過度擬合
分析單變量和多變量時間序列數據
通過K均值和分層聚類對數據進行分類
用knitr準備報告、幻燈片和網頁
用devtools和Rcpp建立可重復使用的R包

內容簡介
本書是資深數據專家數十年教學與實踐經驗的結晶,以簡單直接的方式詳細講解R語言的所有基礎知識,以及常見統計方法和模型在R中的操作規范,通過大量實例,幫助讀者快速理解并掌握R的核心功能,有效解決實際工作問題。
本書共24章,第1~3章介紹R語言的獲取與安裝、R環境的設置以及R包的基礎知識;第4~5章介紹R語言基礎知識和高級數據結構,涉及數學運算、向量、調用函數以及數據框、列表、矩陣和數組等;第6章介紹如何導入數據;第7章詳細介紹統計圖形的繪制,包括基本繪圖和ggplot2;第8~10章介紹R函數編寫,包括對結構、參數和返回規則的討論,講解if和ifelse以及復雜語句控制程序的流程、for和while循環迭代等;第11~13章介紹數據的分組操作、數據整理和字符串操作;第14~15章介紹概率分布與描述性統計;第16~20章介紹線性模型、廣義線性模型、模型診斷、正則化與壓縮以及非線性模型等;第21章介紹時間序列和自相關;第22章介紹各種聚類方式,包括K-means和分層聚類;第23章討論可重復性、報告和利用knitr滑動展示;第24介紹如何創建R包。
目錄:

譯者序

序言

前言

致謝

第1章 獲取R 1

1.1 下載R 1

1.2 R版本 2

1.3 32位與64位 2

1.4 安裝 2

1.5 R的社區版革命 8

1.6 小結 9

第2章 R環境 10

2.1 命令行界面 11

2.2 RStudio 12

2.3 Revolution Analytics RPE 20

2.4 小結 20

第3章 R包 21

3.1 包的安裝 21

3.2 包的加載 23

3.3 創建一個包 24

3.4 小結 24

第4章 R語言基礎 25

4.1 基本數學運算 25

4.2 變量 26

4.3 數據類型 28

4.4 向量 33

4.5 調用函數 37

4.6 函數文件 38

4.7 缺失數據 38

4.8 小結 39

第5章 高級數據結構 40

5.1 數據框 40

5.2 列表 47

5.3 矩陣 52

5.4 數組 54

5.5 小結 55

第6章 導入數據 56

6.1 導入CSV 56

6.2 導入Excel數據 57

6.3 讀入數據庫數據 58

6.4 導入其他統計工具數據 59

6.5 R二進制文件 60

6.6 包含在R中的數據 62

6.7 從互聯網上抓取數據 62

6.8 小結 63

第7章 統計圖形 64

7.1 基本圖形 64

7.2 ggplot2 66

7.3 小結 78

第8章 編寫R函數 79

8.1 hello world! 79

8.2 函數參數 80

8.3 返回值 82

8.4 do.call 83

8.5 小結 84

第9章 控制語句 85

9.1 if和else語句 85

9.2 switch語句 88

9.3 ifelse語句 89

9.4 復合檢查 90

9.5 小結 91

第10章 循環,Un-R方式的迭代 92

10.1 for循環 92

10.2 while循環 94

10.3 控制循環 94

10.4 小結 95

第11章 分組操作 96

11.1 apply函數族 96

11.2 aggregate 99

11.3 plyr 102

11.4 data.table 106

11.5 小結 114

第12章 數據整理 115

12.1 cbind和rbind 115

12.2 連接 116

12.3 reshape2 122

12.4 小結 125

第13章 字符串操作 126

13.1 paste 126

13.2 把格式數據寫成串(sprintf) 127

13.3 提取文本 128

13.4 正則表達式 132

13.5 小結 138

第14章 概率分布 139

14.1 正態分布 139

14.2 二項分布 144

14.3 泊松分布 148

14.4 其他分布 150

14.5 小結 152

第15章 描述性統計 153

15.1 概括性統計量 153

15.2 相關系數和協方差 156

15.3 t-檢驗 163

15.4 方差分析 169

15.5 小結 171

第16章 線性模型 172

16.1 簡單線性回歸 172

16.2 多元回歸 177

16.3 小結 190

第17章 廣義線性模型 191

17.1 邏輯斯蒂回歸 191

17.2 泊松回歸 194

17.3 其他的廣義線性模型 198

17.4 生存分析 198

17.5 小結 202

第18章 模型診斷 203

18.1 殘差 203

18.2 模型比較 208

18.3 交叉驗證 211

18.4 Bootstrap 215

18.5 逐步變量選擇 218

18.6 小結 221

第19章 正則化和壓縮 222

19.1 彈性網絡 222

19.2 貝葉斯壓縮 235

19.3 小結 238

第20章 非線性模型 239

20.1 非線性最小二乘 239

20.2 樣條 241

20.3 廣義相加模型 245

20.4 決策樹 249

20.5 隨機森林 251

20.6 小結 251

第21章 時間序列和自相關 252

21.1 自回歸移動平均模型 252

21.2 向量自回歸 258

21.3 廣義自回歸異方差模型(GARCH) 263

21.4 小結 270

第22章 聚類 271

22.1 K-means 271

22.2 PAM 277

22.3 分層聚類 282

22.4 小結 284

第23章 可重復性、報告和利用knitr滑動展示 285

23.1 安裝LATEX程序 285

23.2 LATEX初級 286

23.3 通過LATEX使用knitr 288

23.4 Markdown技巧 291

23.5 使用knitr和Markdown 292

23.6 pandoc 293

23.7 小結 295

第24章 創建R包 296

24.1 目錄結構 296

24.2 包文件 297

24.3 包文檔 302

24.4 包的檢查、創建和安裝 304

24.5 提交至CRAN 305

24.6 C++代碼 305

24.7 小結 310

附錄A 相關資源 311
序: