-- 會員 / 註冊 --  
 帳號:
 密碼:
  | 註冊 | 忘記密碼
3/26 新書到! 3/19 新書到! 3/14 新書到! 12/12 新書到!
購書流程Q & A站務留言版客服信箱
3ds MaxMayaRhinoAfter EffectsSketchUpZBrushPainterUnity
PhotoShopAutoCadMasterCamSolidWorksCreoUGRevitNuke
C#CC++Java遊戲程式Linux嵌入式PLCFPGAMatlab
駭客資料庫搜索引擎影像處理FluentVR+ARANSYS深度學習
單晶片AVROpenGLArduinoRaspberry Pi電路設計CadenceProtel
HadoopPythonStm32CortexLabview手機程式AndroidiPhone
可查書名,作者,ISBN,3dwoo書號
詳細書籍分類

R大數據分析實用指南

( 簡體 字)
作者:[英]西蒙·沃克威克(Simon Walkowiak)類別:1. -> 程式設計 -> R語言
   2. -> 程式設計 -> 大數據
譯者:
出版社:人民郵電出版社R大數據分析實用指南 3dWoo書號: 51120
詢問書籍請說出此書號!

缺書
NT售價: 495

出版日:5/1/2019
頁數:373
光碟數:0
站長推薦:
印刷:黑白印刷語系: ( 簡體 版 )
加入購物車 加到我的最愛
(請先登入會員)
ISBN:9787115509253
作者序 | 譯者序 | 前言 | 內容簡介 | 目錄 | 
(簡體書上所述之下載連結耗時費功, 恕不適用在台灣, 若讀者需要請自行嘗試, 恕不保證)
作者序:

譯者序:

前言:

內容簡介:

R是一個強大的、開源的、函數式編程語言,可以用于廣泛的編程任務。一般來講,R語言的應用主要在數據統計與分析、機器學習、高性能計算等方面。R語言已經在多個領域贏得了認可,同時也基于其開源、免費的特點不斷地發展壯大。
本書通過9章內容,循序漸進地揭示了大數據的概念,介紹了如何使用R進行數據處理,如何創建Hadoop虛擬機,如何建立和部署SQL數據庫,同時還介紹了MongoDB、HBase、Spark、Hive相關的內容,并介紹了R的潛在應用場景。
本書適合中級數據分析師、數據工程師、統計學家、研究人員和數據科學家閱讀,需要讀者具備數據分析、數據管理和大數據算法的基本知識。
目錄:

第 1章 大數據時代 1
1.1 大數據——重新定義怪物 1
1.2 大數據工具箱——為大而生 4
1.2.1 Hadoop——屋中之象 4
1.2.2 數據庫 6
1.2.3 Hadoop的Spark化 7
1.3 R語言——大數據的無冕之王 8
1.4 小結 13
第 2章 R編程語言與統計環境的介紹 14
2.1 學習R 14
2.2 R語言基礎回顧 16
2.2.1 準備R和RStudio 16
2.2.2 R語言數據結構 19
2.2.3 導出R數據對象 29
2.3 應用數據科學與R 33
2.3.1 導入不同格式的數據 34
2.3.2 探索性數據分析 35
2.3.3 數據聚合和列聯表 37
2.3.4 假設檢驗和統計推斷 41
2.3.5 數據可視化包 52
2.4 小結 53
第3章 由內而外釋放R的力量 54
3.1 R的傳統局限性 54
3.1.1 內存外的數據 55
3.1.2 處理速度 55
3.2 超越內存限制 56
3.2.1 使用ff和ffbase軟件包進行數據轉換和聚合 56
3.2.2 使用ff和ffbase包的廣義線性模型 65
3.2.3 使用bigmemory包擴展內存 73
3.3 R的并行 81
3.3.1 從bigmemory到更快的計算 82
3.3.2 未來的R并行處理 89
3.4 使用data.table包和其他工具提高R性能 91
3.4.1 使用data.table包快速數據導入和操作 91
3.4.2 編寫更好的R代碼 98
3.5 小結 99
第4章 R相關的Hadoop和MapReduce框架 100
4.1 Hadoop架構 100
4.1.1 Hadoop分布式文件系統 101
4.1.2 MapReduce框架 101
4.1.3 其他Hadoop原生工具 104
4.1.4 學習Hadoop 105
4.2 云上的單節點Hadoop 106
4.2.1 在Azure上部署Hortonworks Sandbox 106
4.2.2 Java語言的Hadoop單詞記數示例 119
4.2.3 R語言的Hadoop單詞記數示例 127
4.3 HDInsight—— Azure上的多節點Hadoop集群 145
4.3.1 創建第 一個HDInsight集群 145
4.3.2 智能電表數據分析示例——在HDInsight集群上使用R 164
4.4 小結 175
第5章 R與關系型數據庫管理系統(RDBMS) 176
5.1 關系型數據庫管理系統(RDBMS) 176
5.1.1 常用RDBMS簡介 177
5.1.2 結構化查詢語言(SQL) 178
5.2 用SQLite 連接R 179
5.2.1 準備并導入數據到本地SQLite數據庫 179
5.2.2 通過RStudio連接SQLite數據庫 182
5.3 在Amazon EC2實例中連接MariaDB和R 186
5.3.1 準備EC2實例和RStudio服務器 186
5.3.2 準備MariaDB和數據 188
5.3.3 連接MariaDB和RStudio 195
5.4 連接Amazon RDS上的PostgreSQL和R 209
5.4.1 啟動一個Amazon RDS數據庫實例 209
5.4.2 準備并上傳數據到Amazon RDS上 214
5.4.3 從RStudio 遠程查詢Amazon RDS上的PostgreSQL 222
5.5 小結 232
第6章 R與非關系型數據庫 233
6.1 NoSQL數據庫簡介 233
6.2 用R操作MongoDB 236
6.2.1 MongoDB簡介 236
6.2.2 在Amazon EC2上安裝MongoDB并與R連接 237
6.2.3 使用MongoDB和R處理大數據 240
6.3 Hbase與R 268
6.3.1 Azure HDInsight與HBase和RStudio Server 268
6.3.2 將數據導入HDFS和HBase 274
6.3.3 使用rhbase包讀取和查閱Hbase 277
6.4 小結 282
第7章 比Hadoop更快——使用R編寫Spark 283
7.1 為大數據分析服務的Spark 283
7.2 多節點HDInsight集群上使用R的Spark 284
7.2.1 部署使用支持Spark和R/RStudio的HDInsight 284
7.2.2 將數據讀入HDFS和Hive 289
7.2.3 使用SparkR分析灣區共享單車數據 299
7.3 小結 315
第8章 R語言大數據機器學習 316
8.1 機器學習是什么 316
8.1.1 機器學習算法 316
8.1.2 監督和無監督機器學習方法 317
8.1.3 分類和聚類算法 318
8.1.4 R機器學習方法 318
8.1.5 大數據機器學習工具 319
8.2 在HDInsight集群中使用Spark和R的GLM示例 320
8.2.1 準備Spark群集并從HDFS讀取數據 320
8.2.2 Spark中的R語言邏輯回歸 325
8.3 R中基于Hadoop H2O的樸素貝葉斯 336
8.3.1 在R中運行Hadoop上的H2O實例 336
8.3.2 讀取和探索H2O中的數據 340
8.3.3 R中基于H2O的樸素貝葉斯 343
8.4 R中基于Hadoop H2O的神經網絡 355
8.4.1 神經網絡的工作原理 355
8.4.2 在H2O上運行神經網絡模型 356
8.5 小結 364
第9章 R語言的未來——大數據、快數據、智能數據 365
9.1 R大數據分析的現狀 365
9.1.1 超過單機內存的數據 365
9.1.2 更快的R數據處理 367
9.1.3 Hadoop與R 367
9.1.4 Spark與R 368
9.1.5 R與數據庫 369
9.1.6 機器學習與R 370
9.2 R的未來 370
9.2.1 大數據 370
9.2.2 快數據 371
9.2.3 智能數據 372
9.3 如何提升 372
9.4 小結 373
序: