R語言數據可視化之美:專業圖表繪制指南(增強版) ( 簡體 字) |
作者:張杰 | 類別:1. -> 程式設計 -> R語言 |
譯者: |
出版社:電子工業出版社 | 3dWoo書號: 51969 詢問書籍請說出此書號!【缺書】 NT售價: 795 元 |
出版日:10/1/2019 |
頁數:376 |
光碟數:0 |
|
站長推薦: |
印刷:黑白印刷 | 語系: ( 簡體 版 ) |
|
加入購物車 │加到我的最愛 (請先登入會員) |
ISBN:9787121374432 |
作者序 | 譯者序 | 前言 | 內容簡介 | 目錄 | 序 |
(簡體書上所述之下載連結耗時費功, 恕不適用在台灣, 若讀者需要請自行嘗試, 恕不保證) |
作者序: |
譯者序: |
前言:本書主要介紹如何使用R中的ggplot2包及其拓展包,以及ggraph、circlize和plot3D等包繪制專業圖表。本書先介紹了R語言編程基礎知識,以及使用dplyr、tidyr、reshape2等包的數據操作方法;再對比了base、lattice和ggplot2等包的圖形語法。本書系統性地介紹了使用ggplot2包及其拓展包繪制類別對比型、數據關系型、時間序列型、整體局部型、地理空間型等常見的二維圖表的方法,ggraph、 igraph、circlize等包繪制層次、網絡關系型圖表,以及使用plot3D包繪制三維圖表(包括三維散點圖、柱形圖和曲面圖等)的方法。另外,本書也介紹了論文中學術圖表的圖表配色、規范格式等相關技能與知識。 本書定位 雖然現在Python語言越來越流行,尤其是在機器學習與深度學習等領域,但是R語言在數據分析與可視化方面仍然具有絕對的優勢,其中ggplot2包及其拓展包人性化的繪圖語法大受用戶的喜愛,特別是生物信息與醫學研究者。Nature、Science和Cell等期刊上大量的圖表都是使用R語言繪制的,所以很有必要系統性地介紹R語言的繪圖方法。 R ggplot2有兩本很經典的教程:ggplot2 Elegant Graphics for Data Analysis和R Graphics Cookbook,兩本書重點介紹了ggplot2包的繪圖語法及常見圖表的繪制方法,但是其中介紹的圖表種類并不多。所以本書基于R中的ggplot2包及其拓展包和plot3D包,系統性地介紹了幾乎所有常見的二維和三維圖表的繪制方法,包括簡單的柱形圖系列、條形圖系列、折線圖系列,以及復雜的和弦圖、矩形樹狀圖、日歷圖等。 讀者對象 本書適用于想學習數據分析與可視化相關專業課程的高校學生,以及對數據分析與可視化感興趣的職場人士閱讀,尤其是R語言用戶。從軟件掌握程度而言,本書同樣適用于零基礎學習R語言的用戶。 閱讀指南 全書內容共有12章,其中,第1章和第2章是后面9章的基礎,第3∼11章都是獨立章節,可以根據實際需求有選擇性地進行學習。 第1章 介紹R語言編程與數據可視化基礎,對比了base、lattice和ggplot2包的圖形語法,重點介紹了ggplot2包的圖形語法; 第2章 介紹R語言數據處理基礎,重點介紹了使用dplyr、tidyr、reshape2等包的數據操作方法; 第3章 介紹類別比較型圖表,包括柱形圖系列、條形圖系列、南丁格爾玫瑰圖、徑向柱圖等約30張圖表; 第4章 介紹數據關系型圖表,包括二維和三維散點圖、氣泡圖、等高線圖、三維曲面圖、三元相圖、二維和三維瀑布圖、相關系數熱力圖等約60張圖表; 第5章 介紹數據分布型圖表,包括一維、二維和三維的統計直方圖和核密度估計圖、抖動散點圖、點陣圖、箱形圖、小提琴圖等約50張圖表; 第6章 介紹時間序列型圖表,包括折線圖和面積圖系列、日歷圖、螺旋圖系列、量化波形圖、地平線圖等約20張圖表; 第7章 介紹局部整體型圖表,包括餅圖、散點復合餅圖系列、馬賽克圖、華夫餅圖等約20張圖表; 第8章 介紹高維數據的可視化方法,包括分面圖系列、矩陣散點圖、熱力圖、平行坐標系圖、RadViz圖、圖標法等約20張圖表; 第9章 介紹層次關系型圖表,包括節點鏈接圖、旭日圖、矩形樹狀圖、樹形圖、桑基圖等約10多張圖表; 第10章 介紹網絡關系型圖表,包括節點鏈接圖、弧線鏈接圖、蜂巢網絡圖、和弦圖等約10多張圖表; 第11章 介紹地理空間型圖表,包括從世界到國家、再到地方局部的地圖,還有分級統計地圖,點描法地圖,帶氣泡、柱形、餅圖、連接線的地圖,等位地圖、線型地圖等30多張不同的地圖圖表。 第12章 介紹論文中學術圖表的常用技能,包括常見的截圖與圖片處理軟件及其功能、矢量圖片的修改、論文中學術圖表數據的提取與重繪、論文中學術圖表的規范與調整等。 應用范圍 本書的圖表繪制方法都是基于R中的ggplot2包及其拓展包和其他繪圖包實現的,幾乎適應于所有常見的二維和三維圖表。本書以虛擬地圖的數據為例講解不同的地理空間型圖表,讀者需將繪圖方法應用到實際的地理空間型圖表。 適用版本 本書所用R版本為:3.3.3。R作為免費的開源軟件,數據分析與可視化的包更新迭代很快,這是它的優勢。但是有時候有些代碼運行可能會由于R或者R包版本的更新,而出現函數棄用(deprecated)的情況。此時,需要自己更新代碼,使用新的函數替代原有的函數。 源代碼 本書配有幾乎所有圖表的R語言源文件及其.csv或.txt格式的數據源文件。但是需要注意的是,如果運行的R語言版本沒有安裝相應的數據分析與可視化的包(package),那么請預先安裝相應的包,才能成功運行代碼。同時,也請注意運行R語言和R包的版本是否已經更新。 因本人知識與能力所限,書中紕漏之處在所難免,歡迎并懇請讀者朋友們給予批評與指正,可以通過郵箱聯系筆者;如果讀者有關于R語言學術圖表或商業圖表繪制的問題,可以與筆者交流。另外,更多關于R語言圖表繪制的教程請關注筆者的博客、專欄和微博平臺。也可以重點關注我們的微信公眾號:EasyCharts,還可以添加筆者微信:EasyCharts。筆者的R語言數據分析與可視化的文章會優先發表在微信公眾號平臺。 致謝 桃李春風一杯酒,江湖夜雨十年燈。筆者的處女作《Excel數據之美:科學圖表與商業圖表的繪制》也至今出版逾兩年,一直想著要修訂這本書。但是舊書未翻新,新書忙于碼字改稿,實在是有愧于讀者。其實,在撰寫這本新書的時候,數次想放棄。寫書實在是一件費力勞神的事情,筆者是憑借著對數據可視化的熱愛才堅持至今。 這本書從2017年5月25日開始動筆,斷斷續續居然也花費了兩年的時間。與其說是花費,不如說是陪伴吧。筆者經常對朋友開玩笑說,心情不好的時候碼碼代碼、畫畫圖表,是一件消磨時間、放松心情的事情。 在斷斷續續的寫稿中,筆者也認識了很多熱愛數據分析與可視化的朋友,甚是榮幸,也得益于他們的幫助。很感謝《R語言游戲數據分析與挖掘》的作者謝佳標老師和先鋒信息科技有限公司CEO林禎舜老師對筆者的鼓勵與幫助,也因此有幸參加了2018年的R語言大會;也非常感謝在碼字、寫代碼時一起交流學習的李譽輝(四川大學高分子學院)、杜雨(美團用戶平臺—大數據與算法部—商業分組部)、劉鈺(河南大學土木建筑學院)、厚?(深圳中觀經濟咨詢有限公司)等諸多技術大佬。因為有你們的幫助,所以才有今天這本書。 最后,想對大家說,也是對自己說:且將新火試新茶,詩酒趁年華! 增強版特別說明 隨心而動,立志而行。現在的生活紛紛擾擾,可以做自己喜歡的事情實屬難得。筆者的《R語言數據可視化之美:專業圖表繪制指南》于2019年5月出版,沒想到如此受大家喜愛,有些讀者都買了好幾本。實在慚愧,由于《地圖管理條例》的相關規定,涉及地圖的內容都需要嚴格審查才能出版,所以筆者不得不刪減了嘔心瀝血撰寫的關于地理空間型圖表的章節,然而很多讀者其實特別關注這個部分。 筆者后來想到一個迂回曲折的辦法,自己虛擬了幾個國家和城市的信息數據,使用虛擬地圖的方式講解各種地理空間型圖表,這樣才使得相關內容順利出版。另外,筆者順便把讀者反映的層次關系型和網絡關系型圖表也逐一添加進增強版中。到目前為止,常見的圖表類型基本都已經被囊括書中。 R包的更新迭代很快,也層出不窮。在此,非常感謝辛勤的開發者們。小時候學到一句話:學如逆水行舟,不進則退。R包的更新與創新,也促使大家要不斷地學習,才能跟上新的技術。所以,也希望大家不斷學習、不斷進步。 再次感謝杜雨、李譽輝、劉鈺、厚?等諸多技術大佬。因為有你們的幫助,所以才有今天這本書。最后,想再次對大家說,也是對自己說:學如逆水行舟,不進則退。
作 者 2019年9月2日 |
內容簡介:本書主要介紹使用R 中的ggplot2 包及其拓展包、ggraph 包、circlize 包和plot3D 包等繪制專業圖表的方法。本書先介紹了R 語言編程基礎知識,以及使用dplyr、tidyr、reshape2 等包的數據操作方法;再對比了base、lattice 和ggplot2 包的圖形語法。本書首次系統性地介紹了使用ggplot2 包及其拓展包繪制類別對比型、數據關系型、時間序列型、整體局部型、地理空間型等常見的二維圖表的方法,ggraph、 igraph、circlize 等包繪制層次、網絡關系型圖表,以及使用plot3D 包繪制三維圖表(包括三維散點圖、柱形圖和曲面圖等)的方法。另外,本書也首次介紹了論文中學術圖表的圖表配色、規范格式等相關技能與知識。 |
目錄:第1章 R語言編程與繪圖基礎 1
1.1 學術圖表的基本概念 2
1.1.1 學術圖表的基本作用 3
1.1.2 學術圖表的基本類別 5
1.1.3 學術圖表的繪制原則 7
1.2 你為什么要選擇R 8
1.3 R軟件的安裝與使用 15
1.3.1 R與RStudio的安裝 15
1.3.2 包的安裝與加載 16
1.4 R語言編程基礎 17
1.4.1 數據類型 17
1.4.2 數據結構 18
1.4.3 數據屬性 21
1.4.4 數據的導入與導出 23
1.4.5 控制語句與函數編寫 26
1.5 R語言繪圖基礎 28
1.6 ggplot2圖形語法 30
1.6.1 geom_xxx()與stat_xxx() 32
1.6.2 視覺通道映射 34
1.6.3 度量調整 38
1.6.4 坐標系 44
1.6.5 圖例 53
1.6.6 主題系統 55
1.6.7 位置調整 58
1.7 學術圖表的色彩運用原理 62
1.7.1 顏色模式 62
1.7.2 顏色主題的搭配原理 67
1.7.3 學術圖表的顏色主題 70
1.7.4 顏色方案的拾取使用 72
1.7.5 顏色主題的應用案例 75
1.8 圖表的基本類型 78
1.8.1 類別比較 79
1.8.2 數據關系 79
1.8.3 數據分布 81
1.8.4 時間序列 82
1.8.5 局部整體 82
1.8.6 地理空間 83
第2章 R語言數據處理基礎 84
2.1 表格的轉換 85
2.1.1 表格的變換 85
2.1.2 變量的變換 86
2.1.3 表格的排序 87
2.2 表格的整理 87
2.2.1 表格的拼接 87
2.2.2 表格的融合 88
2.2.3 表格的分組操作 90
第3章 類別比較型圖表 93
3.1 柱形圖系列 94
3.1.1 單數據系列柱形圖 95
3.1.2 多數據系列柱形圖 96
3.1.3 堆積柱形圖 97
3.1.4 百分比堆積柱形圖 98
3.2 條形圖系列 99
3.3 不等寬柱形圖 100
3.4 克利夫蘭點圖系列 101
3.5 坡度圖 103
3.6 南丁格爾玫瑰圖 104
3.7 徑向柱形圖 108
3.8 雷達圖 110
3.9 詞云圖 113
第4章 數值關系型圖表 117
4.1 散點圖系列 118
4.1.1 趨勢顯示的二維散點圖 118
4.1.2 分布顯示的二維散點圖 125
4.1.3 氣泡圖 129
4.1.4 三維散點圖 132
4.2 曲面擬合圖 136
4.3 等高線圖 139
4.4 切面圖 140
4.5 三元相圖 142
4.6 散點曲線圖系列 143
4.7 瀑布圖 145
4.8 相關系數圖 151
4.9 韋恩圖 153
第5章 數據分布型圖表 155
5.1 統計直方圖和核密度估計圖 157
5.1.1 統計直方圖 157
5.1.2 核密度估計圖 157
5.2 數據分布型圖表系列 161
5.2.1 散點分布圖系列 162
5.2.2 柱形分布圖系列 164
5.2.3 箱形圖系列 165
5.2.4 其他圖表 170
5.3 二維統計直方圖和二維核密度估計圖 180
5.3.1 二維統計直方圖 180
5.3.2 二維核密度估計圖 180
5.4 金字塔圖和鏡面圖 184
第6章 時間序列型圖表 186
6.1 折線圖與面積圖系列 187
6.1.1 折線圖 187
6.1.2 面積圖 187
6.2 日歷圖 191
6.3 螺旋圖 194
6.4 量化波形圖 199
6.5 地平線圖 202
第7章 局部整體型圖表 205
7.1 餅狀圖系列 206
7.1.1 餅圖 206
7.1.2 圓環圖 208
7.1.3 復合餅圖系列 208
7.2 馬賽克圖 211
7.3 華夫餅圖 214
第8章 高維數據可視化 216
8.1 高維數據的變換展示 218
8.1.1 主成分分析法 218
8.1.2 t-SNE算法 220
8.2 分面圖 221
8.3 矩陣散點圖 225
8.4 熱力圖 227
8.5 平行坐標系圖 230
8.6 RadViz圖 232
8.7 圖標法 233
8.7.1 基于星形圖的圖標法 234
8.7.2 基于柱形圖的圖標法 236
8.7.3 切爾諾夫臉譜圖 238
8.8 表格圖 241
第9章 層次關系型圖表 242
9.1 表示層次關系型數據的節點鏈接圖 243
9.2 樹形圖 248
9.3 旭日圖 252
9.4 圓堆積圖 255
9.5 矩形樹狀圖 256
第10章 網絡關系型圖表 260
10.1 相鄰矩陣圖 262
10.2 和弦圖 265
10.3 桑基圖 270
10.4 表示網絡關系型數據的節點鏈接圖 273
10.5 蜂巢網絡圖 281
10.6 邊綁定圖 283
第11章 地理空間型圖表 287
11.1 不同級別的地圖 288
11.1.1 世界地圖 288
11.1.2 國家地圖 294
11.1.3 局部地圖 299
11.2 分級統計地圖 300
11.3 點描法地圖 304
11.4 帶餅圖的地圖 309
11.5 帶柱形的地圖 311
11.6 沃羅諾伊地圖 312
11.7 帶連接線的地圖 314
11.7.1 連接地圖 314
11.7.2 流向地圖 315
11.8 等位地圖 317
11.9 線型地圖 322
11.10 點狀地圖 324
11.11 簡化示意圖 327
11.12 郵標法 331
11.13 地鐵線路圖 333
11.13.1 示意地鐵線路圖的繪制 334
11.13.2 實際地鐵線路圖 335
11.13.3 地鐵線路圖的應用 336
第12章 論文中學術圖表的升級技能 341
12.1 圖片的截取與處理軟件 342
12.1.1 常見截圖軟件 342
12.1.2 圖片處理軟件 342
12.2 論文中學術圖表的規范與調整 343
12.2.1 圖片的格式與轉換 345
12.2.2 圖片的分辨率 348
12.2.3 圖片的色彩要求 350
12.2.4 圖片的物理尺寸 351
12.2.5 圖片的標注格式 352
12.2.6 圖片的占內存容量 352
12.2.7 在R中導出圖表 354
12.3 圖表繪制的必備技能 355
12.3.1 矢量圖表元素的修改 355
12.3.2 期刊論文的圖片提取 357
12.3.3 圖表數據的重新提取 357
參考文獻 360 |
序: |