Python數據可視化( 簡體 字) | |
作者:[美]馬里奧·多布勒 [美]蒂姆·高博曼 著 李瀛宇 譯 | 類別:1. -> 程式設計 -> Python -> 程式設計 -> Tableau |
出版社:清華大學出版社 | 3dWoo書號: 52783 詢問書籍請說出此書號! 有庫存 NT售價: 495 元 |
出版日:6/1/2020 | |
頁數:275 | |
光碟數:0 | |
站長推薦: | |
印刷:黑白印刷 | 語系: ( 簡體 字 ) |
ISBN:9787302553489 | 加入購物車 │加到我的最愛 (請先登入會員) |
(簡體書上所述之下載連結耗時費功, 恕不適用在台灣, 若讀者需要請自行嘗試, 恕不保證, 繁體書的下載亦請直接連絡出版社) | |
第1章數據可視化和數據探索的重要性1
1.1簡介1 1.1.1數據可視化簡介1 1.1.2數據可視化的重要性2 1.1.3數據整理2 1.1.4可視化工具和庫3 1.2統計學概述4 1.2.1集中趨勢的度量5 1.2.2離散度測量6 1.2.3相關性6 1.2.4數據類型7 1.2.5摘要統計信息7 1.3NumPy8 1.3.1練習1:加載示例數據集并計算平均值9 1.3.2操作1:使用NumPy計算平均值、中位數、方差和標準偏差12 1.3.3基本的NumPy操作13 1.3.4操作2:索引、切片、分割和迭代14 1.3.5高級NumPy操作15 1.3.6操作3:過濾、排序、組合和重構16 1.4pandas17 1.4.1pandas的優點17 1.4.2pandas的缺點18 1.4.3練習2:加載示例數據集并計算平均值18 1.4.4操作4:使用pandas計算平均值、中位數和給定數字的方差22 1.4.5基本的pandas操作22 1.4.6Series23 1.4.7操作5:基于pandas的索引、切片和迭代24 1.4.8pandas高級操作24 1.4.9操作6:過濾、排序和重構25 1.5本章小結26 第2章繪圖知識29 2.1簡介29 2.2比較圖29 2.2.1線形圖30 2.2.2柱狀圖31 2.2.3雷達圖33 2.2.4操作7:員工技能比較35 2.3關系圖36 2.3.1散點圖37 2.3.2氣泡圖40 2.3.3相關圖40 2.3.4熱圖42 2.3.5操作8:20年內道路交通事故統計44 2.4合成圖44 2.4.1餅圖44 2.4.2堆疊式柱狀圖46 2.4.3堆疊式面積圖48 2.4.4操作9:智能手機銷售額49 2.4.5維恩圖50 2.5分布圖50 2.5.1直方圖51 2.5.2密度圖51 2.5.3箱形圖52 2.5.4小提琴圖54 2.5.5操作10:不同時間區間內列車的頻率56 2.6地理圖56 2.6.1點圖57 2.6.2等值區域圖58 2.6.3連接圖59 2.7良好的設計規則60 2.7.1一般的設計實踐60 2.7.2操作11:確定理想的可視化操作60 2.8本章小結62 第3章Matplotlib63 3.1簡介63 3.2Matplotlib中的圖表63 3.3pyplot基本知識65 3.3.1創建Figure65 3.3.2關閉Figure66 3.3.3格式化字符串66 3.3.4繪制機制67 3.3.5利用pandasDataFrame繪制69 3.3.6顯示Figure69 3.3.7保存Figure69 3.3.8創建簡單的可視化內容70 3.4基本的文本和圖例功能71 3.4.1標記72 3.4.2標題72 3.4.3文本72 3.4.4標注72 3.4.5圖例73 3.4.6操作12:利用線形圖可視化股票的走勢73 3.5基本圖表74 3.5.1柱狀圖74 3.5.2操作13:比較影片評分的柱狀圖76 3.5.3餅圖77 3.5.4創建耗水量餅圖78 3.5.5堆疊式柱狀圖80 3.5.6操作14:餐廳業績的可視化結果80 3.5.7堆疊式面積圖81 3.5.8操作15:利用堆疊式面積圖比較智能手機的銷售狀態82 3.5.9直方圖83 3.5.10箱形圖85 3.5.11操作16:智商的直方圖和箱形圖86 3.5.12散點圖87 3.5.13操作17:利用散點圖可視化動物間的相關性88 3.5.14氣泡圖89 3.6布局90 3.6.1子圖90 3.6.2緊湊型子圖92 3.6.3雷達圖94 3.6.4與雷達圖協同工作94 3.6.5GridSpec96 3.6.6操作18:基于邊緣直方圖創建散點圖97 3.7圖像98 3.7.1基本的圖像操作98 3.7.2操作19:在網格中繪制多幅圖像103 3.8編寫數學表達式103 3.9本章小結104 第4章利用Seaborn簡化可視化操作105 4.1簡介105 4.2控制Figure觀感106 4.2.1圖形樣式108 4.2.2移除軸向110 4.2.3上下文111 4.2.4操作20:利用箱形圖比較不同測試分組中的IQ值112 4.3調色板113 4.3.1分類調色板114 4.3.2連續調色板115 4.3.3離散調色板116 4.3.4操作21:利用熱圖發現航班數據中的模式117 4.4Seaborn中的圖表118 4.4.1柱狀圖118 4.4.2操作22:電影評分比較119 4.4.3核密度估算119 4.4.4相互關系的可視化122 4.4.5小提琴圖123 4.4.6操作23:利用小提琴圖比較不同測試組中的IQ值124 4.5Seaborn中的多圖表125 4.5.1FacetGrid125 4.5.2操作24:前30個YouTube頻道126 4.6回歸圖127 4.7Squarify庫129 4.8本章小結130 第5章繪制地理空間數據131 5.1簡介131 5.1.1Geoplotlib的設計原理132 5.1.2地理空間可視化133 5.1.3簡單地理空間數據的可視化134 5.1.4操作27:繪制地圖上的地理空間數據138 5.1.5采用GeoJSON數據的等值線圖140 5.2圖塊提供商144 5.3自定義層148 5.4本章小結149 第6章基于Bokeh的交互式操作151 6.1簡介151 6.1.1Bokeh的基本概念152 6.1.2Bokeh中的接口152 6.1.3輸出153 6.1.4Bokeh服務器153 6.1.5演示154 6.1.6集成155 6.1.7利用Bokeh進行繪制155 6.1.8比較plotting和models接口161 6.2添加微件169 6.2.1基本的交互式微件169 6.2.2操作29:利用微件擴展圖表179 6.3本章小結180 第7章知識整合181 7.1簡介181 7.1.1操作30:實現Matplotlib和Seaborn操作181 7.1.2操作31:利用Bokeh可視化股票價格184 7.1.3geoplotlib185 7.1.4操作32:利用geoplotlib分析Airbnb數據185 7.2本章小結186 附錄189 第1章數據可視化和數據探索的重要性189 操作1:使用NumPy計算平均值、中位數、方差和標準偏差189 操作2:索引、切片、分割和迭代192 操作3:過濾、排序、組合和重構197 操作4:使用pandas計算平均值、中位數和給定數字的方差200 操作5:基于pandas的索引、切片和迭代204 操作6:過濾、排序和重構209 第2章繪圖知識215 操作7:員工技能比較215 操作8:20年內道路交通事故統計215 操作9:智能手機銷售額215 操作10:不同時間區間內列車的頻率215 操作11:確定理想的可視化操作216 第3章Matplotlib218 操作12:利用線形圖可視化股票的走勢218 操作13:比較影片評分的柱狀圖219 操作14:餐廳業績的可視化結果220 操作15:利用堆疊式面積圖比較智能手機的銷售狀態222 操作16:智商的直方圖和箱形圖223 操作17:利用散點圖可視化動物間的相關性225 操作18:基于邊緣直方圖創建散點圖226 操作19:在網格中繪制多幅圖像228 第4章利用Seaborn簡化可視化操作229 操作20:利用箱形圖比較不同測試分組中的IQ值229 操作21:利用熱圖發現航班數據中的模式231 操作22:電影評分比較232 操作23:利用小提琴圖比較不同測試組中的IQ值233 操作24:前30個YouTube頻道235 操作25:線性回歸237 操作26:耗水量238 第5章繪制地理空間數據239 操作27:繪制地圖上的地理空間數據239 操作28:與自定義層協同工作246 第6章基于Bokeh的交互式操作249 操作29:利用微件擴展圖表249 第7章知識整合255 操作30:實現Matplotlib和Seaborn操作255 操作31:利用Bokeh可視化股票價格261 操作32:利用geoplotlib分析Airbnb數據268 本書詳細闡述了與Python數據可視化相關的基本解決方案,主要包括數據可視化和數據探索的重要性、繪圖知識、Matplotlib、利用Seaborn簡化可視化操作、繪制地理空間數據、基于Bokeh的交互式操作等內容。此外,本書還提供了相應的示例、代碼,以幫助讀者進一步理解相關方案的實現過程。
本書適合作為高等院校計算機及相關專業的教材和教學參考書,也可作為相關開發人員的自學教材和參考手冊。 關于本書
本書將介紹數據可視化的內容及其重要性。隨后,讀者將學習如何計算平均值、中位數和方差以了解統計學方面的知識,并觀察對應數值之間的差異。除此之外,讀者還將學習關鍵的NumPy和Pandas技術,如索引、切片、迭代、過濾和分組機制。接下來,將介紹可視化的不同類型并對其進行比較。據此,讀者將能夠了解如何選取特定的可視化類型。其間,讀者將探討不同的圖表,同時還包括自定義圖表。 在了解了各種可視化庫之后,讀者將學習如何使用Matplotlib和Seaborn簡化可視化的創建過程。除此之外,本書還將引入高級可視化技術,如地理圖和交互式圖表。讀者將學習如何利用地理空間數據創建交互式可視化內容,并可集成至Web頁面中。我們可通過任意數據集構建美觀且具有洞察力的可視化內容。通過等值線圖以及Bokeh,我們還將學習如何在地圖上繪制地理空間數據,并通過添加微件和動畫顯示信息擴展圖表。 最后,本書將對所學知識進行整合,讀者將得到一個新的數據集,并以此創建一個具有洞察力的可視化圖表。 本書目標 ? 了解各種圖表及其最佳用例。 ? 與不同的繪圖庫協同工作并討論其優缺點。 ? 學習如何創建具有洞察力的可視化內容。 ? 了解創建優良可視化圖表的所需條件。 ? 提升Python數據整理技能。 ? 學習相關的業界標準工具。 ? 了解數據格式和表達方式。 適合讀者 本書是針對想步入數據科學領域的開發人員和相關人士而編寫的,他們希望通過數據可視化進一步豐富其個人專業項目。在閱讀本書之前,讀者不需要具備數據分析和可視化方面的經驗,但需要了解Python的基本知識以及高中水平的數學知識。盡管本書是一本入門級的數據可視化書籍,但具有一定經驗的讀者仍可從中受益,并可通過真實數據提升他們的Python技能。 本書以通俗易懂的語言講述了數據可視化技術,并完美地平衡了理論與實踐之間的內容。具體來說,每一章內容都是在前一章的基礎上加以設計的。另外,本書還包含了多項操作,并在現實生活中的業務場景和高度相關的環境中實踐、運用所學的技能。 軟件和硬件需求 為了獲得最佳體驗,推薦使用以下硬件配置。 ? 操作系統:Windows 7 SP1 32/64-bit,Windows 8.1 32/64-bit,Windows 10 32/64-bit,Ubuntu 14.04(及后續版本),macOS Sierra(及后續版本)。 ? 處理器:雙核或更高配置。 ? 內存:4GB RAM。 ? 存儲:10GB可用空間。 除此之外,讀者還需要安裝下列軟件。 ? 瀏覽器:Google Chrome或Mozilla Firefox。 ? Conda。 ? JupyterLab和Jupyter Notebook。 ? Sublime Text(最新版本)、Atom IDE(最新版本)或其他類似的文本編輯應用程序。 ? Python 3。 ? 安裝以下Python庫:NumPy、pandas、Matplotlib、seaborn、geoplotlib、Bokeh和squarify。 |