Python數據分析與可視化-微課視頻版( 簡體 字) | |
作者:魏偉一、李曉紅 | 類別:1. -> 程式設計 -> Python |
出版社:清華大學出版社 | 3dWoo書號: 52513 詢問書籍請說出此書號! 有庫存 NT售價: 245 元 |
出版日:3/1/2020 | |
頁數:236 | |
光碟數:0 | |
站長推薦: | |
印刷:黑白印刷 | 語系: ( 簡體 字 ) |
ISBN:9787302546665 | 加入購物車 │加到我的最愛 (請先登入會員) |
(簡體書上所述之下載連結耗時費功, 恕不適用在台灣, 若讀者需要請自行嘗試, 恕不保證, 繁體書的下載亦請直接連絡出版社) | |
第1章數據分析與可視化概述
1.1數據分析 1.2數據可視化 1.3數據分析與可視化常用工具 1.4為何選用Python進行數據分析與可視化 1.5Python數據分析與可視化常用類庫 1.6JupyterNotebook的使用 1.7本章小結 第2章Python編程基礎 2.1Python語言基本語法 2.1.1基礎數據類型 2.1.2變量和賦值 2.1.3運算符和表達式 2.1.4字符串 2.1.5流程控制 2.2內置數據類型 2.2.1列表 2.2.2元組 2.2.3字典 2.2.4集合 2.3函數 2.3.1函數的定義 2.3.2lambda函數 2.4文件操作 2.4.1文件處理過程 2.4.2數據的讀取方法 2.4.3讀取CSV文件 2.4.4文件寫入與關閉 2.5本章小結 本章實訓 第3章NumPy數值計算基礎 3.1NumPy多維數組 3.1.1創建數組對象 3.1.2ndarray對象屬性和數據轉換 3.1.3生成隨機數 3.1.4數組變換 3.2數組的索引和切片 3.2.1一維數組的索引 3.2.2多維數組的索引 3.3數組的運算 3.3.1數組和標量間的運算 3.3.2ufunc函數 3.3.3條件邏輯運算 3.4數組讀/寫 3.4.1讀/寫二進制文件 3.4.2讀/寫文本文件 3.4.3讀取CSV文件 3.5NumPy中的數據統計與分析 3.5.1排序 3.5.2重復數據與去重 3.5.3常用統計函數 3.6本章小結 本章實訓 第4章Pandas統計分析基礎 4.1Pandas中的數據結構 4.1.1Series 4.1.2DataFrame 4.1.3索引對象 4.1.4查看DataFrame的常用屬性 4.2Pandas索引操作 4.2.1重建索引 4.2.2更換索引 4.3DataFrame數據的查詢與編輯 4.3.1DataFrame數據的查詢 4.3.2DataFrame數據的編輯 4.4Pandas數據運算 4.4.1算術運算 4.4.2函數應用和映射 4.4.3排序 4.4.4匯總與統計 4.5數據分組與聚合 4.5.1數據分組 4.5.2數據聚合 4.5.3分組運算 4.6數據透視表 4.6.1透視表 4.6.2交叉表 4.7Pandas可視化 4.7.1線形圖 4.7.2柱狀圖 4.7.3直方圖和密度圖 4.7.4散點圖 4.8本章小結 本章實訓 第5章Pandas數據載入與預處理 5.1數據載入 5.1.1讀/寫文本文件 5.1.2讀/寫Excel文件 5.2合并數據 5.2.1merge數據合并 5.2.2concat數據連接 5.2.3combine_first合并數據 5.3數據清洗 5.3.1檢測與處理缺失值 5.3.2檢測與處理重復值 5.3.3檢測與處理異常值 5.3.4數據轉換 5.4數據標準化 5.4.1離差標準化數據 5.4.2標準差標準化數據 5.5數據轉換 5.5.1類別型數據的啞變量處理 5.5.2連續型變量的離散化 5.6本章小結 本章實訓 第6章Matplotlib數據可視化基礎 6.1Matplotlib簡介 6.2Matplotlib繪圖基礎 6.2.1創建畫布與子圖 6.2.2添加畫布內容 6.2.3繪圖的保存與顯示 6.3設置Pyplot的動態rc參數 6.3.1全局參數定制 6.3.2rc參數設置 6.3.3繪圖的填充 6.3.4文本注解 6.4Pyplot中的常用繪圖 6.4.1折線圖 6.4.2散點圖 6.4.3直方圖 6.4.4餅圖 6.4.5箱線圖 6.4.6概率圖 6.5詞云 6.5.1安裝相關的包 6.5.2詞云生成過程 6.5.3詞云生成示例 6.6本章小結 本章實訓 第7章Seaborn可視化 7.1Seaborn簡介 7.2風格設置 7.2.1Seaborn繪圖設置 7.2.2Seaborn主題設置 7.2.3設置繪圖元素比例 7.3Seaborn中的常用繪圖 7.3.1直方圖和密度曲線圖 7.3.2散點圖 7.3.3箱線圖 7.3.4散點圖矩陣 7.3.5小提琴圖 7.3.6柱狀圖 7.3.7多變量圖 7.3.8回歸圖 7.4本章小結 本章實訓 第8章pyecharts可視化 8.1pyecharts簡介 8.2pyecharts的使用方法 8.3pyecharts常用圖表 8.3.1柱狀圖 8.3.2餅圖 8.3.3漏斗圖 8.3.4散點圖 8.3.5K線圖 8.3.6儀表盤 8.3.7詞云 8.3.8組合圖表 8.4本章小結 本章實訓 第9章時間序列數據分析 9.1日期和時間數據類型 9.1.1datetime構造 9.1.2數據轉換 9.2時間序列基礎 9.2.1時間序列構造 9.2.2索引與切片 9.3日期范圍、頻率和移位 9.3.1日期范圍 9.3.2頻率和移位 9.4時期 9.4.1時期基礎 9.4.2頻率轉換 9.4.3時期數據轉換 9.5重采樣、降采樣和升采樣 9.5.1重采樣 9.5.2降采樣 9.5.3升采樣 9.6本章小結 本章實訓 第10章SciPy科學計算 10.1SciPy中的常數與特殊函數 10.1.1SciPy的constants模塊 10.1.2SciPy的special模塊 10.2SciPy中的線性代數基本運算 10.2.1基本的矩陣運算 10.2.2線性方程組求解 10.2.3行列式的計算 10.2.4范數 10.2.5特征值分解 10.2.6奇異值分解 10.3SciPy中的優化 10.3.1方程求解及求極值 10.3.2數據擬合 10.4SciPy中的稀疏矩陣處理 10.4.1稀疏矩陣的存儲 10.4.2稀疏矩陣的運算 10.5SciPy中的圖像處理 10.5.1圖像平滑 10.5.2圖像旋轉和銳化 10.6本章小結 本章實訓 第11章統計與機器學習 11.1Scikitlearn的主要功能 11.2分類 11.2.1決策樹規約 11.2.2KNN算法 11.2.3支持向量機 11.2.4樸素貝葉斯分類 11.3聚類 11.3.1KMeans聚類 11.3.2層次聚類 11.3.3基于密度的聚類 11.4主成分分析 11.5本章小結 本章實訓 第12章圖像數據分析 12.1OpenCV簡介與導入 12.1.1OpenCV簡介 12.1.2Python中OpenCV的安裝與導入 12.2cv2圖像處理基礎 12.2.1cv2的基本方法與屬性 12.2.2cv2圖像處理示例 12.3應用尺度不變特征變換 12.4使用加速魯棒特征檢測 12.5圖像降噪 12.6本章小結 本章實訓 第13章綜合案例 13.1職業人群體檢數據分析 13.2股票數據分析 本書使用Python語言,通過大量示例代碼,講解了各種數據分析庫的使用方法和技巧,并對各類數 據圖表的繪制方法進行了詳細的闡述。同時,本書還提供了多個案例,讓讀者理解數據分析方法在實踐中的應用,從而體會數據分析及可視化的樂趣。 本書共13章,主要內容包括數據分析與可視化概述、 Python編程基礎、NumPy數值計算基礎、 Pandas統計分析基礎、Pandas數據載入與預 處理、Matplotlib數據可視化基礎、Seaborn可視化、 pyecharts可視化、時間序列數據分析、 SciPy科學計算、統計與機器學習、圖像數據分析和綜合案例等。 本書可作為各類高等院校計算機科學與技術、軟件工程及大數據技術等專業的本科生教材,也可 作為Python數據分析初學者和愛好者的參考書。
隨著互聯網的飛速發展,人們在互聯網上的行為產生了海量數據,對這些數據存儲、處理與分析帶動了大數據技術的發展。其中,數據挖掘和分析技術可以幫助人們對龐大的數據進行相關分析,找到有價值的信息和規律,使得人們對世界的認識更快、更便捷。在數據分析領域,Python語言簡單易用,第三方庫強大,并提供了完整的數據分析框架,因此深受數據分析人員的青睞,Python已經當仁不讓地成為數據分析人員的一把利器。
因此,本書從Python數據分析的基礎知識入手,結合大量的數據分析示例,系統地介紹數據分析和可視化繪圖的方法,帶領讀者一步步掌握Python數據分析的相關知識,提高讀者解決實際問題的能力。 本書特色 (1) 內容全面,講解系統。 (2) 給出了數據分析環境的安裝和配置步驟。 (3) 詳細介紹了使用Python進行數據分析與可視化的方法。 (4) 提供了多個有較高應用價值的項目案例,有很強的實用性。 (5) 提供豐富的配套資源。 本書內容 第1章數據分析與可視化概述,主要介紹數據分析與可視化的基本內容,數據、數據分析和數據挖掘的關系,數據分析與可視化的常用工具,Python數據分析與可視化的主要庫以及Jupyter Notebook的基本使用方法。 第2章Python編程基礎,主要介紹Python語言的基本語法、內建數據結構、函數以及文件操作。 第3章NumPy數值計算基礎,主要介紹數組及其索引、數組運算、數組讀/寫及常用的統計與分析方法。 第4章Pandas統計分析基礎,主要介紹Pandas數據結構、索引操作、數據運算、分組匯總聚合、透視表以及Pandas的常用繪圖。 第5章Pandas數據載入與預處理,主要針對數據預處理階段的需求,介紹使用Pandas載入數據、合并數據、數據清洗、數據標準化及數據轉換的典型方法。 第6章Matplotlib數據可視化基礎,主要介紹Pyplot繪圖的基本語法、常用參數,各類常用圖形的繪制及詞云的簡單用法。 第7章Seaborn可視化,主要介紹Seaborn可視化中的風格與主題設置及常見繪圖的基本用法。 第8章pyecharts可視化,主要介紹pyecharts的安裝與導入、繪圖主要過程以及柱狀圖、餅圖、漏斗圖、散點圖、K線圖、儀表盤、詞云、地圖及組合圖表的繪制方法。 第9章時間序列數據分析,主要介紹時間序列數據分析的基本方法,包括Pandas中的日期型數據、日期的范圍、頻率及日期的操作。 第10章SciPy科學計算,主要介紹SciPy中的常數和特殊函數、線性代數運算、優化、稀疏矩陣處理及簡單的圖像處理等內容。 第11章統計與機器學習,主要介紹sklearn庫的基本功能、典型分類、聚類算法以及主成分分析方法及應用。 第12章圖像數據分析,主要介紹OpenCV的導入、圖像的基本操作、SIFT和SURF特征點的提取及圖像的降噪。 第13章綜合案例,介紹兩個綜合案例,針對職業人群體檢數據和股票數據,結合前面章節介紹的數據分析和數據可視化技術,實現數據分析與可視化。 本書配套資源 教學大綱、教學課件、電子教案、程序源碼、教學進度表,掃描封底的課件二維碼可以下載。 420分鐘的視頻講解,掃描書中相應位置的二維碼可以在線觀看、學習。 本書由魏偉一、李曉紅編寫。由于編者水平有限,書中難免存在疏漏和不足之處,敬請讀者批評指正。 編者2019年10月 |