|
-- 會員 / 註冊 --
|
|
|
|
Jupyter數據科學實戰 ( 簡體 字) |
作者:[印]普拉泰克·古普塔(Prateek Gupta) | 類別:1. -> 程式設計 -> Python |
譯者: |
出版社:人民郵電出版社 | 3dWoo書號: 53625 詢問書籍請說出此書號!【缺書】 NT售價: 395 元 |
出版日:11/1/2020 |
頁數:254 |
光碟數:0 |
|
站長推薦: |
印刷:黑白印刷 | 語系: ( 簡體 版 ) |
|
加入購物車 │加到我的最愛 (請先登入會員) |
ISBN:9787115544391 |
作者序 | 譯者序 | 前言 | 內容簡介 | 目錄 | 序 |
(簡體書上所述之下載連結耗時費功, 恕不適用在台灣, 若讀者需要請自行嘗試, 恕不保證) |
作者序: |
譯者序: |
前言: |
內容簡介:本書旨在成為讀者進入數據科學領域的指南。全書共20章,涵蓋了數據科學及其應用的各個方面,引入經典數據集將理論與實踐相結合,采用Jupyter等工具,以Python語言由淺入深地介紹了數據科學及相關學科的基本概念、數據預處理、機器學習及時間序列等內容,并提供了不同的案例研究,以達到學以致用的效果。通過閱讀本書,讀者將獲得成為一名數據科學家所需的基本知識和技能。 本書適合有Python或其他編程語言基礎,并對數據科學感興趣的人員閱讀。 |
目錄:第 1章 數據科學基本概念 1 1.1 數據的概念 2 1.1.1 結構化數據 2 1.1.2 非結構化數據 2 1.1.3 半結構化數據 3 1.2 數據科學的定義 3 1.3 數據科學家的工作 4 1.4 數據科學應用實例 5 1.5 為何Python適合數據科學 6 1.6 小結 7 第 2章 軟件安裝與配置 8 2.1 系統要求 9 2.2 下載Anaconda 9 2.3 在Windows系統上安裝Anaconda 10 2.4 在Linux系統上安裝Anaconda 11 2.5 如何在Anaconda中安裝新的Python庫 13 2.6 打開筆記本—Jupyter 14 2.7 了解筆記本 15 2.8 小結 19 第3章 列表與字典 20 3.1 什么是列表 21 3.2 如何創建列表 21 3.3 列表的不同操作 22 3.4 列表與數組的差異 25 3.5 什么是字典 26 3.6 如何創建字典 26 3.7 字典的相關操作 26 3.8 小結 28 第4章 函數與包 29 4.1 Python的Help()函數 30 4.2 如何導入Python包 30 4.3 如何創建并調用函數 31 4.4 在函數中傳遞參數 31 4.5 函數的默認參數 32 4.6 如何在函數中使用未知參數 32 4.7 函數的全局與本地變量 33 4.8 Lambda函數 35 4.9 了解Python中的main方法 35 4.10 小結 38 第5章 NumPy基本概念 39 5.1 導入NumPy包 39 5.2 為何NumPy數組優于列表 40 5.3 NumPy數組屬性 41 5.4 創建NumPy數組 41 5.5 訪問NumPy數組中的元素 43 5.6 NumPy數組的切片 44 5.7 數組連接 46 5.8 小結 47 第6章 Pandas和數據幀 48 6.1 導入Pandas 48 6.2 Pandas數據結構 49 6.3 .loc[]和.iloc[] 54 6.4 一些有用的數據幀函數 55 6.5 處理數據幀中的缺失值 57 6.6 小結 60 第7章 與數據庫交互 61 7.1 SQLAlchemy 62 7.2 安裝SQLAlchemy包 62 7.3 如何使用SQLAlchemy 63 7.4 SQLAlchemy引擎配置 64 7.5 在數據庫中新建表 65 7.6 在表中插入數據 66 7.7 更新記錄 67 7.8 如何合并表格 68 7.8.1 內連接 68 7.8.2 左連接 69 7.8.3 右連接 70 7.9 小結 70 第8章 數據科學中的統計思維 71 8.1 數據科學中的統計學 72 8.2 統計數據/變量的類型 72 8.3 平均數、中位數和眾數 73 8.4 概率的基本概念 74 8.5 統計分布 75 8.6 Pearson相關系數 77 8.7 概率密度函數 78 8.8 真實案例 79 8.9 統計推斷與假設檢驗 79 8.10 小結 86 第9章 如何在Python中導入數據 87 9.1 導入TXT數據 88 9.2 導入CSV數據 89 9.3 導入Excel數據 90 9.4 導入JSON數據 90 9.5 導入腌制數據 91 9.6 導入壓縮數據 91 9.7 小結 92 第 10章 清洗導入的數據 93 10.1 了解數據 94 10.2 分析缺失值 95 10.3 丟棄缺失值 97 10.4 自動填充缺失值 98 10.5 如何縮放和歸一化數據 99 10.6 如何解析日期 102 10.7 如何應用字符編碼 104 10.8 清洗不一致的數據 105 10.9 小結 106 第 11章 數據可視化 107 11.1 條形圖 108 11.2 折線圖 109 11.3 直方圖 110 11.4 散點圖 111 11.5 堆積圖 111 11.6 箱線圖 113 11.7 小結 115 第 12章 數據預處理 116 12.1 關于案例研究 116 12.2 導入數據集 117 12.3 探索性數據分析 118 12.4 數據清洗與預處理 122 12.5 特征工程 124 12.6 小結 129 第 13章 監督式機器學習 130 13.1 常見的機器學習術語 131 13.2 機器學習導論 132 13.3 常用機器學習算法列述 133 13.4 監督式機器學習基礎 134 13.5 解決分類機器學習問題 136 13.6 為何要進行訓練/測試拆分和交叉驗證 140 13.7 解決回歸機器學習問題 144 13.8 如何調整機器學習模型 152 13.9 如何處理sklearn中的分類變量 154 13.10 處理缺失數據的高級技術 155 13.11 小結 158 第 14章 無監督式機器學習 159 14.1 為何選擇無監督式機器學習 160 14.2 無監督式機器學習技術 160 14.2.1 聚類 161 14.2.2 主成分分析 169 14.3 案例研究 172 14.4 驗證無監督式機器學習 178 14.5 小結 179 第 15章 處理時間序列數據 180 15.1 為何時間序列重要 181 15.2 如何處理日期和時間 181 15.3 轉換時間序列數據 184 15.4 操作時間序列數據 187 15.5 比較時間序列的增長率 189 15.6 如何改變時間序列頻率 192 15.7 小結 198 第 16章 時間序列法 199 16.1 時間序列預測的定義 200 16.2 預測的基本步驟 200 16.3 時間序列預測的技術 201 16.3.1 自回歸 201 16.3.2 移動平均 202 16.3.3 自回歸移動平均 203 16.3.4 自回歸積分移動平均 203 16.3.5 季節性自回歸積分移動平均 204 16.3.6 季節性自回歸積分移動平均與外生回歸因子 205 16.3.7 向量自回歸移動平均 205 16.3.8 Holt-Winters指數平滑 206 16.4 預測網頁的未來流量 207 16.5 小結 214 第 17章 案例研究1 215 第 18章 案例研究2 230 第 19章 案例研究3 239 第 20章 案例研究4 247 |
序: |
|