Python數據科學實踐指南( 簡體 字) | |
作者:紀路 | 類別:1. -> 程式設計 -> Python |
出版社:機械工業出版社 | 3dWoo書號: 46863 詢問書籍請說出此書號! 有庫存 NT售價: 295 元 |
出版日:5/1/2017 | |
頁數:241 | |
光碟數:0 | |
站長推薦: | |
印刷:黑白印刷 | 語系: ( 簡體 字 ) |
ISBN:9787111566526 | 加入購物車 │加到我的最愛 (請先登入會員) |
(簡體書上所述之下載連結耗時費功, 恕不適用在台灣, 若讀者需要請自行嘗試, 恕不保證, 繁體書的下載亦請直接連絡出版社) | |
前言
第0章 發現、出發1 0.1 何謂數據科學1 0.1.1 海量的數據與科學的方法2 0.1.2 數據科學并不是新概念3 0.1.3 數據科學是一個系統工程3 0.2 如何成為數據科學家4 0.3 為什么是Python6 0.4 一個簡單的例子8 第1章 Python介紹9 1.1 Python的版本之爭10 1.2 Python解釋器11 1.2.1 Mac OS X系統11 1.2.2 Linux系統11 1.2.3 Windows系統12 1.3 第一段Python程序14 1.4 使用Python shell調試程序15 第2章 Python基礎知識19 2.1 應當掌握的基礎知識19 2.1.1 基礎數據類型19 2.1.2 變量和賦值21 2.1.3 操作符及表達式22 2.1.4 文本編輯器23 2.2 字符串27 2.3 獲取鍵盤輸入29 2.4 流程控制30 2.4.1 條件判斷30 2.4.2 循環31 2.4.3 縮進、空白和注釋33 第3章 函數及異常處理35 3.1 函數和函數的參數36 3.1.1 定義函數37 3.1.2 關鍵字參數和默認參數38 3.1.3 可變數量的參數39 3.1.4 遞歸40 3.2 閉包41 3.3 異常和斷言44 第4章 高級字符串處理47 4.1 字符集和字符編碼47 4.1.1 ASCII字符集和編碼48 4.1.2 Unicode字符集及UTF-8編碼49 4.2 字符串操作和格式化51 4.2.1 字符串的基本操作51 4.2.2 字符串分割52 4.2.3 字符串格式化52 4.3 正則表達式53 4.3.1 正則表達式入門54 4.3.2 在Python中使用正則表達式57 第5章 容器和collections60 5.1 元組60 5.2 列表62 5.2.1 引用傳遞64 5.2.2 列表解析式65 5.3 字典66 5.4 collections69 5.4.1 namedtuple69 5.4.2 Counter70 5.4.3 defaultdict71 5.4.4 OrderedDict71 第6章 Python標準庫簡介73 6.1 math模塊73 6.1.1 常見常量73 6.1.2 無窮74 6.1.3 整數轉換75 6.1.4 絕對值和符號76 6.1.5 常用計算77 6.1.6 指數和對數77 6.2 time79 6.3 random82 6.3.1 隨機數生成器82 6.3.2 取樣84 6.4 glob和fileinput85 6.5 bz2和gzip87 6.6 pprint88 6.7 traceback90 6.8 JSON91 第7章 用Python讀寫外部數據93 7.1 CSV文件的讀寫94 7.1.1 讀取CSV文件94 7.1.2 創建CSV文件95 7.1.3 處理方言96 7.1.4 將讀取的結果轉換成字典97 7.2 Excel文件的讀寫98 7.2.1 讀取Excel文件98 7.2.2 寫Excel文件99 7.3 MySQL的讀寫101 7.3.1 寫入MySQL103 7.3.2 讀取MySQL105 第8章 統計編程106 8.1 描述性統計106 8.1.1 人口普查數據106 8.1.2 均值和中位數110 8.1.3 方差和標準差111 8.1.4 分布113 8.2 數據可視化入門116 8.2.1 pyplot基礎116 8.2.2 柱狀圖和餅圖119 8.3 概率122 第9章 爬蟲入門124 9.1 網絡資源及爬蟲的基本原理124 9.2 使用request模塊獲取HTML內容127 9.2.1 關于HTTP協議127 9.2.2 使用requests的get方法獲取HTML內容129 9.3 使用Xpath解析HTML中的內容133 9.3.1 HTML的層級和Xpath的基本概念134 9.3.2 使用谷歌瀏覽器快速創建Xpath路徑137 9.3.3 使用谷歌瀏覽器復制需要JS渲染的HTML頁面138 9.4 實戰:爬取京東商品品類及品牌列表144 第10章 數據科學的第三方庫介紹149 10.1 Numpy入門和實戰149 10.1.1 Numpy基礎150 10.1.2 Numpy基本運算153 10.1.3 Numpy高級特性159 10.1.4 kNN實戰162 10.2 Pandas的入門和實戰167 10.2.1 Pandas基礎168 10.2.2 泰坦尼克號生存率分析實戰176 10.3 Scikit-learn入門和實戰180 10.3.1 機器學習術語181 10.3.2 Scikit-learn基礎183 10.3.2 實戰186 第11章 利用Python進行圖數據分析193 11.1 圖基礎193 11.2 NetworkX入門194 11.2.1 基本操作194 11.2.2 為圖中的元素添加屬性196 11.2.3 有向圖及節點的度數197 11.2.4 構建圖及圖的操作197 11.3 使用NetworkX進行圖分析199 11.3.1 利用聯通子圖發現社區199 11.3.2 通過三角計算強化社區發現201 11.3.3 利用PageRank發現影響力中心202 第12章 大數據工具入門204 12.1 Hadoop204 12.1.1 Hadoop的計算原理205 12.1.2 在Hadoop上運行Python程序208 12.2 Spark211 12.2.1 為什么需要Spark211 12.2.2 如何學習Spark212 12.3 大數據與數據科學的區別215 附錄A 編寫Python 2與Python 3兼容的代碼217 附錄B 安裝完整的Python開發環境225 附錄C 常用的Python技巧235 本書分為三大部分,其中第1~4章是Python基礎,這個部分會介紹閱讀本書所必須掌握的Python知識。第5~7章是講解Python直接提供的數據處理工具,這些工具包括一些易用的數據結構、標準庫和第三方工具。第8~12章是一些實際的案例,將會涉及Python主要擅長的幾個領域。后的三個附錄分別介紹了關于Python的一些擴展知識。
|