Python3智能數據分析快速入門 ( 簡體 字) |
作者:李明江 張良均 周東平 張尚佳 著 | 類別:1. -> 程式設計 -> Python |
譯者: |
出版社:機械工業出版社 | 3dWoo書號: 51350 詢問書籍請說出此書號!【有庫存】 NT售價: 595 元 |
出版日:6/1/2019 |
頁數:489 |
光碟數:0 |
|
站長推薦: |
印刷:黑白印刷 | 語系: ( 簡體 版 ) |
|
加入購物車 │加到我的最愛 (請先登入會員) |
ISBN:9787111628057 |
作者序 | 譯者序 | 前言 | 內容簡介 | 目錄 | 序 |
(簡體書上所述之下載連結耗時費功, 恕不適用在台灣, 若讀者需要請自行嘗試, 恕不保證) |
作者序: |
譯者序: |
前言:為什么要寫這本書
2017年7月,國務院下達了關于印發《新一代人工智能發展規劃》的通知。通知明確指出要加快培養聚集人工智能高端人才,把高端人才隊伍建設作為人工智能發展的重中之重。而后,2018年12月,普華永道發布了《人工智能和相關技術對中國就業的凈影響》,報告預測,人工智能及相關技術在未來20年將取代中國現有約26%的工作崗位,高于對英國20%的預估,但也能通過提升生產率和實際收入水平在中國創造出大量的新的工作機會。根據普華永道估計,人工智能對中國就業的凈影響可能將創造約12%的凈增崗位,相當于未來20年內增加約9000萬個就業崗位。那么如何才能夠趕上人工智能的浪潮呢?
人工智能是一門綜合了計算機科學、生理學、哲學的交叉學科。凡是使用機器替代人類實現認知、識別、分析、決策等功能,均可認為使用了人工智能技術。按照技術分支,可以將人工智能分為問題求解,知識、推理與規劃,學習,通信、感知與行動四個大方向。其中學習即機器學習,與智能數據分析緊密相關。
跟國外相比,我國智能數據分析在零售、銀行、保險、證券等行業中的應用并不太理想。但隨著市場競爭的加劇,各行業對智能數據分析技術的意愿越來越強烈,可以預計,未來幾年各行業的數據分析應用一定會從傳統的統計分析發展到智能數據分析應用。在大數據時代,數據過剩、人才短缺,智能數據分析專業人才的培養又需要專業知識和職業經驗積累。所以,本書在編程知識的基礎之上,大篇幅地描寫了智能分析常備知識,希望能為智能數據分析人才的培養提供參考。
總的來說,隨著云時代的來臨,智能數據分析技術將具有越來越重要的戰略意義。大數據已經滲透到每一個行業和業務職能領域,逐漸成為重要的生產要素,人們對于海量數據的運用將預示著新一輪生產率增長和消費者盈余浪潮的到來。智能數據分析技術將幫助企業用戶在合理時間內攫取、管理、處理、整理海量數據,為企業經營決策提供積極的幫助。智能數據分析作為數據存儲和挖掘分析的前沿技術,已廣泛應用于物聯網、云計算、移動互聯網等戰略性新興產業。雖然智能數據分析目前在國內還處于初級階段,但是其商業價值已經顯現出來,特別是有實踐經驗的智能數據分析人才更是成為各企業爭奪的熱門。為了滿足日益增長的智能數據分析人才需求,很多大學開始嘗試開設不同程度的智能數據分析課程。“智能數據分析”作為大數據時代的核心技術,必將成為高校數學與統計學專業的重要課程之一。
本書特色
本書作者從實踐出發,總結了智能數據分析常用的方法,深入淺出地介紹了智能數據分析編程過程中的相關知識。書中涵蓋Python環境搭建、Python基礎語法、控制語句、函數、面向對象編程、數值計算、數據處理、繪圖、模型構建等內容,還配套提供了程序代碼及數據。此外,每章的最后均提供課后習題,幫助讀者快速掌握Python的使用方法。
為了幫助讀者更好地使用本書,泰迪云課堂(https://edu.tipdm.org)提供了配套的教學視頻。對于本書配套的原始數據文件、Python程序代碼,均可以通過關注泰迪學社微信公眾號(TipDataMining),回復“圖書資源”進行獲取。為方便教師授課,本書還提供了PPT課件、教學大綱、教學進度表和教案等教學資源,教師可在泰迪學社微信公眾號回復“教學資源”進行獲取。
本書適用對象
開設有數據分析課程的高校的教師和學生。
目前國內不少高校將數據分析引入本科教學中,在數學、計算機、自動化、電子信息、金融等專業開設了數據分析技術相關的課程,但目前這一課程使用的教學工具仍然為SPSS、SAS等傳統統計工具,并沒有使用Python作為教學工具。本書提供了Python語言相關的從安裝到使用的一系列知識,將有效指導高校教師和學生使用Python作為數據分析的工具之一。
數據分析開發人員。
數據分析開發人員的主要工作是將數據分析相關的算法應用于實際業務系統。本書提供了詳細的機器學習與數據分析算法接口的用法與說明,能夠幫助此類人員快速且有效地建立起數據分析應用的算法框架,幫助其迅速完成開發。
進行數據分析應用研究的科研人員。
許多科研院所為了更好地對科研工作進行管理,紛紛開發了適應自身特點的科研業務管理系統,并在使用過程中積累了大量的科研信息數據。但是,這些科研業務管理系統一般沒有對這些數據進行深入分析,對數據所隱藏的價值并沒有充分分析利用。科研人員需要數據分析工具及有關方法論來深挖科研信息的價值,從而提高科研水平。
關注高級數據分析的人員。
Python作為廣泛應用于數據分析領域的編程語言,能為數據分析人員提供快速的、可靠的分析依據。本書提供全面的Python智能數據分析知識,能夠指導這類人員快速入門數據分析,完成指定的數據分析任務。
如何閱讀本書
本書從邏輯上可分為兩大部分。
第一部分是Python編程基礎(第1~4章),介紹了Python環境搭建、Python基礎語法、控制語句、函數、面向對象編程等。第1章旨在讓讀者從全局把握Python,了解利用Python進行智能數據分析的優勢,并詳細介紹了Python環境搭建與配置,同時還對兩個常用集成開發環境做了詳細介紹。第2章先對Python固定語法做了介紹,包括編碼聲明、注釋、縮進等;而后介紹了Python常見的數據類型,包括str、list、tuple、dict、set等;還介紹了Python常用運算符,包括算術運算符、邏輯運算符、成員運算符、位運算符等。第3章主要對控制語句做了詳細介紹,包括條件語句和循環語句,同時還介紹了和條件語句類似的異常處理try-except-else語句。第4章主要介紹了Python的內置函數、自定義函數、面向對象編程以及第三方庫的安裝與使用方法。
第二部分是數據分析編程(第5~9章),主要對數據分析中常用的第三方庫做了詳細介紹,強調在Python中對應函數的使用方法及其結果的解釋說明。內容涵蓋數值分析庫NumPy,數據處理庫pandas,繪圖庫Matplotlib、Seaborn、Bokeh,機器學習與數據分析建模庫scikit-learn。這一部分涉及數據讀取、數據預處理、模型構建、模型評價、結果可視化,幾乎涵蓋了整個數據分析過程,充分而又詳細地說明了Python數據分析的常用操作,相信在本書的指導下,讀者能夠從零開始快速數據入門分析。
勘誤和支持
我們已經盡最大努力避免在文本和代碼中出現錯誤,但是由于水平有限,編寫時間倉促,書中難免出現一些疏漏和不足的地方。如果你有更多寶貴意見,歡迎在泰迪學社微信公眾號回復“圖書反饋”進行反饋。更多本系列圖書的信息可以在“泰迪杯”數據挖掘挑戰賽網站(http://www.tipdm.org/tj/index.jhtml)查閱。
張良均
2019年于廣州 |
內容簡介:本書以Python相關技術為工具,講解了如何基于機器學習等AI技術進行智能數據分析。
作者在Python數據挖掘與分析領域有10余年工作經驗,對AI技術驅動的智能數據分析有非常深入的研究。本書面向沒有Python編程基礎和AI技術基礎的讀者,由淺入深地提供了系統的Python智能數據分析的技術和方法。
全書共9章,從邏輯上可分為兩部分:
第一部分:Python編程基礎(第1~4章)
詳細介紹了從事Python編程需要掌握的各種基礎知識,包括開發環境的搭建與配置,以及各種語法和常見Python庫的原理和使用方法。
第二部分:智能數據分析(第5~9章)
對Python的數值分析庫NumPy、數據處理庫pandas、繪圖庫Matplotlib/Seaborn/Bokeh、機器學習與數據分析建模庫scikit-learn等進行了詳細講解,包含數據讀取、數據預處理、模型構建、模型評價、結果可視化等數據分析的整個過程,能指導讀者快速入門Python智能數據分析。
智能數據分析技術已經成為大數據時代最重要的技能之一,它能幫助企業用戶在合理時間內攫取、管理、處理、整理海量數據,為企業經營決策提供積極幫助。目前智能數據分析技術已經廣泛應用于物聯網、云計算、移動互聯網等戰略性新興產業,商業價值逐漸顯現出來,有實踐經驗的智能數據分析人才被各企業爭搶。
Python編程的技術門檻雖然不高,但是包含的知識點比較多;AI技術不僅學習門檻高,而且知識點紛繁復雜。本書假設你有一定的數據分析基礎,但是沒有Python和AI基礎,為了幫助你快速掌握智能數據分析需要的技術和方法,書中有針對性地講解了Python和AI中必須要掌握的知識點,內容由淺入深,循序漸進。從環境配置、基本語法、基礎函數到第三方庫的安裝與使用,對各個操作步驟、函數、工具、代碼示例等的講解非常詳盡,確保所有滿足條件的讀者都能快速入門。 |
目錄:前言
第1章 Python概述 1
1.1 Python語言介紹 1
1.1.1 Python的發展史 1
1.1.2 Python特性 2
1.1.3 Python應用領域 3
1.1.4 Python機器學習優勢 6
1.2 Python環境配置 8
1.2.1 Python 2還是Python 3 8
1.2.2 Anaconda簡介 8
1.2.3 安裝Anaconda 3 9
1.3 Python的解釋器與IDE 12
1.3.1 Python的解釋器 13
1.3.2 Python各IDE比較 13
1.3.3 PyCharm的安裝與使用 16
1.3.4 Jupyter Notebook的使用 26
小結 32
課后習題 33
第2章 Python基礎知識 34
2.1 固定語法 34
2.1.1 聲明與注釋 34
2.1.2 縮進與多行語句 36
2.1.3 保留字符與賦值 38
2.2 運算符 40
2.2.1 算術運算符 40
2.2.2 賦值運算符 41
2.2.3 比較運算符 43
2.2.4 邏輯運算符 44
2.2.5 按位運算符 44
2.2.6 身份運算符 45
2.2.7 成員運算符 46
2.2.8 運算符優先級 47
2.3 數據類型 48
2.3.1 基礎數據類型 48
2.3.2 復合數據類型 55
2.4 Python I/O 63
2.4.1 input與print 64
2.4.2 文件I/O 67
小結 70
課后習題 70
第3章 控制語句 72
3.1 條件語句 72
3.1.1 if、elif與else 73
3.1.2 try、except與else 76
3.2 循環語句 80
3.2.1 for 81
3.2.2 while 83
3.2.3 break、continue與pass 85
3.2.4 列表推導式 89
小結 91
課后習題 91
第4章 函數與對象 94
4.1 函數 94
4.1.1 內置函數 94
4.1.2 自定義函數 101
4.1.3 匿名函數 107
4.2 對象 109
4.2.1 面向對象簡介 109
4.2.2 屬性與方法 110
4.2.3 裝飾器 116
4.2.4 繼承和多態 119
4.3 Python常用庫安裝 126
4.3.1 第三方庫安裝 126
4.3.2 第三方庫導入 130
4.3.3 第三方庫創建 131
小結 132
課后習題 133
第5章 NumPy數值計算 135
5.1 ndarray創建與索引 135
5.1.1 創建ndarray對象 135
5.1.2 ndarray的索引與切片 142
5.2 ndarray的基礎操作 145
5.2.1 變換ndarray的形態 145
5.2.2 排序與搜索 151
5.2.3 字符串操作 156
5.3 ufunc 159
5.3.1 ufunc的廣播機制 159
5.3.2 常用ufunc 160
5.4 matrix與線性代數 169
5.4.1 創建NumPy矩陣 169
5.4.2 矩陣的屬性和基本運算 170
5.4.3 線性代數運算 172
5.5 NumPy文件讀寫 175
5.5.1 二進制文件讀寫 175
5.5.2 文件列表形式數據讀寫 178
小結 180
課后習題 180
第6章 pandas基礎 182
6.1 pandas常用類 182
6.1.1 Series 182
6.1.2 DataFrame 187
6.1.3 Index 191
6.2 DataFrame基礎操作 193
6.2.1 索引 193
6.2.2 排序 201
6.2.3 合并 204
6.3 其他數據類型操作 210
6.3.1 時間操作 210
6.3.2 文本操作 220
6.3.3 category操作 223
小結 227
課后習題 227
第7章 pandas進階 229
7.1 數據讀取與寫入 229
7.1.1 CSV 229
7.1.2 Excel 231
7.1.3 數據庫 233
7.2 DataFrame進階 235
7.2.1 統計分析 235
7.2.2 分組運算 242
7.2.3 透視表和交叉表 248
7.3 數據準備 250
7.3.1 缺失值處理 251
7.3.2 重復數據處理 255
7.3.3 連續特征離散化處理 256
7.3.4 啞變量處理 259
小結 260
課后習題 260
第8章 繪圖 263
8.1 Matplotlib繪圖基礎 263
8.1.1 編碼風格 263
8.1.2 動態rc參數 267
8.1.3 散點圖 273
8.1.4 折線圖 276
8.1.5 餅圖 278
8.1.6 直方圖與條形圖 280
8.1.7 箱線圖 282
8.2 Seaborn進階繪圖 285
8.2.1 Seaborn基礎 285
8.2.2 關系圖 301
8.2.3 分類圖 311
8.2.4 分布圖 329
8.2.5 回歸圖 334
8.2.6 矩陣圖 341
8.2.7 網格圖 345
8.3 Bokeh交互式繪圖 356
8.3.1 基本構成與語法 356
8.3.2 常見圖形繪制 370
8.3.3 導出與嵌入 375
8.3.4 運行Bokeh應用程序 379
小結 381
習題 381
第9章 scikit-learn 383
9.1 數據準備 383
9.1.1 標準化 383
9.1.2 歸一化 387
9.1.3 二值化 388
9.1.4 獨熱編碼 389
9.2 降維 391
9.2.1 PCA 392
9.2.2 隨機投影 396
9.2.3 字典學習 402
9.2.4 獨立成分分析 408
9.2.5 非負矩陣分解 412
9.2.6 線性判別分析 416
9.3 聚類 420
9.3.1 K-Means 421
9.3.2 層次聚類 424
9.3.3 DBSCAN 427
9.3.4 高斯混合模型 430
9.4 分類 434
9.4.1 Logistic回歸 435
9.4.2 支持向量機 439
9.4.3 決策樹 443
9.4.4 最近鄰 447
9.4.5 樸素貝葉斯 450
9.4.6 隨機森林 452
9.4.7 多層感知機 456
9.5 回歸 460
9.5.1 最小二乘回歸 461
9.5.2 嶺回歸 464
9.5.3 Lasso回歸 466
9.5.4 決策樹回歸 468
9.5.5 隨機森林回歸 471
9.5.6 多層感知機回歸 473
9.6 模型選擇 476
9.6.1 數據集劃分 476
9.6.2 交叉驗證 478
9.6.3 自動調參 479
9.6.4 模型評估 481
小結 486
課后習題 487 |
序: |