3dwoo大學簡體電腦書店
零基礎學Python爬蟲、數據分析與可視化從入門到精通
( 簡體 字)
作者:孟兵,李杰臣 編著類別:1. -> 程式設計 -> Python
   2. -> 程式設計 -> 網路爬蟲
   3. -> 程式設計 -> Tableau
出版社:機械工業出版社零基礎學Python爬蟲、數據分析與可視化從入門到精通 3dWoo書號: 53771
詢問書籍請說出此書號!
有庫存
NT售價: 450
出版日:12/1/2020
頁數:375
光碟數:0
站長推薦:
印刷:黑白印刷語系: ( 簡體 字 )
ISBN:9787111668992 加入購物車加到我的最愛 (請先登入會員)
(簡體書上所述之下載連結耗時費功, 恕不適用在台灣, 若讀者需要請自行嘗試, 恕不保證, 繁體書的下載亦請直接連絡出版社)
如何獲取學習資源
第1章 Python快速上手
1.1Python編程環境的搭建 13
1.2Python的模塊 19
1.2.1初識模塊 19
1.2.2模塊的安裝 19
第2章 Python的基礎語法知識
2.1變量 23
2.2數據類型:數字與字符串 24
2.2.1數字 24
2.2.2字符串 25
2.2.3數據類型的查詢 27
2.2.4數據類型的轉換 28
2.3數據類型:列表、字典、元組與集合 29
2.3.1列表 29
2.3.2字典 33
2.3.3元組和集合 34
2.4運算符 35
2.4.1算術運算符和字符串運算符 35
2.4.2比較運算符 36
2.4.3賦值運算符 37
2.4.4邏輯運算符 38
2.5編碼基本規范 38
2.5.1縮進 39
2.5.2注釋 39
2.6控制語句 41
2.6.1if語句 41
2.6.2for語句 42
2.6.3while語句 43
2.6.4控制語句的嵌套 44
2.7函數 45
2.7.1內置函數 45
2.7.2自定義函數 51
2.8模塊的導入 53
2.8.1import語句導入法 53
2.8.2from語句導入法 54
第3章 數組的存儲和處理—NumPy模塊
3.1創建數組 56
3.1.1使用array()函數創建數組 56
3.1.2創建等差數組 57
3.1.3創建隨機數組 59
3.2查看數組的屬性 61
3.3選取數組元素 63
3.3.1一維數組的元素選取 63
3.3.2二維數組的元素選取 66
3.4數組的重塑與轉置 68
3.4.1一維數組的重塑 69
3.4.2多維數組的重塑 70
3.4.3數組的轉置 71
3.5數組的處理 72
3.5.1添加數組元素 72
3.5.2刪除數組元素 75
3.5.3處理數組的缺失值 76
3.5.4處理數組的重復值 77
3.5.5拼接數組 77
3.5.6拆分數組 79
3.6數組的運算 81
3.6.1數組之間的四則運算 81
3.6.2數組元素的統計運算 82
第4章 數據的簡單處理—pandas模塊入門
4.1數據結構 85
4.1.1Series對象 85
4.1.2DataFrame對象 87
4.2讀取數據 88
4.2.1讀取Excel工作簿數據 89
4.2.2讀取csv文件數據 93
4.3查看數據 94
4.3.1查看數據的前幾行 94
4.3.2查看數據的行數和列數 95
4.3.3查看數據的類型 96
4.4選擇數據 97
4.4.1選擇行數據 97
4.4.2選擇列數據 100
4.4.3同時選擇行列數據 103
4.5修改行標簽和列標簽 104
第5章 數據的高級處理—pandas模塊進階
5.1數據的查找和替換 106
5.1.1查找數據 106
5.1.2替換數據 108
5.2數據的處理 110
5.2.1插入數據 110
5.2.2刪除數據 111
5.2.3處理缺失值 115
5.2.4處理重復值 118
5.2.5排序數據 121
5.2.6篩選數據 123
5.3數據表的處理 125
5.3.1轉置數據表的行列 125
5.3.2將數據表轉換為樹形結構 125
5.3.3數據表的拼接 126
5.4數據的運算 130
5.4.1數據的統計運算 131
5.4.2獲取數值分布情況 133
5.4.3計算相關系數 134
5.4.4分組匯總數據 135
5.4.5創建數據透視表 137
5.5案例:獲取并分析股票歷史數據 138
第6章 使用Python進行數據分析
6.1相關性分析 143
6.1.1獲取股價數據 143
6.1.2合并股價數據 146
6.1.3股價數據相關性分析 148
6.2假設檢驗 150
6.3方差分析 152
6.3.1方差分析的基本步驟 152
6.3.2單因素方差分析的代碼實現 159
6.3.3雙因素方差分析的代碼實現 162
6.3.4利用第三方模塊快速完成方差分析 164
6.4描述性統計分析 167
6.4.1描述性統計指標的計算 167
6.4.2數據的分布狀態分析 169
6.4.3數據的頻數和頻率分析 171
6.5線性回歸分析 174
6.5.1線性回歸分析的數學原理 174
6.5.2線性回歸分析的思路 175
6.5.3廣告費與銷量的一元線性回歸分析 178
6.5.4不同渠道的廣告費與銷量的多元線性回歸分析 182
第7章 Python爬蟲基礎
7.1認識網頁結構 188
7.1.1查看網頁的源代碼 188
7.1.2網頁結構的組成 189
7.1.3百度新聞頁面結構剖析 194
7.2requests模塊 196
7.2.1requests模塊獲取數據的方式 196
7.2.2get()函數的參數介紹 200
7.3案例:爬取豆瓣電影動畫排行榜 202
7.4正則表達式 205
7.4.1正則表達式基礎 205
7.4.2用正則表達式提取數據 209
7.5BeautifulSoup模塊 211
7.5.1實例化BeautifulSoup對象 212
7.5.2用BeautifulSoup對象定位標簽 212
7.5.3從標簽中提取文本內容和屬性值 217
7.6XPath表達式 219
7.6.1實例化etree對象 219
7.6.2用XPath表達式定位標簽并提取數據 220
7.6.3快速獲取標簽節點的XPath表達式 221
7.7數據清洗 222
7.8案例:爬取當當網的圖書銷售排行榜 225
第8章 Python爬蟲進階
8.1Selenium模塊基礎 229
8.1.1Selenium模塊的安裝與基本用法 229
8.1.2Selenium模塊的標簽定位 232
8.1.3Selenium模塊的標簽操作 235
8.2Selenium模塊進階 237
8.2.1模擬鼠標操作 237
8.2.2標簽處理 238
8.2.3顯式等待和隱式等待 239
8.3案例:模擬登錄12306 241
8.4IP反爬的應對 245
8.4.1IP反爬的應對思路 245
8.4.2搭建代理IP池 246
8.4.3實戰案例 248
8.5用cookie池模擬登錄 250
8.5.1用瀏覽器獲取cookie信息 250
8.5.2自動記錄cookie信息 252
8.5.3cookie池的搭建和使用 253
8.6提高爬蟲程序的數據爬取效率 255
8.6.1多進程實現并行 255
8.6.2進程池的創建 258
8.6.3多線程實現并發 259
8.6.4線程池的創建 261
8.6.5多任務異步協程實現并發 263
8.6.6多進程、多線程和多任務異步協程在爬蟲中的應用 265
第9章 表格數據獲取與數據庫詳解
9.1表格類數據的獲取 270
9.1.1用于構建表格的標簽 270
9.1.2read_html()函數的基本用法 271
9.2用數據庫存取數據 274
9.2.1數據庫概述 274
9.2.2MySQL的安裝和配置 275
9.2.3數據表的基本操作 279
9.2.4數據表中數據的基本操作 283
9.2.5用PyMySQL模塊操作數據庫 286
9.2.6用pandas模塊操作數據庫 287
9.3案例:爬取58同城租房信息 292
第10章 自然語言處理
10.1NLP概述 298
10.1.1NLP的應用領域和基本流程 298
10.1.2文本分詞方法 299
10.2jieba分詞器 302
10.2.1jieba分詞器的基礎知識 302
10.2.2jieba分詞器的基本用法 303
10.2.3調整詞典 306
10.2.4關鍵詞提取 309
10.2.5停用詞過濾 311
10.2.6詞頻統計 312
10.3案例:新聞關鍵詞的提取與匯總 313
第11章 數據可視化—Matplotlib模塊
11.1繪制基本圖表 318
11.1.1繪制柱形圖 318
11.1.2繪制條形圖 320
11.1.3繪制折線圖 321
11.1.4繪制面積圖 322
11.1.5繪制散點圖 323
11.1.6繪制餅圖和圓環圖 325
11.2圖表的繪制和美化技巧 326
11.2.1在一張畫布中繪制多個圖表 327
11.2.2添加圖表元素 328
11.2.3添加并設置網格線 330
11.2.4調整坐標軸的刻度范圍 331
11.3繪制高級圖表 333
11.3.1繪制氣泡圖 333
11.3.2繪制組合圖 334
11.3.3繪制直方圖 336
11.3.4繪制雷達圖 336
11.3.5繪制樹狀圖 339
11.3.6繪制箱形圖 340
11.3.7繪制玫瑰圖 341
第12章 數據可視化神器—pyecharts模塊
12.1圖表配置項 343
12.2繪制漏斗圖 347
12.3繪制漣漪特效散點圖 350
12.4繪制水球圖 351
12.5繪制儀表盤 353
12.6繪制詞云圖 354
12.7繪制K線圖 355
第13章 量化金融—股票信息挖掘與分析
13.1案例介紹 358
13.2獲取汽車行業股票的基本信息 358
13.3獲取單只股票的歷史行情數據 364
13.4獲取滬深A股漲幅前60名的信息 365
13.5計算股票的月漲跌幅 369
13.6股票相關性分析 370
13.7股票價格預測 372
在這個大數據時代,無論從事哪種行業,每天都要與海量的數據打交道。從數據中挖掘有用的信息,并進行分析和可視化展示,已成為職場人士亟須掌握的新技能。本書以當前流行的Python語言為工具,從編程新手的角度和日常辦公的需求出發,深入淺出地講解如何通過Python編程高效地完成數據的獲取、處理、分析與可視化。

全書共13章。第1章和第2章主要講解Python編程環境的搭建和Python語言的基礎語法知識。第3~6章以數據處理與分析為主題,講解NumPy模塊和pandas模塊的基本用法和實際應用。第7~9章以數據獲取為主題,由淺入深地講解如何通過編寫爬蟲程序從網頁上采集數據,并保存到數據庫中。第10章主要講解自然語言處理技術在文本分詞中的應用。第11章和第12章以數據可視化為主題,講解如何使用Matplotlib模塊和pyecharts模塊繪制圖表。第13章通過量化金融案例對前面所學的知識進行了綜合應用。

書中的代碼附有詳細且通俗易懂的解說,讓讀者能夠快速理解代碼的功能和編寫思路,并從機械地套用代碼進階到隨機應變地修改代碼,獨立解決更多實際問題。

本書適合想要提高數據處理和分析效率的職場人士和辦公人員閱讀,也可供Python編程愛好者參考。

本書由孟兵、李杰臣編著。由于編者水平有限,本書難免有不足之處,懇請廣大讀者批評指正。讀者除了掃描二維碼關注公眾號獲取資訊以外,也可加入QQ群與我們交流。

需要說明的是,本書爬蟲部分的內容涉及的網站隨時可能改版,導致相應的爬蟲代碼失效。編者會定期更新代碼及相應的講解,請讀者到本書的學習資源中獲取。

編者

2020年10月
pagetop