-- 會員 / 註冊 --  
 帳號:
 密碼:
  | 註冊 | 忘記密碼
3/26 新書到! 3/19 新書到! 3/14 新書到! 12/12 新書到!
購書流程Q & A站務留言版客服信箱
3ds MaxMayaRhinoAfter EffectsSketchUpZBrushPainterUnity
PhotoShopAutoCadMasterCamSolidWorksCreoUGRevitNuke
C#CC++Java遊戲程式Linux嵌入式PLCFPGAMatlab
駭客資料庫搜索引擎影像處理FluentVR+ARANSYS深度學習
單晶片AVROpenGLArduinoRaspberry Pi電路設計CadenceProtel
HadoopPythonStm32CortexLabview手機程式AndroidiPhone
可查書名,作者,ISBN,3dwoo書號
詳細書籍分類

Python網絡數據爬取及分析從入門到精通(爬取篇)

( 簡體 字)
作者:楊秀璋,顏娜類別:1. -> 程式設計 -> Python
   2. -> 程式設計 -> 網路爬蟲
譯者:
出版社:北京航空航天大學出版社Python網絡數據爬取及分析從入門到精通(爬取篇) 3dWoo書號: 49245
詢問書籍請說出此書號!

缺書
NT售價: 300

出版日:5/1/2018
頁數:288
光碟數:0
站長推薦:
印刷:黑白印刷語系: ( 簡體 版 )
加入購物車 加到我的最愛
(請先登入會員)
ISBN:9787512427129
作者序 | 譯者序 | 前言 | 內容簡介 | 目錄 | 
(簡體書上所述之下載連結耗時費功, 恕不適用在台灣, 若讀者需要請自行嘗試, 恕不保證)
作者序:

譯者序:

前言:

內容簡介:

(內容講解專業但不晦澀,實例分析實際但不枯燥)


本書採用通俗易懂的語言、豐富多彩的實例,詳細介紹了使用Python語言進行網路資料爬取的知識,主要內容包括Python語法、規則運算式、BeautifulSoup技術、Selenium技術、Scrapy框架、資料庫存儲等,同時詳細介紹了爬取網站和博客內容、電影資料資訊、招聘資訊、線上百科知識、微博內容、農產品資訊等實例。

書中所有知識點都結合經典實例進行介紹,涉及的實例都給出了詳細的分析流程,程式碼都給出了具體的注釋,同時採用圖文結合的形式講解,讓讀者能更加輕鬆地領會Python網路資料爬蟲的精髓,並快速提高自己的開發能力。

本書即可作為Python開發入門者的自學用書,也可作為高等院校資料爬取、資料分析、資料採擷、大資料等相關專業的教學參考書或實驗指導書,還可供Python開發人員查閱、參考。
目錄:

第1章 網路資料爬取概述 1
1.1 網路爬蟲 1
1.2 相關技術 3
1.2.1 HTTP 3
1.2.2 HTML 3
1.2.3 Python 5
1.3 本章小結 5
參考文獻 5
第2章 Python知識初學 6
2.1 Python簡介 6
2.2 基礎語法 11
2.2.1 縮進與注釋 11
2.2.2 變數與常量 12
2.2.3 輸入與輸出 14
2.2.4 賦值與運算式 16
2.3 資料類型 16
2.3.1 數位類型 16
2.3.2 字串類型 17
2.3.3 列表類型 17
2.3.4 元組類型 19
2.3.5 字典類型 19
2.4 條件陳述式 19
2.4.1 單分支 20
2.4.2 二分支 20
2.4.3 多分支 21
2.5 迴圈語句 22
2.5.1 while迴圈 22
2.5.2 for迴圈 24
2.5.3 break和continue語句 24
2.6 函 數 25
2.6.1 自訂函數 26
2.6.2 常見內部庫函數 27
2.6.3 協力廠商庫函數 29
2.7 字串操作 30
2.8 檔操作 32
2.8.1 打開文件 32
2.8.2 讀/寫文件 32
2.8.3 關閉文件 33
2.8.4 迴圈遍歷文件 34
2.9 物件導向 34
2.10 本章小結 36
參考文獻 36
第3章 規則運算式爬蟲之牛刀小試 37
3.1 規則運算式 37
3.2 Python網路資料爬取的常用模組 39
3.2.1 urllib模組 39
3.2.2 urlparse模組 42
3.2.3 requests模組 44
3.3 規則運算式爬取網路資料的常見方法 45
3.3.1 爬取標籤間的內容 45
3.3.2 爬取標籤中的參數 49
3.3.3 字串處理及替換 50
3.4 個人博客爬取實例 52
3.4.1 分析過程 52
3.4.2 代碼實現 57
3.5 本章小結 59
參考文獻 59
第4章 BeautifulSoup技術 60
4.1 安裝BeautifulSoup 60
4.1.1 Python 2.7安裝BeautifulSoup 60
4.1.2 pip安裝擴展庫 63
4.2 快速開始BeautifulSoup解析 67
4.2.1 BeautifulSoup解析 HTML 68
4.2.2 簡單獲取網頁標籤資訊 71
4.2.3 定位標籤並獲取內容 72
4.3 深入瞭解BeautifulSoup 73
4.3.1 BeautifulSoup對象 74
4.3.2 遍歷文檔樹 79
4.3.3 搜索文檔樹 82
4.4 BeautifulSoup簡單爬取個人博客網站 84
4.5 本章小結 87
參考文獻 87
第5章 BeautifulSoup爬取電影資訊 88
5.1 分析網頁DOM 樹結構 88
5.1.1 分析網頁結構及簡單爬取 88
5.1.2 定位節點及網頁翻頁分析 91
5.2 爬取豆瓣電影資訊 94
5.3 連結跳轉分析及詳情頁面爬取 98
5.4 本章小結 104
參考文獻 104
第6章 Python資料庫知識 105
6.1 MySQL資料庫 105
6.1.1 MySQL的安裝與配置 105
6.1.2 SQL基礎語句詳解 112
6.2 Python操作 MySQL資料庫 119
6.2.1 安裝 MySQL擴展庫 119
6.2.2 程式介面DB-API 121
6.2.3 Python調用 MySQLdb擴展庫 122
6.3 Python操作SQLite 3數__________據庫 126
6.4 本章小結 129
參考文獻 129
第7章 基於資料庫存儲的BeautifulSoup招聘爬蟲 130
7.1 知識圖譜和智聯招聘 130
7.2 BeautifulSoup爬取招聘資訊 132
7.2.1 分析網頁超連結及跳轉處理 132
7.2.2 DOM 樹節點分析及網頁爬取 135
7.3 Navicat for MySQL工具操作資料庫 137
7.3.1 連接資料庫 137
7.3.2 創建資料庫 139
7.3.3 創建表 141
7.3.4 資料庫增刪改查操作 143
7.4 MySQL資料庫存儲招聘資訊 146
7.4.1 MySQL操作資料庫 146
7.4.2 代碼實現 148
7.5 本章小結 153
參考文獻 153
第8章 Selenium技術 154
8.1 初識Selenium 154
8.1.1 安裝Selenium 155
8.1.2 安裝流覽器驅動 156
8.1.3 PhantomJS 158
8.2 快速開始Selenium解析 159
8.3 定位元素 162
8.3.1 通過id屬性定位元素 163
8.3.2 通過name屬性定位元素 165
8.3.3 通過XPath路徑定位元素 166
8.3.4 通過起連結文本定位元素 168
8.3.5 通過標籤名定位元素 169
8.3.6 通過類屬性名定位元素 170
8.3.7 通過CSS選擇器定位元素 170
8.4 常用方法和屬性 170
8.4.1 操作元素的方法 170
8.4.2 WebElement常用屬性 174
8.5 鍵盤和滑鼠自動化操作 175
8.5.1 鍵盤操作 175
8.5.2 滑鼠操作 177
8.6 導航控制 178
8.6.1 下拉式功能表交交互操作 178
8.6.2 Window和Frame間對話方塊的移動 179
8.7 本章小結 180
參考文獻 180
第9章 Selenium爬取線上百科知識 181
9.1 三大線上百科 181
9.1.1 維琪百科 181
9.1.2 百度百科 183
9.1.3 互動百科 184
9.2 Selenium爬取維琪百科 185
9.2.1 網頁分析 185
9.2.2 代碼實現 190
9.3 Selenium爬取百度百科 190
9.3.1 網頁分析 190
9.3.2 代碼實現 195
9.4 Selenium爬取互動百科 198
9.4.1 網頁分析 198
9.4.2 代碼實現 200
9.5 本章小結 202
參考文獻 203
第10章 基於資料庫存儲的Selenium博客爬蟲 204
10.1 博客網站 204
10.2 Selenium爬取博客信息 206
10.2.1 Forbidden錯誤 206
10.2.2 分析博客網站翻頁方法 208
10.2.3 DOM 樹節點分析及網頁爬取 210
10.3 MySQL資料庫存儲博客資訊 212
10.3.1 Navicat for MySQL創建表 213
10.3.2 Python操作 MySQL資料庫 214
10.3.3 代碼實現 216
10.4 本章小結 222
第11章 基於登錄分析的Selenium微博爬蟲 223
參考文獻 242
第12章 基於圖片抓取的Selenium爬蟲 243
12.4 本章小結 254
第13章 Scrapy技術爬取網路資料 255
13.4 本章小結 285
參考文獻 285
套書後記 286
致謝 288
序: