-- 會員 / 註冊 --  
 帳號:
 密碼:
  | 註冊 | 忘記密碼
3/26 新書到! 3/19 新書到! 3/14 新書到! 12/12 新書到!
購書流程Q & A站務留言版客服信箱
3ds MaxMayaRhinoAfter EffectsSketchUpZBrushPainterUnity
PhotoShopAutoCadMasterCamSolidWorksCreoUGRevitNuke
C#CC++Java遊戲程式Linux嵌入式PLCFPGAMatlab
駭客資料庫搜索引擎影像處理FluentVR+ARANSYS深度學習
單晶片AVROpenGLArduinoRaspberry Pi電路設計CadenceProtel
HadoopPythonStm32CortexLabview手機程式AndroidiPhone
可查書名,作者,ISBN,3dwoo書號
詳細書籍分類

比Selenium還強大的網路爬蟲:Scrapy一本就精通

( 繁體 字)
作者:劉 碩類別:1. -> 程式設計 -> 網路爬蟲
譯者:
出版社:佳魁資訊比Selenium還強大的網路爬蟲:Scrapy一本就精通 3dWoo書號: 49314
詢問書籍請說出此書號!

缺書
NT定價: 580
折扣價: 435

出版日:6/6/2018
頁數:
光碟數:0
站長推薦:
印刷:黑白印刷語系: ( 繁體 版 )
加入購物車 加到我的最愛
(請先登入會員)
ISBN:9789863796619
作者序 | 譯者序 | 前言 | 內容簡介 | 目錄 | 
(簡體書上所述之下載連結耗時費功, 恕不適用在台灣, 若讀者需要請自行嘗試, 恕不保證)
作者序:

譯者序:

前言:

內容簡介:

本書說明目前最流行的Python 爬蟲架構Scrapy,它簡單好用、靈活易擴充、文件豐富、開發社區活躍,使用Scrapy 可以高效率地開發網路爬蟲應用。讀者有Python 語言基礎即可,本書從零基礎、逐步由淺入深說明。
全書共14章,系統地介紹Python流行框架Scrapy的相關技術及使用技巧。第1~8 章說明Scrapy 開發的核心基礎部分,重點介紹Scrapy的核心元素,如spider、selector、item、link等。
第9~14 章說明實際爬蟲開發中使用頻率最高的一些實用技術,如下載檔案和圖片、模擬登入、執行JavaScript、爬取動態網頁、使用HTTP代理、分散式爬蟲的編寫等內容。
本書主要特色:
■ 所有基礎部分的說明都配有程式範例,而不僅是枯燥的文件。
■ 案例選材方面以說明基礎知識為核心,儘量選擇專門供練習爬蟲技術的網站(不易變動)或接近日常生活的網站(京東、知乎、豆瓣、360)進行示範。
■ 在說明某些基礎知識時,對Scrapy原始程式進行分析,讓讀者能夠「知其然並知其所以然」。    
適用:有Python語言基礎,想學習編寫複雜網路爬蟲的讀者。
目錄:

01  初識Scrapy   
1.1 網路爬蟲是什麼
1.2 Scrapy 簡介及安裝
1.3 撰寫第一個Scrapy 爬蟲
1.4 本章小結   
02  撰寫Spider   
2.1 Scrapy 架構結構及工作原理
2.2 Request 和Response 物件
2.3 Spider 開發流程
2.4 本章小結   
03  使用Selector 分析資料   
3.1 Selector 物件
3.2 Response 內建Selector   
3.3 XPath
3.4 CSS 選擇器
3.5 本章小結   
04  使用Item 封裝資料   
4.1 Item 和Field
4.2 擴充Item 子類別
4.3 Field 中繼資料
4.4 本章小結   
05  使用Item Pipeline 處理資料   
5.1 Item Pipeline
5.2 更多實例
5.3 本章小結   
06  使用LinkExtractor 分析連結   
6.1 使用LinkExtractor
6.2 描述分析規則
6.3 本章小結   
07  使用Exporter 匯出資料   
7.1 指定如何匯出資料   
7.2 增加匯出資料格式
7.3 本章小結   
08  專案練習   
8.1 專案需求
8.2 頁面分析
8.3 程式實現
8.4 本章小結   
09 ?下載檔案和圖片
9.1 FilesPipeline 和ImagesPipeline
9.2 專案實戰:爬取matplotlib 實例原始程式檔案
9.3 專案實戰:下載360 圖片
9.4 本章小結   
10  模擬登入
10.1 登入實質
10.2 Scrapy 模擬登入
10.3 識別驗證碼
10.4 Cookie 登入
10.5 本章小結
11 爬取動態頁面
11.1 Splash 繪製引擎
11.2 在Scrapy 中使用Splash
11.3 專案實戰:爬取toscrape 中的名人名言
11.4 專案實戰:爬取京東商場中的書籍資訊
11.5 本章小結
12  存入資料庫
12.1 SQLite
12.2 MySQL   
12.3 MongoDB
12.4 Redis
12.5 本章小結
13  使用HTTP 代理
13.1 HttpProxyMiddleware
13.2 使用多個代理
13.3 取得免費代理
13.4 實現隨機代理
13.5 專案實戰:爬取豆瓣電影資訊
13.6 本章小結
14  分散式爬取
14.1 Redis 的使用
14.2 scrapy-redis 原始程式分析
14.3 使用scrapy-redis 進行分散式爬取
14.4 本章小結
序: