|
-- 會員 / 註冊 --
|
|
|
|
Python 網路爬蟲與資料分析入門實戰 ( 繁體 字) |
作者:林俊瑋、林修博 | 類別:1. -> 程式設計 -> Python 2. -> 程式設計 -> 網路爬蟲 |
譯者: |
出版社:博碩文化 | 3dWoo書號: 50004 詢問書籍請說出此書號!【缺書】 NT定價: 450 元 折扣價: 338 元
|
出版日:10/5/2018 |
頁數:256 |
光碟數:0 |
|
站長推薦: |
印刷:黑白印刷 | 語系: ( 繁體 版 ) |
|
加入購物車 │加到我的最愛 (請先登入會員) |
ISBN:9789864343386 |
作者序 | 譯者序 | 前言 | 內容簡介 | 目錄 | 序 |
(簡體書上所述之下載連結耗時費功, 恕不適用在台灣, 若讀者需要請自行嘗試, 恕不保證) |
作者序: |
譯者序: |
前言: |
內容簡介:想自動化生活瑣事?想透過程式擷取網路上的公開資訊?學了Python卻不知道有什麼實際應用?正在尋找入門難度低且成就感高的Python專案?想知道網路爬蟲如何與資料分析結合?本書一次教給你!本書特色:● 基於熱門線上課程與實體教學的學員迴響重新編寫及增補而成的實戰書籍● 以臺灣讀者熟悉的網站為範例(PTT、Dcard、臺灣證交所、蘋果日報網站、Yahoo奇摩電影、Google Maps API、IMDB電影資料庫等)的Python網路爬蟲程式教學● 由淺入深,以實務需求為導向,涵蓋爬蟲常用函式庫、資料儲存、文件編碼、表單及登入頁處理、爬蟲程式被封鎖的常見原因等經驗談● 全新的資料分析章節,包含三個爬蟲程式的經典應用:量化投資、影評情緒分析與商品特價通知本書適合閱讀的對象:● 對網路爬蟲程式或資料分析有興趣者● 想自動化生活瑣事(例如自動追蹤網站特價通知、節省資料收集的時間等),化被動資訊接收為主動● Python新手或入門級讀者(知道何謂變數、if 判斷式與迴圈,寫過一些小程式),想練習低門檻及高成就感的Python專案 |
目錄:Chapter 01 環境設定與網頁爬蟲初探 1-1 環境設定及套件安裝:Anaconda 1-2 使用IDE:PyCharm 1-3 使用Jupyter Notebook 1-4 網頁文件解構與網頁爬蟲初探
Chapter 02 Beautiful Soup 講解與網頁解構 2-1 不要重複造輪子:寫爬蟲之前 2-2 Beautiful Soup 重要功能 (find(), find_all(), .text, .stripped_strings) 2-3 網頁結構巡覽(parent, children, siblings) 2-4 正規表示式 (Regular Expression)
Chapter 03 網頁爬蟲範例實戰 3-1 PTT 八卦板今日熱門文章 3-2 Yahoo 奇摩電影本週新片 3-3 兩大報當日焦點新聞 3-4 Google 搜尋股價資訊 3-5 Dcard 今日熱門文章
Chapter 04 使用 API 4-1 API 簡介 4-2 PTT 八卦板眾來源分佈 (ipstack.com) 4-3 IMDB API 4-4 Google Maps APIs (Google Geocoding/Places API) 4-5 Dcard API
Chapter0 5 資料儲存 5-1 儲存圖片與多媒體檔案 5-2 儲存資料到 CSV 檔 5-3 儲存資料到資料庫 SQLite
Chapter 06 不同編碼與類型的文件 6-1 非 UTF-8 編碼的文件 6-2 XML 文件
Chapter 07 進階爬蟲議題 7-1 處理表單及登入頁 :臺灣高鐵時刻查詢 7-2 處理表單及登入頁 :Yelp 登入 7-3 使用WebDriver:臺銀法拍屋資訊查詢 7-4 爬蟲程式經驗談:被封鎖的常見原因、常用 Header 欄位、網站隱藏欄位、使用代理伺服器
Chapter 08 資料分析實戰 8-1 臺股每日盤後資訊爬蟲及策略回測(量化投資) 8-2 電影評論情緒分析(中文自然語言處理與機器學習) 8-3 商品特價 Gmail 通知:Costco 商品網頁
附表 本書範例目標網站列表
附錄A 在 Mac 安裝Anaconda 開發環境
附錄B Python 爬蟲框架Scrapy 入門教學 B-1 Scrapy 環境安裝 B-2 簡易部落格爬蟲 B-3 Scrapy 系統架構 B-4 博客來網路書店爬蟲 |
序: |
|