Python爬蟲數據分析與可視化：工具詳解與案例實戰 @ 3dWoo大學簡體電腦書店

Python爬蟲數據分析與可視化：工具詳解與案例實戰 ( 簡體字)
作者：成立明胡書敏黃勇	類別：1. -> 程式設計 -> Python 　　　2. -> 程式設計 -> 網路爬蟲
出版社：機械工業出版社	3dWoo書號： 53715 詢問書籍請說出此書號！缺書 NT售價： 345 元
出版日：11/1/2020
頁數：252
光碟數：0
站長推薦：
印刷：黑白印刷	語系： ( 簡體字 )
ISBN：9787111667759	【不接受訂購】
(簡體書上所述之下載連結耗時費功, 恕不適用在台灣, 若讀者需要請自行嘗試, 恕不保證, 繁體書的下載亦請直接連絡出版社)
目錄前言內容簡介第1章 Python程式設計基礎1 1.1 搭建Python開發環境1 1.1.1 安裝Python解譯器1 1.1.2 安裝Python協力廠商開發包2 1.1.3 在PyCharm裡新建專案和檔3 1.1.4 在PyCharm裡更換Python解譯器5 1.2 實踐Python基本語法5 1.2.1 針對基底資料型別的操作6 1.2.2 針對字串的操作7 1.2.3 多行注釋與引入中文8 1.2.4 條件分支語句9 1.2.5 迴圈動作陳述式9 1.2.6 break和continue的用法10 1.2.7 格式化輸出語句11 1.3 定義和調用函數11 1.4 return的重要性——函數的遞迴呼叫12 1.5 熟悉函數的特殊寫法13 1.5.1 函數作為參數14 1.5.2 函數作為返回結果14 1.5.3 匿名函數15 1.6 本章小結15 第2章 Python的資料結構16 2.1 列表16 2.1.1 定義列表16 2.1.2 在列表中增、刪、改元素17 2.1.3 列表的切片操作18 2.1.4 遍歷列表19 2.1.5 列表的常見用法19 2.2 元組20 2.2.1 創建和使用元組20 2.2.2 元組的常見用法21 2.3 集合22 2.3.1 創建和使用集合22 2.3.2 針對集合的常用資料操作23 2.4 字典23 2.4.1 創建和使用字典24 2.4.2 增加、刪除和修改字典中的元素24 2.4.3 遍歷字典25 2.5 針對資料結構的通用性操作25 2.5.1 通過map方法實現序列的映射25 2.5.2 filter方法與資料篩選26 2.5.3 通過reduce方法實現累計效果27 2.5.4 通過sorted方法排序物件27 2.6 本章小結28 第3章 Python物件導向程式設計29 3.1 什麼是物件導向思想29 3.2 封裝特性30 3.2.1 創建類並在類裡封裝屬性和方法30 3.2.2 類方法的第一個參數必須指向實例31 3.2.3 私有屬性的典型錯誤用法31 3.2.4 瞭解其他常用魔術方法33 3.2.5 從私有屬性和私有方法體會封裝特性34 3.3 繼承特性35 3.3.1 繼承的語法和使用場景35 3.3.2 子類無法使用父類的私有屬性和方法36 3.3.3 受保護的屬性和方法37 3.3.4 多重繼承與組合模式38 3.4 多態特性40 3.4.1 以反覆運算器為例來理解多態40 3.4.2 可變參數與方法重載41 3.4.3 整合使用多態和繼承42 3.5 模組、包以及協力廠商庫43 3.5.1 通過import重用現有模組中的功能43 3.5.2 自訂包和使用包43 3.5.3 引入並使用協力廠商庫44 3.6 本章小結45 第4章異常處理機制與文件讀寫46 4.1 通過try…except…finally處理異常46 4.1.1 處理異常的try…except從句46 4.1.2 使用異常處理類47 4.1.3 同時處理多個異常48 4.1.4 在處理異常時引入else代碼塊49 4.1.5 引入finally從句50 4.2 raise與except的整合使用51 4.2.1 通過raise拋出異常51 4.2.2 自訂異常且與except整合使用51 4.3 異常處理的實踐經驗52 4.3.1 盡可能縮小try的代碼塊53 4.3.2 用專業的異常處理類針對性地處理異常53 4.3.3 拿到異常別忽視54 4.3.4 合理確定異常的影響範圍54 4.4 在讀寫檔案例中使用異常機制55 4.4.1 通過os.path獲取目錄和檔案屬性55 4.4.2 以唯讀模式打開檔56 4.4.3 逐行讀取文件58 4.4.4 通過write寫檔59 4.4.5 以添加的方式寫檔59 4.4.6 讀寫csv文件60 4.5 本章小結61 第5章 NumPy陣列處理62 5.1 NumPy庫的基礎資料結構：ndarray對象62 5.1.1 通過array方法創建ndarray62 5.1.2 ndarray的dtype屬性63 5.1.3 創建全0或全1的ndarray64 5.2 NumPy庫的常用操作65 5.2.1 通過arange方法創建序列陣列65 5.2.2 針對ndarray的數學運算66 5.2.3 常用的科學計算函數67 5.2.4 常用的聚合統計函數68 5.2.5 遍歷ndarray陣列69 5.3 針對ndarray的索引和切片操作69 5.3.1 索引操作69 5.3.2 布林索引與條件過濾70 5.3.3 切片操作與共用記憶體70 5.3.4 通過copy函數創建副本72 5.4 本章小結72 第6章 Pandas數據清洗73 6.1 以一維方式存儲資料的Series物件73 6.1.1 Series的常規操作74 6.1.2 創建並使用Series索引75 6.1.3 獲取Series裡的切片資料76 6.1.4 通過布林Series獲取滿足條件的元素78 6.1.5 遍歷Series數據78 6.2 以表格格式存儲資料的DataFrame物件79 6.2.1 DataFrame對象的常規用法79 6.2.2 通過loc、iloc和ix提取資料81 6.2.3 遍歷DataFrame裡的數據82 6.3 面向DataFrame的常用資料分析方法82 6.3.1 對DataFrame資料進行排序83 6.3.2 以列為單位進行運算83 6.3.3 增加和刪除列84 6.3.4 過濾和重設數據85 6.3.5 在DataFrame中進行資料統計分析85 6.3.6 衡量變數間關聯程度的corr方法86 6.4 Pandas與各類檔的交互87 6.4.1 DataFrame資料與csv檔的相互轉換87 6.4.2 NaN與缺失值處理89 6.4.3 DataFrame資料與Excel檔的相互轉換90 6.4.4 DataFrame資料與json檔的相互轉換91 6.5 本章小結92 第7章 Matplotlib數據視覺化93 7.1 通過Matplotlib繪製各類圖形93 7.1.1 繪製折線圖93 7.1.2 繪圖時的通用屬性參數94 7.1.3 繪製柱狀圖95 7.1.4 繪製圓形圖97 7.1.5 繪製長條圖98 7.2 設置座標的技巧99 7.2.1 設置x和y座標標籤文字並展示中文99 7.2.2 設置座標的範圍100 7.2.3 設置座標的主刻度和次刻度101 7.2.4 設置並旋轉座標刻度文字102 7.3 增加視覺化美觀效果103 7.3.1 設置圖例104 7.3.2 設置中文標題105 7.3.3 設置網格效果106 7.4 設置多圖和子圖效果107 7.4.1 通過figure對象同時繪製多張圖107 7.4.2 通過add_subplot方法繪製子圖108 7.4.3 通過subplot方法繪製子圖109 7.4.4 子圖共用x坐標軸110 7.4.5 在大圖裡繪製子圖112 7.5 繪製高級圖表113 7.5.1 繪製散點圖113 7.5.2 繪製熱圖114 7.5.3 繪製等值線圖115 7.6 通過mplot3d繪製三維圖形116 7.6.1 繪製三維曲線圖116 7.6.2 繪製三維散點圖117 7.6.3 繪製三維柱狀圖118 7.7 本章小結119 第8章通過網路爬蟲獲取資料120 8.1 和爬蟲有關的HTTP120 8.1.1 基於HTTP的請求處理流程120 8.1.2 HTTP請求頭包含作業系統和流覽器資訊122 8.1.3 Post和Get請求方法122 8.1.4 HTTP常見的狀態碼122 8.2 通過Urllib庫獲取網頁資訊123 8.2.1 通過request爬取網頁123 8.2.2 設置超時時間124 8.2.3 用URLError處理網路異常124 8.2.4 設置header屬性來類比流覽器發送請求125 8.3 通過BeautifulSoup提取頁面資訊125 8.3.1 安裝BeautifulSoup庫125 8.3.2 用Tag提取HTML元素和屬性126 8.3.3 用NavigableString提取元素值127 8.3.4 用Comment提取注釋127 8.3.5 制定規則搜索指定的內容128 8.4 通過規則運算式截取資訊130 8.4.1 查找指定字串130 8.4.2 用通用字元來模糊匹配130 8.4.3 通過原子表來定義匹配規則131 8.4.4 用findall按匹配規則截取內容132 8.5 用Scrapy爬取博客園文章資訊134 8.5.1 通過Scrapy命令創建爬蟲專案134 8.5.2 明確爬取目標，制定爬取規則134 8.5.3 在Item模組裡定義資料模型136 8.5.4 生成爬蟲檔，定義爬取動作136 8.5.5 在pipelines檔裡定義資料存儲方式137 8.5.6 啟動爬蟲程式，觀察運行效果138 8.6 本章小結139 第9章資料分析的常用方法140 9.1 準備並存儲資料140 9.1.1 用Pandas_datareader庫獲取資料140 9.1.2 以csv和Excel格式存儲資料141 9.1.3 準備MySQL環境142 9.1.4 在MySQL裡存儲資料142 9.1.5 從資料表裡讀取數據145 9.2 描述性統計146 9.2.1 平均數、中位數和百分位元數146 9.2.2 用箱狀圖展示分位數147 9.2.3 統計極差、方差和標準差148 9.3 基於時間序列的統計方法148 9.3.1 用rolling方法計算移動平均值148 9.3.2 基於時間序列的自相關性分析149 9.3.3 基於時間序列的偏自相關性分析151 9.3.4 用熱力圖分析不同時間序列的相關性152 9.4 概率分析方法與推斷統計154 9.4.1 分析收盤價，繪製小提琴圖154 9.4.2 用長條圖來擬合正態分佈效果155 9.4.3 驗證序列是否滿足正態分佈156 9.4.4 參數估計方法157 9.4.5 顯著性驗證158 9.5 回歸分析方法159 9.5.1 構建一元線性回歸模型159 9.5.2 以多元線性回歸模型預測股價162 9.6 本章小結1 全書共13章。第1~4章為基礎篇，主要講述Python基礎知識、Python資料結構、物件導向程式設計思想，Python異常處理和讀寫文件的技巧；第5~7章為資料分析的工具篇，主要講述Numpy庫、Pandas庫和Matplotlib庫的基本功能和應用；第8章和第9章為“資料分析高級技能篇”，主要講述通過爬取技術博客案例、基於Scrapy爬蟲框架的實用技巧、資料分析的常用方法，如Python連接操作資料庫的相關技能，基於時間序列、概率分析、推斷統計和回歸分析方法的數學分析方法；第10~13章為“綜合案例篇”，主要講述二手房資料分析案例、股票資料分析案例以及基於Sklearn庫的機器學習相關實踐。

Python爬蟲 數據分析與可視化：工具詳解與案例實戰

Python爬蟲數據分析與可視化：工具詳解與案例實戰