-- 會員 / 註冊 --  
 帳號:
 密碼:
  | 註冊 | 忘記密碼
3/26 新書到! 3/19 新書到! 3/14 新書到! 12/12 新書到!
購書流程Q & A站務留言版客服信箱
3ds MaxMayaRhinoAfter EffectsSketchUpZBrushPainterUnity
PhotoShopAutoCadMasterCamSolidWorksCreoUGRevitNuke
C#CC++Java遊戲程式Linux嵌入式PLCFPGAMatlab
駭客資料庫搜索引擎影像處理FluentVR+ARANSYS深度學習
單晶片AVROpenGLArduinoRaspberry Pi電路設計CadenceProtel
HadoopPythonStm32CortexLabview手機程式AndroidiPhone
可查書名,作者,ISBN,3dwoo書號
詳細書籍分類

大數據分析:Python爬蟲、數據清洗和數據可視化

( 簡體 字)
作者:黃源 蔣文豪 徐受蓉類別:1. -> 程式設計 -> 大數據
   2. -> 程式設計 -> Python
   3. -> 程式設計 -> 網路爬蟲
譯者:
出版社:清華大學出版社大數據分析:Python爬蟲、數據清洗和數據可視化 3dWoo書號: 52328
詢問書籍請說出此書號!

缺書
NT售價: 300

出版日:1/1/2020
頁數:314
光碟數:0
站長推薦:
印刷:黑白印刷語系: ( 簡體 版 )
加入購物車 加到我的最愛
(請先登入會員)
ISBN:9787302530541
作者序 | 譯者序 | 前言 | 內容簡介 | 目錄 | 
(簡體書上所述之下載連結耗時費功, 恕不適用在台灣, 若讀者需要請自行嘗試, 恕不保證)
作者序:

譯者序:

前言:

大數據是現代社會高科技發展的產物。大數據相對于傳統的數據分析,它是海量數據的集合,它以采集、整理、存儲、挖掘、共享、分析、應用、清洗為核心,正廣泛地應用在軍事、金融、環境保護、通信等各個領域中。
當前,發展大數據已經成為國家戰略,大數據在引領經濟社會發展中的新引擎作用更加明顯。2014年“大數據”首次出現在我國《政府工作報告》中。報告中提到,要設立新興產業創業創新平臺,在大數據等方面趕超先進,引領未來產業發展。“大數據”一詞逐漸在國內成為熱議的詞匯。2015年國務院正式印發《促進大數據發展行動綱要》,《綱要》明確指出要不斷地推動大數據發展和應用,在未來打造精準治理、多方協作的社會治理新模式,建立運行平穩、安全高效的經濟運行新機制,構建以人為本、惠及全民的民生服務新體系,開啟大眾創業、萬眾創新的創新驅動新格局,培育高端智能、新興繁榮的產業發展新生態。
本書以理論與實踐操作相結合的方式深入地講解了大數據分析的基本知識和實現的基本技術,在內容設計上既有上課時教師的講述部分,包括詳細的理論與典型的案例,又有大量的實訓環節,雙管齊下,可極大地激發學生在課堂上的學習積極性與主動創造性,讓學生在課堂上跟上老師的思維,從而學到更多有用的知識和技能。
本書共10章,主要包括大數據、爬蟲與大數據、Scrapy爬蟲、數據庫連接與查詢、數據可視化基礎與應用、大數據存儲與清洗、數據格式與編碼技術、數據抽取與采集、pandas數據分析與清洗,以及數據分析與清洗綜合實訓。
本書有如下特點。
(1) 采用“理實一體化”教學方式,課堂上既有教師的講述,又有學生獨立思考、上機操作等內容。
(2) 配套資源豐富,本書提供教學大綱、教學課件、電子教案、習題答案、程序源碼等多種教學資源,掃描封底的課件二維碼可以下載; 本書還提供150分鐘的視頻講解,掃描書中相應位置的二維碼可以在線觀看、學習。
(3) 緊跟時代潮流,注重技術變化,書中包含了最新的大數據分析知識及一些開源庫的使用。
(4) 編寫本書的教師都具有多年的教學經驗,重難點突出,能夠激發學生的學習熱情。
本書可作為大數據專業、軟件技術專業、信息管理專業、計算機網絡專業的教材,也可作為大數據愛好者的參考書。

本書建議學時為80學時,具體分布如下表所示。

章節建 議 學 時章節建 議 學 時

大數據4大數據存儲與清洗6
爬蟲與大數據12數據格式與編碼技術6
Scrapy爬蟲8數據抽取與采集12
數據庫連接與查詢6pandas數據分析與清洗12
數據可視化基礎與應用10數據分析與清洗綜合實訓4


本書由黃源、蔣文豪、徐受蓉編寫。其中,黃源編寫了第1章、第6~10章; 蔣文豪編寫了第2章,蔣文豪和黃源共同編寫了第3章; 徐受蓉編寫了第4章和第5章。徐受蓉教授對書中內容進行了審閱工作,全書由黃源負責統稿工作。
本書是校企合作共同編寫的結果,在編寫過程中得到了中國電信金融行業信息化應用重慶基地總經理助理楊琛的大力支持。
在編寫過程中,我們參閱了大量的相關資料,在此表示感謝!
由于編者水平有限,書中難免出現疏漏之處,懇請廣大讀者批評指正。


編者

2019年10月于重慶
內容簡介:

在全書中介紹了大數據概述、爬蟲與大數據相關技術、Scrapy 爬蟲、數據庫連接與查詢、數據可視化、數據存儲與清洗概述
、數據格式與編碼技術介紹、數據抽取與采集、pandas 數據清洗。每個階段都重點強化實訓,實現了理論與實踐的結合。教材中應用案例來展開知識點的講解,對重要的、核心的知識點加大練習的比例,以達到熟練運用的目的。
目錄:

配套資源下載

目錄
第1章大數據
1.1大數據概述
1.1.1大數據介紹
1.1.2大數據的特征
1.1.3大數據技術應用與基礎
1.2大數據的意義
1.2.1大數據的國家戰略意義
1.2.2大數據的企業意義
1.2.3我國大數據市場的預測
1.3大數據的產業鏈分析
1.3.1技術分析
1.3.2運營分析
1.4本章小結
1.5實訓
習題
第2章爬蟲與大數據
2.1爬蟲概述
2.1.1爬蟲介紹
2.1.2爬蟲的地位與作用
2.2Python介紹
2.2.1Python開發環境搭建
2.2.2編寫Python程序
2.2.3Python數據類型
2.3爬蟲相關知識
2.3.1了解網頁結構
2.3.2Python與爬蟲
2.3.3基礎爬蟲框架
2.4利用爬蟲抓取網頁內容
2.4.1觀察與分析頁面
2.4.2抓取過程分析
2.4.3獲取頁面內容
2.5本章小結
2.6實訓
習題
第3章Scrapy爬蟲
3.1Scrapy爬蟲概述
3.2Scrapy原理
3.2.1Scrapy框架的架構
3.2.2Request對象和Response對象
3.2.3Select對象
3.2.4Spider開發流程
3.3Scrapy的開發與實現
3.3.1Scrapy爬蟲開發流程
3.3.2創建Scrapy項目并查看結構
3.3.3編寫代碼并運行爬蟲
3.4本章小結
3.5實訓
習題
第4章數據庫連接與查詢
4.1數據庫
4.1.1數據庫概述
4.1.2關系數據庫設計
4.2MySQL數據庫
4.2.1MySQL數據庫概述
4.2.2MySQL數據庫下載、安裝與運行
4.2.3MySQL數據庫命令行入門
4.3使用Python操作MySQL數據庫
4.3.1pymysql安裝與使用
4.3.2Python連接MySQL數據庫
4.4本章小結
4.5實訓
習題
第5章數據可視化基礎與應用
5.1數據可視化
5.1.1數據可視化概述
5.1.2數據可視化工具
5.1.3數據可視化圖表
5.2matplotlib可視化基礎
5.2.1numpy庫
5.2.2matplotlib認識與安裝

5.2.3matplotlib測試
5.2.4matplotlib.pyplot庫
5.3matplotlib可視化繪圖
5.3.1繪制線性圖形
5.3.2繪制柱狀圖形
5.3.3繪制直方圖
5.3.4繪制散點圖
5.3.5繪制極坐標圖
5.3.6繪制餅圖
5.4pyecharts可視化應用
5.5本章小結
5.6實訓
習題
第6章大數據存儲與清洗
6.1大數據存儲
6.2數據清洗
6.2.1數據清洗概述
6.2.2數據清洗的原理
6.2.3數據清洗的流程
6.2.4數據清洗的工具
6.3數據標準化
6.3.1數據標準化的概念
6.3.2數據標準化的方法
6.3.3數據標準化的實例
6.4本章小結
6.5實訓
習題
第7章數據格式與編碼技術
7.1文件格式
7.2數據類型與編碼
7.2.1數據類型概述
7.2.2字符編碼
7.2.3數據轉換
7.3Kettle數據清洗與轉換工具的使用
7.3.1Kettle概述
7.3.2Kettle的安裝與使用
7.4CSV格式的數據轉換
7.4.1CSV格式概述
7.4.2CSV與JSON文件的轉換
7.5本章小結
7.6實訓
習題
第8章數據抽取與采集
8.1數據抽取
8.2文本抽取與實現
8.2.1文本文件抽取
8.2.2CSV文件抽取
8.2.3JSON文件抽取
8.3網頁數據抽取與實現
8.3.1網頁數據抽取
8.3.2Excel抽取網頁數據
8.3.3Kettle抽取網頁數據
8.4數據采集與實現
8.5本章小結
8.6實訓
習題
第9章pandas數據分析與清洗
9.1認識pandas
9.2pandas語法與使用
9.3pandas讀取與清洗數據
9.3.1數據準備
9.3.2從CSV中讀取數據
9.3.3pandas數據清洗
9.4pandas數據可視化
9.4.1pandas繪圖概述
9.4.2pandas繪圖方法
9.5本章小結
9.6實訓
習題
第10章數據分析與清洗綜合實訓
10.1數據清洗實訓
10.1.1使用Kettle對生成的隨機數實現字段選擇
10.1.2使用Kettle連接不同的數據表
10.1.3使用Kettle過濾數據表
10.1.4使用Kettle連接MySQL數據庫,并輸出查詢結果
10.2數據分析實訓
10.3本章小結
習題
序: