-- 會員 / 註冊 --  
 帳號:
 密碼:
  | 註冊 | 忘記密碼
3/26 新書到! 3/19 新書到! 3/14 新書到! 12/12 新書到!
購書流程Q & A站務留言版客服信箱
3ds MaxMayaRhinoAfter EffectsSketchUpZBrushPainterUnity
PhotoShopAutoCadMasterCamSolidWorksCreoUGRevitNuke
C#CC++Java遊戲程式Linux嵌入式PLCFPGAMatlab
駭客資料庫搜索引擎影像處理FluentVR+ARANSYS深度學習
單晶片AVROpenGLArduinoRaspberry Pi電路設計CadenceProtel
HadoopPythonStm32CortexLabview手機程式AndroidiPhone
可查書名,作者,ISBN,3dwoo書號
詳細書籍分類

Python金融大數據挖掘與分析全流程詳解

( 簡體 字)
作者:王宇韜 房宇亮 肖金鑫類別:1. -> 程式設計 -> Python
譯者:
出版社:機械工業出版社Python金融大數據挖掘與分析全流程詳解 3dWoo書號: 51673
詢問書籍請說出此書號!

缺書
NT售價: 450

出版日:8/23/2019
頁數:312
光碟數:0
站長推薦:
印刷:黑白印刷語系: ( 簡體 版 )
加入購物車 加到我的最愛
(請先登入會員)
ISBN:9787111633204
作者序 | 譯者序 | 前言 | 內容簡介 | 目錄 | 
(簡體書上所述之下載連結耗時費功, 恕不適用在台灣, 若讀者需要請自行嘗試, 恕不保證)
作者序:

譯者序:

前言:

內容簡介:

金融從業者每天都要與海量的數據打交道,如何從這些數據中挖掘出需要的信息,并進行相應的分析,是很多金融從業者非常關心的內容。本書以功能強大且較易上手的Python 語言為編程環境,全面講解了金融數據的獲取、處理、分析及結果呈現。
全書共16 章,內容涉及Python 基礎知識、網絡數據爬蟲技術、數據庫存取、數據清洗、數據可視化、數據相關性分析、IP 代理、瀏覽器模擬操控、郵件發送、定時任務、文件讀寫、云端部署、機器學習等,可以實現輿情監控、智能投顧、量化金融、大數據風控、金融反欺詐模型等多種金融應用。無論是編程知識還是金融相關知識,本書都力求從易到難、循序漸進地講解,并輔以商業實戰案例來加深印象。
本書定位為一本金融科技入門讀物,但書中的數據挖掘與分析思想對其他行業來說也具備較高的參考價值。
本書又是一個金融科技工具箱,里面的代碼可以方便地速查速用,解決實際工作中的問題。
本書適合金融行業的從業人員學習。對于大中專院校金融、財會等專業的師生,以及具備一定計算機編程基礎,又希望投身金融行業的讀者,本書也是不錯的參考讀物。
目錄:

前言
如何獲取學習資源
第1章 Python基礎
1.1 Python安裝與第一個Python程序12
1.1.1 安裝Python12
1.1.2 編寫第一個Python程序13
1.1.3 PyCharm的安裝與使用14
1.2 Python基礎知識18
1.2.1 變量、行、縮進與注釋18
1.2.2 數據類型:數字與字符串20
1.2.3 數據類型:列表與字典、元組與集合22
1.2.4 運算符27
1.3 Python語句29
1.3.1 if條件語句29
1.3.2 for循環語句30
1.3.3 while循環語句31
1.3.4 try/except異常處理語句32
1.4 函數與庫33
1.4.1 函數的定義與調用33
1.4.2 函數的返回值與作用域34
1.4.3 常用基本函數介紹36
1.4.4 庫38
第2章 金融數據挖掘之爬蟲技術基礎
2.1 爬蟲技術基礎1—網頁結構基礎41
2.1.1 查看網頁源代碼—F12鍵41
2.1.2 查看網頁源代碼—右鍵菜單43
2.1.3 網址構成及http與https協議44
2.1.4 網頁結構初步了解44
2.2 爬蟲技術基礎2—網頁結構進階44
2.2.1 HTML基礎知識1—我的第一個網頁45
2.2.2 HTML基礎知識2—基礎結構45
2.2.3 HTML基礎知識3—標題、段落、鏈接46
2.2.4 HTML基礎知識4—區塊49
2.2.5 HTML基礎知識5—類與id49
2.3 初步實戰—百度新聞源代碼獲取50
2.3.1 獲取網頁源代碼51
2.3.2 分析網頁源代碼信息53
2.4 爬蟲技術基礎3—正則表達式54
2.4.1 正則表達式基礎1—findall()函數54
2.4.2 正則表達式基礎2—非貪婪匹配之(.*?)55
2.4.3 正則表達式基礎3—非貪婪匹配之.*?57
2.4.4 正則表達式基礎4—自動考慮換行的修飾符re.S60
2.4.5 正則表達式基礎5—知識點補充61
第3章 金融數據挖掘案例實戰1
3.1 提取百度新聞標題、網址、日期及來源63
3.1.1 獲取網頁源代碼63
3.1.2 編寫正則表達式提取新聞信息63
3.1.3 數據清洗并打印輸出65
3.2 批量獲取多家公司的百度新聞并生成數據報告68
3.2.1 批量爬取多家公司的百度新聞68
3.2.2 自動生成輿情數據報告文本文件69
3.3 異常處理及24小時實時數據挖掘實戰71
3.3.1 異常處理實戰72
3.3.2 24小時實時爬取實戰72
3.4 按時間順序爬取及批量爬取多頁內容74
3.4.1 按時間順序爬取百度新聞74
3.4.2 一次性批量爬取多頁內容75
3.5 搜狗新聞與新浪財經數據挖掘實戰78
3.5.1 搜狗新聞數據挖掘實戰78
3.5.2 新浪財經數據挖掘實戰82
第4章 數據庫詳解及實戰
4.1 MySQL數據庫簡介及安裝86
4.2 MySQL數據庫基礎89
4.2.1 MySQL數據庫管理平臺phpMyAdmin介紹89
4.2.2 創建數據庫及數據表90
4.2.3 數據表基本操作92
4.3 Python與MySQL數據庫的交互96
4.3.1 安裝PyMySQL庫96
4.3.2 用Python連接數據庫96
4.3.3 用Python存儲數據到數據庫97
4.3.4 用Python在數據庫中查找并提取數據101
4.3.5 用Python從數據庫中刪除數據102
4.4 案例實戰:把金融數據存入數據庫103
第5章 數據清洗優化及數據評分系統搭建
5.1 深度分析—數據去重及清洗優化105
5.1.1 數據去重105
5.1.2 常見的數據清洗手段及日期格式統一107
5.1.3 文本內容深度過濾—剔除噪聲數據108
5.2 數據亂碼的處理110
5.2.1 編碼分析111
5.2.2 重新編碼及解碼112
5.2.3 解決亂碼問題的經驗方法114
5.3 輿情數據評分系統搭建115
5.3.1 輿情數據評分系統版本1—根據標題評分115
5.3.2 輿情數據評分系統版本2—根據正文內容評分117
5.3.3 輿情數據評分系統版本3—解決亂碼問題118
5.3.4 輿情數據評分系統版本4—處理非相關信息119
5.4 完整的百度新聞數據挖掘系統搭建121
5.4.1 將輿情數據評分存入數據庫121
5.4.2 百度新聞數據挖掘系統代碼整合123
5.4.3 從數據庫匯總每日評分127
第6章 數據分析利器:NumPy與pandas庫
6.1 NumPy庫基礎129
6.1.1 NumPy庫與數組129
6.1.2 創建數組的幾種方式131
6.2 pandas庫基礎132
6.2.1 二維數據表格DataFrame的創建與索引的修改133
6.2.2 Excel工作簿等文件的讀取和寫入137
6.2.3 數據的讀取與編輯139
6.2.4 數據表的拼接144
6.3 利用pandas庫導出輿情數據評分147
6.3.1 匯總輿情數據評分148
6.3.2 導出輿情數據評分表格150
第7章 數據可視化與數據相關性分析
7.1 用Tushare庫調取股價數據152
7.1.1 Tushare庫的基本用法152
7.1.2 匹配輿情數據評分與股價數據154
7.2 輿情數據評分與股價數據的可視化155
7.2.1 數據可視化基礎156
7.2.2 數據可視化實戰160
7.3 輿情數據評分與股價數據相關性分析162
7.3.1 皮爾遜相關系數162
7.3.2 相關性分析實戰164
第8章 金融數據挖掘之爬蟲技術進階
8.1 爬蟲技術進階1—IP代理簡介165
8.1.1 IP代理的工作原理165
8.1.2 IP代理的使用方法166
8.2 爬蟲技術進階2—Selenium庫詳解169
8.2.1 網絡數據挖掘的難點169
8.2.2 模擬瀏覽器ChromeDriver的下載與安裝170
8.2.3 Selenium庫的安裝172
8.2.4 Selenium庫的使用173
第9章 金融數據挖掘案例實戰2
9.1 新浪財經股票實時數據挖掘實戰180
9.1.1 獲取網頁源代碼180
9.1.2 數據提取181
9.2 東方財富網數據挖掘實戰182
9.2.1 獲取網頁源代碼183
9.2.2 編寫正則表達式提取數據183
9.2.3 數據清洗及打印輸出185
9.2.4 函數定義及調用185
9.3 裁判文書網數據挖掘實戰186
9.4 巨潮資訊網數據挖掘實戰188
9.4.1 獲取網頁源代碼189
9.4.2 編寫正則表達式提取數據190
9.4.3 數據清洗及打印輸出191
9.4.4 函數定義及調用191
第10章 通過PDF文本解析上市公司理財公告
10.1 PDF文件批量下載實戰193
10.1.1 爬取多頁內容193
10.1.2 自動篩選所需內容197
10.1.3 理財公告PDF文件的自動批量下載199
10.2 PDF文本解析基礎203
10.2.1 用pdfplumber庫提取文本內容203
10.2.2 用pdfplumber庫提取表格內容204
10.3 PDF文本解析實戰—尋找合適的理財公告206
10.3.1 遍歷文件夾里所有的PDF文件207
10.3.2 批量解析每一個PDF文件209
10.3.3 將合格的PDF文件自動歸檔209
第11章 郵件提醒系統搭建
11.1 用Python自動發送郵件213
11.1.1 通過騰訊QQ郵箱發送郵件213
11.1.2 通過網易163郵箱發送郵件215
11.1.3 發送HTML格式的郵件216
11.1.4 發送郵件附件218
11.2 案例實戰:定時發送數據分析報告221
11.2.1 用Python提取數據并發送數據分析報告郵件221
11.2.2 用Python實現每天定時發送郵件226
第12章 基于評級報告的投資決策分析
12.1 獲取券商研報網站的表格數據229
12.1.1 表格數據的常規獲取方法229
12.1.2 用Selenium庫爬取和訊研報網表格數據232
12.2 pandas庫的高階用法235
12.2.1 重復值和缺失值處理235
12.2.2 用groupby()函數分組匯總數據238
12.2.3 用pandas庫進行批量處理240
12.3 評估券商分析師預測準確度244
12.3.1 讀取分析師評級報告數據進行數據預處理244
12.3.2 用Tushare庫計算股票收益率247
12.3.3 計算平均收益率并進行分析師預測準確度排名251
12.4 策略延伸253
12.4.1 漲停板的考慮253
12.4.2 按分析師查看每只股票的收益率254
12.4.3 計算多階段股票收益率255
第13章 用Python生成Word文檔
13.1 用Python創建Word文檔的基礎知識257
13.1.1 初識python-docx庫257
13.1.2 python-docx庫的基本操作258
13.2 用Python創建Word文檔的進階知識261
13.2.1 設置中文字體261
13.2.2 在段落中新增文字261
13.2.3 設置字體大小及顏色262
13.2.4 設置段落格式264
13.2.5 設置表格樣式267
13.2.6 設置圖片樣式268
13.3 案例實戰:自動生成數據分析報告Word文檔269
第14章 基于股票信息及其衍生變量的數據分析
14.1 策略基本思路274
14.2 獲取股票基本信息及衍生變量數據275
14.2.1 獲取股票基本信息數據275
14.2.2 獲取股票衍生變量數據279
14.2.3 通過相關性分析選取合適的衍生變量282
14.2.4 數據表優化及代碼匯總283
14.3 數據可視化呈現285
14.4 用xlwings庫生成Excel工作簿287
14.4.1 xlwings庫的基本用法287
14.4.2 案例實戰:自動生成Excel工作簿報告290
14.5 策略深化思路292
第15章 云服務器部署實戰
15.1 云服務器的購買與配置295
15.2 程序的云端部署298
15.2.1 安裝運行程序所需的軟件299
15.2.2 實現程序24小時不間斷運行299
第16章 機器學習之客戶違約預測模型搭建
16.1 機器學習在金融領域的應用300
16.2 決策樹模型的基本原理300
16.2.1 決策樹模型簡介300
16.2.2 決策樹模型的建樹依據301
16.3 案例實戰:客戶違約預測模型搭建303
16.3.1 模型搭建303
16.3.2 模型預測及評估306
16.3.3 模型可視化呈現311
序: