3dwoo大學簡體電腦書店
機器學習之路——Caffe、Keras、scikit-learn實戰
( 簡體 字)
作者:阿布,胥嘉幸類別:1. -> 程式設計 -> 機器學習
出版社:電子工業出版社機器學習之路——Caffe、Keras、scikit-learn實戰 3dWoo書號: 47219
詢問書籍請說出此書號!
有庫存
NT售價: 395
出版日:8/1/2017
頁數:328
光碟數:0
站長推薦:
印刷:黑白印刷語系: ( 簡體 字 )
ISBN:9787121321603 加入購物車加到我的最愛 (請先登入會員)
(簡體書上所述之下載連結耗時費功, 恕不適用在台灣, 若讀者需要請自行嘗試, 恕不保證, 繁體書的下載亦請直接連絡出版社)
第一篇 機器學習篇
第1 章 初識機器學習 .... 2
1.1 機器學習——賦予機器“學習”的靈魂 ... 2
1.1.1 小紅帽識別毒蘑菇 ..... 2
1.1.2 三種機器學習問題 ..... 6
1.1.3 常用符號 ...... 6
1.1.4 回顧 ...... 7
1.2 KNN——相似的鄰居請投票 .... 7
1.2.1 模型原理 ...... 7
1.2.2 鳶尾花卉數據集(IRIS) ..... 9
1.2.3 訓練模型 ...... 9
1.2.4 評估模型 ...... 12
1.2.5 關于KNN ..... 14
1.2.6 運用KNN 模型 ...... 15
1.2.7 回顧 ...... 16
1.3 邏輯分類I:線性分類模型 .... 16
1.3.1 參數化的模型 ...... 16
1.3.2 邏輯分類:預測..... 18
1.3.3 邏輯分類:評估..... 22
1.3.4 邏輯分類:訓練..... 23
1.3.5 回顧 ...... 24
1.4 邏輯分類II:線性分類模型 ..... 24
1.4.1 尋找模型的權重..... 24
VI ∣ 機器學習之路——Caffe、Keras、scikit-learn 實戰
1.4.2 去均值和歸一化..... 31
1.4.3 實現 ...... 33
1.4.4 回顧 ...... 34
第2 章 機器學習進階 .... 35
2.1 特征工程 ...... 35
2.1.1 泰坦尼克號生存預測 ..... 35
2.1.2 兩類特征 ...... 38
2.1.3 構造非線性特征..... 41
2.1.4 回顧 ...... 45
2.2 調試模型 ...... 46
2.2.1 模型調試的目標..... 46
2.2.2 調試模型 ...... 49
2.2.3 回顧 ...... 52
2.3 分類模型評估指標 .... 53
2.3.1 混淆矩陣系指標..... 53
2.3.2 評估曲線 ...... 58
2.3.3 回顧 ...... 61
2.4 回歸模型 ...... 61
2.4.1 回歸與分類 ...... 61
2.4.2 線性回歸 ...... 62
2.4.3 波士頓房價預測..... 66
2.4.4 泰坦尼克號生存預測:回歸預測特征年齡Age .... 69
2.4.5 線性模型與非線性模型 ..... 72
2.4.6 回顧 ...... 73
2.5 決策樹模型 ...... 73
2.5.1 信息與編碼 ...... 74
2.5.2 決策樹 ...... 76
2.5.3 對比線性模型和決策樹模型的表現 ..... 77
2.5.4 回顧 ...... 79
2.6 模型融合 ...... 80
2.6.1 融合成群體(Ensamble) ..... 80
2.6.2 Bagging:隨機森林(Random Forest) ... 82
目錄 ∣ VII
2.6.3 Boosting:GBDT ..... 83
2.6.4 Stacking ...... 86
2.6.5 泰坦尼克號生存預測:小結 ..... 93
2.6.6 回顧 ...... 94
第3 章 實戰:股票量化 .... 95
3.1 第一步:構造童話世界 .... 95
3.1.1 股票是什么 ...... 95
3.1.2 當機器學習與量化交易走在一起 ..... 96
3.1.3 構造一個童話世界 ..... 96
3.1.4 回顧 ...... 100
3.2 第二步:應用機器學習 .... 100
3.2.1 構建特征數據 ...... 100
3.2.2 回歸預測股票價格 ..... 103
3.2.3 分類預測股票漲跌 ..... 108
3.2.4 通過決策樹分類,繪制決策圖 ..... 112
3.2.5 回顧 ...... 114
3.3 第三步:在真實世界應用機器學習 .... 114
3.3.1 回測 ...... 115
3.3.2 基于特征的交易預測 ..... 119
3.3.3 破滅的童話——真實世界的機器學習 ... 122
第二篇 深度學習篇
第4 章 深度學習:背景和工具 ... 126
4.1 背景 ...... 126
4.1.1 人工智能——為機器賦予人的智能 ..... 126
4.1.2 圖靈測試 ...... 126
4.1.3 強人工智能 vs 弱人工智能 ..... 127
4.1.4 機器學習和深度學習 ..... 128
4.1.5 過度的幻想 ...... 128
4.1.6 回顧 ...... 129
VIII ∣ 機器學習之路——Caffe、Keras、scikit-learn 實戰
4.2 深度學習框架簡介 .... 129
4.2.1 評測方式 ...... 130
4.2.2 評測對象 ...... 131
4.2.3 深度學習框架評測 ..... 131
4.2.4 小結 ...... 135
4.3 深度學習框架快速上手 .... 135
4.3.1 符號主義 ...... 135
4.3.2 MNIST ...... 136
4.3.3 Keras 完成邏輯分類 .... 138
4.3.4 回顧 ...... 141
4.4 Caffe 實現邏輯分類模型 ..... 141
4.4.1 Caffe 訓練MNIST 概覽 .... 142
4.4.2 Caffe 簡介 ..... 144
4.4.3 準備數據集 ...... 145
4.4.4 準備模型 ...... 146
4.4.5 模型訓練流程 ...... 149
4.4.6 使用模型 ...... 149
4.4.7 Caffe 的Python 接口 ..... 150
4.4.8 回顧 ...... 151
第5 章 深層學習模型 .... 152
5.1 解密生物智能 .... 154
5.1.1 實驗一:大腦的材料 ..... 154
5.1.2 實驗二:探索腦皮層的功能區域 ..... 156
5.1.3 實驗三:不同的皮層組織——區別在于函數算法 ... 158
5.1.4 實驗四:可替換的皮層模塊——神經元組成的學習模型 ... 161
5.1.5 模擬神經元 ...... 162
5.1.6 生物結構帶來的啟發 ..... 163
5.1.7 回顧 ...... 164
5.2 DNN 神經網絡模型 ..... 164
5.2.1 線性內核和非線性激活 ..... 164
5.2.2 DNN、CNN、RNN ..... 165
5.2.3 邏輯分類:一層神經網絡 ..... 166
目錄 ∣ IX
5.2.4 更多的神經元 ...... 167
5.2.5 增加Hidden Layer(隱層) .... 168
5.2.6 ReLu 激活函數 ..... 170
5.2.7 理解隱層 ...... 171
5.2.8 回顧 ...... 172
5.3 神經元的深層網絡結構 .... 172
5.3.1 問題:更寬 or 更深 ..... 172
5.3.2 鏈式法則:深層模型訓練更快 ..... 173
5.3.3 生物:深層模型匹配生物的層級識別模式 ... 175
5.3.4 深層網絡結構 ...... 177
5.3.5 回顧 ...... 178
5.4 典型的DNN 深層網絡模型:MLP .... 178
5.4.1 優化梯度下降 ...... 179
5.4.2 處理過擬合:Dropout ..... 181
5.4.3 MLP 模型 ..... 182
5.4.4 回顧 ...... 185
5.5 Caffe 實現MLP ..... 185
5.5.1 搭建MLP ..... 185
5.5.2 訓練模型 ...... 189
5.5.3 回顧 ...... 190
第6 章 學習空間特征 .... 191
6.1 預處理空間數據 .... 192
6.1.1 像素排列展開的特征向量帶來的問題 ... 192
6.1.2 過濾冗余 ...... 194
6.1.3 生成數據 ...... 195
6.1.4 回顧 ...... 198
6.2 描述圖片的空間特征:特征圖 .... 199
6.2.1 圖片的卷積運算..... 199
6.2.2 卷積指令和特征圖 ..... 201
6.2.3 回顧 ...... 206
6.3 CNN 模型I:卷積神經網絡原理 ... 206
6.3.1 卷積神經元 ...... 207
X ∣ 機器學習之路——Caffe、Keras、scikit-learn 實戰
6.3.2 卷積層 ...... 208
6.3.3 多層卷積 ...... 211
6.3.4 回顧 ...... 216
6.4 CNN 模型II:圖片識別 ..... 216
6.4.1 連接分類模型 ...... 216
6.4.2 貓狗分類 ...... 217
6.4.3 反思CNN 與DNN 的結合:融合訓練 .... 221
6.4.4 深度學習與生物視覺 ..... 222
6.4.5 回顧 ...... 224
6.5 CNN 的實現模型 ..... 224
6.5.1 ImageNet 簡介 ...... 224
6.5.2 Googlenet 模型和Inception 結構 .... 226
6.5.3 VGG 模型 ..... 228
6.5.4 其他模型 ...... 231
6.5.5 回顧 ...... 232
6.6 微訓練模型(fine-tuning) ..... 232
6.6.1 二次訓練一個成熟的模型 ..... 232
6.6.2 微訓練在ImageNet 訓練好的模型 ..... 233
6.6.3 回顧 ...... 239
第7 章 Caffe 實例:狗狗品種辨別 ... 240
7.1 準備圖片數據 .... 240
7.1.1 搜集狗狗圖片 ...... 240
7.1.2 清洗數據 ...... 241
7.1.3 標準化數據 ...... 242
7.1.4 回顧 ...... 243
7.2 訓練模型 ...... 243
7.2.1 生成樣本集 ...... 244
7.2.2 生成訓練、測試數據集 ..... 245
7.2.3 生成lmdb ..... 246
7.2.4 生成去均值文件..... 247
7.2.5 更改prototxt 文件 ...... 247
7.2.6 訓練模型 ...... 249
目錄 ∣ XI
7.2.7 回顧 ...... 249
7.3 使用生成的模型進行分類 .... 249
7.3.1 更改deploy.prototxt ..... 249
7.3.2 加載模型 ...... 250
7.3.3 回顧 ...... 257
第8 章 漫談時間序列模型 ... 258
8.1 Embedding ...... 259
8.1.1 簡單的文本識別..... 260
8.1.2 深度學習從讀懂詞義開始 ..... 261
8.1.3 游戲:詞義運算..... 264
8.1.4 回顧 ...... 264
8.2 輸出序列的模型 .... 265
8.2.1 RNN ...... 265
8.2.2 LSTM ...... 266
8.2.3 并用人工特征和深度學習特征——一個NLP 模型的優化歷程 .. 268
8.2.4 反思:讓模型擁有不同的能力 ..... 270
8.2.5 回顧 ...... 273
8.3 深度學習:原理篇總結 .... 273
8.3.1 原理小結 ...... 273
8.3.2 使用建議 ...... 275
第9 章 用深度學習做個藝術畫家——模仿實現PRISMA . 277
9.1 機器學習初探藝術作畫 .... 278
9.1.1 藝術作畫概念基礎 ..... 278
9.1.2 直觀感受一下機器藝術家 ..... 279
9.1.3 一個有意思的實驗 ..... 280
9.1.4 機器藝術作畫的愿景 ..... 281
9.1.5 回顧 ...... 282
9.2 實現秒級藝術作畫 .... 282
9.2.1 主要實現思路分解講解 ..... 283
9.2.2 使用統計參數期望與標準差尋找mask .... 290
XII ∣ 機器學習之路——Caffe、Keras、scikit-learn 實戰
9.2.3 工程代碼封裝結構及使用示例 ..... 299
9.2.4 回顧和后記 ...... 302
附錄A 機器學習環境部署 ... 303
附錄B 深度學習環境部署 ... 307
附錄C 隨書代碼運行環境部署 .... 312
機器學習需要一條脫離過高理論門檻的入門之路。本書《機器學習篇》從小紅帽采蘑菇的故事開篇,介紹了基礎的機器學習分類模型的訓練(第1章)。如何評估、調試模型?如何合理地發掘事物的特征?如何利用幾個模型共同發揮作用?后續章節一步一步講述了如何優化模型,更好地完成分類預測任務(第2章),并且初步嘗試將這些技術運用到金融股票交易中(第3章)。自然界最好的非線性模型莫過于人類的大腦。《深度學習篇》從介紹并對比一些常見的深度學習框架開始(第4章),講解了DNN模型的直觀原理,嘗試給出一些簡單的生物學解釋,完成簡單的圖片識別任務(第5章)。后續章節在此基礎上,完成更為復雜的圖片識別CNN模型(第6章)。接著,本書展示了使用Caffe完成一個完整的圖片識別項目,從準備數據集,到完成識別任務(第7章)。后面簡單描述了RNN模型(第8章),接著展示了一個將深度學習技術落地到圖片處理領域的項目(第9章)。

越來越多的人期待能擠進機器學習這一行業,這些人往往有一些編程和自學能力,
但數學等基礎理論能力不足。對于這些人群,從頭開始學習概率統計等基礎學科是痛苦的,
如果直接上手使用機器學習工具往往又感到理解不足,缺少點什么。本書就是面向這一人
群,避過數學推導等復雜的理論推衍,介紹模型背后的一些簡單直觀的理解,以及如何上
手使用。本書希望能夠得到這些人的喜愛。
本書包含兩部分:機器學習篇和深度學習篇。
機器學習篇(1~3 章)主要從零開始,介紹什么是數據特征,什么是機器學習模型,
如何訓練模型、調試模型,以及如何評估模型的成績。通過一些簡單的任務例子,講解在
使用模型時如何分析并處理任務數據的特征,如何組合多個模型共同完成任務,并在第3
章初步嘗試將機器學習技術運用到股票交易中,重復熟悉這些技術的同時,感受機器學習
技術在落地到專業領域時常犯的錯誤。
深度學習篇(4~9 章)則主要介紹了一些很基礎的深度學習模型,如DNN、CNN
等,簡單涵蓋了一些RNN 的概念描述。我們更關注模型的直觀原理和背后的生物學設計
理念,希望讀者能夠帶著這些理解,直接上手應用深度學習框架。
說一點關于閱讀本書的建議。本書在編寫時不關注模型技術的數學推導及嚴謹表述,
轉而關注其背后的直觀原理理解。建議讀者以互動執行代碼的方式學習,所有示例使用
IPython Notebook 編寫。讀者可在Git 上找到對應章節的內容,一步一步運行書中講解的
知識點,直觀感受每一步的執行效果。具體代碼下載地址:https://github.com/bbfamily/abu。
本書適合有Python 編程能力的讀者。如果讀者有簡單的數學基礎,了解概率、矩陣
則更佳。使用過Numpy、pandas 等數據處理工具的讀者讀起來也會更輕松,但這些都不
是必需的。如果讀者缺乏Python 編程能力,或者希望進一步獲得Numpy、pandas 等工具

使用相關的知識,可以關注公眾號:abu_quant,獲得一些技術資料及文章。
感謝出版社提供機會讓我們編寫本書,感謝編輯不辭辛苦地和我溝通排版等細節問
題。
本書的完成同樣需要感謝我們的幾位朋友:吳汶(老虎美股)、劉兆丹(百度金融),
感謝你們在本書編寫作過程中提供的有力支持。感謝本書的試讀人員:蔡志威、李寅龍。
pagetop