深度學習實踐:計算機視覺 ( 簡體 字) |
作者:繆鵬 | 類別:1. -> 程式設計 -> 深度學習 2. -> 教材 -> 數位影像處理 |
譯者: |
出版社:清華大學出版社 | 3dWoo書號: 50631 詢問書籍請說出此書號!【有庫存】 NT售價: 395 元 |
出版日:2/1/2019 |
頁數:250 |
光碟數:0 |
|
站長推薦: |
印刷:黑白印刷 | 語系: ( 簡體 版 ) |
|
加入購物車 │加到我的最愛 (請先登入會員) |
ISBN:9787302517900 |
作者序 | 譯者序 | 前言 | 內容簡介 | 目錄 | 序 |
(簡體書上所述之下載連結耗時費功, 恕不適用在台灣, 若讀者需要請自行嘗試, 恕不保證) |
作者序: |
譯者序: |
前言:目前人工智能領域越來越受到公眾的關注,因此人工智能算法工程師也漸漸浮出水面,成為招聘網站上一個非常耀眼的崗位,各類創業投資也緊緊圍繞著AI主題旋轉。 我認為目前人工智能算法工程師主要分為兩類。 科學家型:主要研究前沿算法,在各大高校和企業的研究院居多。 工程師型:主要將最新的算法應用到具體的業務場景,在企業開發部門居多,為本書主要針對對象。 人工智能算法按特征學習的深淺分為機器學習、深度學習,另外也有強化學習方向。按應用場景則可分為:計算機視覺、自然語言和語音處理等。 編寫本書主要基于以下事實,筆者在學習機器學習和深度學習的過程中,發現理論方面的書籍十分豐富,包括周志華老師的《機器學習》與Ian Goodfellow的《深度學習》;教學視頻也十分豐富,包括斯坦福大學吳恩達教授的CS229與李飛飛教授的CS231,以及臺灣大學(National Taiwan University)林軒田老師和李宏毅老師的課程。但是很少有關于一個方向(比如計算機視覺)比較豐富的工程應用書籍,包括當前主流框架的綜合介紹,筆者當時從理論到實踐走了不少彎路,也踩過不少坑,故希望本書能在這個方面做出一點小小的貢獻,成為理論與實踐的橋梁,讓讀者相對容易地邁出由0到1的那一步。 本書主要關注計算機視覺領域,基于開源項目介紹最新的算法,在此也感謝各位開源人士,借助他們的成果,我們學習到了很多知識,本書各章主要內容如下: 第1章對深度學習與計算機視覺進行簡要介紹,也會簡單介紹開發環境的搭建。 第2章主要介紹OpenCV的基本操作及部分高級操作,包括人臉和人眼的檢測與識別。 第3章著重介紹目前常用的幾類深度學習框架,包括PyTorch、Chainer、TensorFlow-Keras和MXNet-Gluon,另外本書中偶爾還會用到ChainerCV和GluonCV。 第4章對圖像分類進行了介紹,包括經典的網絡類型(VGG、ResNet、Inception、Xception、DenseNet),并展示了部分實踐操作。 第5章對目標檢測與識別進行了介紹,包括三種主流的網絡結構:YOLO、SSD、Faster R-CNN,并展示了實踐操作。 第6章介紹圖像分割技術,主要從前背景分割(Grab Cut)、語義分割(DeepLab與PSPNet)和實例分割(FCIS、Mask R-CNN、MaskLab、PANet)三個粒度闡述。 第7章介紹圖像搜索技術,主要指以圖搜圖方面(CBIR),以及對應的實踐展示。 第8章主要介紹圖像生成技術,包括三個大方向:Auto-Encoder、GAN和Neural Style Transfer。 計算機視覺是一個非常大的方向,涉及的內容非常多,本書只涉及了其中部分領域,未涉及OCR、目標追蹤、三維重建和光場等方面的內容。 本書面向的主要是已經擁有機器學習和深度學習基礎,但在計算機視覺領域實踐較少,對各個方向了解較少的讀者,其他感興趣的讀者也可作為科普讀物。希望本書能為計算機視覺感興趣的讀者打開一扇窗戶,引領大家邁出從理論到實踐的關鍵一步。另外由于筆者學識、經驗和能力水平所限,書中難免有錯誤或誤解的地方,歡迎廣大讀者批評指正。 閱讀本書需要的知識儲備包括以下幾種: 線性代數 概率論 統計學 高等數學,主要指函數方面 機器學習 深度學習 Python編程技術(特別需要熟悉Numpy庫) Linux基礎知識(可選項) 如果在學習過程中遇到任何問題或不太理解的概念,那么最好的方式是通過網絡尋找答案,請相信我們所遇到的問題,有很大一部分是大家都會遇到的問題,網上說不定已經有了詳細地討論,這時只需要去發現即可;如果沒有找到對應的解決方法,那么在對應的社區提問也是很好的一種方式。 希望讀者在閱讀本書時,謹記計算機是負責資源調度的,永遠會有時間資源和空間資源的平衡問題。GPU的使用就是并行利用空間換取時間,而IO密集型與計算密集型則是另外兩個常常遇到的問題。在做深度學習方面的實踐時,這些問題都應該考慮到位,特別是面臨海量數據的時候,比如上億級別的圖像搜索業務。這些知識在計算機操作系統的書籍當中有非常詳細的論述,如果讀者希望在計算機領域有長足的發展,那么這是一本最基本最重要的書籍,建議好好學習。 對于本書的完成,要特別感謝王金柱編輯給予的幫助和指導,感謝體貼的妻子體諒筆者分出部分時間來撰寫此書。
繆 鵬 2018年7月1日 |
內容簡介:本書主要介紹了深度學習在計算機視覺方面的應用及工程實踐,以Python 3為開發語言,并結合當前主流的深度學習框架進行實例展示。主要內容包括:OpenCV入門、深度學習框架介紹、圖像分類、目標檢測與識別、圖像分割、圖像搜索以及圖像生成等,涉及到的深度學習框架包括PyTorch、TensorFlow、Keras、Chainer、MXNet等。通過本書,讀者能夠了解深度學習在計算機視覺各個方向的應用以及最新進展。 本書的特點是依托工業環境的實踐經驗,具備較強的實用性和專業性。適合于廣大計算機視覺工程領域的從業者、深度學習愛好者、相關專業的大學生和研究生以及對計算機視覺感興趣的愛好者 使用。 |
目錄:第1章深度學習與計算機視覺1 1.1圖像基礎3 1.2深度學習與神經網絡基礎4 1.2.1函數的簡單表達5 1.2.2函數的矩陣表達5 1.2.3神經網絡的線性變換6 1.2.4神經網絡的非線性變換6 1.2.5深層神經網絡6 1.2.6神經網絡的學習過程8 1.3卷積神經網絡CNN9 1.4基礎開發環境搭建14 1.5本章總結15 第2章OpenCV入門16 2.1讀圖、展示和保存新圖17 2.2像素點及局部圖像18 2.3基本線條操作19 2.4平移20 2.5旋轉20 2.6縮放21 2.6.1鄰近插值22 2.6.2雙線性插值22 2.7翻轉23 2.8裁剪23 2.9算術操作23 2.10位操作24 2.11Masking操作25 2.12色彩通道分離與融合26 2.13顏色空間轉換27 2.14顏色直方圖28 2.15平滑與模糊29 2.16邊緣檢測31 2.17人臉和眼睛檢測示例32 2.18本章總結35 第3章常見深度學習框架36 3.1PyTorch38 3.1.1Tensor39 3.1.2Autograd42 3.1.3Torch.nn43 3.2Chainer45 3.2.1Variable46 3.2.2Link與Function47 3.2.3Chain50 3.2.4optimizers51 3.2.5損失函數51 3.2.6GPU的使用52 3.2.7模型的保存與加載54 3.2.8FashionMnist圖像分類示例54 3.2.9Trainer59 3.3TensorFlow與Keras66 3.3.1TensorFlow66 3.3.2Keras67 3.4MXNet與Gluon73 3.4.1MXNet73 3.4.2Gluon74 3.4.3GluonSequential74 3.4.4GluonBlock75 3.4.5使用GPU76 3.4.6GluonHybrid77 3.4.7LazyEvaluation79 3.4.8Module80 3.5其他框架81 3.6本章總結81 第4章圖像分類82 4.1VGG84 4.1.1VGG介紹84 4.1.2MXNet版VGG使用示例85 4.2ResNet89 4.2.1ResNet介紹89 4.2.2Chainer版ResNet示例90 4.3Inception95 4.3.1Inception介紹95 4.3.2Keras版InceptionV3川菜分類97 4.4Xception116 4.4.1Xception簡述116 4.4.2Keras版本Xception使用示例116 4.5DenseNet122 4.5.1DenseNet介紹122 4.5.2PyTorch版DenseNet使用示例122 4.6本章總結126 第5章目標檢測與識別128 5.1FasterRCNN129 5.1.1FasterRCNN介紹129 5.1.2ChainerCV版FasterRCNN示例131 5.2SSD139 5.2.1SSD介紹139 5.2.2SSD示例140 5.3YOLO148 5.3.1YOLOV1、V2和V3介紹148 5.3.2Keras版本YOLOV3示例150 5.4本章總結157 第6章圖像分割158 6.1物體分割159 6.2語義分割164 6.2.1FCN與SegNet166 6.2.2PSPNet171 6.2.3DeepLab172 6.3實例分割176 6.3.1FCIS177 6.3.2MaskR-CNN178 6.3.3MaskLab180 6.3.4PANet181 6.4本章總結181 第7章圖像搜索183 7.1SiameseNetwork185 7.2TripletNetwork186 7.3MarginBasedNetwork188 7.4Keras版TripletNetwork示例190 7.4.1準備數據190 7.4.2訓練文件191 7.4.3采樣文件195 7.4.4模型訓練202 7.4.5模型測試206 7.4.5結果可視化210 7.5本章小結216 第8章圖像生成218 8.1VAE219 8.1.1VAE介紹219 8.1.2Chainer版本VAE示例220 8.2生成對抗網絡GAN221 8.2.1GAN介紹221 8.2.2ChainerDCGANRPG游戲角色生成示例229 8.3NeuralStyleTransfer238 8.3.1NeuralStyleTransfer介紹238 8.3.2MXNet多風格轉換MSG-Net示例241 8.4本章總結246 后記247 |
序: |