|
-- 會員 / 註冊 --
|
|
|
|
計算機視覺之深度學習:使用TensorFlow和Keras訓練高級神經網絡 ( 簡體 字) |
作者:[英]拉賈林加帕·尚穆加馬尼 | 類別:1. -> 教材 -> 數位影像處理 2. -> 程式設計 -> 深度學習 |
譯者: |
出版社:人民郵電出版社 | 3dWoo書號: 52488 詢問書籍請說出此書號!【缺書】 NT售價: 295 元 |
出版日:1/1/2020 |
頁數:201 |
光碟數:0 |
|
站長推薦: |
印刷:黑白印刷 | 語系: ( 簡體 版 ) |
|
加入購物車 │加到我的最愛 (請先登入會員) |
ISBN:9787115531582 |
作者序 | 譯者序 | 前言 | 內容簡介 | 目錄 | 序 |
(簡體書上所述之下載連結耗時費功, 恕不適用在台灣, 若讀者需要請自行嘗試, 恕不保證) |
作者序: |
譯者序: |
前言: |
內容簡介:本書開門見山,直接幫助你準備好訓練高效深度學習模型的環境,以完成各種計算機視覺任務。書中介紹了常見的深度學習架構,如卷積神經網絡和遞歸神經網絡;講述了如何利用深度學習進行圖像分類、圖像檢索、目標檢測、語義分割等內容。讀完本書,你將能夠開發和訓練自己的深度學習模型,并用它們解決計算機視覺難題。 |
目錄:第 1 章 入門 1 1.1 理解深度學習 1 1.1.1 感知機 1 1.1.2 激活函數 2 1.1.3 人工神經網絡 4 1.1.4 訓練神經網絡 7 1.1.5 嘗試TensorFlow游樂場 8 1.1.6 卷積神經網絡 8 1.1.7 循環神經網絡 10 1.1.8 長短期記憶網絡 11 1.2 計算機視覺深度學習 12 1.2.1 分類 12 1.2.2 檢測或定位與分割 12 1.2.3 相似性學習 13 1.2.4 圖像題注 13 1.2.5 生成模型 14 1.2.6 視頻分析 15 1.3 建立開發環境 15 1.3.1 硬件和操作系統 15 1.3.2 安裝軟件包 17 1.4 小結 23 第 2 章 圖像分類 24 2.1 在TensorFlow中訓練MNIST模型 24 2.1.1 MNIST數據集 24 2.1.2 加載MNIST數據 25 2.1.3 建立一個感知機 25 2.1.4 構建多層卷積網絡 28 2.2 在Keras中訓練MNIST模型 35 2.2.1 準備數據集 35 2.2.2 構建模型 36 2.3 其他流行的圖像測試數據集 38 2.3.1 CIFAR數據集 38 2.3.2 Fashion-MNIST數據集 38 2.3.3 ImageNet數據集和競賽 39 2.4 更大的深度學習模型 40 2.4.1 AlexNet模型 40 2.4.2 VGG-16模型 41 2.4.3 谷歌Inception-V3模型 42 2.4.4 微軟ResNet-50模型 45 2.4.5 SqueezeNet模型 45 2.4.6 空間變換網絡模型 46 2.4.7 DenseNet模型 47 2.5 訓練貓與狗的模型 47 2.5.1 準備數據 48 2.5.2 使用簡單CNN進行基準測試 48 2.5.3 增強數據集 49 2.5.4 遷移學習或微調模型 50 2.5.5 在深度學習中微調一些層 51 2.6 開發現實世界的應用 53 2.6.1 選擇正確的模型 53 2.6.2 處理欠擬合和過擬合場景 53 2.6.3 從面部檢測性別和年齡 54 2.6.4 微調服裝模型 54 2.6.5 品牌安全 54 2.7 小結 54 第 3 章 圖像檢索 55 3.1 理解視覺特征 55 3.1.1 深度學習模型的可視化激活 56 3.1.2 嵌入可視化 57 3.1.3 DeepDream 60 3.1.4 對抗樣本 64 3.2 模型推斷 65 3.2.1 導出模型 65 3.2.2 提供訓練好的模型 66 3.3 基于內容的圖像檢索 68 3.3.1 構建檢索流水線 68 3.3.2 有效的檢索 71 3.3.3 使用自編碼器去噪 74 3.4 小結 77 第 4 章 目標檢測 78 4.1 檢測圖像中的目標 78 4.2 探索數據集 79 4.2.1 ImageNet數據集 79 4.2.2 PASCAL VOC挑戰 79 4.2.3 COCO目標檢測挑戰 79 4.2.4 使用指標評估數據集 80 4.3 目標定位算法 81 4.3.1 使用滑動窗口定位目標 82 4.3.2 將定位看作回歸問題 83 4.4 檢測目標 86 4.4.1 R-CNN(區域卷積神經網絡) 86 4.4.2 Fast R-CNN 86 4.4.3 Faster R-CNN 87 4.4.4 SSD(單射多框探測器) 88 4.5 目標檢測API 88 4.5.1 安裝和設置 88 4.5.2 預訓練模型 89 4.5.3 重新訓練目標檢測模型 90 4.5.4 為自動駕駛汽車訓練行人檢測 92 4.6 YOLO目標檢測算法 92 4.7 小結 94 第 5 章 語義分割 95 5.1 預測像素 95 5.1.1 診斷醫學圖像 97 5.1.2 通過衛星圖像了解地球 97 5.1.3 提供機器人視覺 98 5.2 數據集 98 5.3 語義分割算法 98 5.3.1 全卷積網絡 98 5.3.2 SegNet架構 99 5.3.3 膨脹卷積 103 5.3.4 DeepLab 104 5.3.5 RefiNet 105 5.3.6 PSPnet 106 5.3.7 大卷積核的重要性 106 5.3.8 DeepLab v3 107 5.4 超神經分割 107 5.5 分割衛星圖像 111 5.6 分割實例 113 5.7 小結 114 第 6 章 相似性學習 115 6.1 相似性學習算法 115 6.1.1 孿生網絡 115 6.1.2 FaceNet模型 118 6.1.3 DeepNet模型 120 6.1.4 DeepRank模型 120 6.1.5 視覺推薦系統 121 6.2 人臉分析 122 6.2.1 人臉檢測 122 6.2.2 人臉特征點和屬性 123 6.2.3 人臉識別 126 6.2.4 人臉聚類 130 6.3 小結 131 第 7 章 圖像題注 132 7.1 了解問題和數據集 132 7.2 理解圖像題注的自然語言處理 132 7.2.1 用向量形式表達詞 133 7.2.2 將詞轉換為向量 133 7.2.3 訓練一個嵌入 134 7.3 圖像題注和相關問題的方法 135 7.3.1 使用條件隨機場來鏈接圖像和文本 136 7.3.2 在CNN 特征上使用RNN生成題注 136 7.3.3 使用圖像排序創建題注 138 7.3.4 從圖像檢索題注與從題注檢索圖像 139 7.3.5 密集題注 140 7.3.6 使用RNN生成題注 141 7.3.7 使用多模態度量空間 142 7.3.8 使用注意網絡生成題注 143 7.3.9 知道什么時候查看 143 7.4 實現基于注意力的圖像題注 145 7.5 小結 147 第 8 章 生成模型 148 8.1 生成模型的應用 148 8.1.1 藝術風格遷移 148 8.1.2 預測視頻中的下一幀 149 8.1.3 圖像的超分辨率 150 8.1.4 交互式圖像生成 151 8.1.5 圖像到圖像的翻譯 151 8.1.6 文本到圖像的生成 152 8.1.7 圖像修復 153 8.1.8 圖像混合 153 8.1.9 轉換屬性 154 8.1.10 創建訓練數據 154 8.1.11 創建新的動畫角色 155 8.1.12 照片3D模型 155 8.2 神經藝術風格遷移 156 8.2.1 內容損失 156 8.2.2 使用Gram矩陣的風格損失 160 8.2.3 風格遷移 162 8.3 生成對抗網絡 165 8.3.1 vanilla GAN 165 8.3.2 條件GAN 167 8.3.3 對抗損失 167 8.3.4 圖像翻譯 168 8.3.5 InfoGAN 168 8.3.6 GAN的缺點 169 8.4 視覺對話模型 169 8.5 小結 171 第 9 章 視頻分類 172 9.1 了解視頻和視頻分類 172 9.1.1 探索視頻分類數據集 172 9.1.2 將視頻分割成幀 175 9.1.3 視頻分類方法 175 9.2 將基于圖像的方法擴展到視頻 184 9.2.1 人體姿態回歸 184 9.2.2 視頻分割 185 9.2.3 視頻題注 186 9.2.4 視頻生成 188 9.3 小結 188 第 10 章 部署 189 10.1 模型的性能 189 10.1.1 量化模型 189 10.1.2 MobileNets 190 10.2 云部署 193 10.2.1 AWS 193 10.2.2 Google云平臺 197 10.3 在設備中部署模型 200 10.3.1 Jetson TX2 200 10.3.2 Android 201 10.3.3 iPhone 201 10.4 小結 202 |
序: |
|