3dwoo大學簡體電腦書店
基于深度學習的目標檢測原理與應用
( 簡體 字)
作者:翟中華,孫云龍,陸澍旸類別:1. -> 程式設計 -> 深度學習
   2. -> 教材 -> 數位影像處理
出版社:電子工業出版社基于深度學習的目標檢測原理與應用 3dWoo書號: 56330
詢問書籍請說出此書號!
有庫存
NT售價: 540
出版日:8/1/2023
頁數:300
光碟數:0
站長推薦:
印刷:黑白印刷語系: ( 簡體 字 )
ISBN:9787121460319 加入購物車加到我的最愛 (請先登入會員)
(簡體書上所述之下載連結耗時費功, 恕不適用在台灣, 若讀者需要請自行嘗試, 恕不保證, 繁體書的下載亦請直接連絡出版社)
第1章 計算機視覺及目標檢測 1
1.1 計算機視覺原理 1
1.1.1 人類視覺與計算機視覺比較 1
1.1.2 計算機視覺應用展現 2
1.2 目標檢測概述 9
1.2.1 計算機視覺三大主要任務 9
1.2.2 目標檢測的應用 11
1.2.3 目標檢測面臨的挑戰 12
1.2.4 目標檢測方法 13
第2章 計算機視覺數學、編程基礎 15
2.1 向量、矩陣和卷積 15
2.1.1 向量 15
2.1.2 矩陣 16
2.1.3 卷積 16
2.2 函數極值理論與非極大值抑制 18
2.2.1 函數極值理論 19
2.2.2 非極大值抑制 21
2.3 跨平臺計算機視覺和機器學習軟件庫OpenCV 基礎 24
2.3.1 OpenCV的歷史起源 24
2.3.2 安裝OpenCV 24
2.3.3 OpenCV圖像和視頻的讀/寫 24
2.3.4 OpenCV基本操作 28
2.3.5 OpenCV顏色空間轉換 29
2.3.6 OpenCV幾何變換 31
2.3.7 OpenCV圖像簡單閾值處理 34
2.3.8 OpenCV形態學轉換 40
2.3.9 OpenCV圖像梯度 43
2.4 PyTorch基礎 46
2.4.1 PyTorch簡介 46
2.4.2 PyTorch安裝 47
2.4.3 張量 47
2.4.4 基本代碼操作 49
2.4.5 PIL圖像格式轉換 51
2.4.6 PyTorch自動求導機制 52
2.4.7 PyTorch的神經網絡nn包 55
第3章 OpenCV目標檢測實戰 60
3.1 Haar特征與積分圖像構建算法 60
3.1.1 Haar特征 60
3.1.2 積分圖像構建算法 65
3.2 AdaBoost應用于Haar人臉特征分類 66
3.3 AdaBoost級聯應用于Haar特征人臉檢測 70
3.4 利用OpenCV進行基于Haar特征的人臉檢測實戰 73
第4章 深度學習引入及圖像分類實戰 75
4.1 卷積神經網絡的重要概念 75
4.2 卷積神經網絡訓練技巧及經典架構 79
4.3 設計卷積神經網絡進行圖像分類 82
4.4 選擇卷積神經網絡損失函數及優化器 85
4.5 改進卷積神經網絡以提高圖像分類準確率 88
第5章 目標檢測的兩階段深度學習方法 90
5.1 R-CNN目標檢測思想 90
5.1.1 目標檢測數據集 91
5.1.2 從滑動窗口到選擇搜索 91
5.1.3 R-CNN網絡架構及訓練過程 93
5.2 目標檢測指標——二分類器 97
5.3 R-CNN目標檢測模型評估結果 100
5.3.1 R-CNN用于細粒度類別檢測 108
5.3.2 R-CNN用于目標檢測與分割 109
5.4 R-CNN的缺陷和Fast R-CNN的改進 110
5.4.1 R-CNN的缺陷 110
5.4.2 感興趣區域池化 111
5.4.3 Fast R-CNN創新損失函數設計 113
5.5 Fast R-CNN網絡架構和模型評估 115
5.5.1 Fast R-CNN模型工作流程 115
5.5.2 Fast R-CNN網絡架構 116
5.5.3 RoI池化反向傳播方法 116
5.5.4 Fast R-CNN結果評估 117
5.6 Fast R-CNN的創新 118
5.6.1 Faster R-CNN的創新思想 118
5.6.2 替代選擇搜索的錨框 119
5.6.3 區域建議網絡 120
5.7 深入剖析Faster R-CNN中邊界框回歸 123
5.7.1 為什么使用邊界框回歸 124
5.7.2 邊界框回歸的數學支撐 125
5.8 Faster R-CNN的全景架構和損失函數 127
5.9 Faster R-CNN的訓練步驟及測試步驟 129
5.9.1 Faster R-CNN的訓練步驟 129
5.9.2 Faster R-CNN的測試步驟 131
5.10 詳細講解Faster R-CNN關鍵部分RoI代碼 132
第6章 目標檢測的一階段學習方法 134
6.1 YOLO目標檢測思想 135
6.1.1 改進思想 136
6.1.2 網格單元 137
6.1.3 YOLO創新細節 138
6.2 YOLO的網絡結構、網絡與損失函數 140
6.2.1 YOLO的網絡結構 140
6.2.2 YOLO的網絡訓練與損失函數 142
6.3 YOLO模型評估、優劣勢分析 144
6.3.1 YOLO數據集 145
6.3.2 YOLO模型評估 145
6.3.3 YOLO模型優缺點 146
6.4 YOLOv2實現更好、更快、更強 149
6.5 YOLOv2改進YOLOv1——更好 149
6.5.1 批歸一化 150
6.5.2 高分辨率分類器 150
6.5.3 預設錨框并采用全卷積 150
6.5.4 框聚類 151
6.5.5 約束邊框位置 153
6.5.6 細粒度特征 154
6.5.7 多尺度訓練 154
6.5.8 實驗對比 156
6.6 YOLOv2 使用Darknet-19——更快 158
6.6.1 Darknet-19 158
6.6.2 三階段訓練 159
6.6.3 YOLOv2的損失函數 161
6.7 使用WordTree的YOLO9000——更強 164
6.7.1 組合兩種數據集的必要性 164
6.7.2 構建WordTree進行分層分類 165
6.7.3 在組合數據集上訓練YOLO9000 167
第7章 YOLOv3創新思想及整體架構 170
7.1 YOLOv3的創新改進 170
7.2 YOLOv3的關鍵創新點 171
7.2.1 106層的Darknet-53主干網絡架構 171
7.2.2 三級檢測 176
7.2.3 更擅長檢測較小的物體 177
7.2.4 更多的錨框 177
7.2.5 損失函數 178
7.3 YOLOv3的三級檢測輸出過程 179
7.4 YOLOv3的非極大值抑制 183
7.5 YOLOv3的檢測效果 184
7.6 SSD多尺度特征圖目標檢測思想 185
7.7 SSD網絡架構 191
7.7.1 SSD網絡基礎架構 191
7.7.2 擴張卷積 192
7.7.3 SSD與YOLOv3 193
7.7.4 SSD網絡檢測物體方法 193
7.8 SSD網絡損失函數 194
7.8.1 默認框匹配策略 194
7.8.2 損失函數 195
7.9 SSD較YOLOv3的劣勢 196
第8章 構建Darknet-53網絡實踐 198
8.1 Darknet-53網絡工程結構和配置 198
8.2 實踐代碼 200
8.3 構建Darknet-53網絡前向傳遞過程 203
8.3.1 構建Darknet-53的模塊 203
8.3.2 Darknet-53的模塊詳解 205
8.4 YOLOv3 實現檢測層特征圖到邊界的預測值轉變 209
8.4.1 參數講解 209
8.4.2 實現步驟和代碼 210
8.5 YOLOv3 演示邊框生成過程 212
8.6 YOLOv3 處理低閾值邊框 214
8.6.1 思路講解 215
8.6.2 代碼實踐 215
8.7 YOLOv3 非極大值抑制過程 218
8.7.1 延續上一節代碼講解NMS過程 219
8.7.2 NMS后的整理 220
8.8 YOLOv3演示NMS過程找到最優框 220
8.8.1 運行檢測代碼演示 220
8.8.2 運行結果分析 221
8.9 YOLOv3實現工業工具檢測 224
8.9.1 YOLOv3工業實踐需求分析及目標分析 225
8.9.2 數據采集標注與數據預處理部分 226
8.9.3 模型訓練部分 230
8.9.4 模型優化部分 239
第9章 YOLOv4目標檢測方法 240
9.1 YOLOv4目標檢測創新路徑及技巧體系 240
9.1.1 速度與精度雙提升 240
9.1.2 YOLOv4技巧匯總 240
9.2 YOLOv4大型網絡架構及其主要創新改進 246
9.2.1 空間金字塔結構 246
9.2.2 路徑增強網絡 247
9.2.3 使用YOLOv4的網絡詳情 248
9.2.4 CSPDarknet-53網絡 254
9.2.5 YOLOv4網絡全景關系 255
9.3 YOLOv4中的激活函數 256
9.3.1 各激活函數的比較 256
9.3.2 keras實現三種激活函數性能比較 260
9.4 YOLOv4中的損失函數C-IoU 263
9.4.1 L1和L2損失的缺陷 264
9.4.2 IoU和IoU損失 264
9.4.3 G-IoU、D-IoU和C-IoU 265
9.5 YOLOv4中的新型批標準化 268
9.5.1 各種批標準化 268
9.5.2 跨迭代標準化 270
第10章 EfficientDet目標檢測方法 272
10.1 復合縮放 272
10.2 雙向特征金字塔網絡 274
10.3 EfficientDet體系結構 276
10.3.1 輸入圖像分辨率縮放 276
10.3.2 BiFPN縮放 277
10.3.3 框/類預測網絡縮放 277
10.3.4 主干網 277
10.4 EfficientDet推理效果和不足之處 279
10.4.1 EfficientDet推理效果 279
10.4.2 EfficientDet不足之處 282
參考文獻 284
本書遵循循序漸進、深入淺出的理念,引領讀者夯實相關基礎知識,掌握傳統目標檢測方法,再逐步過渡到深度學習的基本概念及分類用法,進而深入講解目標檢測的兩階段深度學習方法、一階段學習方法,即從以R-CNN為代表的兩階段深度學習方法、以YOLO系列為代表的一階段學習方法等,層層揭開深度學習用于目標檢測的“神秘面紗”,探究其中的奧秘。本書適合目標檢測領域的工程師、研究員閱讀,也可作為深度學習相關專業本科生、研究生的重要參考書,還可作為互聯網行業IT技術人員轉型學習人工智能的參考用書。
計算機視覺是當今學術界和行業中發展最快的AI(Artificial Intelligence,人工智能)學科之一,其起源是美國麻省理工學院(MIT)一位本科生的暑期 項目。
為了讓讀者對于計算機視覺有一個感性的認知,先列舉幾個例子以供參考。機器人如何在太空中導航和執行任務?搜索引擎如何為數十億幅圖像和視頻建立索引?如何根據醫學圖像診斷疾病?自動駕駛汽車如何準確地看清道路?圖像分享App如何創建濾鏡和遮罩?通過上述計算視覺的現實應用場景,不難發現計算機視覺的應用之廣。本書重點——目標檢測在計算機視覺中占據重要地位,如果將計算機視覺比作一個“皇冠”,那么,目標檢測就是皇冠上一顆耀眼的“明珠”。
本書將帶領讀者深入了解目標檢測的深度學習方法,并培養讀者的實踐能力,構建起理解和重建復雜視覺的計算機視覺技術。
眾所周知,AI領域學習曲線較為陡峭。其中,計算機視覺更是在深度學習的推動下,擁有范圍廣、更新快的特點,因此,一些人會產生畏難情緒。基于此,本書為讀者研發優良的學習方法,使讀者既能在嚴謹而又易懂的理論中夯實基礎,又能在有趣的實踐中學習,感受各種目標檢測實踐項目帶來的視覺沖擊,讓讀者在學習計算機視覺的目標檢測部分時事半功倍,更加輕松。
(1)抽絲剝繭、以簡馭繁。
深度學習和計算機視覺目標檢測涉及諸多概念、思維、原理和方法,本書秉承抽絲剝繭的原則,層層剖析復雜原理,達到以簡馭繁的效果。
(2)深入淺出、高度總結。
深度學習、目標檢測理論知識點較多,知識體系龐大。本書秉承深入淺出的理念,對于復雜的知識點提綱挈領、高度總結,使讀者學習起來輕松有趣、張弛有度。
(3)邏輯緊密、環環相扣。
本書始終堅持邏輯緊密的講解理念,知識模塊間環環相扣,讓讀者深入理解計算機視覺這張知識大網的縱橫連接關系,達到學習體系化、系統化的目的。
pagetop