MATLAB計算機視覺與深度學習實戰(第2版) ( 簡體 字) |
作者:劉衍琦,王小超,詹福宇 | 類別:1. -> 工程繪圖與工程計算 -> Matlab |
譯者: |
出版社:電子工業出版社 | 3dWoo書號: 56377 詢問書籍請說出此書號!【有庫存】 NT售價: 640 元 |
出版日:5/1/2024 |
頁數:400 |
光碟數:0 |
|
站長推薦: |
印刷:黑白印刷 | 語系: ( 簡體 版 ) |
|
加入購物車 │加到我的最愛 (請先登入會員) |
ISBN:9787121475733 |
作者序 | 譯者序 | 前言 | 內容簡介 | 目錄 | 序 |
(簡體書上所述之下載連結耗時費功, 恕不適用在台灣, 若讀者需要請自行嘗試, 恕不保證) |
作者序: |
譯者序: |
前言:計算機視覺(Computer Vision,CV)主要研究如何用圖像采集設備和計算機軟件代替人眼對物體進行分類識別、目標跟蹤和視覺分析等。深度學習源自經典的神經網絡架構,屬于機器學習領域,它通過不同形式的神經網絡,結合視覺大數據(擁有大規模存量并不斷產生增量)進行訓練,自動提取細顆粒度的特征并結合粗顆粒度的特征,形成抽象化的視覺描述,在視覺分析方面取得了很大的進步,是當前人工智能爆發式發展的內核驅動。隨著大數據及人工智能技術的不斷發展,計算機視覺以其可視性、規模性、普適性逐步成為AI應用落地的關鍵領域之一,在理論研究和工程應用上均發展迅猛。
MATLAB是MathWorks公司推出的一款應用于科學計算和工程仿真的交互式編程軟件,近幾年已經發展成為集圖像處理、數值分析、數學建模、仿真控制、信號處理等工具箱為一體的科學應用軟件,并且成為世界上應用最廣泛的科學計算軟件之一。數字圖像處理技術涉及計算機科學、模式識別、人工智能、生物工程等學科,是一種綜合性的技術。
自從電子計算機誕生以來,通過計算機仿真來模擬人類視覺便成為一個非常熱門且頗具挑戰性的研究領域。隨著數碼相機、智能手機等硬件設備的普及,圖像以其易于采集、信息相關性多、抗干擾能力強的特點得到了越來越廣泛的應用。當前,人類社會已經進入了信息化和數字化時代,隨著國家對人工智能領域的重視,計算機視覺人才的需求量越來越大,應用也越來越廣泛。
計算機視覺處理工具箱可為用戶提供諸如圖像變換、圖像增強、圖像特征檢測、圖像復原、圖像分割、圖像去噪、圖像配準、視頻處理、深度學習等的技術支撐。同時,借助MATLAB方便的編程及調試技巧,用戶可根據需要進一步拓展計算機視覺處理工具箱,滿足定制化的業務需求。
本書目的
本書以案例的形式展現,力求為讀者提供更便捷、直接的技術支持,解決讀者在研發過程中遇到的實際技術難點,并力求全面講解廣大讀者在研發過程中所涉及的功能模塊及成熟的系統框架,為讀者進行科學實驗、項目開發提供一定的技術支持。
通過對書中案例程序的閱讀、理解和仿真運行,讀者可以有針對性地進行算法調試,這樣可以更加深刻地理解計算機視覺與深度學習應用的含義,并且更加熟練地使用MATLAB進行算法設計與工程研發。
本書特點
作者陣容強大,經驗相當豐富 本書主編之一劉衍琦,是機器學習算法專家及視覺AI課程講師,擅長視覺AI分析、大數據分析挖掘等工程應用,并長期從事工程研發相關工作,涉及互聯網海量圖像、聲紋、視頻檢索,以及OCR圖文檢索、手繪草圖智能識別、AI小目標檢測等應用的算法架構與研發,對圖文識別、大規模以圖搜圖、數據感知和采集等進行過深入研究,并結合行業背景推動了一系列的工程化應用。
在本書其他主編中,王小超在3D視覺分析、圖像水印、工業視覺測量應用、圖像智能識別方面積累了豐富的項目實戰經驗;詹福宇擅長模型設計與分析,在計算機視覺處理方面積累了豐富的工程經驗。
案例豐富、實用、拓展性強 本書以案例的形式進行編寫,充分強調案例的實用性及程序的可拓展性,所選案例均來自作者的日常研究及業務需求,每個案例都與實際課題相結合。另外,書中的每個案例程序都經過調試,作者為此編寫了大量的測試代碼。
點面完美結合,兼顧不同需求的讀者 本書點面兼顧,涵蓋了數字圖像處理中幾乎所有的基本模塊,并涉及視頻處理、配準拼接、數字水印、生物識別等高級圖像處理方面的內容,全面講解了基于MATLAB進行計算機視覺及深度學習應用的原理及方法。
特別致謝
劉衍琦、王小超、詹福宇是本書的主編,于召虎、李雪梅、楊昌玉是本書的副主編。本書的編寫得到了電子工業出版社博文視點編輯張國霞的大力支持,在此對她表示衷心的感謝。在本書案例實驗的設計及研發過程中,參考了MATLAB中文論壇上大量的MATLAB幫助文檔、MATLAB圖書及其他相關資源,也得到了廣大會員的支持,在此感謝他們的信任與鼓勵。
感謝各位讀者朋友給予我的啟發和幫助,感謝家人的默默支持!感謝女兒劉沛萌每天帶給我歡樂,她給予我無限的動力進行計算機視覺及人工智能的探索及應用,也祝全天下的小朋友們都能健康快樂地成長!
由于時間倉促,加之作者水平和經驗有限,書中難免存在疏漏及錯誤之處,希望廣大讀者批評指正。
為了更好地為本書讀者服務,我們為本書提供了讀者交流群及配套代碼、課件、實驗素材、操作演示視頻等資源,具體的資源獲取方式請參考本書封底處的“讀者服務”。
劉衍琦
2024年3月 |
內容簡介:本書詳細講解了29個實用的MATLAB計算機視覺與深度學習實戰案例(含可運行程序),涉及圖像去霧、答題卡識別、圖像分割、肝臟影像輔助分割系統、人臉二維碼編解碼系統、英文印刷體字符識別、圖像融合、全景圖像拼接、圖像壓縮和重建、視頻處理工具、運動目標檢測、路面裂縫檢測識別系統、車流量計數、三維網格模型特征點提取、數字水印、圖像水印、輔助自動駕駛、汽車目標檢測、手寫數字識別、以圖搜圖、驗證碼識別、圖像生成、影像識別、物體識別、圖像校正、時間序列分析、交通目標檢測、智能問答等,還講解了深度神經網絡的拆分、編輯、重構等多項重要技術及應用,涵蓋了數字圖像處理中幾乎所有的基本模塊,并延伸到了深度學習的理論及應用方面。工欲善其事,必先利其器。本書對每個數字圖像處理的知識點都提供了豐富、生動的案例素材,并以MATLAB為工具詳細講解了實驗的核心程序,涉及DeepLearning Toolbox、TensorFlow、Keras、Java等。通過對這些程序的閱讀、理解和仿真運行,讀者可以更加深刻地理解圖像處理的相關知識,并且更加熟練地掌握計算機視覺及深度學習在不同領域中的應用。本書以案例為基礎,結構緊湊,內容深入淺出,實驗簡單高效,適合高等院校計算機、通信和自動化等相關專業的教師、本科生、研究生,以及計算機視覺工程人員閱讀和參考。 |
目錄:第1章 基于圖像增強方法的圖像去霧技術 1
1.1 案例背景 1
1.2 空域圖像增強 1
1.3 直方圖均衡化 2
1.4 程序實現 4
1.4.1 設計GUI 4
1.4.2 全局直方圖均衡化處理 5
1.4.3 限制對比度的自適應直方圖均衡化處理 6
1.4.4 Retinex增強處理 8
1.4.5 方法評測 10
第2章 基于Hough變換的答題卡識別 15
2.1 案例背景 15
2.2 圖像二值化 15
2.3 傾斜校正 16
2.4 圖像分割 19
2.5 程序實現 21
2.5.1 圖像灰度化 21
2.5.2 灰度圖像二值化 21
2.5.3 圖像平滑濾波 21
2.5.4 圖像校正 22
2.5.5 完整性核查 22
第3章 基于聚類算法的圖像分割 32
3.1 案例背景 32
3.2 K-means聚類算法的原理 32
3.3 K-means聚類算法的特點 33
3.4 K-means聚類算法的缺點 34
3.5 基于K-means聚類算法進行圖像分割 34
3.6 程序實現 35
3.6.1 數據樣本間的距離 35
3.6.2 提取特征向量 36
3.6.3 圖像聚類分割 36
第4章 基于區域生長的肝臟影像輔助分割系統 40
4.1 案例背景 40
4.2 閾值分割算法 40
4.3 區域生長算法 41
4.4 基于閾值預分割的區域生長算法 42
4.5 程序實現 42
第5章 基于主成分分析的人臉二維碼編解碼系統 46
5.1 案例背景 46
5.2 QR編碼簡介 46
5.2.1 QR編碼的符號結構 46
5.2.2 QR編碼的基本特性 47
5.2.3 QR編碼的流程 48
5.2.4 QR譯碼的流程 49
5.3 主成分分析 49
5.4 程序實現 50
5.4.1 人臉建庫 50
5.4.2 人臉識別 51
5.4.3 人臉二維碼 52
第6章 基于特征匹配的英文印刷體字符識別 58
6.1 案例背景 58
6.2 圖像預處理 58
6.3 圖像識別技術 59
6.4 程序實現 61
6.4.1 設計GUI 61
6.4.2 回調識別 65
第7章 基于小波變換的圖像融合 67
7.1 案例背景 67
7.2 小波變換 68
7.3 程序實現 70
7.3.1 設計GUI 70
7.3.2 圖像載入 70
7.3.3 小波融合 72
第8章 基于塊匹配的全景圖像拼接 75
8.1 案例背景 75
8.2 圖像拼接 75
8.3 圖像匹配 76
8.4 圖像融合 78
8.5 程序實現 78
8.5.1 設計GUI 78
8.5.2 載入圖像 79
8.5.3 圖像匹配 81
8.5.4 圖像拼接 84
第9章 基于主成分分析的圖像壓縮和重建 90
9.1 案例背景 90
9.2 主成分分析降維的原理 90
9.3 由得分矩陣重建樣本 91
9.4 主成分分析數據壓縮比 92
9.5 基于主成分分析的圖像壓縮 92
9.6 程序實現 92
9.6.1 主成分分析的代碼實現 92
9.6.2 圖像與樣本間的轉換 93
9.6.3 基于主成分分析的圖像壓縮 94
第10章 基于小波變換的圖像壓縮 98
10.1 案例背景 98
10.2 圖像壓縮基礎 98
10.3 程序實現 99
第11章 基于GUI搭建通用的視頻處理工具 107
11.1 案例背景 107
11.2 視頻解析 107
11.3 程序實現 108
11.3.1 設計GUI 108
11.3.2 實現GUI 110
第12章 基于幀間差分法進行運動目標檢測 120
12.1 案例背景 120
12.2 幀間差分法 120
12.3 背景差分法 121
12.4 光流法 122
12.5 程序實現 123
第13章 路面裂縫檢測識別系統設計 132
13.1 案例背景 132
13.2 圖像灰度化 132
13.3 圖像濾波 134
13.4 圖像增強 136
13.5 圖像二值化 137
13.6 程序實現 139
第14章 基于光流場的車流量計數 151
14.1 案例背景 151
14.2 光流法檢測運動物體的基本原理 151
14.3 光流場的計算方法 152
14.4 梯度光流場約束方程 153
14.5 Horn-Schunck算法 155
14.6 程序實現 156
14.6.1 計算視覺系統工具箱簡介 156
14.6.2 基于光流場檢測汽車運動 157
第15章 基于鄰域支持的三維網格模型特征點提取 164
15.1 案例背景 164
15.2 網格特征提取 164
15.2.1 鄰域支持 165
15.2.2 網格特征點提取 166
15.3 程序實現 170
第16章 基于小波變換的數字水印技術 174
16.1 案例背景 174
16.2 數字水印技術原理 175
16.3 典型的數字水印算法 177
16.4 數字水印攻擊和評價 179
16.5 基于小波變換的水印技術 180
16.6 程序實現 182
16.6.1 準備宿主圖像和水印圖像 182
16.6.2 小波數字水印的嵌入 183
16.6.3 小波數字水印的檢測和提取 187
16.6.4 小波數字水印的攻擊實驗 189
第17章 基于BEMD與Hilbert曲線的圖像水印技術 193
17.1 案例背景 193
17.2 BEMD與Hilbert曲線 193
17.2.1 相關工作 194
17.2.2 案例算法 196
17.3 程序實現 200
17.3.1 實驗結果與分析 200
17.3.2 核心程序 203
第18章 基于計算機視覺的輔助自動駕駛 209
18.1 案例背景 209
18.2 環境感知 210
18.3 行為決策 210
18.4 路徑規劃 211
18.5 運動控制 211
18.6 程序實現 211
18.6.1 傳感器數據載入 211
18.6.2 創建追蹤器 213
18.6.3 碰撞預警 215
第19章 基于深度學習的汽車目標檢測 220
19.1 案例背景 220
19.2 基本架構 220
19.3 卷積層 221
19.4 池化層 223
19.5 程序實現 223
19.5.1 加載數據 223
19.5.2 構建CNN 224
19.5.3 訓練CNN 226
19.5.4 評估訓練效果 227
第20章 基于深度學習的手寫數字識別 230
20.1 案例背景 230
20.2 卷積核 230
20.3 特征圖 232
20.4 池化降維 233
20.5 模型定義 234
20.6 MATLAB實現 244
20.6.1 解析數據集 244
20.6.2 構建網絡模型 247
20.6.3 構建識別平臺 250
20.7 Python實現 253
20.7.1 數據拆分 253
20.7.2 訓練網絡 254
20.7.3 網絡測試 257
20.7.4 集成應用 257
第21章 基于深度學習的以圖搜圖 260
21.1 案例背景 260
21.2 選擇模型 260
21.2.1 AlexNet 261
21.2.2 VGGNet 263
21.2.3 GoogLeNet 264
21.3 深度特征 266
21.4 程序實現 269
21.4.1 構建深度索引 269
21.4.2 構建搜索引擎 272
21.4.3 構建搜索平臺 275
第22章 基于深度學習的驗證碼識別 278
22.1 案例背景 278
22.2 生成驗證碼數據 278
22.3 驗證碼CNN識別 286
22.4 程序實現 289
22.4.1 驗證碼樣本數據集標注 289
22.4.2 驗證碼樣本數據集分割 291
22.4.3 訓練驗證碼識別模型 292
22.4.4 測試驗證碼識別模型 294
第23章 基于生成對抗網絡的圖像生成 297
23.1 案例背景 297
23.2 選擇生成對抗數據 297
23.3 設計生成對抗網絡 298
23.4 程序實現 304
23.4.1 訓練生成對抗模型 304
23.4.2 測試生成對抗模型 307
23.4.3 構建生成對抗平臺 309
第24章 基于深度學習的影像識別 311
24.1 案例背景 311
24.2 選擇肺部影像數據集 311
24.3 編輯CNN遷移模型 313
24.4 程序實現 319
24.4.1 訓練CNN遷移模型 319
24.4.2 測試CNN遷移模型 323
24.4.3 融合CNN遷移模型 326
24.4.4 構建CNN識別平臺 328
第25章 基于CNN的物體識別 330
25.1 案例背景 330
25.2 CIFAR-10數據集 331
25.3 VGGNet 332
25.4 ResNet 334
25.5 程序實現 336
第26章 基于CNN的圖像校正 344
26.1 案例背景 344
26.2 傾斜數據集 344
26.3 自定義CNN回歸網絡 346
26.4 AlexNet回歸網絡 347
26.5 程序實現 349
第27章 基于LSTM的時間序列分析 357
27.1 案例背景 357
27.2 厄爾尼諾—南方濤動指數數據 357
27.3 樣條分析 358
27.4 用MATLAB實現LSTM預測 359
27.5 用Python實現LSTM預測 363
第28章 基于YOLO的交通目標檢測 368
28.1 案例背景 368
28.2 車輛YOLO檢測 371
28.3 交通標志YOLO檢測 378
第29章 基于ChatGPT的智能問答 384
29.1 案例背景 384
29.2 網絡URL訪問 384
29.3 ChatGPT接口說明 385
29.4 構建智能問答應用 386 |
序: |