卷積神經網絡與視覺計算( 簡體 字) | |
作者:(美)拉加夫·維凱特森(Ragav Venkatesan),(美)李寶新著 | 類別:1. -> 程式設計 -> 深度學習 2. -> 教材 -> 數位影像處理 |
出版社:機械工業出版社 | 3dWoo書號: 50312 詢問書籍請說出此書號! 有庫存 NT售價: 295 元 |
出版日:11/1/2018 | |
頁數:160 | |
光碟數:0 | |
站長推薦: | |
印刷:黑白印刷 | 語系: ( 簡體 字 ) |
ISBN:9787111612391 | 加入購物車 │加到我的最愛 (請先登入會員) |
(簡體書上所述之下載連結耗時費功, 恕不適用在台灣, 若讀者需要請自行嘗試, 恕不保證, 繁體書的下載亦請直接連絡出版社) | |
譯者序
作者簡介 前言 致謝 第1章視覺計算簡介 11圖像表示基礎 111變換域表示 112圖像的直方圖 113圖像梯度和邊緣 114超越圖像梯度 12基于Hough變換的直線檢測 13Harris角點 14尺度不變的特征變換 15方向梯度直方圖 151人工設計特征空間中的決策制定 152貝葉斯決策 153線性決策邊界 16可變形零件模型的實例研究 17計算機視覺向神經網絡轉變 本章小結 參考文獻 第2章回歸問題中的機器學習 21監督學習 22線性模型 23最小二乘法 24極大似然估計的解釋 25擴展到非線性模型 26正則化 27交叉驗證 28梯度下降 29幾何正則化 210非凸誤差面 211隨機梯度、批梯度及在線梯度下降 212其他自適應學習率的更新規則 213動量 本章小結 參考文獻 第3章 人工神經網絡 31感知器 32多層神經網絡 33反向傳播算法 34改進的反向傳播算法 341激活函數 342權重剪枝 343批量標準化 本章小結 參考文獻 第4章卷積神經網絡 41卷積與池化層 42卷積神經網絡 本章小結 參考文獻 第5章卷積神經網絡的新進展 51預訓練網絡 511通用性和可傳遞性 512利用預訓練網絡的模型壓縮 513Mentee網絡與FitNet 514使用預訓練網絡的應用:使用CNN的圖像美學 52生成網絡 521自動編碼器 522生成對抗網絡 本章小結 參考文獻 附錄AYann 后記 本書覆蓋內容主要包括設計和開發卷積神經網絡架構的一些基本知識。對于那些想要學習或構建深度視覺系統的工程師或學生來說,這本書會是一本非常好的入門讀物,可以幫助他們快速地進入這個領域。本書還提供了豐富的理論知識和實操案例,以及一系列完備的工具包,以幫助初學者獲得在理解和構建卷積神經網絡(CNN)時所必要的基本信息。本書的重點將集中在卷積神經網絡的基礎部分,而不會涉及在高級課程中才出現的一些概念(CNN相關話題)。
本書特點: 為學習和開發CNN提供足夠基礎和全面的知識。 為非計算機科學專業的人提供成體系和系統的知識內容。 易于理解,通過案例研究、代碼片段及數據集進行生動的展示和說明。 適合于那些想要在該領域鍛煉自己實操能力的高年級學生或剛從業的人員。 本書包含CNN概念、方法和軟件工具集,可以幫助你學習、理解和實現前沿的CNN技術。 近年來,深度學習體系結構由于在計算機視覺等應用中的極大成功而開始流行起來。特別是卷積神經網絡(CNN)已經成為深度學習中最重要的一種網絡結構。現在普遍認為深度學習和CNN的術語對于初學者來說,太難學習和掌握了。為此,本書涵蓋了計算機視覺中的深度學習、設計和部署CNN,以及深度計算機視覺體系結構的基礎知識。本書旨在為工程師、本科生和研究生提供入門指南,幫助他們快速學習和建立自己的深度學習系統。本書以通俗易懂的方式寫成,目的是為計算機視覺相關的深度學習技術提供一個易學的教材,同時仍然涵蓋了大量必要的基礎知識。
本書分為5章。第1章簡要介紹了圖像表示和一些計算機視覺模型,這些模型現在被稱為人工方式建模。本章為讀者提供了對圖像表示的基本理解,并介紹了一些線性和非線性的特征提取或表示方法,以及這些表示的特性。此外,本章還介紹了一些基本圖像元素(如邊緣)的檢測方法,還包括用這些表示來完成一些基本的機器學習任務。本章最后對兩種流行的非神經網絡計算機視覺建模技術進行了介紹。 第2章介紹了回歸、機器學習和優化的概念。本章首先介紹監督學習,介紹的第一個學習模型是線性回歸,它的第一種求解方法是利用最小二乘法得到解析解,并用極大似然來進行解釋。本章通過基函數展開的方式實現線性模型向非線性模型的轉變,并進一步介紹了交叉驗證和正則化的方法解決過擬合和泛化問題。本章的后半部分介紹了凸誤差面和非凸誤差面的梯度下降最優化方法,進一步介紹了各種梯度下降法和正則化幾何,并對基本梯度下降法進行了改進,包括二階最小化損失技術和動量學習。 第3章和第4章是本書的核心。第3章在第2章的基礎上,介紹了Rosenblatt感知器和感知器學習算法。本章接著介紹了logistic神經元及其激活函數,研究了兩類和多類問題的單神經元模型,以及這種神經元的優缺點,并介紹了異或問題。針對異或問題,提出了多層神經網絡的思想,介紹了反向傳播算法,并對其進行了改進,給出了一些實用技巧,有助于工程上更好、更穩定的實現。第4章介紹了卷積池化層和CNN。其中研究了該層的各種屬性,并分析了典型的數字手寫體數據集提取的特征。本章還介紹了目前最流行的四種CNN:AlexeNet、VGG、GoogLeNet和ResNet,并對它們的架構和思想進行了比較。 第5章通過介紹CNN的一些當前新穎實用的用法,進一步拓展和豐富了深度神經網絡的結構。本章大致分為兩個連續的部分。第一部分討論了使用網上可下載,并已預訓練好的現成深度網絡的原理。經過預訓練的網絡是在一個完整的數據集上進行訓練得到的,公開提供給研究人員用于新的機器學習任務。這些都是在滿足通用、可遷移的條件下研究的。第5章還研究了給定一個預訓練網絡的情況下,壓縮網絡的和學習新任務的方法。第二部分論述了CNN不用于監督學習,而是用于生成網絡的思想,簡要研究了自編碼器和最新的計算機視覺技術:生成對抗網絡(GAN)。 本書的相關網站(convolutionnetwork)包含代碼及實現、部分彩色插圖、勘誤表和補充資料。2017年春季,本書作為亞利桑那州立大學的一門研究生課程的教材進行講授,講座和材料也可以在本書網站上找到。 圖11是我拍攝的原始圖像(originaljpg)。這是monument山谷的一幅圖片,它是美國西南地區的代表,亞利桑那州也在那里。memorypng是以Salvador Dali的風格繪制的,特別是他的繪畫《記憶的持久性》,它抽象地描述了心靈幻覺的概念,以無形的形式描繪和處理物體,很像我們在書中研究的神經網絡的一些表現形式。 memorypng不是人類所畫,而是由本書介紹的神經網絡繪制的。如果引用了本書,請使用以下的引文參考方式。 本書配有一個基于Python和Theano的CNN工具箱(該工具箱是由本書作者開發的),還有一個網頁包含彩色圖片、勘誤表和其他補充資料。這個神經網絡工具箱被命名為yann,可以在MIT許可證下使用。為了讓初學者更容易地閱讀書中的內容,作者開發了一套使用yann的教程。該教程和工具箱涵蓋了本書討論的不同體系結構的計算機,并提供了示例代碼和應用程序編程接口(API)文檔。在撰寫本書的時候,yann工具箱正在積極開發中,它的客戶支持是通過GitHub提供的。書中的大多數圖片都是灰度圖,但有些圖片最初是彩色的,是在制作過程中被轉換成了灰度圖。這些圖片的彩色版本以及附加說明、相關課程的信息以及問答也可在網站上找到。 工具箱和本書將作為亞利桑那州立大學一學期的“深入學習視覺計算”研究生課程的閱讀材料。本課程包括錄制的講座、課程內容和作業,可供大家使用。作者可以通過電子郵件回答大家對有關內容和代碼的問題,虛心接受大家對本書內容的批評或評論。只要符合出版商的版權政策,作者允許復制書中的圖片、結果和內容。作者希望讀者喜歡這本書,并希望初學者能夠在本書及工具箱的幫助下快速構建自己的學習機器。鼓勵讀者利用本書中的知識做有益于人類的事,但同時真誠地勸告他們不要建造“Skynet”或任何其他末日人工智能機器。 |