人臉識別與美顏算法實戰:基于 Python、機器學習與深度學習 ( 簡體 字) |
作者:方圓圓 著 | 類別:1. -> 程式設計 -> Python 2. -> 教材 -> 數位影像處理 3. -> 程式設計 -> USB |
譯者: |
出版社:機械工業出版社 | 3dWoo書號: 52650 詢問書籍請說出此書號!【有庫存】 NT售價: 495 元 |
出版日:4/1/2020 |
頁數:216 |
光碟數:0 |
|
站長推薦: |
印刷:黑白印刷 | 語系: ( 簡體 版 ) |
|
加入購物車 │加到我的最愛 (請先登入會員) |
ISBN:9787111650454 |
作者序 | 譯者序 | 前言 | 內容簡介 | 目錄 | 序 |
(簡體書上所述之下載連結耗時費功, 恕不適用在台灣, 若讀者需要請自行嘗試, 恕不保證) |
作者序: |
譯者序: |
前言:據統計,在當今各行各業中,互聯網與軟件工程行業薪資名列前茅,大幅領先于傳統行業。BOSS直聘發布《2020年人才資本趨勢報告》,該報告公布了2020年人才領域的前瞻趨勢,對其中的人工智能相關方向進行了梳理。其中,自然語言處理崗位的平均薪資為25?553元;機器學習崗位的平均薪資為27?652元;語音識別崗位的平均薪資為24?037元;深度學習崗位的平均薪資為27?516元;語音、視頻、圖形開發崗位的平均薪資為22?979元。隨著人工智能領域的不斷擴大和普及,各行各業逐步深入實踐和應用人工智能領域的相關技術,具有實踐經驗的頂尖AI人才缺口增大,人工智能技術將成為第四次工業革命的發動機,成為不可或缺的力量源泉。
在人工智能領域,計算機視覺是人工智能最重要的部分之一,尤其是人臉圖像處理領域涌現了商湯、曠視、云叢、抖音等多家獨角獸企業。2014年,中國人臉識別行業的市場規模為49億元;2018年,中國人臉識別行業的市場規模為131億元,年均復合增長率為37%。這充分顯示了人臉圖像處理技術的巨大商用價值,大量的人臉相關應用不斷涌現。
本書結合大量的實際案例,從Python圖像處理開始講起,再到機器學習、深度學習的理論和應用,通過由淺入深、圖文并茂的講解及項目實戰,提高讀者的理論水平和代碼實踐能力。
本書特色
1. 入門門檻低,學習曲線平滑
本書從搭建環境學起,首先介紹Windows、Linux和Mac OS這三種環境下編譯環境的配置和安裝;然后介紹與Python數據編程相關的基礎知識、圖像處理算法基礎及常用函數;接著介紹機器學習和深度學習的基礎理論;最后通過Python復現各種常用軟件中的人臉圖像算法應用。本書學習曲線平滑,適合深度學習和機器學習的零基礎讀者閱讀。
2. 通過對比、理論結合實踐的方式講解,適合新手學習
對于一個新知識點的出現,本書通過對比的方式給出了概念或原理,讓讀者能舉一反三,拓寬知識面;對深度學習的一些理論和概念,本書結合目前熱門軟件中的圖像算法應用實例,讓讀者能邊學習邊實踐,縮短了新手與老手之間的差距。
3. 內容豐富、實用,主次分明
本書所選案例涉獵廣泛而豐富,算法案例緊跟當前潮流,如抖音、天天P圖、美顏相機中的各種圖像處理技巧,沿著“需求→算法設計→代碼實現”的思路講解,書中大量既豐富又生動有趣的例子簡單易學,可直接上手。在代碼示例中,不僅包含了模型構建和設計的核心思想,同時也兼顧了新手容易犯錯的細節展示。此外,本書還介紹了一些在工程實踐中常用的設計與實現技巧,以提高內容的實用性,增強案例與實際系統設計和實現過程的聯系。
4. 圖文搭配合理、生動有趣,全程伴隨實戰
本書從實戰出發,介紹了大約60多個案例,脈絡清晰,沒有太多枯燥的理論講解,而是以一位資深AI算法工程師手把手帶讀者入門做項目的方式,講述了新手如何入門成為AI圖像算法工程師,遇到項目如何入手去做,以及目前抖音中好玩的效果是如何一步步通過算法設計做出來的,沿著Python基礎、圖像處理技術、視頻處理技術、機器學習、深度學習及各類圖像美顏算法的思路去實現。目前,各種App中美顏算法大行其道,希望通過作者有趣的講解,可以帶領讀者探索其中的各種算法設計小技巧。
本書內容
第1章?AI時代:圖像技術背景知識
本章首先介紹了什么是人工智能以及人工智能的歷史和發展,通過介紹AI的發展歷史和一些標志性事件,概述了目前中國AI技術的發展現狀;然后介紹了計算機視覺技術及其分類和應用,讓讀者在第1章就可以體會到AI在生活中無處不在,以及它無限的發展前景。
第2章?武器和鎧甲:開發環境配置
本章主要介紹了本書涉及的開發語言和編譯環境,詳細介紹了OpenCV開源庫及Python不同版本間的區別,帶領讀者手把手搭建PyCharm和Anaconda編譯環境,完成基本的AI開發環境配置,并且在不同環境下裝載各種需要的工具包。
第3章?開啟星辰大海:圖像處理技術基礎知識
本章詳細介紹了圖像處理技術的基礎知識,每個知識點對應多個Python實例,讓讀者能夠輕松完成圖像的旋轉、平移、鏡像和縮放等一系列操作。
第4章?First Blood:第一波項目實戰
本章以大量的Python實例展示了基于圖像處理算法可以實現的多種效果,介紹了抖音哈哈鏡、照片懷舊、素描、油畫、卡通化和馬賽克處理等一系列項目的算法原理和代碼實現,有趣地展示了圖像處理技術中的各種玩法。
第5章?Double Kill:視頻圖像處理理論和項目實戰
本章介紹了視頻圖像處理技術的原理和流程,并以大量的實例展示了如何根據抖音的一些視頻特效來設計算法以實現其效果,完成了抖音視頻中抖動、閃白、霓虹、時光倒流、視頻反復、慢動作和Black magic等效果設計。
第6章?Triple Kill:基于機器學習的人臉識別
本章詳細介紹了機器學習的基礎知識,從一個機器學習的實例出發,講述了機器學習的原理,以及什么時候使用機器學習。本章以經典的人臉識別算法為例,從數據準備到算法設計原理,再到最后的訓練,完成一個完整的機器學習項目。
第7章?Quatary Kill:基于深度學習的人臉識別
本章詳細介紹了深度學習的基本概念和使用場景;講解了深度學習和機器學習的區別,并以LeNet-5網絡為例講解了深度學習的經典網絡;還講解了幾種常見的網絡層及其作用,如卷積層、激勵層、池化層、Flatten層和全連接層;調用TensorFlow進行數據增廣,詳解模型訓練和測試過程,并講解了如何設計損失函數和優化器,以及如何評價一個模型的好壞。
第8章?Penta Kill:人臉圖像美顏算法項目實戰
本章以幾種經典的圖像美顏算法為例,講解了目前主流的美圖軟件,如美顏相機、天天P圖等圖像美顏算法的設計。其中,涉及的圖像處理基礎算法有各種圖像過濾器、圖像顏色HSV空間、顏色分割和各種圖像增強算法等。本章還通過大量的Python實例實現了人臉磨皮、美白和祛痘等效果。
第9章?Legendary:AI時代圖像算法應用新生態
本章以目前主流的應用領域為例,分析了AI時代圖像算法的應用現狀,講解了項目中基本的算法設計邏輯,以及抖音和天天P圖等應用中圖像算法的應用情況與算法設計復現,帶領讀者感受應用級項目算法的設計思路。
配套資源獲取方式
本書涉及的源代碼文件等資料需要讀者自行下載。請登錄華章公司的網站www.hzbook.com,在該網站上搜索到本書,然后單擊“資料下載”按鈕,即可在本書頁面上找到下載鏈接。
本書讀者對象
深度學習愛好者;
計算機視覺技術愛好者;
算法工程設計實現工程師;
渴望入門深度學習相關領域的學生;
圖像處理技術愛好者;
對美顏算法、App自動化妝算法感興趣的人員;
深度學習應用研究人員;
人工智能從業人員。
本書作者
本書由方圓圓編寫。作者在人工智能技術領域有多年的工作經歷和豐富的開發經驗。由于能力和時間所限,書中可能還存在疏漏和不足之處,敬請廣大讀者朋友指正。 |
內容簡介: 本書是一本新手入門人工智能圖像處理技術的基礎圖書,其主旨是帶領讀者從零開始學習人臉識別與美顏算法的相關知識。書中介紹了Python圖像處理的相關知識以及機器學習和深度學習理論及其在人臉識別與美顏領域中的應用。書中秉承知識點結合案例的方式講解,穿插了60多個行業案例和代碼進行實戰,以降低讀者的學習難度。
本書共9章,前5章著重介紹了基本的Python編程和視頻圖像處理技術,包括基于Anaconda和PyCharm的環境搭建、各種數據處理的相關包(NumPy、Matplotlib等),還復現了抖音中各種視頻特效的算法設計;后4章介紹了機器學習和深度學習在人臉圖像處理領域中的算法與實戰案例,包括基于分類器和卷積神經網絡的經典應用、算法模型設計,以及目前主流的視頻媒體中人臉美顏、虛擬試妝等算法的設計和復現。
本書內容豐富,實例典型,實用性強,尤其適合熟悉Python但不熟悉框架而又想要了解和學習機器學習及深度學習在人臉圖像處理應用中的初學者閱讀,同時也適合有一定基礎的程序員作為工具書和參考書使用。 |
目錄:推薦序 前言 第1章 AI時代:圖像技術背景知識 1 1.1 人工智能的前世今生 2 1.2 AI與CV的相互融合之路 3 1.3 AI圖像處理技術 5 1.4 本章小結 7 第2章 武器和鎧甲:開發環境配置 8 2.1 來自傳承的饋贈:OpenCV開源跨平臺機器視覺庫 8 2.1.1 OpenCV的整體概念 9 2.1.2 OpenCV的應用領域 9 2.1.3 OpenCV的編程語言 9 2.1.4 OpenCV支持的系統 10 2.1.5 OpenCV的線上資源 10 2.2 召喚萌寵:Python語言的“制霸”之路 10 2.2.1 Python語言的發展 11 2.2.2 Python 2.7.X版本和3.X版本的區別 11 2.2.3 本書采用的Python版本 13 2.3 鑄劍:基于PyCharm的系統環境配置 14 2.3.1 PyCharm在Mac OS系統下的安裝和配置 14 2.3.2 Mac OS系統下Anaconda的安裝和配置 17 2.4 牛刀小試:一起動手來寫個例子吧 19 2.5 本章小結 21 第3章 開啟星辰大海:圖像處理技術基礎知識 22 3.1 圖像的基本概念 23
3.1.1 像素的概念 23 3.1.2 圖像的構成 24 3.1.3 圖像的格式 24 3.1.4 理解圖像的位深和通道的概念 25 3.2 圖像的讀取、顯示和存儲操作 26 3.2.1 OpenCV基本圖像處理函數 26 3.2.2 Python讀取一張圖片并顯示和存儲 27 3.3 從像素出發構建二維灰度圖像 28 3.3.1 NumPy科學計算庫 28 3.3.2 創建二維灰度圖像 30 3.3.3 灰度圖像的遍歷 31 3.4 灰度圖像和彩色圖像的變換 32 3.4.1 圖像的顏色空間 32 3.4.2 彩色圖像的通道分離和混合 33 3.4.3 彩色圖像的通道分離和混合程序示例 34 3.4.4 彩色圖像的二值化 35 3.4.5 彩色圖像的遍歷 37 3.4.6 彩色圖像和灰度圖像的轉換 38 3.5 圖像的幾何變換 40 3.5.1 圖像幾何變換的基本概念 40 3.5.2 插值算法 41 3.5.3 圖像的縮放 42 3.5.4 圖像的平移 44 3.5.5 圖像的旋轉 45 3.5.6 圖像的鏡像變換 47 3.6 圖像色彩空間基礎知識 48 3.6.1 圖像的色調、色相、飽和度、亮度和對比度 48 3.6.2 RGB色彩空間 49 3.6.3 HSV色彩空間 49 3.6.4 HSI色彩空間 50 3.7 圖像的直方圖 50 3.7.1 圖像直方圖的基本概念 50 3.7.2 繪制灰度圖像的直方圖 51 3.7.3 繪制彩色圖像的直方圖 53 3.7.4 圖像直方圖均衡化 54 3.7.5 圖像直方圖反向投影 56 3.8 本章小結 58 第4章 First Blood:第一波項目實戰 59 4.1 抖音哈哈鏡 60 4.1.1 抖音的哈哈鏡效果 60 4.1.2 哈哈鏡的原理 61 4.1.3 哈哈鏡的程序實現 61 4.2 給你一張老照片 64 4.2.1 懷舊風格算法原理 64 4.2.2 懷舊風格程序實現 65 4.3 給自己畫一張文藝范的素描 66 4.3.1 輪廓檢測算法原理 66 4.3.2 素描風格算法原理 67 4.3.3 素描風格算法的程序實現 68 4.4 來一張油畫吧 69 4.4.1 圖像油畫算法原理 69 4.4.2 圖像油畫算法的程序實現 69 4.5 如何打馬賽克 72 4.5.1 馬賽克算法原理 72 4.5.2 馬賽克算法的程序實現 72 4.6 打造自己的專屬肖像漫畫 74 4.6.1 漫畫風格算法原理 74 4.6.2 漫畫風格算法的程序實現 74 4.7 本章小結 76 第5章 Double Kill:視頻圖像處理理論和項目實戰 77 5.1 視頻處理流程和原理 78 5.1.1 視頻的捕獲和存儲 78 5.1.2 提取視頻中的某些幀 79 5.1.3 將圖片合成為視頻 80 5.1.4 多個視頻合并 81 5.2 抖音中的視頻抖動效果設計 82 5.2.1 視頻抖動的原理 82 5.2.2 視頻抖動的程序實現 83 5.3 抖音中的視頻閃白效果設計 85 5.3.1 視頻閃白的原理 86 5.3.2 視頻閃白的程序實現 87 5.4 抖音中的視頻霓虹效果設計 90 5.4.1 視頻霓虹的原理 90 5.4.2 視頻霓虹效果的程序實現 91 5.5 抖音中的視頻時光倒流效果設計 94 5.5.1 視頻時光倒流的原理 94 5.5.2 視頻時光倒流的程序實現 94 5.6 抖音中的視頻反復效果設計 95 5.6.1 視頻反復的原理 95 5.6.2 視頻反復的程序實現 95 5.7 抖音中的視頻慢動作效果設計 96 5.7.1 視頻慢動作的原理 97 5.7.2 視頻慢動作的程序實現 97 5.8 視頻人物漫畫風格濾鏡設計 98 5.9 本章小結 99 第6章 Triple Kill:基于機器學習的人臉識別 100 6.1 機器學習的基本概念 101 6.1.1 機器學習的目的 101 6.1.2 機器學習的內容 102 6.1.3 機器學習的作用 103 6.1.4 如何使用機器學習獲得的東西 105 6.1.5 使用機器學習方法的時機 106 6.1.6 總結機器學習的基本概念 108 6.2 機器學習中的圖像預處理流程 112 6.2.1 一個經典的機器學習圖像處理實例 112 6.2.2 人臉識別機器學習Model訓練思路 113 6.2.3 正樣本圖像預處理 113 6.2.4 負樣本圖像預處理 121 6.3 人臉檢測機器學習算法設計 123 6.3.1 圖像特征 123 6.3.2 Harr-like特征求值加速算法 127 6.3.3 圖像分類器 128 6.3.4 人臉檢測的訓練算法流程 130 6.3.5 人臉檢測的檢測算法流程 131 6.4 訓練人臉檢測分類器并測試 132 6.4.1 訓練準備 132 6.4.2 開始訓練 133 6.4.3 模型測試 134 6.5 本章小結 135 第7章 Quatary Kill:基于深度學習的人臉識別 137 7.1 深度學習的基本概念 138 7.1.1 深度學習簡介 138 7.1.2 深度學習和機器學習的區別 139 7.1.3 深度學習入門概念 141 7.2 卷積神經網絡 147 7.2.1 卷積的原理 147 7.2.2 池化層的原理 150 7.2.3 全連接層的原理 150 7.2.4 一個經典的CNN網絡結構 152 7.3 手寫數字分類項目 153 7.3.1 訓練環境的搭建 153 7.3.2 訓練數據的準備 154 7.3.3 訓練網絡的搭建 155 7.3.4 訓練代碼 158 7.3.5 深度學習基礎知識擴展 159 7.4 基于深度學習的人臉識別解決方案 161 7.4.1 數據的準備 161 7.4.2 數據集的讀取和處理 163 7.4.3 網絡的搭建 165 7.4.4 Model的訓練過程 167 7.4.5 Model的測試過程 168 7.5 本章小結 169 第8章 Penta Kill:人臉圖像美顏算法項目實戰 170 8.1 人臉磨皮算法 171 8.1.1 圖像濾波算法和效果 171 8.1.2 人臉磨皮算法設計 176 8.2 圖像的色彩空間 180 8.2.1 RGB和HSV色彩空間基礎知識 180 8.2.2 RGB和HSV轉換的數學描述和函數實現 180 8.2.3 圖片中的顏色檢測 181 8.3 人臉美白算法設計 183 8.3.1 通過圖層混合實現圖像美白算法 184 8.3.2 通過beta參數調整實現圖像美白算法 185 8.3.3 通過顏色查找表實現圖像美白算法 187 8.4 人臉的手動祛痘算法設計 189 8.4.1 圖像修復算法介紹 190 8.4.2 圖像修復的原理 190 8.4.3 通過圖像修復算法實現手動祛痘 191 8.5 本章小結 193 第9章 Legendary:AI時代圖像算法應用新生態 194 9.1 抖音中的圖像技術 195 9.1.1 抖音中的圖像應用概覽 195 9.1.2 抖音中的人臉檢測技術 195 9.1.3 抖音中的人臉檢測技術應用 197 9.1.4 抖音中的人體檢測技術 201 9.1.5 抖音中的人體檢測技術應用 201 9.1.6 抖音中的視頻技術 202 9.1.7 抖音中的圖像技術總結 205 9.2 美顏和美妝類App中的圖像技術 206 9.2.1 美顏和美妝類App圖像應用概覽 207 9.2.2 五官的調整 207 9.2.3 美妝算法 208 9.2.4 染發算法 209 9.2.5 五官分析 211 9.2.6 美顏相機和美妝相機中圖像技術的一些總結 213 9.3 電商中的圖像技術 213 9.3.1 電商中的圖像技術應用概覽 213 9.3.2 虛擬穿戴技術和商品3D展示 214 9.3.3 尺寸測量 214 9.3.4 相似商品推薦及以圖搜圖 215 9.4 本章小結 216 |
序: |