文字識別:原理、方法和實踐( 簡體 字) | |
作者:丁曉青 王言偉等 | 類別:1. -> 教材 -> 數位影像處理 |
出版社:清華大學出版社 | 3dWoo書號: 46688 詢問書籍請說出此書號! 有庫存 NT售價: 640 元 |
出版日:4/1/2017 | |
頁數:610 | |
光碟數:0 | |
站長推薦: | |
印刷:黑白印刷 | 語系: ( 簡體 字 ) |
ISBN:9787302454625 | 加入購物車 │加到我的最愛 (請先登入會員) |
(簡體書上所述之下載連結耗時費功, 恕不適用在台灣, 若讀者需要請自行嘗試, 恕不保證, 繁體書的下載亦請直接連絡出版社) | |
第1章緒論1.1引言1.2文字和漢字1.2.1文字的代碼表示1.2.2漢字的字體字形1.2.3漢字的特點1.2.4中文信息處理1.3文字識別和漢字識別1.4文字識別研究歷程1.5文字識別分類1.5.1按照不同文種文字和文檔的識別技術分類1.5.2按照獲取圖像方式和識別對象不同分類1.5.3單個字符識別和文檔篇章識別1.6文字識別與筆跡鑒別1.7漢字識別的基本方法——基于視覺感知的漢字識別方法1.8關于本書參考文獻第2章模式識別和模式識別信息熵理論2.1引言:模式與模式識別2.2基于貝葉斯統計決策的模式識別2.3模式識別統一信息熵理論2.3.1特征和類別及其相關信息熵2.3.2后驗熵:最優貝葉斯分類器誤識率的上限2.3.3模式識別的學習與識別信息過程2.3.4互信息:決定模式識別性能的鑒別熵2.4正態分布條件下的模式識別信息熵系統2.5最大互信息鑒別分析(互信息鑒別子空間模式識別)2.5.1最大互信息子空間線性鑒別分析方法2.5.2最大互信息線性鑒別分析與線性鑒別分析LDA2.6特征選擇的信息熵準則2.6.1基于錯誤概率的類別可分性準則2.6.2基于有效互信息的類別可分性準則2.7從信息熵分析看提高識別性能的途徑2.8漢字集合和漢字文本的信息熵2.8.1漢字集合的信息熵2.8.2漢字文本的信息熵和漢字的極限熵2.9本章小結參考文獻第3章漢字識別的特征提取3.1引言3.2漢字字符圖像規一化預處理3.2.1線性規一化3.2.2非線性規一化3.2.3基于整體密度均衡的非線性規一化3.3漢字識別中的特征抽取3.3.1結構特征3.3.2統計特征3.4漢字識別特征提取研究的發展歷程3.4.1基于圖像變換的印刷漢字識別特征和系統3.4.2基于形態學漢字結構分析的兩級印刷漢字識別特征和系統3.4.3漢字筆畫密度微結構全局特征及多字體漢字識別系統3.4.4基于漢字筆畫方向網格特征的魯棒漢字識別系統3.5筆畫方向線素特征3.5.1方向線素特征的形成方法3.5.2網格化方向線素特征3.5.3對原模糊分塊方法的改進——低通采樣方向線素特征3.5.4實驗和結果3.6基于Gabor濾波器的高性能漢字識別方向特征3.6.1Gabor變換理論分析3.6.2適用于漢字識別的Gabor濾波器組設計及實驗驗證3.6.3對Gabor濾波器組輸出的非線性變換3.6.4分塊特征的抽取3.6.5實驗及結果3.7漢字識別梯度方向特征抽取方法3.7.1梯度方向特征3.7.2梯度方向特征的快速算法3.8不同筆畫方向特征的識別性能實驗比較3.9本章小結參考文獻第4章特征的鑒別分析和分布整形4.1引言4.2線性鑒別分析4.2.1優化準則4.2.2變換形式和最優解4.2.3變換的分解形式4.2.4啟發式討論4.2.5實驗與結果4.2.6小結4.3正則化線性鑒別分析4.3.1小樣本帶來的問題4.3.2利用正則化估計協方差陣4.3.3實驗結果4.4異方差鑒別分析4.4.1基于極大似然估計的異方差線性鑒別分析4.4.2基于Chernoff準則的異方差線性鑒別分析4.4.3基于Mahalanobis準則的異方差線性鑒別分析4.4.4實驗結果4.4.5小結4.5特征統計分布整形變換4.5.1特征分布的整形4.5.2正態性檢驗4.5.3BoxCox變換4.5.4方向線素及梯度特征的整形4.5.5實驗與結果4.6本章小結參考文獻第5章模式識別分類器設計/統計模式分類方法5.1引言5.2貝葉斯判決理論5.3正態分布下的貝葉斯分類器5.3.1正態分類模型5.3.2最小距離分類器MDC5.3.3線性距離分類器LDC5.3.4二次鑒別函數分類器QDF5.3.5二次鑒別函數5.3.6QDF誤差分析5.4改進二次鑒別函數分類器MQDF5.4.1修正二次鑒別分類MQDF5.4.2QDF修正形式的貝葉斯估計推導5.4.3實驗與結果5.5系統實現與應用5.5.1非限定脫機手寫漢字識別系統5.5.2多字體印刷中、日、韓文識別系統5.6分類器的置信度分析5.6.1分類器的置信度和廣義置信度5.6.2基于距離的分類器的廣義置信度估計5.6.3多層前向神經網絡分類器廣義置信度估計5.6.4從廣義置信度求置信度的方法5.6.5使用ACT估計后驗概率5.6.6置信度分析在字符識別中的應用5.6.7小結5.7分類器集成5.7.1集成的3個層次5.7.2基于線性回歸的多分類器集成5.7.3利用線性回歸提高后驗概率估計的準確性5.7.4后驗概率的估計誤差與誤識率的關系5.7.5實驗結果5.7.6小結5.8本章小結參考文獻第6章無約束手寫漢字識別分類器鑒別學習6.1引言6.2基于最小錯誤率的鑒別學習6.2.1最小錯誤率學習6.2.2基于MCE的多模板距離分類器參數鑒別學習6.2.3基于MCE的MQDF分類器參數鑒別學習6.2.4基于MCE的正交混合高斯模型的鑒別學習6.3基于啟發式的鑒別學習方法6.3.1矯正學習6.3.2鏡像學習方法6.3.3樣本重要性加權學習方法6.4本章小結參考文獻第7章聯機手寫漢字識別7.1引言7.1.1聯機手寫漢字識別方法回顧7.2描述結構的統計模型——SSM7.2.1基元間關系的描述7.2.2結構統計模型SSM的定義及概率分析7.2.3SSM應用于聯機手寫漢字識別7.2.4實驗與分析7.2.5小結7.3路徑受控HMM和時空統一模型7.3.1路徑受控HMM(PCHMM)7.3.2PCHMM在聯機手寫漢字識別中的應用7.3.3聯機手寫漢字識別的時空統一模型——STUM7.3.4實驗與分析7.3.5小結7.4基于全局模式分析的統計結構特征7.4.1聯機漢字筆跡的結構分析7.4.2聯機手寫漢字分類特征的分析與提取7.4.3小結7.5高性能聯機手寫漢字識別系統及其嵌入式系統7.5.1聯機手寫漢字識別系統7.5.2嵌入式聯機手寫識別系統7.6本章小結參考文獻第8章利用上下文信息的漢字識別后處理8.1概述8.2漢字識別后處理模型8.2.1漢字文本識別的整體模型8.2.2利用多層語言知識的漢字識別整體模型8.2.3整體模型的全局優化8.2.4影響后處理性能的要素分析8.3統計語言模型8.3.1ngram模型的基本理論8.3.2基于字的語言模型8.3.3基于詞的語言模型8.4候選集的有效性8.4.1候選集大小分析8.4.2混淆矩陣獲取8.4.3擴充候選字集8.4.4詞條近似匹配算法8.5文本識別后處理的實現8.5.1字bigram模型的上下文處理8.5.2字trigram模型的上下文處理8.5.3詞bigram模型的上下文處理8.5.4字、詞相結合的上下文處理8.4.5利用上下文信息的漢字識別實驗系統8.6實驗結果與分析8.6.1實驗數據說明8.6.2語言模型的影響8.6.3候選字集的影響8.6.4文本識別混合后處理系統的影響8.7本章小結參考文獻第9章脫機手寫文檔識別方法9.1引言9.2文本行識別研究概況9.3基于過切分的脫機手寫中文文本行識別方法9.3.1脫機手寫中文文本行識別方法9.3.2基于分段的文本行識別搜索方法9.3.3文本行切分識別中的語言模型自適應9.3.4脫機手寫中文文本識別系統9.4基于HMM的無切分民族文字文檔識別方法9.4.1無切分識別方法的主要思想9.4.2無切分文檔識別方法中的特征提取9.4.3無切分文檔識別方法中的模型訓練9.4.4無切分文檔識別方法中的模型優化9.4.5無切分文檔識別方法中的解碼識別9.4.6無切分維文文檔識別研究的相關實驗9.4.7小結9.5本章小結參考文獻第10章文檔版面自動分析和理解10.1版面處理的概念10.2版面分析研究的歷史和現狀10.2.1版面分析研究的分類10.2.2版面分析工作的發展10.2.3版面分析的困難10.3基于多層次基元的版面分析模型10.3.1多層次可信度的定義10.3.2多層次可信度指導下的自底向上版面分析算法10.3.3連通域層次10.3.4行層次10.3.5區域層次10.3.6頁面層次10.3.7實驗結果10.4版面理解和重構10.4.1版面理解和重構的需求10.4.2文檔結構模型10.4.3版面理解10.4.4版面重構10.4.5原文重現的電子出版物制作系統10.5本章小結參考文獻第11章蒙藏維多文種識別11.1引言11.1.1蒙藏維文識別11.1.2民族文字識別的現狀11.1.3藏文及其識別11.1.4維吾爾文及其識別11.1.5蒙古文及其識別11.2蒙藏維文識別的基本策略11.2.1基本識別單元選擇11.2.2基本框架和關鍵技術11.3多文種民族文字識別中的字符規一化11.3.1基于基線分塊的民族字符規一化策略11.3.2規一化點陣大小選擇11.3.3位置規一化11.3.4基于三次B樣條函數的字符圖像插值11.3.5筆畫寬度調整11.4民族文字識別中的特征提取與特征變換11.4.1改進型方向線素特征11.4.2基于視覺特性的方向特征11.4.3基于線性鑒別分析的特征變換11.4.4實驗結果11.5民族文字識別中的級聯分類器設計11.5.1預分類11.5.2基于鑒別學習MQDF的主分類器11.5.3輔助分類11.5.4實驗結果11.6藏文文本切分和藏文識別后處理11.6.1藏文文本切分11.6.2拼寫規則與統計方法相結合的藏文識別后處理11.7多民族語言文字識別系統的實現——THOCR統一平臺民族文字識別系統11.7.1統一平臺多民族文字識別系統特點11.7.2維漢英混排民族文字的識別11.7.3蒙藏維多文種統一平臺識別系統性能11.7.4蒙藏維文檔識別的跨文種翻譯理解11.8本章小結參考文獻附錄A常用縮略語表附錄B文字識別相關研究成果附錄C文字識別相關成果主要獎勵附錄D已授權文字識別相關發明專利附錄E文字識別相關的博士論文附錄F本書中算法研究相關數據庫索引
本書基于模式識別和信息熵理論,全面、系統和深入地分析介紹了各種漢字、多文種文字識別的理論和方法,以及解決復雜多變的多文種文字和文檔識別中關鍵問題的有效算法和具體實踐。本書可以作為相關專業研究生的參考書,也可以供從事模式識別、文字和文檔識別等計算機信息處理研究的科研人員和從事相關產品開發的工程技術人員閱讀參考。
文字是人類信息最重要的載體和最集中的表象,記載了幾千年人類的文明和歷史,對五千年中華文明的傳承和發展起著極其關鍵的作用。當今人類社會進入快速計算機網絡信息化的時代,信息的全球化和大數據資源的獲取,首先要求解決和實現各類信息的數字化,特別是文字和文檔信息的計算機數字化。計算機信息化,就是要求計算機也能像人一樣識圖認字:使計算機具有對圖像或文字表象的自動識別的能力。也就是說,文字和文檔識別信息化也是人工智能和計算機視覺需要解決的重要問題。20世紀60年代,國際上就十分重視對文字識別的研究。我國漢字數量巨大、結構復雜,難以輸入計算機,這成為漢字信息化的攔路虎,因此,漢字識別及海量文檔的計算機數字化研究極為緊迫,并具有特殊的歷史意義。作者所在的清華大學智能圖文信息處理研究室從20世紀80年代就開始了漢字等多文種文字和文檔識別信息化的研究和探索,數十位師生持續卅余年,齊心奮力,在文字識別的理論和方法研討上、在大規模印刷、聯機和脫機手寫漢字識別、中日韓、蒙藏維哈柯阿民族文字文檔識別的研究上取得領先的研究成果,并將研究成果在世界范圍推廣應用。這些經歷和成果成為本書撰寫的直接動因。《文字識別:原理、方法和實踐》一書圍繞模式識別和文檔信息化而展開。基于模式識別和信息熵理論分析,對文字和文檔識別的理論和方法以及關鍵問題進行了較為深入、系統的分析和研究,并介紹了多種文字和文檔識別方法和系統。全書包括11章,各章內容如下: 第1章緒論介紹文字的基本屬性和特點;第2章模式識別和模式識別信息熵理論,揭示模式識別的核心互信息,漢字和漢字文本的信息熵;第3章介紹漢字識別的特征提取和優良的漢字識別特征;第4章介紹特征的鑒別分析、維數壓縮和特征高斯分布整形;第5章介紹最優貝葉斯分類器和MQDF設計;以上章節主要介紹文字識別基本理論。第6章介紹脫機手寫漢字識別的鑒別學習方法;第7章介紹基于時空統一模型的結構聯機漢字識別方法,以及基于結構特征的統計聯機手寫漢字識別系統; 第8章介紹利用上下文語言信息進行漢字文本識別后處理的理論方法;第9章介紹基于過切分的文本行識別及基于HMM的無切分文檔識別方法;第10章介紹復雜文檔版面的自動分析、理解和重構,及文檔自動識別和重構方法;第11章介紹蒙藏維多文種文字文檔識別的策略、理論和方法,為民\|漢跨文種文檔識別理解打下基礎。本書有選擇性地針對文字和文檔識別中必須解決的諸多重要問題,從單字、聯機、多變脫機漢字識別、鑒別學習,到復雜版面、連筆書寫、上下文相關文檔識別,以及多文種民族文字識別,力圖較完整地,從理論、方法和實踐進行深入分析和討論。全書內容主要源自我們研究工作的總結,大部分章節源于研究生的論文,包括張睿、劉海龍、張嘉勇、林曉帆、征荊、陳彥、王學文、王言偉、李元祥、姜志威、陳明、王華等同學的博士論文。丁曉青負責全書的編撰,王言偉還做了大量文檔編輯工作。希望讀者能夠對文字和文檔識別的理論、方法和實踐有較為全面的認知和了解,并從中獲得有益的啟發。最后需要說明的是,本書沒有也不可能完全包括當前在此領域內最新的研究成果和發展。對于讀者,本書能夠起到拋磚引玉的目的,我們就十分欣慰了。本書的內容主要源自研究組對文字和文檔識別理論和方法的研究和探索,特別是漢字識別研究開創者之一,已故的吳佑壽院士,他的一貫支持,為漢字識別研究的成功發揮了重要作用;劉長松、彭良瑞進行了長期的工作,為本書和研究成果的產品化,作出突出貢獻;以及集數十位研究生的不懈努力和研究成果,除上面已經提及的參與者外,還包括:朱夏寧、董宏、黃曉非、李彬、徐寧、郭繁夏、茍大銀、趙明生、郭宏、劉今暉、陳友斌、方馳、靳簡明、陳力、魯湛、陳彥、李闖、王賢良、文迪、何峰、姚正斌、李昕、蔣焰、付強等。在此一并表示衷心的感謝!
|