熱線電話:0755-23712116
郵箱(xiang):contact@legoupos.cn
地(di)址:深圳市寶安(an)區沙井街道后亭茅洲山工業園(yuan)工業大廈全(quan)至科技創(chuang)新園(yuan)科創(chuang)大廈2層2A
OCR光學字(zi)符識別技術(shu)
什么是OCR光學字符識別?
OCR (Optical Character Recognition,光(guang)學(xue)字符識(shi)別(bie))是指(zhi)電(dian)子設備(例(li)如掃描儀或數(shu)碼(ma)相機)檢查紙上打印的(de)字符,通過(guo)檢測暗、亮的(de)模式確定(ding)其形狀,然后用字符識(shi)別(bie)方法將形狀翻譯成計(ji)算機文字的(de)過(guo)程。衡(heng)量一個OCR系統性能好壞的(de)主要指(zhi)標有:拒識(shi)率(lv)、誤識(shi)率(lv)、識(shi)別(bie)速度、用戶界(jie)面的(de)友好性,產品的(de)穩定(ding)性,易用性及可行性等。
在工(gong)業領(ling)域(yu),光學字(zi)符識別(bie) (OCR) 是一項機器(qi)視(shi)覺任務,包括從圖像(xiang)中提取文本(ben)信息(xi)。
OCR 是高精度文本識別技術,并(bing)且對中(zhong)等顆粒(li)圖形噪聲無懈可擊。它們還適用于識別使用點陣打印機制作的字(zi)(zi)符。該(gai)技術為部分遮擋或(huo)變形的字(zi)(zi)符提供了令人滿意的結果。
識(shi)別(bie)過程的(de)效(xiao)率(lv)主要(yao)取決于文(wen)本分(fen)割結果(guo)的(de)質量(liang)。大多數識(shi)別(bie)案(an)例都(dou)可以使(shi)用提供(gong)的(de)一組識(shi)別(bie)模型(xing)完成。在其(qi)他情況下,可以輕松準備新的(de)識(shi)別(bie)模型(xing)。
OCR光學字符識別技術步驟
為(wei)了實現最準確的識別,有必要進行仔細的文本(ben)提取和(he)分(fen)段。從圖(tu)像(xiang)獲取文本(ben)的總體過程(cheng)包括(kuo)以下步驟:
獲取文本位置
文本(ben)的(de)(de)位置是固定的(de)(de),它由稱(cheng)為掩碼的(de)(de)框描述。例(li)如,個人身份證是按照(zhao)正式規范制作的(de)(de)。每個數據字段的(de)(de)位置是已知的(de)(de)。經過良好校準的(de)(de)視覺系統可以拍攝文本(ben)位置幾乎(hu)恒定的(de)(de)圖像。
文(wen)本(ben)位(wei)置(zhi)不是固定的,但它與輸入(ru)圖像上(shang)的特征元素或特殊標記(ji)(光(guang)學標記(ji))相(xiang)關。要獲取文(wen)本(ben)的位(wei)置(zhi),必須找到光(guang)學標記(ji)。這可(ke)以通過模板匹配(pei)、1D 邊緣檢測或其他技術(shu)完(wan)成。
未(wei)指定文本的位置,但可以通(tong)過圖像閾(yu)值輕松地從背景中(zhong)分(fen)離字符。然后可以使用 Blob 分(fen)析技術找(zhao)到正確的字符。
從背景中提取文本
文本提取過(guo)程中(zhong)的主(zhu)要復雜情況(kuang)可能(neng)是(shi)光(guang)線不均(jun)勻。某些技術(如光(guang)規范化或邊緣(yuan)銳化)有助于查(cha)找字(zi)符。
此時,已提取(qu)的文本區域已準備好進行分段。
分段文本
文本區(qu)域分(fen)割(ge)是將區(qu)域拆分(fen)為行和單(dan)個(ge)字符(fu)的過程。只有當每(mei)個(ge)區(qu)域包(bao)含(han)一個(ge)字符(fu)時,識(shi)別(bie)才可能實(shi)現。
當文(wen)本文(wen)本行分(fen)開時(shi),每行必須(xu)拆分(fen)為單獨的字符。
接下來,提取(qu)的字符(fu)將(jiang)從圖形(xing)表(biao)示形(xing)式(shi)轉換為文(wen)本(ben)表(biao)示形(xing)式(shi)。
調用OCR模型庫
通過調(diao)用OCR模(mo)型庫,使識別(bie)到的字符以文本形式與模(mo)型庫進行比對,匹配數據最相似的模(mo)板,得出(chu)準確的字符信息。
字符識別
通常(chang)來(lai)說需要(yao)選擇適當的(de)字(zi)符(fu)規范(fan)大小(xiao),來(lai)分類(lei)字(zi)符(fu)的(de)大小(xiao)。
熱線電話:0755-23712116
郵箱(xiang):contact@legoupos.cn
地(di)址:深圳市寶安(an)區沙井街道后亭茅洲山工業園(yuan)工業大廈全(quan)至科技創(chuang)新園(yuan)科創(chuang)大廈2層2A