熱線(xian)電話:0755-23712116
郵箱:contact@legoupos.cn
地(di)址:深圳市寶(bao)安區(qu)沙井街道(dao)后亭茅(mao)洲山(shan)工業園工業大廈全(quan)至(zhi)科技創新園科創大廈2層(ceng)2A
隨著(zhu)機(ji)器視(shi)覺技(ji)術的(de)快(kuai)速(su)發(fa)展(zhan),傳統很(hen)多(duo)需要人工(gong)(gong)(gong)來手動操作(zuo)的(de)工(gong)(gong)(gong)作(zuo),漸漸地被機(ji)器所(suo)替代。傳統方法(fa)(fa)做目(mu)標(biao)識別大多(duo)都(dou)是(shi)靠人工(gong)(gong)(gong)實(shi)現(xian),從(cong)形狀、顏色、長(chang)度、寬度、長(chang)寬比來確定被識別的(de)目(mu)標(biao)是(shi)否符合標(biao)準,最終定義出(chu)一(yi)系列的(de)規(gui)則(ze)來進行目(mu)標(biao)識別。這樣的(de)方法(fa)(fa)當然在一(yi)些簡單的(de)案例中已(yi)經應(ying)用的(de)很(hen)好(hao),唯一(yi)的(de)缺點是(shi)隨著(zhu)被識別物體的(de)變動,所(suo)有的(de)規(gui)則(ze)和算法(fa)(fa)都(dou)要重(zhong)新設(she)計和開發(fa),即使是(shi)同(tong)(tong)樣的(de)產(chan)品,不(bu)同(tong)(tong)批次的(de)變化都(dou)會造成不(bu)能重(zhong)用的(de)現(xian)實(shi)。
而隨著機器學習,深度學習的發展,很多肉眼很難去直接量化的特征,深度學習可以自動學習這些特征,這就是深度學習帶給我們的優點和前所未有的吸引力。很多特征我們通過傳統算法無法量化,或者說很難去做到的,深度學習可以。特別是在圖像分類、目標識別這些問題上有顯著的提升。
視覺常用的目標識別方法有三種:Blob分析法(BlobAnalysis)、模板匹配法、深度學習法。下面(mian)就三(san)種(zhong)常用(yong)的目標識別方法進行對比。
Blob分析(xi)法(BlobAnalysis)
在計算機視覺中的Blob是指圖像中的具有相似顏色、紋理等特征所組成的一塊連通區域。Blob分析(BlobAnalysis)是對圖像中相同像素的連通域進行分析(該連通域稱為Blob)。其過程就是將圖像進行二值化,分割得到前景和背景,然后進行連通區域檢測,從而得到Blob塊的過程。簡單來說,blob分析就是在一塊“光滑”區域內,將出現“灰度突變”的小區域尋找出來。
舉例來說,假如現在有一塊剛生產出來的玻璃,表面非常光滑,平整。如果這塊玻璃上面沒有瑕疵,那么,我們是檢測不到“灰度突變”的;相反,如果在玻璃生產線上,由于種種原因,造成了玻璃上面有一個凸起的小泡、有一塊黑斑、有一點裂縫,那么,我們就能在這塊玻璃上面檢測到紋理,經二值化(BinaryThresholding)處理后的圖像中色斑可認為是blob。而這些部分,就是生產過程中造成的瑕疵,這個過程,就是Blob分析。
Blob分析工具可以從背景中分離出目標,并可以計算出目標的數量、位置、形狀、方向和大小,還可以提供相關斑點間的拓撲結構。在處理過程中不是對單個像素逐一分析,而是對圖像的行進行操作。圖像(xiang)的(de)每一行都(dou)用游程(cheng)長度編碼(RLE)來表示(shi)相(xiang)鄰的(de)目標范圍。這種算法與基于像(xiang)素的(de)算法相(xiang)比,大(da)大(da)提高了處理(li)的(de)速(su)度。
針對二維目標圖像和高對比度圖像,適用于有無檢測和缺陷檢測這類目標識別應用。常用于二維目標圖像、高對比度圖像、存在/缺席檢測、數值范圍和旋轉不變性需求。顯然,紡織品的瑕疵檢測,玻璃的瑕疵檢測,機械零件表面缺陷檢測,可樂瓶缺陷檢測,藥品膠囊缺陷檢測等很多場合都會用到blob分析。
但另一方面,Blob分析并不適用于以下圖像:1.低對比度圖像;2.必要的圖像特征不能用2個灰度級描述;3.按照模版檢測(圖形檢測需求)。
總(zong)的(de)來說,Blob分析就是檢測圖像的(de)斑點,適用于背景(jing)單一,前景(jing)缺(que)陷(xian)不(bu)區(qu)分類別,識(shi)別精(jing)度(du)要求不(bu)高的(de)場景(jing)。
模板匹配法
模板匹配是一種最原始、最基本的模式識別方法,研究某一特定對象物的圖案位于圖像的什么地方,進而識別對象物,這就是一個匹配問題。它是圖像處理中最基本、最常用的匹配方法。換句話說就是一副已知的需要匹配的小圖像,在一副大圖像中搜尋目標,已知該圖中有要找的目標,且該目標同模板有相同的尺寸、方向和圖像元素,通過統計計算圖像的均值、梯度、距離、方差等特征可以在圖中找到目標,確定其坐標位置。
這就說明,我們要找的模板是圖像里標標準準存在的,這里說的標標準準,就是說,一旦圖像或者模板發生變化,比如旋轉,修改某幾個像素,圖像翻轉等操作之后,我們就無法進行匹配了,這也是這個算法的弊端。
所以(yi)這種匹(pi)配算法,就是在(zai)待檢測(ce)圖像(xiang)上,從左(zuo)到右,從上向下對(dui)模板圖像(xiang)與小東西的(de)圖像(xiang)進行比對(dui)。
在opencv中有cv2.matchTemplate(src,templ,result,match_method)方法可以調用,src是待檢測圖像,templ是模板庫,match_method是匹配的方法。 這種方法相比Blob分析有較好的檢測精度,同時也能區分不同的缺陷類別,這相當于是一種搜索(suo)算法,在(zai)待檢測圖像上根(gen)據不同roi用(yong)(yong)指定的(de)匹配方(fang)法與模(mo)板庫中的(de)所(suo)有(you)圖像進行搜索(suo)匹配,要(yao)求缺(que)陷的(de)形狀(zhuang)、大小、方(fang)法都有(you)較高(gao)的(de)一致性,因此(ci)想要(yao)獲得可用(yong)(yong)的(de)檢測精度需要(yao)構(gou)建較完善的(de)模(mo)板庫。
深度學習法
2014年R-CNN的提出,使得基于CNN的目標檢測算法逐漸成為主流。深度學習的應用,使檢測精度和檢測速度都獲得了改善。
自從AlexNet在比賽中使用卷積神經網絡進而大幅度提高了圖像分類的準確率,便有學者嘗試將深度學習應用到目標類別檢測中。卷積神經網絡不僅能夠提取更高層、表達能力更好的特征,還能在同一個模型中完成對于特征的提取、選擇和分類。
在這方面,主要有兩類主流的算法:
一類是結合RPN網絡的,基于分類的R-CNN系列兩階目標檢測算法(twostage);
另一類則是將目標檢測轉換為回歸問題的一階目標檢測算法(singlestage)。
物(wu)體(ti)檢測的(de)任務是找出(chu)圖(tu)像或視頻中的(de)感興趣物(wu)體(ti),同時檢測出(chu)它們的(de)位置和大小(xiao),是機器視覺領域的(de)核心問題之一。
物(wu)體(ti)檢測(ce)過程中(zhong)有(you)(you)很多不確(que)定因素,如圖像(xiang)中(zhong)物(wu)體(ti)數(shu)量(liang)不確(que)定,物(wu)體(ti)有(you)(you)不同的(de)外觀、形(xing)狀、姿態,加之物(wu)體(ti)成像(xiang)時(shi)會有(you)(you)光照(zhao)、遮擋等因素的(de)干擾,導致檢測(ce)算(suan)法(fa)有(you)(you)一定的(de)難度。進入深(shen)度學習時(shi)代(dai)以來,物(wu)體(ti)檢測(ce)發展(zhan)主(zhu)要集中(zhong)在兩(liang)個方向:twostage算(suan)法(fa)如R-CNN系列和(he)onestage算(suan)法(fa)如YOLO、SSD等。兩(liang)者的(de)主(zhu)要區別(bie)在于twostage算法需要先生成proposal(一個有可能包含待檢物體的預選框),然后進行細粒度的物體檢測。而onestage算法會直接在網絡中提取特征來預測物體分類和位置。
深圳市雙翌光電科技有限公司是一家以機器視覺為技術核心,自主技術研究與應用拓展為導向的高科技企業。公司自成立以來不斷創新,在智能自動化領域研發出視覺對位系統、機械手視覺定位、視覺檢測、圖像處理庫等為核心的20多款自主知識產權產品。涉及自動貼合機、絲印機、曝光機、疊片機、貼片機、智能檢測、智能鐳射等眾多行業領域。雙翌視覺系統最高生產精度可達um級別,圖像處理精準、速度快,將智能自動化制造行業的生產水平提升到一個更高的層次,改進了以往落后的生產流程,得到廣大用戶的認可與肯定。隨著智能自動化生產的普及與發展,雙翌將為廣大生產行業帶來更全面、更精細、更智能化的技術及服務。