前言:一篇好文章的誕生,需要你不斷地搜集資料、整理思路,本站小編為你收集了豐富的計算機視覺的優點主題范文,僅供參考,歡迎閱讀并收藏。
關鍵詞:計算機視覺技術;食品工業;分級;圖像處理
中圖分類號: TS207 文獻標識碼:A
隨著微型個人計算機應用的越來越廣泛,以及計算機在綜合學科中應用的深入研究,現如今在工農業、軍事國防、醫學衛生等眾多領域的使用和研究方面計算機視覺技術都起到了至關重要的作用,為了節省人力、降低成本、減少誤差,該項技術在食品企業、科研院所、檢測機構中的應用更加普遍。如今,在農產品藥物殘留檢測、水果重量分級、等級篩選、質量監管等方面計算機視覺技術有眾多應用。
1 計算機視覺技術概述
計算機視覺技術是利用計算機、攝像機、圖像卡以及相關處理技術來模擬人的視覺,用以識別、感知和認識我們生活的世界[1]。該技術是模擬識別人工智能、心理物理學、圖像處理、計算機科學及神經生物學等多領域的綜合學科。計算機視覺技術用攝像機模擬人眼,用計算機模擬大腦,用計算機程序和算法來模擬人對事物的認識和思考,替代人類完成程序為其設定的工作。該技術由多個相關的圖像處理系統組成,主要包括光源提供系統、圖像提取系統、計算機數據運算系統等。原理是:首先通過攝像機獲得所需要的圖像信息,然后利用信號轉換將獲得的圖像信息轉變為數字圖像以便計算機正確識別[2]。隨著科學技術的發展,計算機技術在各個領域得到廣泛應用,計算機視覺技術不僅在代替人類視覺上取得了重大成就,而且在很多具體工作方便超越了人的視覺功能。計算機視覺計算有如此快速的發展,是因為與人類的視覺相比該技術具有以下顯著優勢[3]。
1.1 自動化程度高
計算機視覺可以實現對農產品的多個外形和內在品質指標進行同時檢測分析,可以進行整體識別、增強對目標識別的準確性。
1.2 實現無損檢測
由于計算機視覺技術對農產品的識別是通過掃描、攝像,而不需要直接接觸,可以減少對所檢測食品的傷害。
1.3 穩定的檢測精度
設計的運行程序確定后,計算機視覺技術的識別功能就會具有統一的識別標準,具有穩定的檢測精度,避免了人工識別和檢測時主觀因素所造成的差異。
2 計算機視覺技術在食品檢測中的應用
20世紀70年代初,學者開始研究計算機視覺技術在食品工業中的應用,近幾十年電子技術得到快速發展,計算機視覺技術也越來越成熟。國內外學者在研究計算機視覺技術在食品工業中的應用方面主要集中在該技術對果蔬的外部形態(如形狀、重量、外觀損傷、色澤等)的識別、內部無損檢測等方面。國內有關計算機視覺技術在食品業中的應用研究起始于90年代,比國外發達國家晚多達20a,但是發展很快。
2.1 計算機視覺技術在果蔬分級中的應用研究
計算機視覺技術在食品檢測中的應用研究相當廣泛,從外部直徑、成熟度的檢測到內部腐爛程度的檢測都有研究。韓偉等[4]采用分割水果的拍攝圖像和新的計算機算法計算水果的半徑,進而得出果蔬的最大直徑。研究表明,該算法不僅降低了計算量而且提高了計算精度,此方法用于水果分級的誤差不超過2mm,高于國際水果分級標準所規定的5mm分類標準差,可在工業生產中很好應用。李慶中[5]也利用圖像的缺陷分割算法研究了計算機視覺技術在蘋果檢測與分級中的應用,結果表明此算法能快速、有效地分割出蘋果的表面缺陷。孫洪勝等[6]以蘋果色澤特征比率的變化規律為理論基礎,結合模糊聚類知識利用計算機視覺技術來檢測蘋果缺陷域,檢測不僅快速而且結果精確。劉禾等[7]通過研究認為蘋果的表面缺陷可以利用計算機視覺技術進行檢測,計算機視覺技術還可以將蘋果按照檢測結果進行分級,把檢測過的蘋果分成裂果、刺傷果、碰傷果和蟲傷果等類別。梨的果梗是否存在是梨類分級的重要特征之一,應義斌等[8]通過計算機視覺技術、圖像處理技術、傅立葉描述子的方法來描述和識別果形以及有無果柄,其識別率達到90%。楊秀坤等[9]綜合運用計算機視覺技術、遺傳算法、多層前饋神經網絡系統,實現了具有精確度高、靈活性強和速度快等優點的蘋果成熟度自動判別。陳育彥等[10]采用半導體激光技術、計算機視覺技術和圖像分析技術相結合的方法檢測蘋果表面的機械損傷和果實內部的腐爛情況,初步驗證了計算機視覺技術檢測蘋果表面的損傷和內部腐爛是可行的。馮斌等[11]通過計算機視覺技術對水果圖像的邊緣進行檢測,然后確定水果的大小用以水果分級。試驗表明,該方法比傳統的檢測方法速度快、準確率高,適用于計算機視覺的實時檢測。朱偉[12]在模糊顏色的基礎上,分析西紅柿損傷部分和完好部分模糊顏色的差別,用分割方法對西紅柿的缺陷進行分割,結果顯示準確率高達96%。曹樂平等[13]人研究了溫州蜜柑的果皮顏色與果實可滴定酸含量以及糖分含量之間的相關性,然而根據相關性,樣品檢測的正確識別率分別只有約74%和67%。劉剛等[14]從垂直和水平兩個方向獲取蘋果的圖像,并通過計算機自動分析圖像數據,對蘋果的外徑、體積、以及圓形度等參數進行處理,與人工檢測相比,計算機視覺技術具有檢測效率高,檢測標準統一性好等優點。Blasco. J [15]通過計算機視覺技術分析柑橘果皮的缺陷,進而對其在線分級,正確率約為95%。趙廣華等[16]人綜合計算機視覺識別系統、輸送轉換系統、輸送翻轉系統、差速勻果系統和分選系統,研制出一款適于實時監測、品質動態的智能分級系統,能夠很好地實現蘋果分級。王江楓等[17]建立了芒果重量與攝影圖像的相互關系,應用計算機視覺技術檢測桂香芒果和紫花芒果的重量和果面損傷,按重量分級其準確率均為92%,按果面損傷分級的準確率分別為76%和80%。
2.2 計算機視覺技術在禽蛋檢測中的應用研究
禽蛋企業在生產過程中,產品的分級、品質檢測主要采用人工方法,不僅需要大量的物力人力,而且存在勞動強度大、人為誤差大、工作效率低等缺點,計算機視覺技術可以很好的解決這類產品工業生產中存在的困擾。歐陽靜怡等[18]利用計算機視覺技術來檢測雞蛋蛋殼裂紋,利用攝像機獲取雞蛋圖像后,采用fisher、同態濾波和BET算法等優化后的圖像處理技術,獲得裂紋形狀并判斷,試驗結果表明,計算機視覺技術對雞蛋蛋殼裂紋的檢測準確率高達98%。汪俊德等[19]以計算機視覺技術為基礎,設計出一套雙黃雞蛋檢測系統。該系統獲取蛋黃指數、蛋黃特征和蛋形尺寸等特征,和設計的數學模型對比來實現雙黃雞蛋的檢測和識別,檢測準確率高達95%。鄭麗敏等[20]人通過高分辨率的數字攝像頭獲取雞蛋圖像,根據圖像特征建立數學模型來預測雞蛋的新鮮度和貯藏期,結果表明,計算機視覺技術對雞蛋的新鮮度、貯藏期進行預測的結果準確率為94%。潘磊慶等[21]通過計算機視覺技術和聲學響應信息技術相結合的方法檢測裂紋雞蛋,其檢測準確率達到98%。Mertens K等[22]人基于計算機視覺技術研發了雞蛋的分級檢測系統,該系統識別帶污漬雞蛋的正確率高達99%。
2.3 計算機視覺技術在檢測食品中微生物含量中的應用研究
計算機技術和圖像處理技術在綜合學科中的應用得到快速發展,在微生物快速檢測中的應用也越來越多,主要是針對微生物微菌落的處理。食品工業中計算機視覺技術在微生物檢測方面的研究和應用以研究單個細胞為主,并在個體細胞的研究上取得了一定的進展。殷涌光等[23]以顏色特征分辨技術為基礎,設計了一套應用計算機視覺技術快速定量檢測食品中大腸桿菌的系統,該系統檢測結果與傳統方法的檢測結果具有很好的相關性,但與傳統方法相比,可以節省5d時間,檢測時間在18h以內,并且能夠有效提高產品品質。Lawless等[24]人等時間段測定培養基上的細胞密度,然后通過計算機技術建立時間和細胞密度之間的動態關聯,利用該關聯可以預測和自動檢測微生物的生長情況,如通過計算機控制自動定量采集檢測對象,然后分析菌落的邊緣形態,根據菌落的邊緣形態計算機可以顯示被檢測菌落的具置,并且根據動態關聯計算機視覺系統可以同時處理多個不同的樣品。郭培源等[25]人對計算機視覺技術用于豬肉的分級進行了研究,結果顯示計算機視覺技術在識別豬肉表面微生物數量上與國標方法檢測的結果顯著相關,該技術可以有效地計算微生物的數量。Bayraktar. B等[26]人采用計算機視覺技術、光散射技術(BARDOT)和模式識別技術相結合的方法來快速檢測李斯特菌,在獲取該菌菌落中的形態特征有對圖像進行分析處理達到對該菌的分類識別。殷涌光等[27]人綜合利用計算機視覺、活體染色、人工神經網絡、圖像處理等技術,用分辨率為520萬像素的數字攝像機拍攝細菌內部的染色效果,并結合新的圖像處理算法,對細菌形態學的8個特征參數進行檢測,檢測結果與傳統檢測結果顯著相關(相關系數R=0.9987),和傳統檢測方法相比該方法具有操作簡單、快速、結果準確、適合現場快速檢測等特點。魯靜[28]和劉侃[29]利用顯微鏡和圖像采集儀器,獲取乳制品的掃描圖像,然后微生物的圖像特征,識別出微生物數量,并以此作為衡量乳制品質量是否達標的依據,并對產品進行分級。
2.4計算機視覺技術在其他食品產業中的應用研究
里紅杰等[30]通過提取貝類和蝦類等海產品的形狀、尺寸、紋理、顏色等外形特征,對照數學模型,采用數字圖像處理技術、計算機識別技術實現了對貝類和蝦類等海產品的無損檢測和自動化分類、分級和質量評估,并通過實例詳細闡述了該技術的實現方法,證實了此項技術的有效性。計算機視覺技術還可以檢驗玉米粒形和玉米種子質量、識別玉米品種和玉米田間雜草[31]。晁德起等[32]通過x射線照射獲取毛葉棗的透視圖像后,運用計算機視覺技術對圖像進行分析評估,毛葉棗可食率的評估結果與運用物理方法測得的結果平均誤差僅為1.47%,因此得出結論:計算機視覺技術可以應用于毛葉棗的自動分級。Gokmen,V等通用對薯片制作過程中圖像像素的變化來研究薯片的褐變率,通過分析特色參數來研究薯片中丙烯酰胺的含量和褐變率也關系,結果顯示兩項參數相關性為0.989,從而可以應用計算機視覺技術來預測加熱食品中丙烯酰胺的含量,該方法可以在加熱食品行業中得到廣泛應用。韓仲志等人拍攝和掃描11類花生籽粒,每類100顆不同等級的花生籽粒的正反面圖像,利用計算機視覺技術對花生內部和外部采集圖像,并通過圖像對其外在品質和內在品質進行分析,并建立相應的數學模型,該技術在對待檢樣品進行分級檢測時的正確率高達92%。另外,郭培源等人以國家標準為依據,通過數字攝像技術獲取豬肉的細菌菌斑面積、脂肪細胞數、顏色特征值以及氨氣等品質指標來實現豬肉新鮮程度的分級辨認。
3 展望
新技術的研究與應用必然伴隨著坎坷,從70年代初計算機視覺技術在食品工業中進行應用開始,就遇到了很多問題。計算機視覺技術在食品工業中的研究及應用主要存在以下幾方面的問題。
3.1 檢測指標有限
計算機視覺技術在檢測食品單一指標或者以一個指標作為分級標準進行分級時具有理想效果,但以同一食品的多個指標共同作為分級標準進行檢測分級,則分級結果誤差較大。例如,Davenel等通過計算機視覺對蘋果的大小、重量、外觀損傷進行分析,但研究結果顯示,系統會把花粵和果梗標記為缺陷,還由于蘋果表面碰壓傷等缺陷情況復雜,造成分級誤差很大,分級正確率只有69%。Nozer等以計算機視覺為主要技術手段,獲取水果的圖像,進而通過分析圖像來確定水果的形狀、大小、顏色和重量,并進行分級,其正確率僅為85.1%。
3.2 兼容性差
計算機視覺技術針對單一種類的果蔬分級檢測效果顯著,但是同一套系統和設備很難用于其他種類的果蔬,甚至同一種類不同品種的農產品也很難公用一套計算機視覺設備。Reyerzwiggelaar等利用計算機視覺檢查杏和桃的損傷程度,發現其檢測桃子的準確率顯著高于杏的。Majumdar.S等利用計算機視覺技術區分不同種類的麥粒,小麥、燕麥、大麥的識別正確率有明顯差異。
3.3 檢測性能受環境制約
現階段的計算機視覺技術和配套的數學模型適用于簡單的環境,在復雜環境下工作時會產生較大的誤差。Plebe等利用計算機視覺技術對果樹上的水果進行識別定位,但研究發現由于光照條件以及周邊環境的影響,水果的識別和定位精度不高,不能滿足實際生產的需要。
綜上所述,可看出國內外學者對計算機視覺技術在食品工業中的應用進行了大量的研究,有些研究從單一方面入手,有些研究綜合了多個學科,在研究和應用的過程中,取得了較大的經濟效益,也遇到了很多問題,在新的形勢下,計算機視覺技術和數碼拍攝、圖像處理、人工神經網絡,數學模型建設、微生物快速計量等高新技術相融合的綜合技術逐漸成為了各個領域學者的研究熱點,以計算機視覺為基礎的綜合技術也將在食品工業中發揮更加重要的作用。
參考文獻
[1] 寧紀鋒,龍滿生,何東健.農業領域中的計算機視覺研究[J].計算機與農業,2001(01):1-3.
[2] 李崢.基于計算機視覺的蔬菜顏色檢測系統研究[D].吉林:吉林大學,2004.
[3] 曾愛群.基于計算機視覺與神經網絡的芒果等級分類研究[D].桂林:桂林工學院,2008.
[4] 韓偉,曾慶山.基于計算機視覺的水果直徑檢測方法的研究[J].中國農機化,2011(05):25-29.
[5] 李慶中.蘋果自動分級中計算機視覺信息快速獲取與處理技術的研究[D].北京:中國農業大學,2000.
[6] 孫洪勝,李宇鵬,王成,等.基于計算機視覺的蘋果在線高效檢測與分級系統[J].儀表技術與傳感器,2011(06):62-65.
[7] 劉禾,汀慰華.水果果形判別人工神經網絡專家系統的研究[J].農業工程學報,1996,12(0l):171-176.
[8] 應義斌,景寒松,馬俊福.用計算機視覺進行黃花梨果梗識別的新方法[J].農業工程學報,1998,14(02):221-225.
[9] 楊秀坤,陳曉光,馬成林,等.用遺傳神經網絡方法進行蘋果顏色白動檢測的研究[J].農業工程學報,1997,13(02):193-176.
[10] 陳育彥,屠康,柴麗月,等.基于激光圖像分析的蘋果表面損傷和內部腐爛檢測[J].農業機械學報,2009,40(07):133-137.
[11] 馮斌,汪憋華.基于計算機視覺的水果大小檢測方法[J].農業機械學報,2003,34(01):73-75.
[12] 朱偉,曹其新.基于模糊彩色聚類方法的西紅柿缺陷分割[J].農業工程學報,2003,19(03):133-136.
[13] 曹樂平,溫芝元,沈陸明.基于色調分形維數的柑橘糖度和有效酸度檢測[J].農業機械學報,2009,41(03):143-148.
[14] 劉剛,王立香,柳兆君.基于計算機視覺的蘋果質量檢測[J].安徽農業科學,2012,40(08):5014-5016.
[15] Blasco J,Aleixos N,Molto puter vision detection of peel defects in citrus by means of a region oriented segmentation algorithm[J].Journal of Food Engineering,2007,81(03):535-543.
[16] 趙廣華,飛,陸奎榮,等.智能化蘋果品質實時分選系統[J].中國科技信息.
[17] 王江楓,羅錫文,洪添勝,等.計算機視覺技術在芒果重量及果面壞損檢測中的應用[J].農業工程學報,1998(12):186-189.
[18] 歐陽靜怡,劉木華.基于計算機視覺的雞蛋裂紋檢測方法研究[J].農機化研究,2012(03):91-93.
[19] 汪俊德,鄭麗敏,徐桂云,等.基于計算機視覺技術的雙黃雞蛋檢測系統研究[J].農機化研究,2012(09):195-199.
[20] 鄭麗敏,楊旭,徐桂云,等.基于計算機視覺的雞蛋新鮮度無損檢測[J].農業工程學報,2009,25(03):335-339.
[21] 潘磊慶,屠康,詹歌,等.基于計算機視覺和聲學響應信息融合的雞蛋裂紋檢測[J].農業工程學報,2010,26(11):332-337.
[22] Mertens K,De Ketelaere B,Kamers B,et al.Dirt detection on brown eggs by means of colorcomputer vision[J]. Poultry Science,2005,84(10):1653-1659.
[23] 殷涌光,丁筠.基于計算機視覺的食品中大腸桿菌快速定量檢測[J].吉林大學學報(工學版),2009,39(02):344-348.
[24] Lawless C,Wilkinson DJ,Young A,et al.Colonyzer: automated quantification of micro-organism growth characteristics on solid agar[J].BMC Bioinformatics,2010(08):38-44.
[25] 郭培源,畢松,袁芳.豬肉新鮮度智能檢測分級系統研究[J].食品科學,2010,31(15):68-72.
[26] Bayraktar B,Banada PP,Hirleman ED,et al.Feature extraction from light-scatter patterns of Listeria colonies for identification and classification [J].Journal of Biomedical Optics,2006,11(03):34- 36.
[27] 殷涌光,丁筠.基于計算機視覺的蔬菜中活菌總數的快速檢測[J].農業工程學報,2009,25(07):249-254.
[28] 魯靜.乳品微生物自動檢測系統的設計[J].湖北第二師范學院學報,2010,27(08):115-117.
[29] 劉侃.鮮奶含菌量快速檢測系統[D].華中科技大學,2008.
[30] 里紅杰,陶學恒,于曉強.計算機視覺技術在海產品質量評估中的應用[J].食品與機械,2012,28(04):154-156.
關鍵詞 智能交通系統;計算機視覺;汽車流量
中圖分類號:TN948 文獻標識碼:A 文章編號:1671-7597(2014)14-0048-01
基于視覺的圖像處理器測量精度高,抗干擾能力強,許多自然及人為的干擾都可以被消除,運用預測技術可以再捕獲瞬間丟失的目標,并且能實現對記憶的跟蹤。它通常安裝在路邊或架空安裝,不會重新鋪設路面,也不會影響埋在地下的水和天然氣管道,更不會干擾交通。 基于視覺的圖像處理有其突出的優點,表現在:可以獲得的目標信息非常巨大,獲取信息的方法也非常方便。
1 研究的實用意義
車輛檢測系統在智能交通系統中具有很重要的地位。機動車輛流量計數與監控為智能控制提供了相當重要的數據來源,通過計算機視覺的機動車流量統計系統可以檢測很多交通參數,便于我們檢測和監控,這些參數中的一個重要參數就是汽車
流量。
基于視頻的檢測法作為最有前途的方法之一,有以下優點。
1)能高效、準確、安全可靠地的監視和控制道路交通,能夠提供高質量高分辨率的圖像信息。
2)用于交通監視和控制的主要設備就是安裝視頻攝像機,現在我國所有城市基本都已經安裝了視頻攝像機,甚至高清視頻攝像機。因為安裝視頻攝像機破壞性非常低、很方便、也很經濟。
3)由計算機視覺得到的交通信息可以通過聯網工作,非常有利于對道路交通網的監視以及控制。
4)由于目前對智能交通系統的安全性、實時性和可靠性的要求都非常高,計算機技術和圖像處理技術的發展顯得極其
重要。
2 研究內容
本研究主要包含兩大部份:一部分就是采用分類和分割方法把采集到的視頻圖像的目標進行識別;另一部分就是通過定位方法來實現目標的跟蹤。這兩部份是缺一不可,緊密聯系在一起的。
首先先介紹視頻圖像的目標識別,視頻圖像目標的識別方法有很多,但總體上主要有兩種方法:一是大家熟悉的相關匹配法,二是特征匹配法。相關匹配法是通過找到最大相關值(最大相關值指的就是當前圖像與參考圖像間的相關系數的大?。┧诘奈恢脕泶_定當前輸入圖像中的目標位置。相關匹配法優點是可以在信噪比很小的條件下工作,對噪聲抑制能力非常強,在計算形式上比較簡單,很容易實現。但它的缺點也很明顯,由于相關匹配法對幾何和灰度畸變十分敏感,反而計算量偏大,造成的直接后果就是非常容易產生累積誤差,而且最關鍵的就是不能充分利用視頻圖像目標的幾何特性,就不能保證對識別目標的跟蹤精度。相關匹配法比較適合于對目標的尺寸變化不大并且場景各部分的相關性不強,當前輸入圖像和參考圖像的產生條件較為一致的場合。特征匹配方法是目前研究較多的一類圖像匹配方法,它是通過目標的特征與輸入圖像中目標的特征來比較辨識目標。它首先提取輸入圖像和參考圖像的相關特征信息,比如邊緣、角點等。然后通過測量距離來比較輸入圖像與參考圖像的特征集合,如果輸入圖像的特征集與參考圖像的特征集距離是最小的(在滿足給定約束條件下),則判定該目標被識別。它對目標的幾何特征、灰度畸變一點都不敏感,但它充分利用了目標圖像的特征信息,因而可以保證較高的跟蹤精度。
上面介紹了視頻圖像目標的識別,現在介紹本研究第二部分:通過定位方法來實現目標的跟蹤。對于圖像目標的跟蹤方法通常有下面幾個方法。
亮度中心法,其實這種方法計算很簡單,只要確定了一個點,就能完成定位。這個點就是一個跟蹤點,它就是具有最高灰度的像素點(來自獲得的視頻目標圖像)或這個點上的一個鄰域。這種方法、性能很穩定、容易實現,工程上運用的很多。但這種跟蹤非常容易受干擾,因為它主要適用于紅外和其他放射性目標的跟蹤。
最佳空間濾波法是常用跟蹤方法之一,它完全是在亮度中心法的基礎上建立起來的,為了提高跟蹤性能,就要把目標的大小、形狀、運動特性等特征都完全利用起來。但目前這類方法也有明顯缺點,在實用性、定位精度上和計算量方面都有較大的限制。
投影、形心法是通過目標的投影或形心來確定目標的實際位置和運動姿態。對比前面兩種跟蹤方法,投影、形心法的優點是計算量非常小,容易通過硬件方式來實現。缺點是它的抗干擾性能力比較差,主要用于均勻背景下跟蹤孤立目標。
從以上對研究內容的介紹,現有的各類識別和定位方法都各有優缺點,要想找到一個合適的方法,都達不到滿意的效果。要想取得較好的性能,都只能在目標尺寸相對對比度變化都不大、對噪聲的干擾又比較小、圖像灰度的空間變化并不明顯的理論環境中。然而實際的環境通常是變化無常的,通過一種方法來實現目標的識別與跟蹤很難有合適的效果。最近幾年,結合這些方法的優點和缺點,混合定位識別的方法確能將上述各類基本的識別方法進行混合定位,使它們能夠合二為一,相互補充。這代表著目標識別方法非常具有理論研究和應用價值,是一個重要發展方向。
3 技術路線
研究的技術路線(如圖1):首先提取出攝像機采集到的視頻,該視頻是以幀為單位的圖片文件形式。然后對圖像數據進行數學上的處理,比如二值化、提取邊緣等。這樣就可以識別汽車的位置進行定位,最后對識別出來的汽車數量通過計數器計數。
4 研究實現
通過基于計算機視覺的研究,我們設計出了能夠實現機動車流量的檢測和計數的系統。并且該系統能夠對運動目標進行識別與跟蹤定位,對出現多目標遮擋和丟失目標,還可以重新匹配。
5 結束語
本文創新之處就是將上述各類基本的識別方法進行混合定位,使它們能夠相互補充。這代表著目標識別方法非常具有理論研究和應用價值,是一個重要發展方向。
參考文獻
[1]章毓晉.圖像工程(第2版)[M].清華大學出版社,2007.
[2]夏文龍.基于計算機視覺的汽車流量檢測研究[D].四川大學,2003.
[3]葛群輝,淺談基于視覺的高速公路車流檢測技術[J].科技資訊,2010(2).
[4]劉萌萌,基于無標度攝像機的車流跟蹤與速度估計算法研究[D].西南交通大學,2005.
計算機視覺的第一步是特征提取,即檢測圖像中的關鍵點并獲取有關這些關鍵點的有意義信息。特征提取過程本身包含4個基本階段:圖像準備、關鍵點檢測、描述符生成和分類。實際上,這個過程會檢查每個像素,以查看是否有特征存在干該像素中。
特征提取算法將圖像描述為指向圖像中的關鍵元素的一組特征向量。本文將回顧一系列的特征檢測算法,在這個過程中,看看一般目標識別和具體特征識別在這些年經歷了怎樣的發展。
早期特征檢測器
Scale Invariant Feature Transform(SIFT)及Good Features To Track(GFTT)是特征提取技術的早期實現。但這些屬于計算密集型算法,涉及到大量的浮點運算,所以它們不適合實時嵌入式平臺。
以SIFT為例,這種高精度的算法,在許多情況下都能產生不錯的結果。它會查找具有子像素精度的特征,但只保留類似于角落的特征。而且,盡管SIFT非常準確,但要實時實現也很復雜,并且通常使用較低的輸入圖像分辨率。
因此,SIFT在目前并不常用,它主要是用作一個參考基準來衡量新算法的質量。因為需要降低計算復雜度,所以最終導致要開發一套更容易實現的新型特征提取算法。
二代算法
Speeded Up Robust Features(SURF)是最早考慮實現效率的特征檢測器之一。它使用不同矩形尺寸中的一系列加法和減法取代了SIFT中浩繁的運算。而且,這些運算容易矢量化,需要的內存較少。
接下來,HOG(Histograms ofOriented Gradients)這種在汽車行業中常用的熱門行人檢測算法可以變動,采用不同的尺度來檢測不同大小的對象,并使用塊之間的重疊量來提高檢測質量,而不增加計算量。它可以利用并行存儲器訪問,而不像傳統存儲系統那樣每次只處理一個查找表,因此根據內存的并行程度加快了查找速度。
然后,ORB(Oriented FASTand Rotated BRIEF)這種用來替代SIFT的高效算法將使用二進制描述符來提取特征。ORB將方向的增加與FAST角點檢測器相結合,并旋轉BRIEF描述符,使其與角方向對齊。二進制描述符與FAST和HarrisCorner等輕量級函數相結合產生了一個計算效率非常高而且相當準確的描述圖。
CNN:嵌入式平臺目標識別的下一個前沿領域
配有攝像頭的智能手機、平板電腦、可穿戴設備、監控系統和汽車系統采用智能視覺功能將這個行業帶到了一個十字路口,需要更先進的算法來實現計算密集型應用,從而提供更能根據周邊環境智能調整的用戶體驗。因此,需要再一次降低計算復雜度來適應這些移動和嵌入式設備中使用的強大算法的嚴苛要求。
不可避免地,對更高精度和更靈活算法的需求會催生出矢量加速深度學習算法,如卷積神經網絡(CNN),用于分類、定位和檢測圖像中的目標。例如,在使用交通標志識別的情況下,基于CNN的算法在識別準確度上勝過目前所有的目標檢測算法。除了質量高之外,CNN與傳統目標檢測算法相比的主要優點是,CNN的自適應能力非常強。它可以在不改變算法代碼的情況下快速地被重新“訓練(tuning)”以適應新的目標。因此,CNN和其他深度學習算法在不久的將來就會成為主流目標檢測方法。
CNN對移動和嵌入式設備有非常苛刻的計算要求。卷積是CNN計算的主要部分。CNN的二維卷積層允許用戶利用重疊卷積,通過對同一輸入同時執行一個或多個過濾器來提高處理效率。所以,對于嵌入式平臺,設計師應該能夠非常高效地執行卷積,以充分利用CNN流。
事實上,CNN嚴格來說并不是一種算法,而是一種實現框架。它允許用戶優化基本構件塊,并建立一個高效的神經網絡檢測應用,因為CNN框架是對每個像素逐一計算,而且逐像素計算是一種要求非常苛刻的運算,所以它需要更多的計算量。
不懈改進視覺處理器
關鍵詞:ARM OPENCV AdaBoost
近年來,功能各異的視頻監控設備越來越多,但是,大多只能簡單記錄視頻畫面,將監控到的視頻信息存儲起來,而不能對所監控到的視頻做一定的處理分析和預測?;贏RM的人臉檢測系統,為我們的視頻監控設備提供了一個視頻處理的參考解決方案,在一定基礎上加以擴充,可以完成人物識別,危險行為檢測與報警等,使視頻監控設備更加智能化。
1、視頻監控的幾項關鍵技術及發展方向
視頻監控的關鍵技術主要有視頻采集壓縮算法、視頻信號可靠地傳輸、信息存儲調用的智能化與系統的集中管理等。視頻監控技術發展方向為分布采集集中管理、高品質圖象壓縮處理、開放標準統一接口、統一認證以確保安全、操作人性化以及功能集成化、結構模塊化和傳輸多樣化。隨著不斷發展的網絡技術,基于嵌入式技術的網絡數字監控系統不再是處理模擬視頻信號,而是把攝像機輸出的模擬視頻信號通過視頻編碼器直接轉換為IP數字信號。
2、平臺的搭建
ARM之所以應用廣泛,是因為有較快得運算速度,較低的價格,開發人員也比較容易接觸,程序較易移植過來等特點。EmbeddedLinux也是Linux家族的成員,支持廣泛的硬件平臺,如PPC、ARM、MIPS等,也繼承了Linux的優點——開源、免費,同時也有廣泛的應用軟件支持,能夠比較方便的移植操作系統與應用軟件。
3、OPENCV簡介
OpenCV是一個開源的計算機視覺庫,采用C/C++語言進行編寫,可以運行在Linux/Windows/Mac等操作系統上,同時還提供了Python、Ruby以及其他語言的接口。其設計目標就是執行速度盡量快,它采用優化的C語言編寫,能夠充分利用多核處理器的優勢。除此之外,另外一個目標就是構建一個簡單易用的計算機視覺框架,開發人員可以利用它更便捷地設計復雜的計算機視覺相關應用程序。其中包含的函數有500多個,覆蓋了計算機視覺的許多應用領域,如工廠產品檢測、醫學成像、信息安全、攝像機標定、立體視覺和機器人等。
4、人臉檢測的原理
人臉檢測技術的研究要追溯到20世紀70年代,早期的研究主要致力于模板匹配、子空間方法、變形模板匹配等,近幾年,集中研究基于數據驅動的學習方法,如統計模型方法,神經網絡學習方法,統計知識理論和支持向量計算方法,基于馬爾可夫[1]隨機域的方法,以及基于膚色的人臉檢測等。目前在實際中應用的人臉檢測方法多為基于Adaboost[2]學習算法的方法。
Viola是AdaBoost算法的一種,主要基于積分圖和級聯檢測器,其方法框架可大至分為以下三大部分:第一部分,使用Harr-like特征來表示人臉,并且使用“積分圖”實現特征數值的快速計算;第二部分,使用Adaboost算法挑選出一些最能代表人臉的矩形特征,用弱分類器按照加權投票的方式,構造為一個強分類器;第三部分,為有效的提高檢測速度,將訓練得到的若干強分類器串聯組成一個級聯結構的層疊分類器。
人臉檢測的目的就是從圖片之中找出所有包含人臉的子窗口,對人臉的子窗口與非人臉的子窗口進行區分。第一步,在一個20*20的圖片中提取出一些簡單的特征(Harr特征),將白色區域內的像素減去黑色區域,因此在人臉與非人臉圖片的相同位置上,有著大小不一樣的數值,這些特征就是區分人臉和非人臉的依據。第二步,使用上萬張切割好的人臉圖片和上萬張背景圖片作為訓練樣本。訓練圖片一般都調到到20*20的大小。在這樣大小的圖片中,可供haar使用的特征數大概有1萬個左右,然后通過機器學習算法也就是Adaboost算法挑選數千個有效的haar特征,用來組成人臉檢測器。第三步,學習算法訓練出一個人臉檢測器后,便可以在各種各樣的場合使用了。使用時,依次縮放圖像比例,最后在縮放后的圖片20*20的子窗口中依次判別是否是人臉。
人臉檢測技術在門禁系統、智能監控系統中已經得到了很好的應用。另外,目前的筆記本電腦登錄時,也陸續使用人臉識別技術作為憑證。同時,人臉檢測算法也在數碼相機和手機中起作用,作為一個新新的功能提供用戶使用。
5、結語
ARM上進行圖像處理以及人臉檢測與識別等是可行的方案,可以減少硬件成本。 采用Linux+Qt4+OpenCv+Arm是一個方案合理、技術成熟、成本低廉、應用廣泛的人臉檢測與圖像處理的解決方案。
參考文獻
關鍵詞:數字圖像技術;應用;發展趨勢
中圖分類號:TP391.41
計算機的特點在于能夠處理各種數據,數字圖像能夠經過增強、復原、分割等處理,隨著計算機技術的不斷發展和進步,現在的數字圖像技術具有圖像處理多樣性、精度高、圖像的再現性好、處理量大的優點,本文主要研究數字圖像處理技術的發展現狀和發展趨勢。
1 數字圖像處理技術研究現狀
所謂圖像處理是指利用計算機來處理圖像的過程,主要是實現改善圖像的視覺效果,研究的內容主要包括圖像數字化、圖像增強、圖像還原以及圖像分割等。數字圖像處理最早來源于20世紀20年代的報紙業,到20世紀50年代,隨著計算機的發展,數字圖像處理技術得到人們的普遍關注,數字圖像處理技術隨著太空計劃得到很大的發展,最具有典型的例子,是對月球照片的處理。
進入到20世紀70年代后,數字圖像處理技術隨著計算機斷層掃面(CT)的出現得到發展,在以后的時間里,數字圖像處理技術不斷有新的研究成果,1975年EWI公司研究的CT裝置獲得諾貝爾獎,目前數字圖像技術已廣泛應用在各行各業中。
2 數字圖像處理技術的應用
數字圖像處理技術目前在各行各業中都得到了很大的進展。在遙感航空航天方面,不少國家都派出了偵查飛機對目標地區進行空中攝影,進而通過圖像處理技術來分析照片,節省了人力、物理,也能夠從圖片中得到其他的有用信息。在20世紀60年代以來,美國以及其他的一些國家發射了資源遙感衛星,由于成像條件非常差,因此圖像本身的質量也不高,需要采取數字圖像處理技術處理,如采用多波段掃描器進行掃描成像,圖像分辨率為30m,這些圖像轉變為數字信號傳送下來,再經過處理。數字圖像處理技術在各國的應用中已非常廣泛,如用在森林調查、災害監測、資源勘查以及城市規劃中。
數字圖像處理技術最早來源于醫藥方面,因此在生物醫學工程方面,數字圖像處理技術也發揮出了巨大作用,除了上文所講述的CT之外,還有一些顯微圖像處理技術,主要是識別紅細胞、白細胞以及染色體分析等,在醫學診治方面X光肺圖像增強、心電圖分析以及超聲波圖像處理技術等發揮出了重要作用。
在通信工程方面,目前通信主要的發展趨勢為綜合性的多媒體通信,也就是將電視、計算機以及電話聯合在一起在數字通信網上傳輸,在傳輸的過程中最為復雜和困難的地方集中在圖像的處理中,比如說,彩色電視信號速率為100Mbit/s以上,想要傳輸出去就需要壓縮信息的比特量,因此技術成敗的關鍵就在于編碼壓縮。目前國家正在大力研發的新的編碼方法,如小波變換圖像壓縮編碼以及自適應圖像網絡編碼等。
在工業和工程方面,主要的應用集中在自動裝置配線中檢測零件的質量、彈性力學照片的應力分析以及郵政信件的自動分檢等,另外在智能機器人中也有應用。在軍事、公安方面,數字圖像處理技術的應用主要集中在導彈的精確制導、偵查照片以及圖像的傳輸和顯示方面,在公安方面,主要應用在鑒別人臉、識別指紋以及圖片復原方面。數字圖像處理技術除了以上所講述的應用領域之外,在電視圖像的編輯、服裝設計、發型設計以及文物資料復原等方面也有廣泛的使用。
3 數字圖像處理技術的發展趨勢
目前數字圖像技術隨著科技的進步得到了很大的發展,隨著低成本硬件相關技術的發展可以想象數字圖像技術將會得到更加廣泛的應用,目前國內的研究成果主要集中在一些診斷、圖像壓縮編碼以及目標識別等方面,但是還沒有廣泛應用在實際生活中。數字圖像處理技術將會向著高分辨率、立體化、超高速以及智能化等方面發展,下面具體講述數字圖像處理技術的發展趨勢。
隨著計算機、人工智能以及思維科學研究的不斷發展,數字圖像處理技術在計算機視覺方面將會進一步的發展,智能機器人的重要感覺器官是視覺,目前研究的開放話題集中在理解和識別三維應力,將會應用在軍事勘察、危險環境作業以及家庭服務等方面,目前人們對于自身的視覺了解的還非常少,因此在計算機視覺方面還需要進一步的探索。
數字圖像處理技術還會向著虛擬現實發展,所謂虛擬現實就是使用計算機構成一個虛擬的三維空間,這項技術的發展是在計算機硬件技術的提高方面提出的,人們應用機器人身上的攝像機能夠真實的感受到所在的環境,進而操縱機器人的行為,另外網上虛擬現實也是未來的一個發展方向。人們在完成社會生產中往往習慣使用自身的認識和工具,將這些掌握在自身手中,因此目前時代的發展趨勢就是將原來二維的東西向著三維發展,如三維重建技術在地圖方面的使用,在軍事方面能夠使用電子沙盤實現任意角度的轉化和計算,也能夠真實的直觀的反應兩點之間的障礙物等,還能夠實現模擬飛行路線,為作戰指揮帶來極大的便利。在計算機中進行三維重建目前的熱點和難點問題主要是計算機視覺研究領域。在圖像壓縮、識別以及分割方面,目前已取得很大的研究進展,目前圖像處理面臨的新的問題主要是圖像專業壓縮算法、圖像識別算法等。
4 結束語
綜上所述,本文先分析了數字圖像處理技術研究現狀和主要的應用領域,進而研究數字圖像技術的發展趨勢。目前數字圖像處理技術已廣泛的應用在生活中,如在網絡、手機等中的應用,數字圖像處理技術的發展與人們的生活息息相關,隨著技術的不斷發展,數字圖像處理技術還會不斷得到進步,這些還需要更多的人努力去研究。
參考文獻:
[1]孔大力,崔洋.數字圖像處理技術的研究現狀與發展方向[J].山東水利職業學院院刊,2012(04):11-14.
[2]陳炳權,劉宏立,孟凡斌.數字圖像處理技術的現狀及其發展方向[J].吉首大學學報(自然科學版),2009(01):63-70.
[3]呂戈靜.淺談數字圖像處理技術的現狀及發展[J].電腦知識與技術,2012(33):8035-8036.
[4]丁可.數字圖像處理技術研究與發展方向[J].經濟研究導刊,2013(18):246+270.
關鍵詞:圖像識別;SURF算法;特征點;魯棒性
中圖分類號:TP391 文獻標志碼:A
圖像識別,是利用計算機對圖像進行處理、分析和理解,以識別各種不同模式的目標和對像的技術。圖像的局部不變特征有著在多種圖像變換(如光照變換,幾何變換等)下的不變性、獨特性、低冗余性以及無需預先對圖像分割等特點,已經被廣泛應用于圖像匹配領域。基于特征不變的方法具有精度高、執行速度快、壓縮信息量和魯棒性好等優點。尺度不變特征轉換(Scale-invariant feature transform,SIFT)算法便是其中的代表,該算法由David Lowe于1999年在ICCV上提出,并于2004年完善總結。SIFT算法匹配能力較強,能提取穩定的特征,可以處理兩幅圖像之間發生平移、旋轉、仿射變換、視角變換和光照變換等情況下的匹配問題,但該算法數據量大,復雜度高,耗時長,同時也存在著特征提取及匹配速度慢,在灰度變化相似的區域容易產生誤匹配的缺陷,限制了該算法的應用。SURF算法是針對SIFT算法的不足而改進的一種有效算法。
1SURF算法描述
快速魯棒特征[1](Speeded-up Robust Features,SURF)是一種高魯棒性的局部特征點檢測器,由Herbert Bay等人于2006年在ECCV上提出的。該算法比SIFT更快更加具有魯棒性,對圖像分辨率、旋轉、尺度縮放、平移和亮度變化等保持不變,而且對仿射變換、噪聲以及視角變化等也能保持一定程度的穩定性。
SURF算法的基本流程主要包括:特征點檢測、特征點描述和特征點匹配三部分。該算法中有三個關鍵技術,分別為:使用積分圖像完成圖像卷積操作,減少了時間計算的復雜度,提高計算速度;采用基于Hessian矩陣的檢測器檢測特征值,其在可重復性和穩定性方面都優于基于HarTis的檢測器;采用Haar小波作為特征描述子,Harr特征速度快,能夠減少計算時間并增加魯棒性。
1.1積分圖像
積分圖像是一種對原始圖像的特征表示方法。對于一幅灰度的圖像,積分圖像中的任意一點(x,y)的值是指從圖像的左上角到這個點所構成的矩形區域內所有的點的灰度值之和[2]。圖1所示填充區域即為點(x,y)的積分值。
1.2尺度空間的建立
圖像的尺度空間是在視覺信息(圖像信息)處理模型中引入一個被視為尺度的參數,通過連續變化尺度參數獲得不同尺度下的視覺處理信息,然后綜合這些信息以深入地挖掘圖像的本質特征。一幅圖像的尺度空間可定義為原始圖像與高斯核的卷積運算,圖像的尺度大小可以用高斯標準差來表示[3]。在計算機視覺領域, 尺度空間被表示為一個圖像金字塔。在SIFT算法中,輸入圖像函數反復與高斯函數的核卷積并反復對其進行二次抽樣,但因為每層圖像依賴于前一層圖像, 并且需要重設圖像尺寸,所以使得運算量較大。SURF算法與SIFT算法在使用金字塔原理上的不同之處在于SURF算法申請增加圖像核的尺寸,允許尺度空間的多層同時被處理,并且不需要對圖像進行二次抽樣, 從而提高了算法性能。同時SURF算法采用了尺度插值和3*3*3的非極值抑制方法以提取尺度不變的特征點。圖2中A圖是運用傳統方式建立的一個圖像金字塔結構,運算會反復使用高斯函數對子層進行平滑處理, 且圖像的尺寸是變化的。B圖的SURF算法保持原始圖像不變而只是改變濾波器的大小。
1.3Hessian特征檢測
2算法實現
根據SURF算法的基本原理,設計算法的實現過程。首先通過視頻采集設備獲取模板圖像,并對其建立積分圖像和構建尺度空間結構,再通過視頻采集設備捕捉當前視頻幀,然后檢測出模板圖像及當前視頻幀的特征點, 并保存每個特征點各項特性的描述信息,最后比較模板圖像與當前幀圖像特征點的描述子信息進行圖像匹配。
3OpenCV技術
OpenCV(Open Source Computer Vision Library)[5]于1999年由Intel建立,是一個基于(開源)發行的跨平臺計算機視覺庫,可以運行在Linux、Windows和Mac OS操作系統上。OpenCV輕量級而且高效,由一系列C函數和少量C++類構成, 實現了計算機視覺,圖像處理和模式識別等方面的很多通用算法。
OpenCV為Intel公司的Integrated Performance Primitives(IPP)提供了透明接口,這意味著如果有為Intel處理器優化的IPP庫,OpenCV將在運行時自動加載這些庫。OpenCV致力于真實世界的實時應用,通過優化的C代碼的編寫對其執行速度帶來了可觀的提升,編寫程序過程中調用OpenCV的基礎函數庫, 即可完成十分復雜的開發任務, 極大的提高開發效率。
3.1OpenCV的特點
1) 跨平臺,Windows,Linux,Mac OS;
2) 免費,開源;
3) 代碼經過優化,可用于實時處理圖像;
4) 統一的結構和功能定義;
5) 強大的矩陣運算和圖像處理能力;
6) 具有底層和高層的應用開發包;
7) 用戶接口方便靈活。
3.2OpenCV的功能
1) 對圖像數據的操作,包括分配、釋放、復制和轉換數據。
2) 具有對矩陣和向量的操作以及線性代數的算法程序,包括矩陣、解方程,特征值以及奇異值。
3) 具有基本的數字圖像處理能力,如可進行濾波、邊緣檢測、角點檢測、采樣與差值、色彩轉換、形態操作、直方圖和圖像金字塔等操作。
4) 對運動的分析,如對光流、運動分割和跟蹤的分析。
5) 對目標的識別,可采用特征法和隱馬爾科夫模型(HMM)法。
6) 具有基本的GUI功能,包括圖像與視頻顯示、鍵盤和鼠標事件處理及滾動條等。
3.3OpenCV模塊
1) CV核心函數庫,實現圖像處理,結構分析,運動分析,對象識別,攝像機標定和3D重構等功能。
2) CVAUX輔助函數庫,實現通過立體視覺來實現的動作識別,基于輪廓線的形狀匹配,模式識別,紋理描述等功能。
3) CXCORE數據結構與線性代數庫,實現數據變換,矩陣運算等功能。
4) HIGHGUI圖像界面函數庫,實現圖像獲取,用戶界面設計等功能。
5) ML機器學習函數庫,包括模式分類和回歸分析等。
4Android上的系統實現
Android是基于Linux開放性內核的操作系統,是Google公司在2007年l1月5日公布的手機操作系統。Android采用軟件堆層的架構,主要分三部分:底層以Linux核心為基礎,提供基本功能;中間層包括函數庫和虛擬機;最上層是各種應用軟件。Android應用程序用Java語言編寫。每個應用程序都擁有一個獨立的Dalvik虛擬機實例,這個實例駐留在一個由Linux內核管理的進程中[6]。
在Android系統上使用OpenCV來實現該系統,需利用JNI編寫相應的本地代碼組件并通過Android NDK工具集將其嵌入到Android應用程序中。首先,利用Android應用程序框架編寫相應的Java代碼;然后通過JNI與OpenCV提供的函數編寫本地C/C++代碼,并使用Android NDK將本地代碼文件編譯生成可由Java代碼調用的共享庫(動態鏈接庫),最后通過SDK生成完整的Android應用程序[7]。
4.1JNI
JNI(Java Native Interface),即JAVA本地調用。它允許Java代碼和其他語言編寫的代碼進行交互。
5結論
本文提出了一種基于SURF算法的圖像識別方法,并運用此方法實現了一套基于Android平臺的圖像識別系統。由于系統需要進行大量的圖像處理運算, 因此通過使用Android NDK調用OpenCV圖像處理函數庫以提高編程效率,。系統通過手機攝像頭提取視頻幀, 并使用SURF算法對其進行快速魯棒特征檢測。實驗結果表明, 該方法復雜度低、實時性好并且具有良好的魯棒性,將系統用于移動設備圖像識別加密,以及視頻監控等方面,會使其擁有更好的識別效率和可靠性。
參考文獻:
[1]彭欣,劉富強,宋華軍.基于SURF目標跟蹤算法研究[J].長春理工大學學報, 2011,34(2):138-141.
[2]徐秀云.基于特征點的景象匹配技術研究[D].南京:南京理工大學,2009:1-68.
[3]高健, 黃心漢, 彭剛,等. 一種簡化的SIFT圖像特征點提取算法[J].計算機應用研究,2008,25(7):2 213-2 215.
[4]VASILEIOS K,CHRISTOPHOROS NIKOU,ARISTIDIS LIKAS.Visual Tracking by Adaptive Kalman Filtering and Mean Shift[J].Springer-Verlag Berlin Heidelberg,2010,6040:153-162.
[5]黎松,平西定,丁益洪.開放源代碼的計算機視覺類庫OpenCV的應用[J].計算機應用與技術,2005,22(8):134-136.
[6]韓超,梁泉.Android系統原理及開發要點詳解[M]北京:電子工業出版社,2010:70-93.
[7]韓露.一種Java與OpenCV結合實現的目標檢測模塊[J].計算機應用,2008(3):773-775.
[8]HUIYU ZHOU,YUAN YUAN,CHUNMEI SHI.Object tracking using SIFT features and mean shift[J]. Computer Vision and Image Understanding,2009,113:345-352.
[9]HERBERT BAY, ANDREAS ESS, TINNE TUYTELAARS,et al.Speeded-Up Robust Features(SURF)[J].Preprint submitted to Elsevier,2008:233-245.
[10]TA D N CHEN,W C GELFAND,N PULLI K.SURFTrac:Efficient Tracking and Continuous Object Recognition using Local Feature Descriptors[C]//Coumputer Vision and Pattern Recognition(CVPR'09),2009:2 937-2 943.
[11]紀華,吳元昊,孫宏海,等.結合全局信息的SIFT特征匹配算法[J].光學精密工程,2009,17(2):439-444.
[12]CHAVES A,GUSTAFUSON D.Vision——Based Obstacle Avoidance Using SIFT Features[C]//Proceedings of the 5th International Symposium on Advances in Visual Computing.2009:550-557.
[13]公磊,周聰.基于Android的移動終端應用程序開發與研究[J].計算機與現代化,2008(8):85-89.
本文深入地分析了當前實施人臉檢測技術的可行性,并對本方案實施的優勢進行了概括。
【關鍵詞】人臉檢測技術 計算機技術 識別技術
1 人臉檢測的前景
人臉檢測作為近年來生物識別領域的一個熱門研究方向,具有操作方便,用戶易于接受,事后追蹤能力強等優點。但是因為人臉檢測與識別運行的過程往往需要大量的運算,并且其算法并不簡單,因此目前大部分人臉檢測與識別系統的設計與開發都需要立足于計算機技術。下面筆者將會對以計算機平臺為基礎的人臉檢測的實現過程展開詳細的論述與分析。
2 相關技術研究現狀
2.1 人臉圖像的獲取與預處理
一般情況下,攝像頭負責對人臉圖像的攝取,除此之外,專門的圖像庫也是人臉圖像的來源之一。前者多應用于系統的應用階段,一般來說,它不僅僅可以作為應用系統存在,也可以作為研究系統存在;而后者多應用于研究階段,并且它只能作為研究系統存在,是基于標準人臉圖像庫而存在的。
獲得需要的圖像之后,接下來就要對圖像進行預處理,這一環節對于人臉檢測與識別系統的應用來說,是非常關鍵的。在獲取圖像的過程中,會受到外部復雜環境的影響,例如燈光亮度、配套設施好壞、噪聲干擾、對比不明顯等等。并且,由于距離與焦距存在的差異,導致無法確定人臉所處的具置。因此,圖像預處理這一環節是必不可少的,有了這一環節才能確保圖像上人臉所處位置與大小比較恰當。人臉扶正、人臉圖像增強及其幾何歸一化和灰度歸一化等都是圖像預處理環節主要的工作內容。而圖像變換增強、直方圖均衡法、非線性平滑濾波、圖像的歸一化等則是圖像預處理過程之中所運用的主要方法。
2.2 人臉檢測技術
人臉識別是否能夠具有較好的識別性能,取決于人臉檢測的性能水平的高低,因此可以說,人臉檢測是人臉識別得以實現的前提條件。借助人臉檢測算法技術,檢查并測驗靜態圖像(動態視頻幀),從而準確的對此圖像(視頻)進行判斷,從而知道此圖像是否具有人臉圖像,假若判斷此圖像具有人臉圖像,則需要明確其所處區域及圖像數值大小,這就是人臉檢測。高效率與檢測精準是用戶對人臉檢測的一個普遍性評價,現如今這項技術已經獲得了用戶的認可,專家學者也對其展開了更深入的分析研究。
人臉圖像所囊概的特征是非常豐富的,例如膚色、人的輪廓、結構等特征都是極具代表性的,此外其系列圖像往往還會涉及到一些其他信息,例如運動狀態等。基于這些特征信息,研究者設計了許多人臉識別的檢測算法,按照這些方法的思想策略大致可將人臉檢測方法分為4類:基于知識的方法、基于模塊匹配的方法、基于外觀形狀的方法和基于特征的方法。
2.3 人臉識別技術
借助對相應的人臉識別算法的運用,辨別出圖像上的人臉的身份信息,第一步是對圖像進行搜索,從而找出圖像上的人臉目標,然后識別人臉目標體的身份信息,這就是人臉識別。
以人臉識別技術的發展狀況作為劃分的依據,研究工作往往將人臉識別技術劃分為四種類別,分別為:其一是幾何特征為基礎的;其二是以統計特征為基礎的;其三是以機器靴子為基礎的;其四是以局部模式為基礎的;
3 選擇的硬件平臺
3.1 圖像輸入
人臉圖像的輸入部分可以是普通的USB攝像機、網絡攝像機等,也可以將已經拍攝好的圖像存儲在硬盤等存儲設備。因此其應用往往不會受限于特定的場所。
如果攝像機選擇的性能比較差一些,會增加后面算法的復雜度;此外還會對人臉檢測與識別的最終效果造成一定的影響;為了提高系統的性能,所以應該選擇性能比較好,產生的相片噪聲比較小的相機。
3.2 中央處理
本方案中的中央處理部分選取的是計算機的CPU;因為現在CPU的功能強大,再加上良好的微軟系統,使得系統的性能大大的提升。
作為系統的中心處理部分,應該選擇一臺專門的服務器來處理圖像的檢測和識別。這是由于圖像往往需要占據大量的內存,在實施算法的過程之中會耗用較多的資源。
4 檢測系統的組成
4.1 計算機視覺庫OpenCV的介紹
Open CV是計算機視覺庫,它是跨平臺的,并且以(開源)發行為基礎,能夠在很多操作系統上運用,例如Linux、Windows、Mac OS,其具有的C函數跨平臺的中、高層API高達五百個。由于其有著豐富的視覺處理算法,因此在數字圖像處理領域之中的運用非常普遍,例如物體、人體、人臉等的識別。本文后面分析工作的開展都是以Open CV計算機視覺庫為基礎的。
4.2 人臉圖像采集模塊
原始的人臉圖像一般是在用戶注冊時采集的,一般會在幾副到十幾幅之間, 且采集到的這些人臉圖像需包含該人臉的不同的表情和多種姿態。人臉采集是人臉檢測的第一個步驟,筆者在前文現狀分析的基礎上,為使人臉檢測更加精確,結合了人眼與人臉檢測兩種技術。成功獲取人臉圖像后將會步入圖像預處理這一步驟,相應的工作內容不再贅述。
當然進行人臉識別時的圖像采集工作也是由此模塊來完成,采集完需要進行歸一化、圖像均衡、灰度化、直方圖增強等預處理,之后根據當前處于訓練階段還是識別階段將其送入人臉特征提取模塊。
4.3 人臉特征提取模塊
這一模塊的主要工作是提取人臉圖片的特征,隨后開展降維處理,最終在數據庫之中錄入該特征,方便人臉圖像識別模塊對圖像的識別。在前文人臉識別技術研究現狀分析的基礎上,筆者認為此模塊工作的開展,首先可以采取人臉區域先分塊再提取特征的方法。
4.4 人臉圖像識別模塊
人臉識別系統的好壞很大程度上取決于人臉識別的設計水平與其所挑選的計算方法,因此可以說,人臉識別系統的關鍵在于人臉識別。現如今,以小波分析為基礎、以視覺聯想為基礎、以人臉表情為基礎的人臉識別技術是運用最普遍的。因此,本文的關鍵點就在于此,要查閱相關資料,從而挑選出最恰當的算法。
5 結論
我們以OpenCV和計算機為平臺,對人臉圖像的預處理、人臉圖像的特征提取和人臉圖像的識別算法進行仿真分析和優化。這樣,我們就可以充分利用人臉識別現有的算法,并進行優化,來實現快速高效的檢測和識別系統。
參考文獻
[1]朱文佳,戚飛虎.快速人臉檢測與特征定位 [J].中國圖像圖形學報,2005,10(11):1455-1458.
[2]王志良,孟秀艷.人臉工程學[M].北京:機械工業出版社,2008.
作者簡介
宋家慧(1978-),女,山東省蒼山縣人。大學本科學歷?,F為廣西機電職業技術學院講師。研究方向為計算機應用、數據庫應用和數據挖掘。
關鍵詞:運動目標跟蹤;生成方法;圖像感知哈希;OPENCV
中圖分類號:TP392 文獻標識碼:A 文章編號:1009-3044(2016)14-0179-03
隨著計算機信息技術的發展,計算機視覺已經成為研究熱點之一,運動目標跟蹤更是計算機視覺領域的熱門課題。如今運動目標跟蹤技術已經廣泛用于監控、交通、軍事、醫療的等領域。視頻是一幀一幀連續播放的圖像序列,目標跟蹤是指從視頻的某一幀開始,通過目標檢測方法找到到運動目標或者人工指定跟蹤目標,在之后的連續圖像序列中持續對目標進行識別和跟蹤。
目標跟蹤方法通常分為判別方法和生成方法兩種。判別方法把跟蹤看成一個二分類的問題:以目標物體作為正樣本,背景作為負樣本,通過訓練分類器可以把目標從背景中分離出來,從而實現對目標的跟蹤。目前很多判別方法提出,其中STRUCK是判別方法中最杰出的[2],但是此方法需要大量的計算,速度較慢,并不能滿足實時跟蹤的需求。生成方法首先學習外觀模型來表示目標,然后在搜索區域的候選模型中選擇出與目標模型誤差最小的一個作為跟蹤結果。生成方法最早可以追溯到Lucas和Kanade提出的基于原始圖像的整體模板法,即LK方法。僅僅使用原始圖像作為模板,不能很好地提取目標外觀特征,適應目標外觀變化,且需要的計算量較大。Hager和Belhumeur 等人改進了LK方法,對原始圖像進行降維,使用對光照不敏感的低維特征作為目標外觀的表示。在此基礎上,Black和Jepson又提出了使用一定的學習策略進行模型更新,從而更好的處理目標外觀的變化。此時生成跟蹤方法的框架已經形成。隨后很多模型的不同特征被用于跟蹤。如Comaniciu人等結合顏色直方圖和數學上的均值偏移方法,提出了meanshift方法。Collins 拓展了可自適應尺度變換的改進方法camshift。為了更好的處理遮擋和提升實時性能,局部稀疏表示(PCA、稀疏編碼等)和多種特征的聯合表示也被用于目標跟蹤。[1][2]
跟蹤的過程中會出現眾多的干擾因素影響跟蹤的性能,如尺度變換,光照變化,偏移,遮擋等問題。處理這些因素的關鍵在于構造有效且魯棒的外觀表示模型。文獻[1]證明了模型表示的選擇對于跟蹤性能的影響最大。于是近些年來,跟蹤問題更多的焦點集中在尋找有效的表示模型上。本文提出了一個有效的生成方法,使用圖像感知哈希作為模型表示進行跟蹤,
具有尺度不變性和運算速度快的優點,并且引入了模型更新策略,從而解決了目標跟蹤中出現的偏移、遮擋問題。
1圖像感知哈希
感知哈希是指將具有相同感知內容的多媒體信息映射為一段數字摘要,用來對媒體信息進行比對。圖像感知哈希則是對數字圖像的感知信息進行摘要。傳統的哈希技術僅僅簡單地把圖片看作一個二進制文件進行處理,而沒有考慮到圖像上的感知信息。隨著網絡上有損壓縮格式的使用,傳統的哈希算法如MD5、SHA1等方式不再適用于圖片的匹配,于是提出了圖像感知哈希技術,利用的圖片的感知特征作為摘要信息來進行圖像的識別和認證[4]。
在MD5、SHA1這樣的加密哈希方法中,得到的哈希值僅僅是一段固定長度的二進制數字,和其本身的內容沒有關系。單向性和抗碰撞性要求它對輸入的二進制數據的比特變化敏感,也就是說,即使輸入數據一位的比特變化,也會導致輸出哈希值的明顯的隨機變化。
對于數字圖像而言,圖像數據格式的變化,普通的圖像潤飾或者加工操作,圖像通信的信道噪聲等在劇烈改變圖像二進制數據的同時,一般都只會影響圖像呈現信息的質量,而不會改變其內容。因此大部分感知哈希算法都具有共同的基本特性:圖像可以放大縮小,可以有不同的方向、角度,甚至可以有細微的顏色差別,其哈希值都應該保持不變或者在一個指定的閾值內變化。而以上的特性也正好適用于目標跟蹤中用來匹配目標。
2提出的算法
近些年來,已經有很多不同的圖像感知哈希算法提出[5]。其中包含很多復雜的甚至可以加密的方法,但是經測試,即使將很簡單的感知哈希算法作為特征使用到跟蹤中,也能起到很好的效果。
2.1模型表示
本文中采取的感知哈希作為跟蹤目標的模型表示,計算方法如下:
1)將原圖像轉化為灰度圖,灰度圖就可以很好的保存圖像輪廓和細節,減少計算量,提高速度。
2)縮小圖像尺寸,把原大小轉化為8*8的方形圖像。縮小尺寸可以大幅度減少圖像的高頻信息,保留低頻信息。低頻信息反映了圖像的整體框架,具有對放大、縮小、平移、模糊的不變性,這也是圖像哈??梢宰鳛槟繕烁櫰ヅ涮卣鞯年P鍵原因。
3)計算所有像素灰度的平均值,用于和每個像素比較。
4)將所有的像素值與平均值進行對比,大于等于平均值記為1,小于平均值記為0。
5)把這64個2進制位由在原圖像從左到右從上到下的順序排列,形成哈希值。
以Lena圖為例,計算圖像感知哈希的步驟如圖1所示:
2.2 運動模型和觀察模型
跟蹤算法使用圖像感知哈希作為模型特征,以兩個哈希值之間的漢明距離作為評判相似度的標準(觀察模型)。漢明距離表示哈希值中對應位置二進制位不同的個數,漢明距離越大,說明圖像越不相似,反之則越相似。
漢明距離的計算:d(x,y)=∑x[i]y[i],如下所示。
由[1]我們得知,在選取合適特征情況下,即便是用很簡單的跟蹤框架也能夠實現很好的跟蹤效果。本系統在第一幀使用人工標注的方法圈定要跟蹤的目標,之后的每一幀使用滑動窗口作為運動模型搜尋目標:在當前目標2*2的范圍內尋找目標,使用漢明距離作為觀察模型來從候選的模型中選取最接近目標的一個。如圖2。
2.3偏移問題
在模型更新的過程中,由于誤差積累,會導致跟蹤結果偏移。對于此問題,本算法采取使用第一幀和上一幀的權重共同跟蹤的方法,第t幀的模型M(t)=αM(0)+(1-α)M(t-1),其中α表示第一幀中目標模型所占的權重。隨著時間變化,第一幀的權重應逐漸減小。本方法中取α=1/(1+t)。
2.4 遮擋問題
當模型被遮擋時,如果繼續更新,會導致更新到覆蓋物更新到了錯誤的模型。所以本方法中的模型更新針對遮擋也提出了解決方法。d(h)表示漢明距離,當0
2.5算法流程
1)在視頻的某一幀使用鼠標拖拽圈定要跟蹤的目標,作為模型T,大小為p*q,左上角像素的位置為(m,n)。
2)計算選中窗口區域的感知哈希值H(T)。
3)下一幀F中使用在當前位置的2*2大小的窗口中滑動,計算每個大小為p*q的子窗口Fi,j的哈希值H(Fi,j)。i,j為子窗口Fi,j 左上角的像素在F圖中的坐標,稱為參考點。i,j的取值范圍:m-p/2
4)比較搜索窗口和模型窗口的哈希值的漢明距離D(H(T),H(Fi,j)),選取所有子窗口中漢明距離最小的子窗口作為跟蹤結果。
5)根據提出的模型更新機制決定是否將跟蹤結果Fi,j作為下一幀的跟蹤模型T,重復步驟2到步驟5。
3 基于Opencv的系統實現及仿真實驗
Opencv是一個開源的數字圖像處理和計算機視覺的函數庫,實現了圖形圖像處理和計算機視覺方面的很多通用算法,方便開發人員將注意力集中于算法的實現而不需要自己寫一些底層操作代碼,避免造成時間和精力上的浪費。
Opencv提供了數組、序列、矩陣、樹等基本結構,也包含了差分方程求解、傅里葉分析、積分運算、特殊函數等眾多高級數學計算函數,以及各種圖像處理操作和目標跟蹤、攝像機校準、三維重建等高級視覺函數。本設計中的基本功能如讀取視頻,鼠標選取操作,縮放圖像,彩色圖像轉化為灰度圖像等基本功能都由opencv提供的函數實現。
本設計基于windows10+visual studio 2013+opencv2.4.11環境,實現了在固定的背景的情況下進行穩健的目標跟蹤,具有尺度不變性和光照不變性,達到不需要預先訓練的每秒30幀以上的實時跟蹤效果。圖3為程序在第82、269、550、736幀跟蹤到的結果。
4 結論
實驗結果表明,在目標跟蹤中引入圖像匹配中的感知哈希方法作為跟蹤特征,有較快的運行速度、準確度和魯棒性,可以作為一種良好的特征用于目標跟蹤。雖然與Object Tracking Benchmark[2]中排名靠前的算法相比,本設計仍然有差距,但是提出了一種將圖像感知哈希引入跟蹤的概念。近些年來還不斷有新的感知哈希算法提出,不乏兼具尺度不變性,旋轉不變性等良好特性的感知哈希算法,試想將這些方法用于運動目標跟蹤,會具有更好的跟蹤效果,可作為目標跟蹤發展的下一步研究方向。
參考文獻:
[1] N Wang, J Shi, DY Yeung, J Jia. Understanding and Diagnosing Visual Tracking Systems[C].International Journal of Computer Vision, 2015.
[2] Wu Y, Lim J, Yang M H. Object Tracking Benchmark[J]. Pattern Analysis & Machine Intelligence IEEE Transactions on, 2015.
[3] 徐光柱,雷幫軍.實用性目標檢測與跟蹤算法原理及應用[M].北京,國防工業出版社, 2015.
[4] Schneider M, Shih-Fu Chang. A Robust Content based Digital Dignature for Image Authentication[C]. Proc of IEEE International Conference on Image Processing, Lausanne, 1996.
【關鍵詞】計算機技術 殘障人士 影響 發展
一 計算機技術帶給殘障人士生活上的影響
(1)對殘障人士基本生活保障
隨著計算機技術的不斷發展,計算機已經進入社會生活的各個領域,它已經和人們的生活息息相關。它不僅能通過計算機技術來提高工作效率、獲取需要的知識以及進行娛樂。與此同時,處于弱勢的殘疾人群體,也可以通過計算機與外界溝通、交流并獲取自己所需知識。一般情況下,殘疾人因為行動不便,或者由于語言上的障礙不能正常的外界交流,常失去和其他人公平競爭的機會,這致使很多殘疾人的生活得不到保障。但是,計算機技術的發展則使他們得到了學習知識的機會,通過計算機獲取相應的知識,以此來提升自身的能力,使自己的基本生活得到保障。
(2)對殘障人士學習的保障
通過計算機,殘疾人可以不用行動或通過交談就可以完成工作,他們也可以通過計算機來獲取知識從而增加自身的知識儲備量。殘疾人在“聽”、“說”、“看”、“做”等方面有著不同的缺陷,但利用計算機技術可以彌補他們的缺陷方面。如人機交互技術:隨著語音識別和計算機視覺技術的發展,人機交互技術成為殘障人士克服各種障礙的重要工具。在一些殘疾人聯合會,負責人通過組織肢體殘疾者學習電腦操作技術,使他們可以借助高科技手段,真正的融入社會中去。殘疾人借助計算機的幫助可以使自己更加靈活的進行工作。
(3)對殘障人士疾病輔助的保障
計算機具有速度快、精度高、可靠性高的優點, 通過計算機技術我們可以設計出有利于殘疾人生活的工具。在以前,輪椅要通過手來搖動或者人推動才能移動,而現在通過在輪椅上安裝微型的計算機,就可以通過語音或者預設來實現移動。在這方面大大提高了殘疾人出行不便的問題。社會上的一些患有先天性聾啞的兒童,通過對他們進行康復訓練,糾正他們的發音,每天記錄他們的學習情況,把記錄錄入到計算機中,然后通過一些分析軟件來進行分析,分析出他們每天的進步情況,以便為他們制定出更好的康復計劃。計算機給殘疾人的生活帶來各種便利,提高了他們各方面的效率,通過計算機網絡的鏈接,使殘疾人與社會更加的貼近,在一定的程度上擴大了他們的生存空間。
二 計算機技術在殘障設施上的發展
(1)計算機技術在“聽、看”方面的發展
隨著計算機技術的發展,讓盲人閱讀漢字已經成為可能。通過掃描把文字用聲音的方式輸出,盲人最終也可以通過計算機技術來閱讀文字。如今有聽力障礙的殘疾人有的會佩戴上人工耳蝸,人工耳蝸它是一種電子裝置,能夠幫助耳聾患者重新恢復聽力。它的原理就是代替了已經病變受損的聽覺器官,把聲音通過電信號傳遞給內耳耳蝸,刺激分布在那里的聽覺神經,然后大腦就形成了聽覺。而人工眼是使盲人能夠看得見的一個現代化的科技產品,他通過電子設備把景物拍攝下來,然后傳送給人的相關神經。這些技術的出現使得殘障人士的生活方式、交往方式以及思維方式都發生了很大的改變,可見,計算機技術的發展對輔助殘障人士設施的發展產生了深遠的影響。
(2)自然人機交互技術領域的發展
伴隨著計算機技術的發展,人機交互技術也取得了部分的成就,目前,自然人機交互技術的飛速發展給殘疾人帶來了很大的方便。近期自然人機交互主要研究及進展有筆式交互、語音交互、基于計算機視覺技術的人機交互、基于傳感器的交互。腦電波交互、手臂機交互等比較前沿的人機交互研究也正在開展。像肌電、腦電技術的開展將讓肢體有障礙的人士行動自如。20世紀70年代我國的肌電假肢得到了很好的發展,現在此技術已經得到廣泛的應用。高位截肢患者的肌肉雖然已經被截去,但其控制運動的神經系統還依然存在。但神經移植術[2]為解決這一問題開辟了途徑,這種技術就是利用肌的信號控制多自由度假肢。還有手語識別和合成將會使有聽覺障礙的患者“說話”。手語識別即是指通過計算機采集設備獲得聾啞人手語數據,采用模式識別算法,結合上下文知識,獲知手語含義,進而翻譯成語音,傳達給不懂手語的正常人。而手語合成則是一個和上述過程相反的過程,即是正常人通過語音表達,然后計算機將語音翻譯成手語并表現出來,向有聽覺障礙的患者傳遞信息。這樣,有聽覺障礙的人就可以“聽見”聲音了。自然語言理解始終是人機交互的最重要目標,雖然目前在語言模型、語料庫、受限領域應用等方面均有進展,但由于它的難度,自然語言理解仍是科學家和語言學家的一個長期研究目標。
三、結論
綜上所述,計算機技術是一個融匯技術,經濟,法律和社會工作的一門學科,從它身上不僅僅能看出對社會有巨大的價值,還能看到對殘疾人的巨大幫助。然而我國在計算機輔助殘疾人技術的開發設計與利用服務方面還十分的落后,需要培養大量的的輔助技術領域的引領者,策劃者與服務者,以推動各種高品質的輔助技術產品的開發和輔助技術服務的發展;需要通過發展高等輔助技術教育培養高層次研究人員,以總結,完善和發展該學科的理論與技術,發展輔助技術高等教育對支持殘疾人獨立生活,促使他們向生產性社會成員方面發展,開發新的潛在市場,有重大意義。我們要通過實驗來培養實際的工作能力、合作精神以及嚴謹的工作態度,這樣我們才會使我國的計算機技術繼續進步,那樣才會更大幅度的改善殘疾人的生活水平,殘疾人才會擁有更加美好的未來。計算機技術的發展,給殘疾人帶來了本質的改變,讓他們能夠更有效的使用計算機,改善了他們的生活狀況。我們相信,隨著計算機技術的不斷發展與完善,它將能為殘疾人帶來更多的便利與幫助。
參考文獻: