日韩精品高清自在线,国产女人18毛片水真多1,欧美成人区,国产毛片片精品天天看视频,a毛片在线免费观看,午夜国产理论,国产成人一区免费观看,91网址在线播放
公務員期刊網 精選范文 計算機視覺感知技術范文

計算機視覺感知技術精選(九篇)

前言:一篇好文章的誕生,需要你不斷地搜集資料、整理思路,本站小編為你收集了豐富的計算機視覺感知技術主題范文,僅供參考,歡迎閱讀并收藏。

計算機視覺感知技術

第1篇:計算機視覺感知技術范文

1計算機視覺的概述及基本體系結構

1.1計算機視覺概述

通過使用計算機和相關設備,對生物視覺進行模擬的方式,就是計算機視覺。對采集到的圖片或視頻進行相應的技術處理,從而獲得相應的三維信息場景,是計算機視覺的主要任務。計算機視覺是一門學問,它就如何通過計算機和照相機的運用,使人們獲得被拍攝對象的數據與信息所需等問題進行研究。簡單的說,就是讓計算機通過人們給其安裝上的“大腦”和“眼睛”,對周圍環境進行感知。計算機視覺是一門綜合性學科,在各個領域都有所作為,已經吸引了各個領域的研究者對其研究。同時,計算機視覺也是科學領域中一個具有重要挑戰性的研究。

1.2計算機視覺領域基本體系結構

提出第一個較為完善的視覺系統框架的是Marr,他從信息處理系統角度出發,結合圖像處理、心理物理學等多領域的研究成果,提出被計算機視覺工作者基本接受的計算機視覺系統框架。在此基礎上,研究者們針對視覺系統框架的各個角度、各個階段、各個功能進行分析研究,得出了計算機視覺系統的基本體系結構,如圖1。

2計算機視覺在交通領域的應用

2.1牌照識別

車輛的唯一身份是車輛牌照。在檢測違規車輛、稽查被盜車輛和管理停車場工作中,車輛牌照的有效識別與檢測具有重要的作用和應用價值。然而在實際應用工作中,雖然車牌識別技術相對成熟,但是由于受到拍攝角度、光照、天氣等因素的影響,車牌識別技術仍需改善。車牌定位技術、車牌字符識別技術和車牌字符分割技術是組成車牌識別技術的重要部分。

2.2車輛檢測

目前,城市交通路口處紅綠燈的間隔時間是固定不變的,但是受交通路口的位置不同、時間不同的影響,每個交通路口的交通流量也是持續變化的。此外,對于某些交通區域來說,公共資源的配備,比如交通警察、交通車輛的數量是有限的。如果能根據計算機視覺技術,對交通路口的不同時間、不同位置的交通情況進行分析計算,并對交通流量進行預測,有利于為交通警察縮短出警時間、為交通路口的紅綠燈根據實際情況設置動態變化等技術提供支持。

2.3統計公交乘客人數

城市公共交通的核心內容是城市公交調度問題,一個城市如何合理的解決公交調度問題,是緩解城市運力和運量矛盾,緩解城市交通緊張的有效措施。城市公交調度問題,為公交公司與乘客的平衡利益,為公交公司的經濟利益和社會效益的提高做出了巨大的貢獻。由于在不同的地域、不同的時間,公交客流會存在不均衡性,高峰時段的公交乘客過多,平峰時段的公交乘客過少,造成了公交調度不均衡問題,使有限資源浪費嚴重。在計算機視覺智能公交系統中,自動乘客計數技術是其關鍵技術。自動乘客計數技術,是對乘客上下車的時間和地點自動收集的最有效的技術之一。根據其收集到的數據,從時間和地點兩方面對客流分析,為城市公交調度進行合理的安排。

2.4對車道偏離程度和駕駛員工作狀態判斷

交通事故的發生率隨著車輛數量的增加而增加。引發交通事故的重要因素之一就是駕駛員疲勞駕駛。據相關數據顯示,因車道偏離導致的交通事故在40%以上。其中,駕駛員的疲勞駕駛就是導致車道偏離的主要原因。針對此種現象,為減少交通事故的發生,計算機視覺中車道偏離預警系統被研究開發并被廣泛應用。針對駕駛員眨眼頻率,利用計算機視覺對駕駛員面部進行圖像處理和分析,再根據疲勞駕駛關注度與眨眼頻率的關系,對駕駛員的工作狀態進行判斷。此外,根據道路識別技術,對車輛行駛狀態進行檢測,也是判斷駕駛員工作狀態的方法之一。這兩種方法,是目前基于計算機視覺的基礎上,檢測駕駛員疲勞狀態的有效方法。

2.5路面破損檢測

最常見的路面損壞方式就是裂縫。利用計算機視覺,及時發現路面破損情況,并在其裂縫程度嚴重之前進行修補,有利于節省維護成本,也避免出現路面坍塌,車輛凹陷的情況發生。利用計算機視覺進行路面檢測,相較于之前人工視覺檢測相比,有效提高了視覺檢測的效率,增強了自動化程度,提高了安全性,為市民的出行安全帶來了更高保障。

3結論

本文從計算機視覺的概述,及計算機視覺基本體系結構,和計算機視覺在交通領域中的應用三面進行分析,可見計算機視覺在交通領域中的廣泛應用,在交通領域中應用的有效性、顯著性,以此可得計算機視覺在現展過程中的重要性。隨著計算機視覺技術的越來越成熟,交通領域的檢測管理一定會加嚴格,更加安全。

作者:夏棟 單位:同濟大學軟件學院

參考文獻:

[1]段里仁.智能交通系境在我國道路空通管理中的應用[J].北方工業時報,2015(06).

[2]王豐元.計算機視覺在建筑區間的應用實例分析[J].河北電力學報,2015(04).

[3]李釗稱.主動測距技術在計算機數據分析中的作用探析[J].計算機應用,2015(08).

[4]馬良紅.三維物體影像的攝取與分析[J].中國公路學報,2014(05).

第2篇:計算機視覺感知技術范文

關鍵詞:動態場景;自適應預測;多特征融合;計算機視覺;運動目標

接受信息的關鍵手段之一就是視覺系統,隨著科學技術水平的不斷發展,以及計算機和信號處理理論的誕生,讓機器擁有人類視覺功能已經不再是夢。對所采集視頻中的運動目標進行跟蹤、檢測,并對其目標行為進行分析,就是運動目標分析的內容,運動目標分析是計算機視覺領域關鍵內容之一,其屬于圖像理解與圖像分析的范疇。而在運動目標分析系統中,跟蹤與檢測運動目標則為中級和低級處理部分,是分析與理解行為的高等層分析模塊的基礎。檢測與跟蹤運動目標技術主要包括了:機器人視覺導航、軍事領域、運動圖像編碼、交通管制、視覺監視等。

1目標檢測算法

連續圖像序列由視頻中提取出,由前景區域與背景區域共同組成了整個畫面。前景區域包含了如運動的人體、車輛等動態要素,它是指人們較為感興趣的區域。而背景區域主要包含例如樹木、建筑物等靜態要素,它的像素值僅發生微弱變化或者不產生變化。在連續圖像序列中,采用一系列算法分隔開背景區域和前景區域,將運動目標信息有效提取,則為運動目標檢測。以靜態場景為基礎的運動目標檢測算法包括了光流法、背景差分法、幀間查分法等,文章主要針對背景差分法進行介紹。

背景差分法通常適用于靜態場景,其是將背景圖像與當前幀圖像進行差分,運動目標依靠閥值化進行檢測,因為該算法僅能夠在背景變化緩慢或者不發生變化的情況下應用,因此就有著一定的局限性。假設當前幀圖像為fk(x,y),背景圖像B(x,y)可通過一定的方法得出,而這時背景差分圖像則為:

(1)

而假設二值化閥值為Th,二值化圖像B(x,y)則為:

(2)

運動目標檢測結果可通過數學形態學處理獲得。

2 背景模型的實時更新

要更新背景圖像可采用一階KALMAN濾波來實現,為了克服氣候變化、光照變化等外部環境變化對運動檢測產生的影響,采用一階KALMAN濾波更新背景圖像公式如下:

Bk+1(p)=Bk(p)+g(Ik(p)-Bk(p)) (3)

而增益因子則為:g=?琢1(1-Mk(p))+?琢2Mk(p) (4)

公式中?琢1和?琢2是權值系數;M是第k時刻二值化后目標圖像中p像素的值;B為背景圖像;I為當前幀圖像。要想將運動目標從背景序列圖像中有效分割出來,就必須要達到?琢2足夠小的條件,且?琢1應等于或者大于10?琢2,若?琢1值過大,就會將算法自身的去噪特性喪失,在序列背景圖像中也會存儲越來越多的運動變化。

3 更新車輛目標模型

核與活動輪廓算法具有效率高、技術復雜度低等特點,它以非參數核概率密度估計理論為基礎,在視頻運動目標跟蹤中廣泛應用。彩色圖像序列通過攝像機獲取,人臉目標模型可以采用RGB顏色空間來進行描述。在跟蹤車輛的過程中,噪聲、遮擋、光照等干擾或多或少存在,因干擾因素的存在,車輛像素特征也會發生相應的微弱變化。若不對目標模型進行更新,會對跟蹤精度產生影響,所以,采用的矩形模板會包括一定背景。而在實施跟蹤的過程中,要對車輛目標模型進行更換。如果其過程物遮擋,當BHATTACHARYYA系數滿足?籽>Tudm條件時,更新車輛目標模型,更新模型為:

(5)

公式中Tudm是模板更新閥值;qk-1是更新之前的車輛目標模型。通過視頻跟蹤,在近場景和遠場景拍攝到的視頻中,多尺度圖像空間由各個幀圖像構成。例如:將將書本作為跟蹤對象,由遠及近從書本的正上方拍攝六十幀圖像,為了能使矩形框正好能夠包含書本,對每幀圖像張書本手工劃定矩形框,并對框內圖像的信息量進行統計。最后,隨書本尺度的變化,給出圖像信息量變化曲線。

4 計算機視覺原理

計算機視覺是一門研究怎樣使機器進行觀察的科學,更切確地說,就是指利用電腦和攝影機代替人眼對目標進行識別、跟蹤和測量等機器視覺,并進一步做圖形處理,用電腦處理成為傳送給儀器檢測或更適合人眼觀察的圖像。計算機視覺研究相關的理論和技術作為一個科學學科,嘗試創建能夠從圖像或者多維數據中獲取信息的人工智能系統。這里所指的信息指Shannon定義的,可以用來幫助做一個決定的信息。因為感知可以看作是從感官信號中提取信息,所以計算機視覺也可以看作是研究如何使人工系統從圖像或多維數據中感知的科學。

計算機視覺就是由計算機來代替大腦完成處理和解釋,用各種成象系統代替視覺器官作為輸入敏感手段。使計算機能象人那樣通過視覺觀察和理解世界,具有自主適應環境的能力就是計算機視覺的最終研究目標,而需要經過長期的努力才能達到這個目標。所以,在實現最終目標以前,通過努力的中期目標是建立一種視覺系統,這個系統能依靠反饋的某種程度的智能和視覺敏感完成一定的任務。例如:計算機視覺的一個重要應用領域就是自主車輛的視覺導航,但要實現自主導航的系統,卻還沒有條件實現象人那樣能識別和理解任何環境。所以,人們通過不懈的努力,研究在高速公路上具有道路跟蹤能力,有效避免與前方車輛碰撞的視覺輔助駕駛系統。人類視覺系統是有史以來,人們所知道的功能最強大和完善的視覺系統。這里要指出的一點是在計算機視覺系統中計算機起代替人腦的作用。計算機視覺可以而且應該根據計算機系統的特點來進行視覺信息的處理,但并不等于計算機必須按人類視覺的方法完成視覺信息的處理??梢哉f,對人類視覺處理機制的研究將給計算機視覺的研究提供指導和啟發,所以,用計算機信息處理的方法研究人類視覺的機理,建立人類視覺的計算理論,與此同時也是一個十分重要和讓人感興趣的研究領域。這方面的研究被稱為計算視覺。計算視覺可被認為是計算機視覺中的一個研究領域。計算機視覺領域的不完善性與多樣性為其突出特點。

5 結束語

對視頻中的運動目標進行跟蹤、識別、檢測,并對目標行為進行研究、分析,這就是基于視覺運動目標分析。以計算機視覺為基礎,分析運動目標,包括了目標行為的理解與分析、目標跟蹤、運動目標檢測、預處理圖像等,它是計算機視覺領域重要內容之一。理解與分析運動目標的行為,既是計算機視覺的根本目的之一,也是檢測與跟蹤運動目標的最終目標。從理論層考慮,理解與分析運動目標的行為可以分為人工智能理論研究與模式識別。簡要闡述基于計算機視覺的運動目標分析,而所面臨的是對運動目標行為的理解。

參考文獻

[1]楊可,劉明軍,毛欣,夏維建,劉偉,周旋,吳煒,周凱.基于計算機視覺的電纜終端表面溫升分析系統[J].電視技術,2013(7).

[2]葉闖,沈益青,李豪,曹思汗,王柏祥.基于人類視覺特性(HVS)的離散小波變換(DWT)數字水印算法[J].浙江大學學報:理學版,2013(2).

[3]何青海,馬本學,瞿端陽,李宏偉,王寶.基于機器視覺棉葉螨自動監測與分級方法研究[J].農機化研究,2013(4).

[4]賈挺猛,茍一,鮑官軍,董茂,楊慶華.基于機器視覺的葡萄樹枝骨架提取算法研究[J].機電工程,2013(4).

第3篇:計算機視覺感知技術范文

關鍵詞: 計算機 視覺注意機制 計算機視覺注意模型

1.引言

隨著信息技術的不斷發展,數據處理量劇增,以及用戶不斷擴大的個性化需求,對計算機信息處理能力提出了越來越高的要求。如何在場景中快速準確地找到與任務相關的局部信息,即物體選擇與識別,已經成為計算機信息處理領域的一個研究熱點。隨著在心理學領域注意機制研究的不斷發展,將注意機制引入信息處理領域來解決物體識別問題,已經不再是紙上談兵。

人類視覺系統進行視覺信息處理時,總是迅速選擇少數幾個顯著對象進行優先處理,忽略或舍棄其他的非顯著對象。進入人類視野的海量信息,通過注意選擇機制進行篩選,就能使我們有選擇地分配有限的視覺處理資源,保證視覺信息處理的效率,這就是視覺選擇注意機制的原理。依據人類視覺選擇注意的基本原理,開發能夠進行智能圖像信息處理的計算機系統,就成為一大任務。我們研究的主要方向是使計算機處理對象時,能夠具備與人類相似的視覺選擇注意能力。

2.視覺注意機制

研究視覺注意機制是個多學科交叉的問題,目前多個領域的研究人員都取得了研究成果,并且對視覺注意的理論都形成了一些共識。目前普遍認為注意既可以是按自底向上(自下而上)的圖像數據驅動的,也可以是安自頂向下(自上而下)的任務驅動的。其中,自下而上的研究主要來自圖像中物體數據本身的顯著性。例如,在視覺搜索實驗中,顯著的物體會自動跳出,如圖1中的圓點通過特征對比,以形狀跳出的形式獲得注意。自上而下的引導主要來自當前的視覺任務,以及場景的快速認證結果,即我們可以“故意”去注意任何一個“不起眼”的物體,如我們可以在圖書館浩如煙海的藏書中,找到自己感興趣的那本書。

研究視覺注意機制的重要方法是研究眼睛在搜索目標時的表現。顯著圖中的各目標在競爭中吸引注意點,注意點在各個注意目標間轉移。根據注意點轉移時是否伴隨眼動,視覺注意也分為隱式注意和顯式注意。隱式注意的中央凹不會隨著注意點的轉移而移動,而顯式注意的中央凹隨每次注意點的轉移而運動。

對視覺注意機制的研究為計算機視覺的發展提供了可能。計算機視覺借鑒人類視覺的注意機制,建立視覺注意的計算模型。通過“注意點”的選擇與轉移,實現對復雜場景中任務的搜索與定位,最終來實現實時信息的響應處理。在計算機視覺的研究中,顯式注意應用較多。

3.計算機視覺注意模型

從人的角度來看,人類視覺系統通過視覺,選擇注意在復雜的場景中迅速將注意力集中在少數幾個顯著的視覺對象上。從場景的角度來看,場景中的某些內容比其他內容更能引起觀察者的注意,我們稱之為視覺顯著性,兩者其實是從不同的角度對視覺選擇注意過程的描述。

我們把引起注意的場景內容定義為注意焦點FOA(Focus of Attention)。Treisman的特征整合理論中將視覺信息處理過程劃分為前注意和注意兩個階段,各種視覺特征在前注意階段被以并行的方式提取出來,并在注意階段以串行方式整合為視覺客體,即注意的特征和客體是通過不同方式進行的。在注意焦點的選擇和轉移上,Koch[2]進行了深入的研究,他提出注意焦點FOA的變化具有四個特征,即單焦點性:同一時刻只能存在一個FOA;縮放性:FOA的空間范圍可以擴大或者縮小;焦點轉移性:FOA能夠由一個位置向另一個位置轉移;鄰近優先性:FOA轉移時傾向于選擇與當前注視內容接近的位置。同時注意焦點具有抑制返回的特點,即FOA轉移時抑制返回最近被選擇過的注視區域。在此基礎上,視覺注意的研究人員提出了多種視覺注意模型。

4.視覺注意模型的研究現狀

人類的視覺注意過程包括兩個方面:一方面是對自下而上的初級視覺特征的加工,另一方面是由自上而下的任務的指導,兩方面結合,共同完成了視覺的選擇性注意。與此對應,當前的計算機視覺注意研究也分為這兩個方面。

4.1自下向上的數據驅動注意模型研究及分析

在沒有先驗任務指導的情況下,視覺注意的目標選擇主要是由場景中自下而上的數據驅動的,目標是否被關注,由它的顯著性決定?,F在,自下而上的注意研究主要基于Treisman的特征整合理論和Koch&Ullman的顯著性模型,Itti、satoh等人均在此基礎上提出了自己的研究模型,并做了一些模型的改進研究。自下而上的研究方法通過對輸入圖像提取顏色、朝向、亮度等方面的基本視覺特征的研究,形成各個特征對應的顯著圖。另外,一些研究者采用基于局部或全局對比度的方法,來得到圖中每個像素的顯著性,進而得到顯著圖。

現有的自下而上的視覺注意計算模型中,Itti的顯著圖模型(簡稱Itti模型)最具代表性。該模型主要包含3個模塊:特征提取、顯著圖生成和注意焦點轉移。模型通過初級特征的提取,將多種特征、多種尺度的視覺空間通過中央―周邊算子得到的各個特征的顯著性圖合成一幅顯著圖。顯著圖中的各個目標通過勝者為王的競爭機制,選出唯一的注意目標,其中注意焦點的轉移用的是禁止返回機制。但該模型也有一些缺點,如顯著區與目標區域有偏差、計算量較大、運行時間較長、動態場景中實時處理不平等。

在動態場景之中,由于Itti模型很難滿足實時性的要求,科研工作者們正在努力研究動態場景的特性,并建立相應的動態模型。如Wolfe[1]指出,影響前注意的特征包括顏色、方向、曲率、尺寸、運動、深度特征、微調支距、光澤、形狀,等等,其中又以運動特征最為敏感。而You等采用了一種空間域特征和時間域特征相結合的視覺注意模型,該模型假設當場景中存在全局運動時,視覺注意對象將極少做運動。然而,許多真實的場景并不能滿足這個假設,限制了模型的適用范圍。Hang等人提出了一種運動圖的計算方法,并把運動圖作為特征之一,與顏色、亮度、方向等特征結合。這些研究關注了運動特征對視覺的影響,但是均存在一定的局限性,對于復雜的運動場景的注意焦點計算很難取得良好的效果。

我國研究者也在Itti注意模型的基礎上研究了適合動態場景中的注意模型,形成了一些理論成果。如曾志宏[2]等人提出注意焦點計算模型,鄭雅羽[3]等提出基于時空特征融合的視覺注意計算模型。這些模型都能較好地提取動態場景下的視覺目標。

4.2自上而下的任務驅動的注意模型研究及分析

自上而下的注意即任務驅動的注意,通過目標和任務的抽象知識,在一定程度上指導注意焦點的選擇。在自上而下注意模型的研究方面,Laar(1997)提出了一個用于隱式視覺注意的模型,該模型通過任務學習,將注意集中于重要的特征。Rabak[4]提出了基于注意機制的視覺感知識別模型,該模型在定義目標顯著性時,通過語義分析對其他三個自下向上的視覺控制參數項進行線性組合。Salah將可觀測馬爾科夫模型引入到模擬任務驅動的注意模型研究中,并在數字識別和人臉識別的實驗中取得了很好的效果。Itti提出以調節心理閾值函數的形式來控制視覺感知。

目前對自下而上的數據驅動方面的研究較多,而對自下而上的任務驅動方面研究較少。因為任務驅動的注意與人的主觀意識有關,同時受到場景的全局特征影響。自上而下的注意涉及記憶、控制等多個模塊的分工協作,其過程非常復雜。

5.計算機視覺注意模型研究的趨勢

自底向上和自頂向下的加工是兩種方向不同的信息處理機制,兩者的結合形成了統一的視知覺系統。人類的視覺信息處理系統只有遵循這樣的方法,才能有效地實現視覺選擇注意的目的。

實踐證明,把自底向上和自頂向下的研究相分離的研究方法并不能很好地解決計算機的視覺注意過程。要想使計算機能夠準確模擬人類的視覺注意過程,實現主動的視覺選擇注意的目的,采用兩種研究方法相結合的形式勢在必行。自底向上的視覺注意計算往往離不開與自頂向下的有機結合,實現二者的優勢互補是以后計算機視覺注意研究的一個趨勢。

參考文獻:

[1]Wolf J M,Cave K R.Deploying visual attention:the guided search model.In:Troscianko T,Blake A,eds.AI and the Eye.Chichester,UK:Wiley press,1990.

[2]曾志宏,周昌樂,林坤輝,曲延云,陳嘉威.目標跟蹤的視覺注意計算模型[J].計算機工程,2008,(23).

[3]鄭雅羽,田翔,陳耀武.基于時空特征融合的視覺注意模型[J].吉林大學學報,2009,(11).

[4]Rabak I A,Gusakova V I,Golovan A V,et al.A model of attention-guided vision perception and recognition.Vision Research,1998,38.

第4篇:計算機視覺感知技術范文

關鍵詞OpenCV;科學教育;推廣價值

1、OpenCV庫簡介

OpenCV是由Intel微處理器研究實驗室的視覺交互組開發的一個跨平臺計算機視覺庫,它的代碼都是開源的而且都經過非常好的優化,并且具有很好的移植性,可以根據需求導入到合適的環境中使用。它可以實現有關圖像識別與處理和計算機視覺技術方面的很多通用算法。它的優勢是可以運行在當代社會使用熱門的各大操作系統上,適用性強,還可以脫離外部庫而獨立運行。OpenCV的C和C++都是經過優化的開源代碼,采用靈活的接口,提升計算機的運行速度。其中包含的函數就有500多個,包括的種類有C和C++等。OpenCV因為免費面向市場,已經被社會各界廣泛使用?,F已應用于人機互動、圖像識別、圖像分割、目標追蹤、3D重建、機器視覺、結構分析等數個領域。OpenCV主要包括以下幾個部分:①cxcore:核心功能模塊,包含一些基本函數,運用于各種數據類型的計算。②cv:圖像處理和計算機視覺功能。③ml:機器學習模塊,主要內容是分類器。④cvaux:包括大部分實驗性的函數,例如ViewMorph-ing、三維跟蹤、PCA、HMM等。⑤Highgui:圖像界面接口,支持攝像頭的讀取和轉換。

2、OpenCV處理圖像的功能

OpenCV中有很多的函數,可以實現很多不同的功能,其中最具有學習價值的部分就是圖像處理。處理圖像主要分為三部分:加載圖像,顯示圖像,處理圖像。

2.1加載圖像

不同類型的圖像有著不同的內部結構。我們需要根據圖像的結構采用合適的方法將圖像文件中的數據讀入內存。OpenCV中的cvLoadImage()函數,可以加載圖像數據。而且圖像的格式不影響加載的效果,加載后它以一個指向IplImage結構體的指針形式返回,大大方便了后續處理的過程。2.2顯示圖像加載圖像后需要通過函數使其顯示。cvNamedWindow()函數由HighGUI庫提供,它可以在屏幕上創建一個窗口,將圖像顯示出來。cvShowImage()函數的作用是在這個創建的窗口中顯示出加載過后的圖像。觀察圖像時經常用到的重要函數還有可以使程序暫停的函數cvWaitKey(),以及用于釋放內存的函數cvReleaseImage()和cvDestoryWindow(),掌握并運用這些函數,就可以輕松的實現觀察圖像的功能。

2.3處理圖像

OpenCV中包含的多種函數,可以達到圖像處理技術方面的很多效果,包括圖像灰度化函數cvtColor(),邊緣檢測函數Sobel()、Laplacian()、Canny(),其中Canny算子只能處理8位灰度圖,其余兩種8位32位都可以,合并梯度函數addWeighted(),放大縮小函數resize(),閾值化操作函數imshow()等等。適當選用合適的函數并加以運用即可達到目標所需。

3、OpenCV的推廣價值體現

OpenCV可以應用在社會的各個領域,價值就體現在每個科學的產物當中。舉個近在身邊的例子,隨著社會的發展,生活質量的提高,人們的居住環境也在逐漸改善,樓層越蓋越高,無數摩天大樓,商業大廈群起而立,電梯已經成為了我們日常生活中必不可少的工具。盡管現在電梯的功能、質量不斷地提升,但是仍然存在些許不足,當我們在學校的教學樓內等電梯時發現了一個問題,那就是在電梯使用的高峰期時,比如在上下課時段,有很多人都在同一樓層等電梯。但是此時只有一臺離該樓層最近的電梯會過來,而其余的電梯都會自動向其它叫梯樓層運行或是閑置??墒谴藭r這一臺電梯只能容納有限數量的人,時常不能使所有人坐上電梯,這樣就無法滿足全部人的需求,由此就導致了有部分人無法及時地坐上電梯,需要繼續等候,而閑置的電梯又不能及時地被利用。這樣不僅不能合理地利用資源,反而浪費了許多不必要的時間。因此,我們想到可以通過利用圖像識別與處理的方法來彌補這個不足,首先通過硬件設備連接拍照捕獲候梯人像,后臺運行判斷出候梯人數,然后運用語言編程來確定調動電梯的個數,從而來達到實現自動控制每個電梯的運行的目的,使所有人都能在第一時間乘坐電梯。而上文中提到的OpenCV就可以完成這項艱巨的任務。我們將OpenCV導入編程環境,其次修改電梯工作系統的運行程序,將軟件與硬件設備相連通,這樣通過調度程序,就可以輕松高效地解決這個問題。使用這種方法,不僅可以節約人們的候梯時間,方便學生、老師上課,而且可以合理有效地調度電梯,使電梯的價值得到最大化。見微知著,OpenCV可以應用在每個領域,對各界的發展起到推動作用,造福社會的科技發展,方便人們的生活。

4、科學教育存在的問題

在歷年的教學模式中,老師們往往會強調理論知識的重要性,但卻忽略了對學生使用動手能力的培養,學生不能獨立完成實踐性的技術操作,也就是說教學模式缺乏實踐性。只有將理論與實踐相結合,才能實現知識價值的最大化,因此,應當在教學中配合著實踐課程,舉一反三,讓學生們更加深刻地學習和了解所學到的知識。而如今雖然一部分學校也開設了實踐課程,但也只是淺嘗輒止,并沒有過多地講授計算機技術實踐方面的知識,學生們也沒有真正擁有動手實踐能力,這使學生們的技術知識十分受限。雖然現在多數學生對計算機略懂一二,但是實際上僅僅會使用類似Word等簡單的軟件,而技術要求較高的一些軟件及工具卻全然不知,甚至對自己所學過的課程軟件的使用也是馬馬虎虎,這對于未來工作所需的能力來講,實在是九牛一毛。目前中學生使用電腦的重心更多放在了社交軟件和游戲上,很少有人利用計算機學習更多的技能,這對青少年的發展實在是利大于弊的,而且這樣也失去了計算機的正向價值。因此,我們應該改變現有的教學模式,一邊教授理論知識,一邊配合指導學生動手操作,將理論與實踐相結合,也能讓學生更好地消化和吸收所學到的知識,并且引導學生正確使用計算機,發揮計算機的價值,讓學生們都能夠在計算機中獲得更多的知識。

5OpenCV開源算法庫在各個領域的實例化體現

OpenCV在醫學領域、軍事領域、安全防護領域等都有很大的重要意義。在醫學領域中,由于有了這個開源算法庫,我們可以盡可能地調用它,從而來進行圖像處理、對象檢測,讓醫生更好更快速觀測人體結構,及時發現病癥。在軍事領域中,大多數無人操作的機器運作,比如無人機飛行、水下無人駕駛儀、無人駕駛汽車等等,都需要用到OpenCV來對圖像進行處理,并進行分析,并且可以檢測出人眼看不到的事物,這是OpenCV能夠帶來人類的巨大的進步。在安全防護領域中,我們現實生活中常見的汽車的安全駕駛,房屋入侵的檢測、自動監視報警系統等等,正是由于這些技術,讓我們的環境更加安全,這都是我們生活中息息相關不可缺少的?,F如今,國家的科學技術飛速發展,日益強盛,OpenCV的成績有目共睹,未來的發展需要科學技術的不斷推進,才能為祖國未來的其他事業提供強有力的后盾。

6OpenCV在科學教育中的作用

在文化改革的大背景下,文盲的概念早已從沒有文化轉變成了不會使用計算機。因為隨著科技的進步,計算機的使用已經越來越廣泛,計算機已經逐步取代了以往人工可以完成的許多工作,比如在超市生成的結賬單、用計算機控制動力系統的運行、人造衛星軌跡的計算等等,這些都依賴于計算機強大的功能。計算機的推廣證明著我國科技的發展和人類文明的進步,由此可見,計算機技術知識的掌握對現代人來說是十分重要的。如果想要成為一個真正有技術、有能力的人才,就務必要熟練掌握計算機技術的使用。但是目前當代社會的教育在計算機技術方面的內容還不夠豐富。減壓政策開放以來,教育課時被壓縮,技術知識的傳輸也相應減少,學生們的能力也因此日益下降。而科學教育,顧名思義,是使科學技術在教育過程中得以傳承。想要科學地教育學生,就必須要多多講授科學技術方面有關的知識。說到科學技術,它的重點自然是計算機技術,而OpenCV作為計算機視覺技術的核心,可以說也是計算機技術甚至科學教育中的一個重要部分。在教育中普及并傳承這個技術無疑可以提高學生們的技術水平。但是,相信有大多數的人在此之前從未聽說過計算機視覺技術,也并不了解OpenCV庫,更加不會學習到與之有關的技術知識。在這樣嚴峻的形勢下,我們更應該將類似OpenCV方面技術有關的知識通過教育傳遞下去。各大高校應積極開展有關計算機的活動,開設與計算機技術有關的課程。這樣才能根據社會的需求來培養更多的綜合性人才。如果可以將其投入到現代教育當中,定會使現在的教育事業更加輝煌,也能使祖國的未來更加璀璨。

參考文獻

[1]于仕琪,劉瑞禎.學習OpenCV(中文版)[M].北京:清華大學出版社,2009.

[2]陰法名.基于OpenCV圖像處理[J].科技信息,2009(32):220.

[3]賈小軍,喻擎蒼.基于開源計算機視覺庫OpenCV的圖像處理[J].計算機應用與軟件,2008,25(4):276-278.

[4]陳勝勇.基于OpenCV的計算機視覺技術實現[M].北京:科學出版社,2008.

[5]劉潔,馮貴玉,張汗靈.一種圖像處理和計算機視覺的開發工具[J].計算機仿真,2006(11).

第5篇:計算機視覺感知技術范文

關鍵詞:多模態;檢索;圖像特征

0 引言

現階段基于圖像檢索普遍采用方式是人工對上傳到網絡中的數字圖像進行文字標注,根據每幅圖像的視覺特征人為的設置他們的文字描述。在檢索時,使用標注的文字作為關鍵字來檢索我們想要的數字圖像。這種依據圖像標注的文字匹配檢索的方法簡稱為“字找圖”,它的缺點為:(1)由于需要大量的人工對每幅圖像進行文字標注,數字圖像的數量是海量的,標注工作是非常耗費人力和時間;(2)由于每個人對圖像的認識不同,所以,在標注的過程中會按照自己對圖像的認識來選擇標注文字,這樣會使不同的人對圖像的標注不同,而在檢索中會產生很大誤差;(3)不同國家使用的標注文字不同,所以在匹配文字時也會產生很大的偏差;(4)有的圖像里面含有大量的內容,不可能用幾個關鍵字就能表達清楚。為解決標注圖像檢索的缺陷問題。學者著手開展對內容的圖像檢索技術的研究?;诙嗄B的圖像檢索的改善了此類瓶頸問題,主要從被檢圖像庫根據海量圖像特征進行檢測和匹配,獲取圖像之間的相關性特征信息。

1 基于多模態的圖像特征匹配方法

(1)直接從圖像中尋找匹配線索,而不是通過人為的文字標注,正因為這個特點,突破了傳統的關鍵字標注的耗費人力時間的缺點,而是直接對圖像本身進行處理和分析,使檢索更貼近圖像本身。

(2)檢索可以是人機交互的,當使用一種特征選取方式檢索的結果不能滿足人們的需求時,人們可以人工的改變特征選取方式使檢索結果向于人們需求的方向接近。這樣避免了計算機檢索圖像時的不靈活性,加入了人為的因素。因此,人和計算機結合檢索能使效率和準確率更高。

(3)基于內容的圖像檢索是一種相似性檢索,可以將檢索結果進行相似性排序,我們可以采取逐步求精的算法,不斷減小檢索的范圍,直到定位到準確目標,這與傳統數據庫精確匹配有很大的不同。

由于這些方法,基于多模態內容的圖像檢索漸漸成為人們研究的重點,此類技術可以應用在社會安全、遙感、醫學、數字圖書館、建筑、計算機輔助設計、地理信息系統、商標版權管理、等諸多領域。

2 基于紋理識別的多模態的圖像檢索系統的框架和技術

基于紋理識別的多模態圖像檢索系統組成部分如圖1所示。

(1)輸入模塊:分析和獲取圖像的紋理特征值,并將特征向量輸入圖像特征數據庫。

(2)描述模塊:利用查詢抽象檢索技術,實現將用戶需求抽象提取相關圖像特征語義,并完整描述成計算機能進行識別的特征向量。

(3)檢索模塊:與圖像數據庫的圖像紋理特征值進行相關性匹配,根據機器學習和神經網絡技術,對跨語義的特征向量進行學習和篩選,獲取最符合查詢要求的圖像信息,并返回給用戶。

3 基于圖像紋理特征的檢測方法

圖像有三大底層特征,分別是顏色特征、紋理特征和形狀特征。紋理特征是顯著的視覺特征,其弱化了顏色和亮度的作用,但它吸收了表面結構的排列與組織次序,而且表現出了上下文的關系,反映出了同質再現的視覺特征。

紋理源于人們對物體表面觸感的概念,這種固有的內在特征反映了物體表面的組織結構或者上下文內容的關系等諸多有用的信息,或者反映了圖像像素間的灰度變化情況或者顏色變化情況。組成紋理的基本元素叫作紋元或者紋理基元,是一個觸發視覺感知并且特性相對穩定的基本單元,這些單元在一定的區域內的不同位置會以不同的形態再現,主要是灰度或色彩模式呈現不同特點,其包含多個像素,在物體表面呈現三種:周期性、準周期性或隨機性。

如今,神經網絡、最近鄰分類器、決策樹和支持向量機等模式方法已經廣泛的應用到了許多領域,譬如圖像分類、視頻處理、檢索等。模式類就是由一些共同屬性所決定的,模式分類就是根據對象的特征或屬性進行分類。

按照學習方法的監督程度,也就是根據否存在先驗知識并且是否使用到這些先驗知識,模式分類方法可以分為監督分類和非監督分類。

監督分類對各對象分類的依據是通過訓練樣本,選擇合適的特征參數,以此建立判別函數。監督分類必須要有分類區域的先驗類別知識用以建立判別函數,從而獲得訓練分類器,它把圖像分解為多個組成部分,求解各部分之間的空間關系。一般監督分類在訓練階段需要手工選擇分類區域從而可以確定模型。

在沒有先驗知識情況下,非監督分類能夠有效地分類,是因為其根據圖像像元間的相似度和從分析數據上得到的統計特性,它不需要獲取判別函數集而去進行場地訓練。熟知并且常用的K-means和ISODATA法就是非監督分類方法,也是一種聚類分析方法。這種方法是將圖像視作一些特征的集合,先對這些特征進行聚類分析,得到特征單詞和特征碼,再用統計方法對特征單詞和特征碼進行統計分析,最后根據統計特征進行有效分類。

前面一種分類是根據監督程度來劃分,模式分類方法還可以分為經驗型分類方法和理論型分類方法,此時是根據有無前人分類算法的思想。經驗型方法中比較常用的有最近鄰分類器、RBF網絡和神經網絡等。理論型模式分類算法比較常用的有貝葉斯分類器,支持向量機,這種分類算法數量較少,遠沒有經驗型分類方法多。貝葉斯分類器通過計算樣本概率的差異,將樣本進行分類,但是分布函數的求取較為困難;支持向量機方法SVM基于統計學習理論,在實際應用中取得了一定的成效。

第6篇:計算機視覺感知技術范文

技術層面:以骨干企業為創新主體,結合高校、科研院所等智力資源,著力突破一批重大共性關鍵技術。

自然語言處理。研發自動分詞、命名實體識別、詞性標注等自然語言處理基礎技術,開展語法分析、語義分析、對話管理、意圖檢測等深度技術研究,重點突破對話級別的語義理解及知識問答技術,語篇級別的語義理解分析技術和高精度的文本情感分析技術等。

計算機視覺。利用深度學習技術提升識別效果,研發面向電視遙控、手機遙控、汽車導航等交互領域的手勢識別技術;研發面向人數估計、擁堵分析、目標跟蹤、異常檢測等的大規模人群視頻監控與智能分析技術,形成具有國際先進水平的、完整的自主知識產權、可轉移轉化的計算機視覺軟件系統。

機器學習。通過實現可以靈活變換的網絡拓撲結構,應對不同類型數據的隱層模型、百億級別的數據處理能力和模型尺度;賦予機器類人腦的時空認知能力,形成機器學習的時空建??蚣芎透咏祟惛兄到y的神經網絡。

知識圖譜。面向教育、互動娛樂、智能客服等特定領域,研究大規模知識圖譜中不同類型知識的表示框架與學習機制,從非結構化或半結構化的互聯網信息中獲取有結構的知識,探索多源異構信息的知識獲取與融合表示,自動構建知識圖譜,并研究知識表示驅動的推理技術。

平臺層面:依托統一平臺實現智力、數據、技術和計算資源的高效對接,促進產學研用聯合創新。

人工智能共性技術研發平臺。加強智能語音處理、計算機視覺、生物特征識別、自然語言處理、機器翻譯、知識圖譜、智能邏輯推理、機器自主學習、智能機器人等重大共性關鍵技術研發,為行業及有潛力的應用創新開發企業和個人提供核心技術支撐,提供成熟的智能人機交互、自然語言處理、自動知識檢索等共性技術引擎及產品。

人工智能開放支撐服務平臺?;诿嫦蛉斯ぶ悄茴I域的大規模分布式軟硬件基礎設施,匯聚企業、高校、科研院所以及創業者等社會多方力量,建設面向全行業和創新應用開發者提供人工智能算法和服務支撐的云服務平臺,實現技術向產業活動和經濟發展的高效轉化,推動傳統產業和社會服務向智能化方向發展。

人工智能產業公共服務平臺。支持和鼓勵業內政產學研用等單位,整合業內相關資源,建立涵蓋戰略研究、咨詢服務、標準制定、評測認證、應用示范等功能于一體的產業公共服務平臺,為行業發展提供全面支撐。

應用層面:結合共性技術研發和平臺建設實際,優先推動在服務機器人、無人駕駛、信息安全等領域示范應用。

智能客服。研發面向智能客戶服務的智能語音、語義理解等共性關鍵技術,構建特定領域知識庫,研發自助客服、商業智能、生物特征識別認證等平臺系統。

服務機器人。重點研發面向家庭環境的語音增強、室內定位和導航跟蹤等共性關鍵技術,整合傳感器和機械控制相關技術成果,實現軟硬件一體化的服務機器人綜合系統,并在家庭、教育、醫療等方面形成示范應用。

第7篇:計算機視覺感知技術范文

眼下,在北京中關村頤和園附近的一所宅院里,最接近科幻的一幕現實版故事正在上演。

落地

這是一家專注于計算機視覺以及人工智能的科技公司,致力于讓計算機像人一樣主動獲取視覺信息并進行精確的實時分析。它創立于2013年初,成立不久就獲得真格基金和聯創策源的天使投資,并于2014年6月獲得紅杉資本數千萬美元A輪投資。

似乎有意無意和中關村的幾十萬創業大軍和眾多極客有所區分,格靈深瞳選擇了一處古色古香的大院子作為辦公場所。本刊記者在一個有點陰雨的天氣里,隨著中關村管委會等部門組織的媒體團來探訪這個有點神秘的科技公司。

一臉陽光的格靈深瞳CEO何搏飛帶領眾人穿越回廊,讓人感覺在穿越格非小說里的南方,而中央大廳里辦公的年輕人專注于電腦屏幕和鍵盤的神情則提醒我們這是一個IT公司。事實上,這里的人有不少來自美國斯坦福、布朗大學等名校,而且,按照何搏飛的說法,這里完全按照硅谷的方法來管理。

當我們落座在會議室的時候,何搏飛和同事打開了鏈接投影儀的電腦,他早就準備了一場演說。他的同事也有一些散落在聽眾席上,年輕的臉上洋溢著青春的印記。在講述了人工智能時代的趨勢之外,何搏飛也介紹了他們正在做的具體業務。

作為一種并不那么科幻的務實之舉,格靈深瞳現階段聚焦于將人工智能及模式識別技術應用到安防、交通、零售等領域,客戶包括了中國網點最多的銀行、銷售額最高的商場,以及客流量最大的機場等。這是一個可以讓技術優勢變現的領域,可以讓格靈深瞳不至于凌空蹈虛。

這是一塊大蛋糕。據何搏飛的介紹,安防監控領域的中國市場規模在2013年就已達到4000億人民幣,比智能手機的市場高出了800多億,而且未來中國安防監控領域還有巨大的增長空間。

關于行業痛點,他分別從“監”和“控”兩個層面給大家進行了分析。以國內某大型機場的航站樓為例,中控室里面的每個保安需要同時看12500個攝像頭的畫面,由于人的生理極限限制,這是不可能辦到的;再以天安門為例,所有的攝像頭每24小時產生的數據量為1800T,如果天安門發生了一件事,需要找到當事人,工作量也龐大得難以想象。

現在格靈深瞳可以有辦法解決傳統監控“看不見”和“找不到”的問題。他們自主研發的“深瞳無人監控安防系統”可以實時地監控人的行為并作出判斷,在最短時間內發現甚至預判一些非常規事件的發生,比如暴力、跌倒等。

聚人

格靈深瞳的兩個創始人,一個是受過良好商業訓練的經理人,一個是頂尖的科學人才,構成了最初的人才組合。CEO何搏飛畢業于斯坦福大學商學院,曾先后成功創建了兩家美國公司中國區的團隊和業務,29歲就擔任了美國上市公司中國區總經理。而CTO的趙勇則是畢業于布朗大學計算機工程系的博士,他另一個令人矚目的身份是前Google Research研究員和谷歌眼鏡核心團隊成員。

這種組合猶如蘋果當年喬布斯和沃茲的組合??萍己蜕虡I,誰也離不開誰。

真格基金很早就介入到這個創業團隊中。如果沒有王強和徐小平的運作和推動,趙勇何時回中國恐怕還是個未知數。

王強和徐小平都是新東方教師出身,敦厚愛才之心常溢于言表。他們先后投資了陳歐、季逸超、趙勇等人。在投資季逸超的時候,他們看中的居然是季逸超只做和直接現實不大相關的事情。而作為谷歌眼鏡研發團隊之一的趙勇,最初身上似乎也并未可見有多大的“市場屬性”。

王和徐曾兩次在硅谷和趙勇喝酒,卻從來沒談創業或技術改變世界。他們注意到趙勇“內心涌動著一種東西?!蓖鯊姾托煨∑接X察到了什么呢?也許趙勇在谷歌感到了瓶頸,他的自由生長欲望被阻礙了。

徐小平捕捉到了趙勇內心的那種閃動,開始動員他創業,據說花了一年半左右的時間。

2013年趙勇拎著皮箱告別谷歌,來到小平的住處。他回來之前很多基金也是非常興奮,都說投,但是當天晚上小平告訴趙勇,其他的基金不投了,因為他現在沒有產品,也沒有什么方向。小平說:“我們全投,你敢扔掉谷歌,我們為什么不敢扔我們的錢?”

王強的觀念是這樣的:“投資的工夫在投資之外,大家都在算數字的時候我就不算,你可能獲得的就是大數字,你天天算小數字,非常清晰加在一起也是非常有限的,人生投資創業都是一樣的道理。”

現在,在頤和園旁邊的大宅院里,已經聚集了25個人,這些都是有夢想的年輕人。他們中有21歲的陳心怡,她曾就讀于普林斯頓大學,是第一個獲得美國“20 under 20”獎項的中國人,這個獎會給予每個獲獎者十萬美元的資金,而獲獎的一個必要條件就是必須輟學去做一些有意義有創意的事情,心怡最后加入了格靈深瞳;宋晨,美國麻省理工學院碩士畢業,在通用電氣工作了8個月,放棄了還有3個月就可以到手的北京戶口,迫不及待地加入了格靈深瞳;覃曉飛,西安交大的一名工科研究生,憑著自己的興趣運營了一個微信公眾號,因為何搏飛的朋友圈屢次被該公眾號的內容刷屏,在好奇心的驅使下,他聯系上了覃曉飛,給了他一個月的實習機會。在覃曉飛實習的第20天時,他決定退學加入格靈深瞳。何搏飛說,這三個優秀的年輕人只是格靈深瞳員工團隊的一個縮影,是一群有理想有熱情有創業夢想的優秀人才的代表。

造風

在一次極客圈里的聚會活動中。趙勇用了幾個科技大片感十足的視頻為大家展示了機器人的工作場景。借助機器視覺,機器人甚至可以在跳動的心臟上做手術,機器人也可以代替人開車。之后,計算機視覺的想象空間會越來越大。他還指出,機器視覺的三個關鍵技術是3D視覺、高性能計算(神經網絡計算)、機器深度學習。

顯然,這家公司可以發力的領域還很寬廣。安全監控市場只是他們展開應用和市場化的第一個領域,這家公司把自己定位在更為前沿的人工智能類的公司,它面向的是一個近乎無限的市場。

何搏飛認為,互聯網的盛宴已經宣告結束,打通人與機器的連接才是未來的奧秘之地。目前人能理解機器,未來機器要能更理解人。而格靈深瞳正在做的,是從視覺入手,讓機器有智能化的視覺能力,能讀懂人的行為模式。只有當人與物之間能夠有效地雙向聯系,讓世間萬物能夠像人一樣感知和思考,才能最大程度地釋放出計算機的潛能為人服務,這就是即將到來的“人工智能”時代,也就是“萬物智能”的時代。

無獨有偶,前微軟亞太研發集團主席張亞勤也發表過類似觀點:下一波科技趨勢是“互聯網的物理化”,即從現在開始到未來的幾十年,更多數字虛擬的世界將走向實體,物理化。

格靈深瞳的投資人徐小平和王強對這個公司贊不絕口,甚至親自上場,在一個網絡視頻里為公司的招聘做代言。在視頻里,平時較為學究氣的王強援引哈羅德?布魯姆的話說,傳統的印刷文字的想像文學的時代,將會被一種視覺文化來替代。而計算機網絡的智能化又是一個非常明顯的趨勢,所以格靈深瞳踩對了未來的兩個最重要的或者全部的節點。

徐小平認為格靈深瞳的出現,讓全世界的計算機擁有了人類那樣的獨立自主的判斷。這個公司做的是根本性的顛覆人類與世界關系的這么一種科技預產品。他興奮地搖動著肩膀和兩只手,用歡快的語氣說:“我只能說我充滿了無限的遐想,以及堅定的信念?!?/p>

筆者有點納悶,作為初創型公司,格靈深瞳的宣傳視頻是否略顯高調了呢?中國人平時都講究含蓄,悶聲不響發大財。但接下去的內容讓筆者若有所悟。

趙勇坦言,計算機視覺本身只是對世界進行感知的一個技術。要讓它完成一個價值的話,需要整個思維體系、行動體系來配合。“比如說我們要指揮一個機器人,除了感知技術以外,要把自動控制結合起來,要把通訊結合起來,還要把機械傳動結合起來,才能夠形成一個完整的設備以及一個完整的服務或者體驗。”所以格靈深瞳需要各個方面的優秀計算機工程師和科學家。

筆者的感受是:格靈深瞳其實已經找準了一塊非常有潛力的領域,而且在關鍵環節建立了一定核心優勢,這將撬起一個大產業。這時候,打出旗號,召集最優秀的人的聚集,就是搶占前沿領域的一個重要步驟――得人才者得天下,適當的輿論造勢也是一種必要的策略。

第8篇:計算機視覺感知技術范文

【關鍵詞】智能車輛 機器視覺 發展

一、前言

機器視覺技術,即計算機視覺技術,是智能車輛行駛環境感知的通道,一些控制決策參數直接由機器視覺獲取。例如,智能車輛自主導航行駛時前方預瞄點位置的獲取,超車行駛時前方車輛和車道邊界位置的獲取等等都要由機器視覺來完成。機器視覺系統在智能車輛上的應用源于20世紀 80年代中期。其早期研究是針對具有良好的室內試驗環境條件進行設計的。

從20世紀90年代中期開始,智能車輛機器視覺的研究出現兩個發展方向,其中一個發展方向是相對簡單的機器視覺系統在智能車輛中的早期應用。主要體現在如下幾個方面:(1)機器視覺橫向輔助導航系統。(2)自適應導航控制系統。(3)自主“停車啟動”駕駛系統。(4)換道輔助系統[1]。智能車輛機器視覺技術發展的另一個方向是研制開發具有擬人駕駛性能水平的復雜機器視覺系統。從長遠來看,這種視覺系統還應具有自學習的功能。目前,德國聯邦國防大學(UBM)著名學者Dickmanns教授開展了“多焦距主動汽車眼”(MarVEye-Multi-focal active/reactive Vehicle Eye)的研究。這種新型的綜合視覺系統將智能車輛機器視覺技術提高到了一個新的水平。

二、國內外研究現狀

機器視覺導航智能車輛已經成為當今智能車輛的發展主流,世界各主要國家都在競相開展智能車輛視覺系統的研究。機器視覺系統是智能車輛感知局部環境的重要“器官”,而其所起的核心作用無外乎兩個:識別行駛道路邊界與行駛環境中的其它車輛(主要指前方車輛)或其它障礙物。具體地講,就是利用安裝在智能車輛前方的單目或多目光學CCD攝像機(或其它傳感器)實時地獲取圖像,利用圖像中的信息根據設計的算法識別出道路邊界位置和前方車輛位置,再將這些路、車位置信息傳給智能車輛的指揮系統,為其自主導航決策提供依據。而國內外的研究工作也主要集中在道路位置識別和前方車輛識別這兩個方面。

目前對道路邊界的識別主要集中在直線路形和路旁障礙物較少的道路條件。直線路形識別較為簡單,用直線方程描述道路邊界,可以大大減少計算量,此技術也相對較為成熟,例如有霍夫變換法,通過幾何折射關系直接將道路邊界標注出來。這種方法的缺點是受噪聲尤其是直線噪聲的影響較大,且算法不穩定。

吉林大學智能車輛課題組用基于圖像灰度與方差統計的方法識別直線路界,即在得到圖像后進行預處理并在最終的二值圖像中劃分網格,通過計算各網格的統計特性,由馬氏距離區分道路邊界點與非邊界點,得到邊界點最多的一條直線作為直線道路邊界。此方法能夠準確的識別道路邊界,但當路旁噪聲較大時識別效果不夠理想。同時,基于熵最大化邊緣提取的圖像預處理過程由于算法復雜,耗時較長。

由于彎曲路形模式較為復雜,情況變化多樣,算法難以統一,并且由于算法的復雜性,很難滿足準確性和實時性要求。因此國內外對彎曲路徑識別的研究從方法上并不成熟。國外有人用具有某些特征的曲線方程擬合彎曲路界,但由于參數的增加,計算量增大,因此很難滿足實時性要求。國內有人用直線整條或分段近似擬合彎曲路界,在車道邊界曲率不大時能夠基本滿足要求,但當曲率較大時識別準確性不高。因此,可以認為對道路邊界尤其是彎曲道路邊界的識別還有待于進一步研究。

由于前方車輛在圖像中的灰度信息特征很不明顯,例如當車輛在遠方與近處時的灰度統計特性、紋理特性、外形特性等完全不同。因此,算法魯棒性是一個非常棘手的問題。很難提出一種滿足各種狀態的識別算法。一般利用機器視覺進行車輛識別的方法可分為以下三類:

(1)基于車輛特征的方法。該方法利用圖像中車輛存在的特征(紋理、邊緣、對稱性以及底部陰影等)進行分割和識別。這種方法的缺點是,當單獨使用某一種特征時,經常會因光照或環境的變化,導致該特征信息量不足。因此,極易出現錯判或漏判的現象。

(2)基于模板匹配的方法。這種方法利用大量的預先做好的車輛模板(基于灰度信息或小波特征) ,與實時采集的圖像進行匹配。尋找相關性最大的匹配區域作為車輛存在區域。通常,這種方法魯棒性相對較好,缺點是實時性較差。

(3)基于學習的方法。這種方法的本質是利用神經網絡,對大量的車輛圖像進行訓練,然后通過分類器進行分類。通常這種方法被用來對已檢測的車輛進行驗證。

吉林大學智能車輛課題組提出一種基于車輛特征的方法識別和跟蹤前方的車輛。首先,利用車輛底部存在陰影的特征,在圖像中確定可能存在的車輛區域。然后,通過分形維數計算該區域的紋理特征,排除非車輛區域。這種方法對于強光條件和車輛顏色與路面的顏色特征相似的情況,識別和定位的效果不夠理想。

三、關鍵難點與長遠發展

在不考慮硬件設備的情況下,制約智能車輛視覺系統探測效果的三個關鍵因素是視覺系統所應用算法的實時性、魯棒性和精確性。實時性要求視覺系統數據處理必須與車輛的高速行駛同步進行;魯棒性要求智能車輛視覺系統在各種復雜的路面環境下均具有良好的適應性,例如路面有大量樹木與建筑物陰影、變化的氣候條件等;精確性則要求視覺系統在一些復雜環境下不能出現過多的錯判率。這三個要求相輔相成,互相制約。要完全達到上述要求,智能車輛機器視覺系統還需要很長的發展歷程。目前有關智能車輛機器視覺系統的研究正處于一個高速發展的階段,由于硬件水平的提高和理論研究工作的深入,在可以預見的將來將達到一個更高的水平。

參考文獻:

[1]王榮本, 游峰, 崔高健, 郭烈. 基于計算機視覺高速智能車輛的道路識別. 計算機工程與應用,2004,(8):34-39

[2]顧柏園, 王榮本, 余天洪, 郭烈. 基于視覺的前方車輛探測技術研究方法綜述. 公路交通科技. 2005,(10):28-33

第9篇:計算機視覺感知技術范文

以人為中心的交互

傳統方式下,計算機通過多種設定的程序與人交互,需要人去主動適應計算機。在新的交互模式中,計算機則能根據人的動作來主動適應人的要求,例如通過分析語音來識別人發出的命令,并通過語音合成來表達信息。

如何讓計算機“看”,屬于計算機視覺研究的范疇,已開始應用于實際的身份認證技術,例如虹膜識別、人臉識別等技術,通過采集的圖像來獲得信息并得出結果?,F有的技術可以通過攝像機拍攝人的面部表情,然后利用圖像分析和識別技術進行表情識別。能把圖像“看進去”早已不是問題,一個小小的攝像頭就能勝任,關鍵是如何從圖像中獲取所需的信息。要讓計算機像人一樣的“看”,最根本的問題在于計算機對圖像的最終分析和理解,盡管圖片中的形狀、顏色、紋理已經為計算機提供了較多的信息,但是要能用先驗知識去思考、識別,就又回到了人工智能這個老問題。

2002 年倫敦帝國學院的科研小組花費數年時間來研究人類眼睛活動與大腦感知之間的關系,最終發明出一種專門用來捕捉眼球細微動作的紅外線感應裝置,被他們稱為“眼標”。它能鑒別眼睛在顯示屏上的移動和注視,如果電腦使用者盯住屏幕上的某個鏈接圖標1秒以上,電腦就自動打開該鏈接;如果使用者盯住打印或者存盤的圖標,電腦就會自動進行相應的操作(附圖)

中科院自動化所研制成功的通過臉部動作來控制的智能輪椅,能夠讓使用者利用頭部姿態控制其轉動,即當人的頭轉向左邊,輪椅左轉;人的頭轉向右邊,輪椅右轉。這實際上是適時臉部跟蹤和頭位估計的問題。

隨著傳感器技術的發展,越來越精確的交互方式成為可能,例如用于識別手勢的數據手套。它能對較為復雜的手的動作進行檢測,包括手的位置和方向、手指彎曲度,并根據這些信息對手勢進行分類。類似的,SimGraphics于1994年開發的虛擬演員系統,通過用戶戴上的安裝有觸及臉不同部位的傳感器的頭盔,來控制計算機生成表情圖像。

人機交互追求全方位

雖然語音、表情、姿態等均能獨立表示一定的含義,并在某些場合完成交互過程,但人在交互過程中卻總是通過各種信息的同時處理來進行的。實現多通道的人機界面是人與計算機最為自然的交互方式,它集自然語言、語音、手語、人臉、唇讀、頭勢、體勢等多通道為一體的,并對這些通道信息進行編碼、壓縮、集成和融合,集中處理包括圖像、音頻、視頻、文本等多媒體信息。目前,多模態技術正在成為智能人機交互的研究熱點。

“模糊”理解人的情感

精確交互技術能用一種技術來完全達到用戶的交互目的,例如鍵盤和鼠標器均需用戶精確輸入。而人們的動作或思想往往并不很精確,計算機應該理解人的要求,甚至糾正人的錯誤,智能化的交互界面就是為了實現這樣的目標。與此同時,新一代的人機交互過程能夠處理復雜的情感信息,這就是所謂的情感計算。

人的情緒與心境狀態的變化總是伴隨著某些生理特征或行為特征的起伏,人們表達情感通過一系列的面部表情、肢體動作和語音來進行,又通過視覺、聽覺、觸覺來感知情感的變化。視覺察覺則主要通過面部表情、姿態來進行。語音、音樂則是主要的聽覺途徑。觸覺模型則包括對、沖擊、汗液分泌、心跳等的處理。

情感計算研究的重點就在于通過各種傳感器獲取由人的情感所引起的生理及行為特征信號,建立“情感模型”,從而創建一個能感知、識別和理解人類情感的能力,并能針對用戶的情感做出智能、靈敏、友好反應的個人計算系統,縮短人機之間的距離,營造真正和諧的人機環境。目前為止,有關研究已經在人臉表情、姿態分析、語音的情感識別和表達方面獲得了一定的進展。

無處不在的計算

由于新一代高速互聯網的飛速發展,網絡帶寬和CPU 計算能力的成倍增長,以及多媒體技術的日益成熟,計算機、通信及多媒體技術逐步趨向融合。以互聯網為基礎的信息基礎設施,將成為人與人之間交互或人與信息源、外部世界交互的媒介。在這種環境下,計算將無處不在。

無處不在的計算最早是由已故的Xerox Parc計算機科學實驗室主任Mark Weiser 和他的研究小組在20 世紀90 年代初構想并提出的。Mark認為,從長遠看,個人計算機和工作站會消失,因為計算會變得無處不在,這種消失并不是技術發展的直接后果,而是人類心理的作用。當人類對某些事物掌握得足夠好的時候,這些事物就會成為生活中不可分割的一部分,人們就會慢慢地忽略其存在。今后,許多計算裝置也會變得就像Don Norman描述的那樣變成了不可見的計算機,計算也會變成無處不在,不可見的人機交互也會無處不在的。就像我們時刻呼吸著的氧氣一樣,我們看不見卻可以體驗到。

受到無處不在的計算以及穿戴式計算機和虛擬現實發展的影響,MIT Media Lab的H. Lshii等人對早期的GUI(Graspable UserInterface,可抓握用戶界面)理論進行了重要發展,于1997 年提出有形用戶界面的思想。傳統的圖形用戶界面事實上成為隔離物質世界和信息世界之間的屏障,而有形用戶界面希望在用戶、比特和原子之間建立一個無縫交互界面。

信息內容的智能處理

人和計算機的交互一方面是為了獲得服務,另一方面則需要通過計算機處理大量的信息。因此,智能人機交互的另一個重要范疇就是實現信息內容的智能處理。

信息技術產品逐步進入后PC時代,各式各樣的信息家電、網絡接入終端以及集成計算與通信功能的產品繁多。易用性、善解人意已逐漸變成信息設備參與市場競爭的關鍵。甚至一個具有重大創新的知識產權將帶動一個新產業。如中文和漢語信息處理,面向信息內容的智能化處理技術,包括文字與語音的識別、翻譯、查詢、分類、摘要等。這方面的技術突破將極大地推動信息服務業和計算機產業。

將信息轉變為知識、將信息基礎設施發展為知識基礎設施是21世紀的重要技術發展方向。其中,軟件技術將在數據發掘、知識發現、Internet海量信息的智能化檢索和網上軟件機器人等方面進行重點突破。

傳統與智能交互并存

新一代的智能人機交互,力圖淡化傳統的計算機數值計算的概念,突出以人為本的交互過程。那么傳統的以鍵盤、鼠標和屏幕為基礎的GUI 交互界面是否馬上就會消失呢?

美國著名的計算機圖形學家A.VanDam 認為:“雖然各種三維圖形的應用發展得很快,如虛擬現實、科學計算可視化等,但GUI、3D Widget等都將長期存在”。這是因為目前大量的應用已經采用成熟的GUI 技術,因此GUI 不會被淘汰。

國內外研究狀況

亚洲精品尤物av在线网站| 精品国产人妻一区二区三区 | 五月婷婷精品| 久久久www免费人成精品| 国产精品欧美久久久久久日本一道| 久久这里只精品热免费99 | 亚洲欧美色一区二区三区| 成人性能视频在线| 激情成人综合网| 国产乱码一二三区精品| 久久精品道一区二区三区| 亚洲国产精品中文字幕日韩| 真人作爱免费视频| chinese国产在线视频| 久久亚洲国产精品五月天| 曰韩人妻无码一区二区三区综合部| 欧美xxxx做受欧美| 人妖另类综合视频网站| 一本大道久久香蕉成人网| 亚洲人成77777在线播放网站不卡| 经典女同一区二区三区| 99在线精品免费视频九九视| 午夜AAAAA级岛国福利在线| 日韩成人极品在线内射3p蜜臀| 99国产精品白浆在线观看免费| 成人国产网站V片免费观看| 日韩人妻无码免费视频一区二区三区 | 国产美女无遮挡免费| 国产av一区二区三区日韩| 亚洲国产精品无码久久久| 日韩小视频网站hq| 丰满女邻居的嫩苞张开视频| 国产午夜精品久久精品电影| 亚洲中文字幕麻豆一区| 日韩精品久久久久久免费| 文中字幕一区二区三区视频播放| 欧美性精品| 边吃奶边添下面好爽| 久久国产成人亚洲精品影院老金| yw193.can尤物国产在线网页| 国产成人麻豆精品午夜福利在线|