計算機視覺的前景精品(七篇)

時間：2024-01-01 15:43:49

序論：寫作是一種深度的自我表達。它要求我們深入探索自己的思想和情感，挖掘那些隱藏在內心深處的真相，好投稿為您帶來了七篇計算機視覺的前景范文，愿它們成為您寫作過程中的靈感催化劑，助力您的創作。

計算機視覺的前景

篇(1)

關鍵詞：OpenCV；計算機視覺技術；三維模擬技術

中圖分類號：TP391 文獻標識碼：A 文章編號：1009-3044（2015）30-0137-02

21世紀是國際計算機技術高度發展的時代，人們生活中的每個角落都可以看到計算機技術的身影，尤其是現代計算機視覺技術和圖像處理功能發展更加迅猛，各技術分支也逐漸趨于成熟。計算機視覺技術主要指的就是利用智能計算機系統來代替人類的眼睛對現實三維世界進行辨識和理解，整個過程均是計算機自我學習的過程，而隨著這項技術研究的不斷深入，其不再僅僅包含計算機技術科學，同時還涉獵了包括生理學、神經學、物理學、應用數學等多門學科，為人類科技的進步提供了有效的動力。

1 計算機對視頻中運動物體檢測的原理概述

在現代計算機技術基礎下，對視頻當中的運動物體檢測原理主要包括兩種，分別是從微觀和宏觀的角度出發。其中宏觀檢測技術指的是當計算機截取了視頻中的某一個圖像，其以整幅圖像為對象進行檢測；微觀檢測技術是指在截取圖像后，根據實際需求對某一區域內的圖像內容進行檢測。在計算機視覺技術實際應用時，其第一步就是對圖像的采集，第二步是對已經采集的圖像進行預分析處理，如果采用宏觀檢測技術則對圖像整體進行分析；如果采用微觀檢測技術則首先將圖像進行分割，然后對分割后各圖像內容中出現的運動物體影像進行分析。在圖像數據獲取過程中應用的是背景差分法，這一技術主要是將背景和運動物體進行分離提取，以獲取沒有背景圖像的運動物體影像數據。還可以利用幀間差分法，這種方法主要是對一個視頻圖像的逐幀畫面進行差別比較，從而獲得各幀圖像上的差值，而將這些差值幀圖結合起來就是一個物體在計算機視覺下的運動軌跡。現代研究者更傾向于將背景和幀間差分法進行結合運用，這樣可以獲得無背景下的運動物體軌跡，進而提升計算機視覺系統捕捉數據的準確性。

2 OpenCV的應用概述

OpenCV是現代計算機視覺技術當中具有開源性的視覺庫，其最早是由俄羅斯Intel分公司所研發，不僅高效，而且具有兼容的優勢。同時與傳統IPL圖像處理系統相比，OpenCV所處理的圖像數據等級更高，例如在對運動物體進行特征跟蹤、目標分割、運動軌跡分析以及三維模型重建等方面都有著巨大的優勢。

OpenCV本身編輯的源代碼是開放式的，編寫過程簡潔且方便，并且程序中大多數函數已經通過了匯編的最優化，使其能夠更加高效地被應用。在使用OpenCV的攝像機標定模塊已經為用戶設計了實用性較強的接口，并且能夠支持Windows界面的操作平臺，使得這一技術的操作更加簡便。這一技術本身操作簡便，對于編程人員和檢驗人員個人技能素質要求并不高，視覺技術系統研發人員可以利用簡便的操作來檢驗其設想是否能夠實現，這就使得現代計算機視覺技術開發團隊能夠形成更好的協作研發關系，進一步提升技術研究效率。目前已知OpenCV編程系統在航空航天定位、衛星地圖繪制、工廠大規模生產視覺檢測等方面得到了廣泛的應用，同時對于無人飛行器的視覺捕捉技術也有極大的幫助。最為重要的是OpenCV編程語言的兼容性較強，編程人員可以根據自己的意愿對源代碼進行披露，并且國內也已經形成了規模較大的交流社區，給更多同行業者提供答疑解惑的場所，進一步擴大了OpenCV的應用范圍。

3 基于OpenCV的計算機視覺技術

3.1 基于OpenCV下的運動物體檢測技術

在常規運動物體檢測技術下，均是直接通過圖像背景和運動物體的區分來實現運動物體的捕捉。而基于OpenCV下的運動物體檢測技術則不僅能夠針對于圖像背景的分離實現運動物體的觀察，還可通過物體本身特定的信息來進行檢測，主要包括形狀、輪廓以及顏色等。這樣就能夠實現在復雜的背景當中將特定的運動物體完整抽離出來。其基本流程包括：首先，對影像數據當中某一時間點的圖像進行捕捉，然后對這一視頻圖像的格式進行轉化；其次，對轉化格式后的視頻圖像進行早期處理，并將運動物體和復雜的背景區分開，降低周圍各環境因素對運動物體主體圖像的影響；第三，根據完成提取后的運動物體圖像進行辨識，然后再從視頻當中捕捉擁有相同特征的物體，并對該物體進行跟蹤識別。而這一過程的實質則在于先利用圖像捕捉技術對畫面進行截取，然后同時利用背景差分法和幀間差分法對圖像進行分割，逐幀地將運動物體完成提取出來，以供計算機進行視覺跟蹤處理。

3.2 基于OpenCV的圖像預處理技術

一般情況下，計算機視覺處理技術應用的環境情況較為復雜，大多數應用環境當中均有光照的變化，并且部分計算機視覺處理設備還需要在露天環境下進行工作，此時周圍環境中的風、溫度、光照、氣候以及運動物體數量等對視頻圖像的采集均有著極大的影響。環境因素會使圖像采集的質量大幅度降低，同時圖像當中的噪點問題也難以避免，而噪點是視覺捕捉和圖像處理當中最大的影響因素。因此，在基于OpenCV下的計算機視覺技術在捕捉視頻圖像之后先對其進行預處理，然后再由系統對運動物體進行分離、檢測和跟蹤。一般的預處理過程主要包括平滑度濾波、圖像填充、背景實時更新等。

1）圖像的平滑度濾波預處理技術

由于在實際計算機視覺捕捉過程中圖像噪點是難以避免的問題，以此在對圖像中運動物體進行檢測前，應該相對這些噪點進行預處理，降低環境噪聲對圖像的影響。圖像的平滑度濾波處理共分為兩種方式，分別為線性和非線性。其中線性處理方式就是通過計算機處理設備的簡單運算，對圖像當中的噪點進行直接清除，但這一技術使用后會造成截獲圖像模糊不清的情況，因此僅對噪點較少的圖像采用該處理方式；非線性濾波處理則是利用復雜的圖像處理運算，將截獲圖像當中的噪點無限縮小，使其不對圖像整體造成影響，并且可以有效保證圖像的局部調整，但這種處理方式在運算時速度沒有線性濾波處理快，因此需應用在噪點較多，圖像信息較復雜的處理當中。

2）圖像的填充預處理技術

這一處理技術在使用過程中運算速度較慢，主要是由于其需要對逐幀的圖像均進行處理，也包括兩種處理方式，分別為邊緣填充和腐蝕膨脹處理。其中邊緣填充處理主要指的是在確定運動物體之后，利用計算機系統自身的邊緣檢測處理技術，對物體的輪廓進行辨識，并利用形態學上的漫水填充方式對運動物體周圍的噪點進行顏色填充，減小其對畫面整體元素的影響。而腐蝕膨脹處理與邊緣填充處理原理相類似，但這種處理技術主要是針對于噪點進行腐蝕和膨脹，使其在畫面當中所占比例擴大，但對運動物體本身不造成影響，這使運動物體和噪點之間的差異就會更加明顯，就可以將噪點的影響降到最低，但這種處理方法的效果和攝像機本身的性能、質量等有著密切的關聯。

3）背景的實時更新預處理技術

在進行運動物體和背景分離過程中，計算機系統需要對圖像上的背景元素進行辨識，并對其開展初始化處理，這樣就能夠為后期實時背景圖像的差異進行凸顯，以增加前景圖像的效果，降低噪點對圖像的影響。在運用這一技術時，首先要先對第一幀的圖像進行確定，并將第一幀圖像當中的背景圖像元素進行辨識，然后在后期圖像更新和運動物體檢測過程中對背景進行實時更新處理。在更新的過程中其流程主要包括：首先，系統要對所讀取的畫面進行有效的判斷，了解該圖像是否為第一幀；其次，將Opencv處理的圖像轉變為單通道灰度值；第三，對轉變后的圖像進行高斯平滑度濾波處理，將圖像當中的噪點進行去除；第四，采用形態學噪點填充技術對圖像當中的噪點進行二次處理，以獲得所需要更新的背景圖像。

3.3 前景運動物體的提取技術

在計算機視覺技術進行運動物體的檢測時，只有有效保障檢測流程的準確度，才能夠有效保障對前景運動物體的跟蹤效果。其主要分為兩大步驟，其一是對二值化后的圖像數據進行分割處理；其二是在圖像分析前對其進行充分的填充處理，保證前景圖數據的完整性。同時，在前景圖像提取的過程中也分為多個步驟，其包括：首先，對所提出的前景圖像和背景圖像進行差分處理；其次，將差分處理后的圖像二值化處理；第三，對背景當中前景物體的輪廓或邊緣進行辨識，根據前景圖像的輪廓對其進行填充。由于在實際操作過程中，攝像頭所處環境的變化較大，并且會在不同場所內的不同角度捕捉畫面，因此就需要在前景圖像提取時有效提高背景圖像實時更新的效果。

利用閥值二值化的分割方式能夠有效將前景圖像和背景圖像分離開，從而使目標運動物體能夠呈現獨立化，并且閥值分割方式開展前要相對每個像素點進行確定，判斷其是否位于灰度值的范圍內。而將該圖像的像素灰度和閥值進行對比后會出現兩種結果，分別是灰度值低于或高于閥值。在實際應用過程中，有效確定圖像的分割閥值T，就能夠降低環境當中光照因素對圖像質量的影響。

4 計算機視覺技術當中的三維重建技術

1）三維重建的視覺系統

計算機視覺技術在對圖像進行捕捉時可以視為是對大量的圖像信息進行處理，從攝像機的視覺角度出發，其所輸入的圖像一般為二維屬性，但輸出的信息確是三維數據，而這種三維空間數據能夠提升對運動物體所處空間位置、距離等描述的準確性。在三維重建視覺系統工作過程中，其相對基本的圖像數據框架進行確定，然后利用一個坐標點建立2.5D圖像數據，即以此點為視角能夠觀察到的圖像數據，再將2.5D圖像數據進行整合從而建立三維圖像。

2）雙目視覺系統

當人體利用雙眼在不同角度、同一時間內觀察同一個物體時，就可以利用算法來測量該物體和人體之間的距離，而這種方法也被稱為雙目立體感，其應用的原理主要是人體視覺差所帶來的影響。同時利用兩臺攝像機對同一圖像從不同角度進行觀察，就能夠獲得人體雙目觀察后的效果，因此這一三維重建技術也被稱為“雙目視覺系統”。兩臺不同的攝像機即可代表人體雙眼，其對圖像進行逐幀捕獲，但由于角度不同和環境影響因素的差異，因此造成了圖像差異，必須對其捕捉的圖像進行預處理。

3）三維重構算法

在計算機視覺技術中對于視頻流的采集主要依靠的是彩色攝像機、紅外攝像機、紅外接收攝像頭等設備。還可以利用微軟所提供的Kinect設備，在進行運動物體檢測前能夠對NUI進行初始化處理，將系統內函數的參數設定為用戶信息深度圖、彩圖、骨骼追蹤圖等數據。在使用Kinect設備對視頻流進行打開時，其可以遵循三個步驟，其一是彩色和深度數據的處理；其二是根據數據的索引添加顏色信息，并將其引入到深度圖數據當中；其三是骨骼追蹤數據。

5 結束語

計算機視覺捕捉技術是現代計算機應用當中較為先進的內容，其應用范圍較廣，對于運動物體的捕捉準確度較高，能夠有效推進現代計算機模擬技術的發展。

參考文獻：

[1] 張海科.基于Opencv的人手識別與跟蹤定位技術研究與實現[D].昆明：云南大學，2013.

篇(2)

關鍵詞：計算機；視覺檢測技術；原理；應用

中圖分類號：TP391.41

受到CIMS的推動和影響，諸多企業的發展趨勢逐步趨向于個性化以及自動化，這種大的發展趨勢間接的對我國的計算機輔助技術提出了更高的要求，計算機相關技術的發展面臨著更加嚴峻的挑戰。就現階段分析來看，計算機輔助檢測技術在現代諸多企業中得到了廣泛的應用。隨著柔性制造系統的不斷進步與發展，驅動圖像處理軟件、現場總線技術的日趨成熟，檢測系統的靈敏性、智能化特點愈發受到人們的關注，在這種大的發展趨勢之下，計算機視覺檢測技術得到了較快的發展。基于計算機視覺系統現已經廣泛應用于現場監控、工況監視等諸多環境之中。

1 關于對視覺技術的相關研究

1.1 基于計算機的視覺檢測技術的原理分析和探究

圖像技術主要指的就是通過各種途徑所實現的對圖像的獲取以及進一步的深入加工和處理技術。根據視覺檢測技術的抽象程度以及對圖像處理方式的不同，可以大致將圖像的處理和加工技術劃分為三個最主要的層次，這三個層次分別是圖像的加工處理、圖像的分析以及對于圖像的理解。將這三個層次進行進一步的結合，便是圖像工程。計算機視覺檢測技術是一門新興的計算機檢測技術，該技術建立在對計算機視覺研究的基礎之上，吸收和借鑒相關的研究成果，借助于傳感器來實施三維測量，進而有效獲得被測物體的空間具置信息，故而可以很好的滿足當代制造業的發展需求。區別于一般的圖像處理系統，計算機視覺檢測技術所獲取的相關數據信息更為精準和迅速，其環境適應性更強。

基于計算機的視覺檢測技術注重計算理論的輔導作用，以應用為目標進行視覺技術分析。自上世紀七十年代以來，我國關于對計算機視覺檢測技術的研究又取得了顯著的進步，并且逐步邁入更為實質性的研究階段，在該階段中，逐步開始從通過從多個角度（諸如光學角度、生理學角度以及投影射影角度等等）對其成像問題加以分析。以Marr為代表的專家更是建立了一些一般性的視覺性處理模型來輔助該技術的研究。

1.2 視覺檢測技術中傳感器的作用

在計算機的控制下配有相關的視覺檢測系統，在該視覺檢測系統中，主要有三個主要方面的主要作用：第一，對于視覺傳感器模型的分析以及確定；第二，進行圖像數據分散與整理的相關工作；第三，CAD模型的建立。傳感器的主要作用就是對測量棒材的多個截面進行分析，將所收集得到的數據經由圖像采集卡采集后，傳到相關的圖像處理系統中，進而進一步輔助準確的模型的建立。

2 基于計算機的視覺檢測技術的應用研究分析

2.1 基于計算機的視覺檢測技術的發展狀況研究

在研究的初步階段，相關技術人員借助于數字化的圖像處理技術，主要就是為了進一步提高所獲得的數字照片的清晰度和質量要求，進而更為精準、科學、規范的對照片所提供的信息加以辨別，為航空衛星圖片的讀取、識別和分類做準備。在這一系列的視覺工作中，其中最為主要和常見的工作主要是包括分類、識別判讀以及三維結構的構建。

基于計算機的視覺檢測技術借助于對計算機視覺技術，將所獲得的被觀察物品的相關信息加以信號轉換，并傳遞給圖像處理系統，圖像處理系統通過甄別和判斷不同照片像素的分布和亮度等訊息，將其進一步轉換成為數字化信號，接下來由計算機的圖像系統抽出符合目標特征的信號加以運算，對下一步的設備動作加以決定和執行。

就現階段而言，我國的計算機視覺檢測技術系統在諸多領域均有所應用，最為典型的領域諸如醫學的輔助診斷、機器人的感應系統、智能化的人機接口等均是建立在該技術的基礎之上。借助于計算機視覺技術這一手段，可以有效提高對產品檢測的效率，提高精準度，這種新型的視覺檢測技術相比較于傳統的人眼在流水線上的跟進，其具有顯著的優越性，其獲取測量結構迅速、檢測結果可以直接被觀察、可以進行自動識別以及定位準確和實時性的特點，這就很好的避免了由于人的一些主觀性因素所導致的誤差出現。

二十世紀以來，基于生物特性的計算機視覺檢測技術得到了空前的發展，具體表現在人臉識別、生硬識別、指紋識別以及虹膜的識別中，形式日趨靈活和復雜多變。借助于計算機的視覺檢測技術，可以有效對用戶的身份進行鑒定和識別、判定用戶的特殊信息等。除此之外，還可以將基于計算機的視覺識別技術逐步推廣到其他領域，如海關的安全檢查以及出口、入口的安全控制等領域。

2.2 基于計算機的視覺檢測技術的相關應用分析

2.2.1 數碼相機中所采用的圖像采集技術

視覺檢測技術的一個顯著特點就是有效提高了生產的柔性和自動化程度，本世紀以來，數碼相機憑借其高分辨率，快速成像、顯像，功能豐富多變以及性價比較高的特定風靡全球，逐步取代了傳統的照相機，傳統的照相機主要采用的是CCD 攝像頭，其主要的核心及時采集卡，顯然這種采集系統已經逐步落后于時展的腳步，現已逐步被淘汰。

2.2.2 微文字識別系統的相關研發和設計

隨著科學技術的不斷進步與發展，大規模集成電路得到了較快的進步，基于計算機的視覺檢測系統的成本得到了極大的降低，基于計算機視覺檢測技術的微文字識別系統的研發也被提到了日程中來。微文字識別系統的處理芯片大多是借助于數字信號處理芯片來實現圖像的識別，進而借助先進的語音合成技術將朗讀變為可能。此外，為了便于使用，該系統的體積被盡可能的縮小，并且可根據美觀度和實用性等設計為各種形狀。

2.2.3 特殊用紙水印在線檢測系統

基于計算機的視覺檢測技術可以在某一特定領域代替人的主觀判斷，諸如水印質量的自動檢測方面。區別于普通的工作人員，計算機可以實現長時間工作，對于誤差范圍的控制可以通過設置等實現，而且在計算機執行任務期間，所受到的客觀和主觀因素相對較少，這就極大程度上避免了由于人的因素所導致的失誤性操作，進而有效提高了工作效率以及檢測的精準度。這一優點，在水印質量標準的認定中具有十分重要的意義和作用，通過研發一定的程序和軟件，可以制定出一套操作性強、權威性較高的水印清晰度量化標準。

3 基于計算機的視覺檢測技術的發展展望

綜合分析來看，計算機視覺檢測技術現已有大約四十年的歷史，作為一種新興的檢測技術，該技術的顯著優越性不言而喻，該檢測技術以其高精度、反應靈敏迅速、智能化、自動化等特點被廣泛應用于諸多領域和行業之中，并取得了顯著的成，可以說，該技術具有十分廣闊的發展前景。但是，不可否認，基于計算機的視覺檢測技術并不是十分的成熟，在其設計和研發過程中仍然存在著諸多不足，而且視覺檢測技術是一項設計到心理、生理等多方面知識的復雜性技術，涉及領域眾多，更強大功能的實現需要人類知識的不斷拓展和延伸，因此，必須意識到該檢測技術發展道路上的困難和挑戰。

4 結束語

隨著科學技術的不斷進步與發展，經濟的發展對于新技術的研發提出了更高的挑戰，再者由于廣大人民群眾生活質量的不斷提高，對于生活水平也有了進一步的認識和了解。基于計算機的視覺檢測技術的研發和進步，無疑更好推動了高速發展的經濟，不斷滿足了人民群眾日益提高生活需求。由此來看，深入對視覺檢測技術的研究和探究無疑具有十分重要的作用，筆者衷心希望，以上關于對我國基于計算機的視覺檢測技術的相關探究能夠被相關負責人合理的吸收和采納，進而更好的推動科學技術的創新和進步，推動經濟的不斷進步與發展。

參考文獻：

[1]李旭港.計算機視覺及其發展與應用[J].中國科技縱橫，2010（06）：42.

[2]張江明，張娟.淺談制造業中計算機視覺檢測技術的應用與發展[J].科技創新導報，2011（24）：1.

篇(3)

關鍵詞：計算機視覺；智能交通；監控系統

中圖分類號：TP277

近些年來，隨著我國人民生活水平提高，使私家車輛的數目急劇增長，并且車輛的增長速度遠遠超出市政建設的力度。這樣的事實導致城市交通擁堵、違規通車、車禍增加，所以迫切的要求加快市政建設，實施高效率的交通監控措施，基于計算機視覺的智能交通監控系統也由此得到了相應的廣泛的發展和應用。那么，計算機視覺技術下的智能交通監管系統究竟應該如何設計與實現呢？

1 計算機視覺下的智能交通監控系統

1.1 計算機視覺技術

計算機視覺技術即利用各種圖像攝錄設備將通過對視覺目標進行識別、跟蹤、測量并將由此獲取的視覺信息傳輸至計算機并進而利用圖像技術進行視覺信息處理以達到進一步進行智能化處理的視覺處理技術。

1.2 智能交通系統（ITS）

智能交通系統（ITS）是指通過現代化的網絡信息技術、自動控制技術等有效綜合手段在一定范圍內建立的全方位發揮作用的交通運輸綜合管理和控制系統。作為交通運輸管理體系的一場新的革命，近年來，由此技術進一步開發形成的監控系統已經在各個道路的關鍵路口、路段和其他交通繁忙地域普遍建立，為交通運輸管理提供了自動化、智能化的信息收集和處理等多方面的服務。但是，隨著城市建設的迅猛發展和人流、車流量的猛增，更加智能化的交通管理系統的開發和利用顯然也成為了當務之急。

2 計算機視覺下的智能交通監管系統的建立

正是基于新的發展需要，我們有必要把計算機視覺和智能交通監控系統進一步結合起來，首先通過計算機視覺分別對各個道路的關鍵路口、路段和其他交通繁忙地域等相應位置實時進行交通信息采集，然后，通過信息傳輸系統、或者進行處理后存入服務器并將處理過的實時交通信息及時傳輸到監控指揮系統，以實現對于各個道路的關鍵路口、路段和其他交通繁忙地域的實時監控和管理。由此，顯然就需要設計以下各個子系統并共同構建為一個完整的體系。

計算機視覺下的智能交通監管系統

實時交通信息收集系統

監控指揮系統

高質量信息存儲傳輸系統

圖1 計算機視覺下的智能交通監管系統工作程序示意圖

3 智能交通監控系統的實現

計算機視覺下的智能交通監管系統實現的第一步是通過實時交通信息收集系統實時進行交通信息采集，即通過對于運動物體的分割，在圖像找出有意義的部分，抽出運動目標的特征，進而通過連續畫面間的變化判斷目標的運動狀況。在這一系統運行中，首先可以“攝像頭讀入”的初始視頻，使用相應的算法提取“背景”，然后通過原圖與背景運算形成相應的“前景”，由此即可進一步通過矩形框的使用來達到“運動目標檢測”與信息采錄的目的。

圖2 視覺監控系統原理圖

3.1 系統功能實現

對運動物體的檢測主要有光流法以及差分法兩種方法，由于光流法比較復雜和耗時，實時檢測很難實現，因而，現有實時交通信息收集系統一般通過差分法的應用來進行開發和實現。

3.1.1 幀間差分法

幀間差分法對運動目標進行分割處理過程中使用較多也最為簡單實用的一種方法，其基本原理就是通過在連續的圖像序列中兩個或三個相鄰幀間采用基于像素的幀間差分并且閾值化來提取圖像的運動區域，進而通過逐象素比較獲取前后兩幀圖像之間的差別來判斷運動物體的移動狀況。在實際操作中，一般可以假設用于獲取序列圖像的視頻設備為靜止物體，設視頻中連續兩幀的圖像為It（x，y）和It+1（x，y），然后通過對連續兩幀的圖像相應的像素進行比較，利用Dt（x，y）=It+1 （x，y）-It（x，y）這一方程求出相應的閾值來檢測出運動物體的移動狀況：

Mt（x，y）=

當然，必須注意的是，由于幀間差分法所得到的差分圖像在現實中并非由理想封閉的輪廓區域組成的，因而，運動目標的輪廓自然也就往往是局部的、不連續的，且其誤差往往隨著運動物體速度的增大而增大，因而，這一方法并不適于對于高速運動目標的有效檢測。

3.1.2 背景差分法

與幀間差分法不同，背景差分法則是利用當前圖像與背景圖像的差分來檢測物體運動狀況一種方法。其基本原理是在可控制環境下，通過對于運動背景的固定假設，設待檢測運動物體的圖像為I（x，y），背景圖像為B（x，y），通過輸入圖像與背景模型進行比較，利用D（x，y）=I（x，y）-B（x，y）這一方程求得到圖像中的各像素的變化信息，進而檢測運動物體的移動狀況：

Mt（x，y）=

當然，在實際運用中，背景差分法的關鍵，是要建立一個背景模型，并更新模型。

3.2 程序功能的實現

本程序功能實現所主要使用的是OpenCV函數。OpenCV能夠實現對圖像數據的操作，包括分配、釋放、復制、設置和轉換數據，以及對攝像頭的定標、對運動的分析等。在函數實現上，用到了Cv圖像處理的連接部件函數，運動分析與對象跟蹤中的背景統計量的累積相關函數等相關的函數。本系統就是運用圖3介紹使用到的函數名及其功能和使用格式等來實現對視頻流的運動車輛的輪廓檢測的。

圖3 尋找輪廓程序主要算法流程

實驗證明，本系統能夠較好地實現對視頻流的運動目標的輪廓檢測和對象跟蹤，并能實時更新背景，車輛跟蹤正確率在95%以上，雖然存在著輪廓檢測正確率稍差的缺點，但其主要原因是由于攝像頭所處的角度和運動目標靠近程度的影響，從根本上并不影響對于運動目標的實際檢測。

4 結束語

加快城鎮化進程是我國發展的大趨勢，在這一趨勢下，城市病的治理當然可以離不開現代化的科學技術。但是，必須注意的是，無論多么先進的管理系統，最終都只有通過人的行為才能夠發揮有效的作用，在這個意義上，設計與使用先進的交通監控系統固然是解決交通問題的技術條件，但是，交通問題的解決，最終還必須依賴于人的素質的全面提高。

參考文獻：

[1]戴俊喬.城市道路交通視頻監控系統架構和性能的研究[J].科技與創新，2014（06）.

[2]張偉龍，李剛，王雨翔.基于計算機視覺的智能交通監控系統[J].小型微型計算機系統，2014（07）.

[3]龐其富.淺談城市軌道交通視頻監控系統設計方案[J].通訊世界，2014（01）.

篇(4)

提起數字媒體，人們通常會想到傳媒行業，其實數字媒體的應用絕不局限于傳媒。隨著寬帶網絡的普及，人們在日常業務處理過程中，正面對越來越豐富的網上媒體和內容，包括各種視頻、音頻、文本、圖像等。下面，就讓我們跟著諸位數字媒體方面的專家一起來分享這個繽紛的世界。

三維幾何建模與形狀表示

北京大學視覺與聽覺信息處理國家重點實驗室主任教育部長江學者獎勵計劃特聘教授查紅彬

精彩問答

在背景比較復雜、有干擾的情況下模型檢索的效果怎么樣？

在模型檢索的時候并沒有考慮背景，因為這是做模型檢索比較容易的部分。模型檢索一般是沒有背景的，但也可以做，但是要推廣到背景比較復雜的物體上識別可能有很大的問題，因為這時候匹配不僅僅是局部匹配，而是兩個子集和子集的匹配問題，到目前為止，我們只是做沒有背景的模型檢索。

為什么要重新談論三維形狀表示問題？在多媒體信息處理領域里面，有兩個比較重要的方向，這也是計算機科學技術領域里兩個重要的方向，一個是計算機視覺，一個是計算機圖形學。計算機視覺是從圖像中通過識別或重建處理，得到一個對對象物的描述。反過來說圖形學，是對一個對象和場景的描述，通過繪制和動畫生成圖像和視頻。它們從處理過程來說是逆過程，這兩個領域之間有密切的關聯。

我們現在考慮計算機三維建模或模型的描述，考慮的不僅僅是計算機視覺或計算機圖形學所包含的內容。這里面簡單列舉一下，比如基于模型的三維物體識別和場景識別，這兩個應該是典型的計算機視覺里面考慮的應用。除了這以外還可以用模型干別的事情，比如繪制，還包括基于這樣模型的設計、變形、動畫等等。除了兩個單獨研究的應用之外，還要想怎么把兩者結合起來，把虛擬和真實的東西無縫連接到一起，這些都牽涉到三維模型。

我們考慮的三維模型跟以前相比，應用領域大了很多，要達到這個要求，對模型的表達、形狀的表達也都有了更高的要求。

怎樣找到一些更新更有效地表達形式來符合這些要求呢？這里有四個方面，現在能不能建立一個形狀空間，把考慮的對象完整地在形狀空間里面表達出來。第二點就是針對形狀的特性，表達要具有柔性，對象物的表面不都是連續的，也有一些非連續性和不規律性，這些特性怎樣能夠進行柔性處理。第三個是需要一些描述是局部性的，另外一些要求描述是整體性的，這兩者之間如何有一個很好的結合方法。第四是在大量的計算當中，包括變形和動畫中有很多編輯的工具，所以我們要求對現在的形狀表達有一些比較高的要求。

在計算機視覺里面有一個老大難就是識別，已有模型，但是眼前看到的是一部分三維數據，怎么用這部分數據和模型數據匹配來識別它呢？這就牽涉到局部匹配，我們要解決局部匹配需要什么描述？我們要有一個模型，從大量的數據中建立一個模型庫，并從中抽取很多特征，把這些特征進行組織。這里面牽涉三個比較大的問題，第一個是形狀空間怎么構造，沒有很好的特征表達或整理的形式，后面的匹配以及其他的工作就很難做。第二個是怎么定義基于這種特征的相似度。第三個是怎樣在形狀空間當中搜索到最優的匹配。

針對這些問題我們最近一兩年做了一些工作，最近提出一個廣義形狀分布(Generalized Shape Distributions)描述方式，主要目的有兩點，能不能在三維形狀表示過程當中，找到一些最關鍵的描述指令，并從中找到相互關系，把整體和局部結合起來。如果把之間的關系描述出來，就能把局部結構性的信息用整體觀點加進去，這兩件工作就是我們做這件事情的主要目的。

在形狀描述問題上，我們還有很多工作要做，除了局部、整體描述之外，我們要想辦法把他們結合到一起。今后幾年要用更多的模式識別的辦法，來解決面臨的圖形學或虛擬現實和計算機視覺當中的很多問題。

生活中的計算機視覺

香港中文大學信息工程系終身教授

微軟亞洲研究院視覺計算組負責人湯曉歐

精彩問答

微軟亞洲研究院視覺計算組在原創思想這一塊，引領下一個方向有沒有什么考慮，您談到很多對人們日常生活影響很大的應用，但是在背后的更深層的考慮，更新的創意在哪里呢？

我們的研究者都很年輕，我本人也才工作七年的時間，很多的算法已經發展這么多年了，所以在開始的時候比較容易想出來的方法，現在已經很難有那么多的原創內容。我們的工作是去找一些非常原創的內容，有的是理論上的，有的是新的發明，這可以有很大的影響。

圖像通過閃光燈的分割，前景和背景深度差會不會影響分割效果，距離會不會影響分割效果呢？

我們這個通過閃光燈對圖像進行分割的技術，會一定程度上受到光的強度和距離的影響。

我們主要的研究領域包括計算機視覺、模式識別、圖像處理和視頻處理。下面就為大家介紹幾個比較典型的應用。

如何將圖片的前景和后景分離？我們現在照兩張圖片，一張打閃光燈，一張沒有打閃光燈，這樣拍出來的照片背景沒有變化，但前景變化很厲害。在開閃光燈的情況下拍的照片，前景和后景可以利用一些技術很容易地分開來。

把一個圖片的前景切割出來放入另一張圖后，那剩下的圖片缺一塊的怎么辦呢？如何修復剩下的圖片呢？在例舉的圖片上，大家可以看到不同的區域，我們可以由一個算法，從其他的地方借過來，再貼上去，經過這樣的處理后，圖像基本上和原來沒有太大的區別。

如此的修修補補又有什么用呢？比如說，你對這張圖像不是很滿意，你可以把圖片上不喜歡的部分劃出來，然后利用一些技術將劃出來的空白部分填上。更有用的地方在于，你照了不想被別人看到的照片后，除了刪除，你多了一個選擇。你可以把不想讓別人看到的照片部分去掉，并利用一些算法把空白的地方填補上，而且讓別人看不出來。

現在大家的電腦上都會有很多照片，怎么快速地瀏覽這些照片呢？我們可以把這些圖像都放在一個屏幕上，可屏幕畢竟有限，怎么才能把照片放得更多一些呢？我們現在做的是可以隨機把照片放到桌面上，但是電腦會對每張照片上的重要信息進行篩選，在放盡可能多的照片的同時，讓每張照片上最重要的信息不被遮掩，而且均勻地分布在桌面上。這樣大家看起來就更清楚了。這個算法就是怎么讓所有圖像均勻分布，同時把所有背景都要蓋上。我們可以對圖像進行各種處理，同時我們也可以利用一些技術知道別人有沒有處理圖像，對圖像有沒有做過手腳。

現在我們來說說視頻方面。比如說抖動很厲害的圖像，怎么把物體移到中間？一個辦法是把除移動圖像外的公共部分切出來，但是移動越大，公共部分就會越來越小，更好的辦法是用一些技術把空處填上。

現在MSN的功能已經越來越豐富。比如說一段電影，你看到一件比較中意的衣服，只要你把鼠標移動衣服的覆蓋范圍，你就能很清楚地知道這件衣服的品牌及價格。如果你把鼠標在那件衣服上輕點，電腦就會直接跳轉到這個衣服的相關網站。

你在視頻聊天的時候如果不想讓對方看到你所處的環境，你就可以很輕松地把背景模糊掉。如果大家對自己的長相不是那么有信心，我們可以幫你改變一下你的長相。為自己添一幅酷酷的墨鏡，換上一個性感的大嘴巴，這些都能輕而易舉地完成。

多媒體傳感器網絡

北京郵電大學教授、博士生導師

智能通信軟件與多媒體北京市重點實驗室主任馬華東

傳感器研究是IT非常熱門的話題，首先我為大家介紹一下多媒體傳感器網絡的基本概念。從早期的巨型機到今天的小型機，生物芯片尺寸越來越小，但是效率越來越高；網絡設備聯網和數據交換的需求越來越大，設備之間的傳輸量也越來越大；從信息處理的角度來看，內容逐漸占據了主導地位，由數據為中心轉到以內容處理為中心。這三方面的演化是今天討論多媒體傳感器的背景。

傳感器網絡是一組傳感器節點，由組織方式協作地感知采集和處理感知對象的信息，它的基本特點是造價低、能量敏感、通信能力有限、計算能力弱、動態變化。現在的需求是要求通信能力越來越強，計算能力應付節點的處理的要求。

右圖是目前主流的傳感器節點的配置，從配置來講還是比較低的，現在信息處理側重壓力、溫度、光、震動等簡單的數據或者是標量數據。人類獲取信息80%是視覺信息，10%左右是聽覺信息，也就是說90%左右的信息是多媒體信息。傳感器網絡就是對音頻、視頻信息獲取后提供給使用者，使其對環境信息有一個全方位的了解，對傳感器網絡的應用是非常廣泛的。

從網絡的結構來講，基本結構和原來傳感器網絡差別不是很大，這里面強調增加音頻、視頻獲取處理，網絡傳輸整個過程的各個環節，同時這里面最好可以交互。有了這個概念以后，深入分析一下主要特點，首先是網絡能力的增強，這樣一個傳感器網絡應該集信息的采集、處理傳輸、轉發、能量供應等方面，除了傳統的標量數據，音頻、視頻的圖像數據，都可以進行采集處理。

現在多媒體傳感器網絡目前有哪些問題呢？從需求來看，現在網絡是異構的信息，媒體信息的格式，種類很多，并且差異非常大，數據量比較大，特別是音頻、視頻信息，格式比較復雜。這些信息傳輸過程中需要高速實時地傳輸，對網絡傳輸速率也提出了比較高的要求。媒體信息的安全問題，也是網絡需要考慮的，還有服務質量的問題。針對這些需求，我們可以看到，通信資源和計算資源這兩者之間存在非常大的矛盾，或者非常大的鴻溝，如何解決這兩者之間的差距就是我們研究的問題所在。

最后談一下多媒體傳感器網絡研究的挑戰，首先是節點的芯片設計，這是基礎，這里面需要采用多種技術，包括軟硬件協同設計的技術，各種技術結合，降低成本、能耗、體積、提高運算速度和可靠性。第二是三維場景的覆蓋問題，方向性傳感模型是一個簡單的二維圖形，實際上是三維圖形監測，這是一個三維場景方向的問題，研究這個就復雜多了。還有一個問題是服務質量保證問題，在新的網絡當中服務質量體系是什么樣，也是研究的方向。再一個是信息處理，為了使網絡傳輸數據量比較快，能不能在節點做信息處理的計算。當然信息的安全也比較重要，用這些節點獲取多媒體信息怎么保證安全的質量，使應該看到的人看到這些信息，不應該看到的人看不到這些信息。

在多媒體傳感器網絡中，我們還是做了一些工作，和一些同行學者也有一些交流，這里面也有一些質疑，說多媒體傳感網絡和原來傳感器網絡設計初衷是不是吻合的，原來沒有想讓它處理這么多信息，原來體積比較小，加上這些信息以后，無疑使它的體積增大，這里面和初衷之間是不是有矛盾，傳感器網絡研究有沒有必要性，如果有必要性可行不可行，這都是我們目前研究的問題。

篇(5)

1視覺跟蹤算法

1.1KCF算法

KCF（KernelCorrelationFilter)核相關濾波算法通過目標樣本去訓練判別分類器，訓練判別分類器分析當前跟蹤的目標是被跟蹤目標周圍的背景信息還是被跟蹤目標，如圖1所示。KCF通過嶺回歸分類器的學習來完成對目標的跟蹤，通過快速傅里葉變化實現算法的加速運算。KCF跟蹤算法在訓練階段，利用循環矩陣理論，對視頻目標區域進行稠密采樣，獲取正負樣本，提取方向梯度直方圖（HOG)特征，通過嶺回歸分類器分析所以樣本進行訓練。在檢測階段，以視頻前一幀目標位置為中心進行稠密采樣，將得到的所有樣本輸入到嶺回歸分類器，經過嶺回歸分類器的分類，得到目標的位置。

1.2TLD算法

TLD（Tracking-Learning-Detection）目標跟蹤算法由跟蹤模塊(Tracking）、檢測模塊(Detection)、學習模塊(Learning)三部分組成，如圖2所示。該算法首先由跟蹤模塊的作用是將被跟蹤目標的運動軌道處理成軌道碎片提供給學習模塊進行學習，學習模塊根據跟蹤模塊的處理結果進行學習并對檢測模塊的錯誤進行分析，通過學習處理后生成訓練樣本，檢測模塊在接收到訓練樣本后對相關參數和目標模型進行跟新并對跟蹤模塊重新初始化，其中跟蹤模塊為中值流跟蹤器，學習模塊為P-N目標模型學習。

1.3視覺跟蹤算法改進

KCF跟蹤算法的運行速度方面和在目標環境變化不大的情況下跟蹤速度表現優異，但其在被跟蹤目標出現遮擋、形變、跟丟后無法找回目標，反觀TLD解決了被跟蹤目標被遮擋、目標跟丟無法重新找回的情況，因此將兩個算法互相融合，取長補短能提高算法的運算速度和追蹤效果。融合方法：利用KCF克服TLD的中值流跟蹤器的缺點，將KCF替換TLD的中值流跟蹤器，能夠加快TLD的目標跟蹤速度。當被跟蹤目標在當前圖像幀中消失后，KCF會把盲目地在背景中尋找被跟蹤目標，當被跟蹤重新出現時，KCF算法依然在背景中尋找被跟蹤目標，導致跟蹤失敗，為了避免這個錯誤的方法，KCF與TLD融合的算法包含了原TLD學習模塊，當判斷目標丟失時不再盲目地在背景內尋找目標，當目標重新出現時重新跟蹤目標，進一步提高算法的跟蹤性能。雖然這兩個算法的融合方法很簡單，但融合后的算法確實解決了KCF不能跟蹤被遮擋的物體以及目標跟蹤后不能找回的缺點，而且算法速度上高于原TLD算法，提高了算法的性能和適用性。

2機器人控制系統設計

機器人系統總體框架如圖4所示，USB攝像頭拍攝到的圖像信以視頻幀的形式傳入到程序中。首先先進行KCF的濾波和特征跟蹤，再經由TLD算法的處理運算出目標狀態，再通過整合模塊把得到被跟蹤目標的位置信息轉換為云臺舵機轉動命令發送，通過CH340模塊將指令由USB轉為TTL電平，機器人下位機通過STM32單片機直接或間接地控制各個模塊實現機器人的各個功能。STM32單片機在接收到PS2手柄模塊和CH340模塊的控制信號后，根據程序存儲器對應的指令執行行動，如前進、水彈槍射擊等。STM32單片機實時接收各模塊的信息，例如編碼電機的電機轉速，陀螺儀的歐拉角等，根據各模塊的信息及時調整機器人的運動狀態實現機器人運動底盤的靈活移動。攝像頭所拍攝的圖像信息并不會直接交給STM32單片機除了，而是先經由上位機NUC通過視覺追蹤算法運算過后所得的控制指令發送給單片機接收，單片機接收到通過CH340轉換的控制指令后控制舵機云臺轉動追蹤目標。

3機器人目標跟蹤算法軟件設計

目標跟蹤算法軟件實現流程圖如圖5所示。由于該目標跟蹤算法的運算結果只返回一個跟蹤框，并沒有實際的跟蹤結果，所以需要獲取被跟蹤目標所在圖像中的坐標，獲取包圍被跟蹤目標的矩形重心后，才能方便實現目標跟蹤算法。計算出被跟蹤目標的矩形包圍框的重心后，先對圖像幀區域進行劃分，使用漸近式接近目標區域為核心思想，將每一幀的圖像劃分為許多相同的矩形區域。隨后根據KCF+TLD目標跟蹤算法運算得出的結果框的重心與圖像正中心對比，計算出被跟蹤目標與圖像正中心坐標的偏移量，再通過舵機控制算法計算出舵機云臺的轉動量，逐幀接近目標所在位置，達到跟蹤效果。

4系統視覺跟蹤算法測試

篇(6)

（長安大學信息工程學院，陜西西安710064）

摘要：目前計算機視覺在智能交通領域有著廣泛的應用，基于三維逆投影圖的車速檢測利用計算機視覺，使用線性系統模型進行攝像機標定，得到透視投影矩陣，確立三維世界坐標與二維圖像序列的映射關系。通過設定檢測區域并得到該區域的對應逆投影圖，利用車尾陰影特征檢測跟蹤車輛，得到車輛目標的位移（s）、時間（t）的關系，進行速度檢測，該算法具有較好的穩定性。

關鍵詞：智能交通；計算機視覺；透視投影矩陣；車速檢測

中圖分類號：TN911.73?34 文獻標識碼：A 文章編號：1004?373X（2015）16?0070?03

收稿日期：2015?03?09

基金項目：教育部博士點基金（20120205110001）

0 引言

車速檢測在交通領域中占有重要地位，其檢測方法包括虛擬線圈、雷達測速等傳統方法，以及利用計算機進行視頻分析處理的智能交通檢測方法。而在基于視頻進行車速檢測的方法中，大部分通過直接分析二維圖像得到車輛速度。由于攝像機的透視關系，二維圖像與真實物體存在很大差距，存在尺度變換和幾何形變，增加了車速檢測的難度。本文設計了一種基于三維逆投影的車速檢測方法，通過對二維圖像序列進行標定，進行圖像三維重建，得到逆投影圖像序列，該圖像序列中的車輛目標具有幾何不變性，其位置、大小與真實車輛位置、大小一一對應。經過檢測逆投影圖像序列中車輛目標的車尾陰影特征后，跟蹤連續幀目標，計算獲取目標速度。

1 三維標定

攝像機標定是通過確定攝像機的位置、內外參數和建立成像模型，來確定世界坐標系中的物體和它在圖像平面上的成像之間的對應關系。空間物體上某點的三維幾何位置與它在圖像中對應點的相互關系是由攝像機成像的幾何模型確定的。在傳統攝像機標定中采用針孔模型，攝像機坐標系與世界坐標系之間的關系可以用旋轉矩陣R 與平移向量μ 來表示，因此空間中一點P 在世界坐標系和攝像機坐標系下的齊次坐標[xW ] ,yW ,zW ,1 T 和[xC ] ,yC,z C,1 T 之間存在如下關系：

式中：R 為3×3 正交單位矩陣；μ 為三維平移向量，0T = [0,0,0]。

利用針孔模型中的透視映射關系，可以將上述關系簡化為式（2）：

式中：(u,v) 為一點的圖像坐標；(xW ) ,yW ,zW 為該點的世界坐標；mij 為投影矩陣M 的第i 行第j 列元素。

已知n 個點的圖像坐標和世界坐標，可以通過式（2）得到一線性方程組：

利用至少已知的6 個點對應的世界坐標和圖像坐標，通過最小二乘法可以求解線性方程式（3）的解m，得到投影矩陣M，實現了三維標定[1]。

2 車輛特征提取

車輛特征提取步驟如下：

（1）設定檢測框[2]。在路面上設立一虛擬檢測框，該檢測框與實際路面貼合，長15 m，寬4 m，投影到圖像坐標形成圖1（b）所示的ABCD。

（2）恢復逆投影圖。根據式（2）可知，三維中的每一個點通過透視投影矩陣M 變換后，都可以得到圖像坐標中與之對應的像素點。根據M 矩陣恢復該檢測框中的數據，得到大小為240×600的逆投影圖，該圖中的檢測目標不存在幾何形變和尺度變換，如圖1（c）所示。

（3）車輛目標檢測。檢測框設立在路面上，所有點的z 坐標均為0，由此恢復得到的逆投影圖中xy 平面的信息是與實際對應的真實信息。在恢復后的逆投影圖中，車尾陰影部分這一明顯特征可以表征車輛目標[3]。通過大量實驗研究表明利用車尾陰影作為車輛特征，進行車輛目標檢測可以很好地避免干擾，減小誤差。

（4）車輛目標提取。在獲得的逆投影圖像中提取目標，本文通過檢測圖像中車輛目標的車尾陰影作為車輛特征，進行連續圖像序列幀中的目標跟蹤。圖1（d）中MN為車尾陰影位置所在像素行，該像素行與三維實際坐標一一對應，通過三維坐標距離與逆投影圖大小的對應關系可以得到車尾所在像素行對應的三維坐標。

3 車速計算

在已知的圖像序列中，假設連續幀中的目標車輛做勻速直線運動[4?5]。通過勻速直線運動方程s = vt + s0 計算目標車輛瞬時速度，利用最小二乘法原理可以很大程度上減小隨機誤差。當有多組（s，t）數據時，可以組成方程組，如式（4）所示：

式中：v 為車輛瞬時速度；ti 為連續n 幀對應的時間（即n/幀頻）；si 為車輛所在的實際位置。

轉換為矩陣形式為：

式（5）是一個(n × 2) × (2 × 1) = (n × 1) 的矩陣等式，記為AX = b 。

由式（6）可以求出X，得到車輛瞬時速度v。

4 實驗結果

通過標定后，可以獲得原圖像序列對應的逆投影圖，將逆投影圖二值化后求車尾陰影位置進行目標車輛的檢測與跟蹤。圖2為同一目標車輛的連續幀處理過程。在該序列圖中檢測并跟蹤目標車輛。將檢測到的車尾位置在原逆投影圖中標注，如圖3所示。車尾在逆投影圖中的像素行轉化為實際三維距離后可得si ，幀間時間間隔ti 為40 ms（幀頻為25 Hz），可以得到如表1所示的對應關系。由式（6）可以解出車輛瞬時速度為50.55 km/h。

5 結語

在交通領域中利用計算機視覺，通過圖像處理技術進行交通信息的檢測。建立基于攝像機的透視投影關系，可以標定出三維世界坐標與二維圖像坐標的對應關系，從而獲得三維逆投影圖，進行車輛目標的跟蹤，計算得到車輛速度信息。通過大量實驗研究表明，該方法可以準確計算得到車輛速度，具有較好的穩定性和可靠性，在當今智能交通領域具有一定的應用前景。

參考文獻

[1] 馬頌德，張正友.計算機視覺：計算理論與算法基礎[M].北京：科學出版社，1998.

[2] HE Xiaochen，YUNG N H C. A novel algorithm for estimating vehicle speed from two consecutive images [C]// IEEE Work?shop on Applications of Computer Vision. [S.l.]：IEEE，2007：111?120.

[3] 宋俊芳.基于視頻的車流量檢測統計技術研究[D].西安：長安大學，2010.

[4] 馬慧明.車速檢測技術述評[J].中北大學學報：自然科學版，2007（z1）：139?144.

[5] 童劍軍，鄒明福.基于監控視頻圖像的車輛測速[J].中國圖象圖形學報：A輯，2005，10（2）：192?196.

篇(7)

關鍵詞:運動目標識別;背景差分法;瞬時差分法;OpenCV

中圖分類號:TP273

0 引言

運動目標的識別就是對包含運動信息的視頻序列運用適當的技術進行處理,把與背景存在相對運動的前景區分開的過程。它是計算機視覺信息提取中的一個重要問題,也是更高層次視頻分析,如基于對象的視頻編碼、目標跟蹤、運動分析基礎。目前,運動目標識別主要有三種方法:背景差分法、瞬時差分法和光流法。背景差分法可以得到比較完整的運動目標信息,但是背景模型的獲取和更新比較困難。瞬時差分法容易在目標內部產生空洞,不能得到完整的目標信息。光流法計算比較復雜,且抗噪性能差,如果沒有特定的硬件支持,一般很難用于運動目標識別的實時性操作。

在此介紹一種將背景差分法和瞬時差分法相結合的運動目標識別算法,并給出基于OpenCV實現算法的過程和實驗結果。

1 算法思想

背景差分法是利用當前圖像與背景圖像的差分來識別出運動目標的方法。背景模型的獲取和更新是該方法中的關鍵技術。一種簡單的獲取背景圖像的方法是當場景中無任何目標出現時捕獲背景圖像,這種人工的非自適應方法獲取的背景圖像僅適用于短時間內的視頻監控。目前大多數算法已經放棄這種非自適應的背景圖像估計方法。當場景環境不是很復雜時,可以使用統計濾波完成場景中背景圖像的估計,大多數情況下都可以得到正確的背景估計圖像,但是當場景中有個別部分做無規則運動時,會引起場景中像素值不斷變化,從而引起估計誤差。基于高斯統計模型的背景估計方法在有部分區域不斷變化的場景中也能比較準確地估計出背景模型,但是它的計算比較復雜,加上識別過程中其他操作也可能無法滿足實時性需求。

瞬時差分法是在視頻序列中兩個相鄰幀間采用基于像素的時間差分,并且閾值化來提取出運動目標的方法。即將相鄰的兩幀圖像做逐像素相減運算,并設定閾值,若相減的值大于閾值,則將其看作前景圖像(運動目標);否則看作是背景圖像。瞬時差分法對于動態環境的適應性較強,不需要獲取背景圖像。當相鄰兩幀圖像的紋理、灰度等信息比較接近時,這種方法通常不能完整地檢測到目標的具體內容,在物體內部產生空洞。但是它可以較準確地得到運動物體的輪廓。

在此將使用一種背景差分法和瞬時差分法相結合的方法。首先根據一定數量的視頻序列,采用基于高斯統計模型的方法獲得背景圖像。在后續處理中,對于每一幀的視頻圖像,首先用瞬時差分法識別出運動目標的輪廓,然后用這幀圖像運動目標輪廓以外的區域對背景模型進行基于統計濾波的更新。這樣就可以減少場景中運動目標對更新背景模型的影響,同時保證了系統運行時間的實時性,也可以得到較完整的目標識別信息。

2 算法實現

根據前文的算法思想,可以得到系統的流程圖如┩1所示。

開放源代碼的計算機視覺類庫OpenCV(Open Source Computer Vision Library)是由英特爾公司位于俄羅斯的研究實驗室所開發的一套可免費獲得,并由┮恍┆C函數和C++類所組成的庫,用來實現一些常用的圖像處理及計算機視覺算法[7[CD*2]10]。下面給出利用OpenCV實現算法的具體過程和關鍵部分的代碼:

(1) 捕獲視頻幀

定義捕捉源:

(2) 基于高斯統計估計背景模型

定義高斯背景模型:

將高斯背景模型的背景圖像復制到事先定義的背景圖像pBkImg 中:

(3) 使用瞬時差分法獲得不包含運動區域的當前幀,并更新背景。當前幀pFrame和前一幀pFrame0做差分,結果放在差分圖像diff中,并二值化:

接下來要做的操作是,找到差分圖像中的輪廓,得到他們的外接矩形。將面積小的矩形視為噪音拋棄,剩下的則視為運動目標。同時設置當前幀pFrame和背景pBkImg的ROI為運動目標的外接矩形。先將當前幀的ROI置0,再對當前幀與背景的ROI進行邏輯(or)運算。這樣,對于運動目標所在區域,當前幀和背景的圖像信息是一樣的,也就達到了消除運動目標對背景更新的影響目的。

這段代碼如下所示:

用上述過程得到不包含運動目標信息的當前幀更新背景模型:

(4) 進行背景差分,得到當前幀運動目標識別結果的二值圖像pFrImg:

3 實驗結果

根據上述算法思想和實現過程,使用VC++6.0和OpenCV 1.0實現運動目標的識別。經過計算,該算法處理每一幀圖像的時間大約是16 ms,可以滿足實時性系統的要求。使用該算法對一段交通監控圖像進行運動目標的識別,結果如圖2所示。其中,圖2(a)是當前幀圖像,圖2(b)是不包含運動信息的當前幀圖像,用矩形框標注出了由幀間差分檢測到運動目標的位置,┩2(c)是當前的背景模型,圖2(d)是背景差分的結果。オ

4 結語

由上述實驗結果可以看出,本文介紹的算法可以較準確地得到背景圖像,并且實現運動目標的識別。

系統尚需改進的地方有對運動目標邊緣的檢測不夠清楚;如果可以加入陰影的檢測和去除,應該會取得[LL]更好的識別效果。這些將是進一步研究的工作。

參考文獻

[1]劉雪.基于圖像序列的運動目標檢測與跟蹤算法研究[D].山東:山東大學,2007.

[2]許志良,周智恒,曹英烈,等.關于運動目標檢測的發展現狀研究[J].移動通信,2008(6):35[CD*2]38.

[3]丁忠校.視頻監控圖像的運動目標檢測方法綜述[J].電視技術,2008,32(5):72[CD*2]76.

[4]尹彥,耿兆豐.基于背景模型的運動目標檢測與跟蹤[J].微計算機信息,2008,24(11):298[CD*2]300.

[5]趙占杰,林小竹,張金燕.基于背景重建的運動目標檢測算法[J].北京石油化工學院學報,2008,16(2):27[CD*2]30.

[6]肖麗軍,于哲舟,周栩,等.基于對稱差分算法的視頻運動目標分割[J].吉林大學學報:理學版,2008,46(4):691[CD*2]696.

[7]賈小軍,喻擎蒼.基于開源計算機視覺處理庫OpenCV的圖像處理[J].計算機應用與軟件,2008,25(4):276[CD*2]278.

[8]馬桂珍,朱玲贊,段麗.基于OpenCV的視頻應用程序的開發方法[J].現代電子技術,2007,30(4):78[CD*2]80.

[9]李振偉,陳,趙有.基于OpenCV的運動目標跟蹤及其實現[J].現代電子技術,2008,31(20):128[CD*2]131.

[10]劉瑞禎,于仕琪.OpenCV教程基礎篇[M].北京:北京航空航天大學出版社,2007.

亚洲色自偷自拍另类小说-囯产精品一品二区三区-亚洲av无码专区亚洲av网站-四房播播网站

計算機視覺的前景精品(七篇)

篇(1)

篇(2)

篇(3)

篇(4)

篇(5)

篇(6)

篇(7)

計算物理

航空計算技術

計算機

現代計算機