學號:21011110234。
隨著人工智能技術的不斷發展,智能機器人領域也取得了前所未有的發展。尤其是深度神經網絡在視覺系統中廣泛應用後,取得了很多明顯的成果。對於自主移動機器人來說,視覺系統起著非常重要的作用,而圖像分割技術在這個系統中起著非常重要的作用。傳統的圖像分割技術已經基本能夠分離圖像的前景和背景,但是近年來,隨著深度學習算法的發展,人們開始將其應用於圖像分割,並提出了許多分割網絡,也取得了很好的分割效果。在圖像分割的基礎上,人們還使分割有了語義類別和標簽,這就是現在的語義分割。在介紹語義分割的基礎上,介紹了新的任務分割場景、實例分割和全景分割。本文還介紹了最近研究的熱點三維點雲的語義分割,並闡述了其實現的必要性。
嵌入式牛鼻智能機器人,圖像分割,語義分割,計算機視覺。
嵌入奶牛問題的圖像分割技術的傳統常用方法
鑲嵌牛文字
壹.導言
計算機視覺,即計算機視覺,是通過計算機模擬人類視覺的工作原理,獲取並完成壹系列圖像信息處理的機器。計算機視覺屬於機器學習在視覺領域的應用,是壹個跨學科的研究領域,涉及數學、物理、生物、計算機工程等學科。
計算機視覺的主要應用有無人駕駛、人臉識別、無人安防、車輛車牌識別、智能圖像傳輸、3D重建、VR/AR、智能攝影、醫學圖像處理、無人機、工業檢測等。人類駕駛又稱自動駕駛,是目前人工智能領域的壹個重要研究方向,讓汽車自主駕駛或輔助駕駛員駕駛,提高駕駛操作的安全性。目前人臉識別技術已經比較成熟,在很多地方都有應用,人臉識別的準確率比人眼要高。安全壹直是我們國家非常重視的問題,也是人們特別關註的問題。很多重要位置都安排了巡邏巡邏,住宅小區、公司也安排了治安巡邏,確保安全。車輛牌照識別目前是壹項不成熟的技術。車輛牌照識別用於違章檢測、交通流分析、安全帶識別、智能交通燈和停車場中的車輛識別。在3D重建之前,廣泛應用於工業領域。它可以用來建模三維物體,方便地測量物體的各種參數,或簡單地復制物體。計算機視覺的應用有很多,隨著技術的發展,應用領域會越來越多。在工業領域中的應用,在機器人技術中的應用等。
對於傳統的圖像分割過程,通常可以分為五個步驟,即特征感知、圖像預處理、特征提取、特征篩選和推理預測識別。通過研究發現,在視覺發展的早期,人們並沒有對圖像中的特征給予足夠的重視。而傳統的分割過程是將特征提取和分類分開,然後在需要輸出結果的時候再合並,其實現的難度可想而知。
深度學習算法問世後,卷積神經網絡在計算機視覺技術中得到了廣泛應用,衍生出了很多研究方向。深度學習主要是基於特征來進行比較。比如人臉識別,用卷積神經網絡提取兩張不同位置人臉的特征,然後相互比較,最後得到比較結果。目前計算機視覺的主要研究方向有圖像分類、目標檢測、圖像分割、目標跟蹤、圖像濾波降噪、圖像增強、風格化、三維重建、圖像檢索、GAN等。本文主要針對圖像分割領域,進行了簡要的概述。
圖像分割技術是計算機視覺領域的壹個重要研究方向,也是圖像語義理解的重要組成部分。圖像分割是指將壹幅圖像分割成若幹個具有相似屬性的區域的過程。從數學的角度來看,圖像分割就是將壹幅圖像分割成不相交的區域的過程。近年來,隨著深度學習技術的逐步深入,圖像分割技術得到了突飛猛進的發展。與該技術相關的技術,如場景物體分割、人體背景分割、人臉和人體解析、三維重建等,已經廣泛應用於無人駕駛、增強現實、安防監控等行業。
二、發展現狀
近年來,許多學者將圖像分割技術應用到移動機器人的控制中,該技術可以在機器人運動的同時定位、構建地圖並分割出不同的前景和背景,使視覺系統掃描到的圖像具有語義信息。壹些學者還致力於更準確、更精確的分割,不僅可以區分不同種類的物體,還可以對同壹種類的不同物體進行分類,甚至在此基礎上劃分背景。因為我們生活的世界是壹個三維空間,所以有學者將圖像場景還原為三維,然後使用相關方法對整個三維場景進行分割。圖像分割作為計算機視覺研究中的經典問題,越來越受到人們的關註。
?首先是傳統的圖像分割方法。在傳統的分割中,人們利用數字圖像處理、拓撲學和數學的知識來分割圖像。雖然計算能力逐漸增強,深度學習也在發展,壹些傳統的分割方法不如深度學習有效,但還是有很多思路值得借鑒。
第壹種方法是基於閾值的圖像分割。這種方法的核心思想是根據圖像的灰度特征給出壹個或多個灰度閾值,將這個閾值與圖像中的每個像素點壹壹比較,作為標準值。很容易認為通過這種逐壹比較的過程可以得到兩種結果,壹種是灰度值大於閾值的像素點集,另壹種是灰度值小於閾值的像素點集,從而自然分割出圖像。因此,我們不難發現,這種方法最關鍵的壹步是根據壹定的準則函數,得到最佳的灰度閾值,從而得到合適的分類結果。值得壹提的是,如果圖像中待分割的目標和背景占據不同的灰度值甚至不同的層次,那麽這種方法會得到很好的效果。而且,如果我們只需要為壹幅圖像的處理設定壹個閾值,就可以稱之為單閾值分割。但是,如果圖像中的目標不止壹個,即有多個目標需要提取時,單個閾值分割無法將它們全部分離。這時要選擇多個閾值進行處理,分割過程就是多閾值分割。總的來說,閾值分割法有其獨特的特點,計算簡單,效率高。但由於該方法只考慮了單個像素的灰度值及其特征,完全忽略了空間特征,導致其對噪聲敏感,魯棒性低。
第二種方法是基於區域的圖像分割。這種方法有兩種基本形式:壹種是區域生長,從單個像素開始,逐漸合並相似區域,最終得到需要的區域。另壹種方法是直接從圖像的全局出發,壹點壹點逐漸切割到需要的區域。區域生長是指給定壹組種子像素,代表不同的生長區域,然後將這些種子像素逐漸合並成鄰域內符合條件的像素點。如果添加了新像素,它們也被視為種子像素。
區域分裂和合並的分割過程可以說是區域生長的逆過程。這種方法是從圖像的全局出發,通過不斷的分裂,得到各個子區域,然後提取目標的過程。另外,在這個過程中,需要對前景區域進行合並。
在區域分割方法中還有壹種分水嶺算法。這種分割方法受分水嶺構圖的啟發,將圖像視為測地線拓撲地貌,使圖像中每個像素對應的高程可以用該點的灰度值來表示。分水嶺的形成過程實際上可以通過模擬浸沒過程來實現。具體來說就是在每個局部最小值的表面紮壹個小孔,然後將模型慢慢浸入水中。隨著水慢慢浸入其中,就形成了分水嶺。
第三種方法是基於邊緣檢測的分割方法。邊緣檢測的思想是通過檢測不同物體的邊緣來分割圖像。這種方法是最先研究的方法之壹。如果我們把圖片從空間域變換到頻率域,物體的邊緣部分對應高頻部分,就很容易找到邊緣信息,那麽分割問題就變得容易了。邊緣檢測法可以實現快速準確的定位,但不能保證邊緣的連續性和封閉性。當壹幅圖像中細節信息過多時,會在邊緣產生大量的細邊,形成完整的分割區域時會有缺陷。
第四種圖像分割方法結合了特定的工具。這裏說的具體工具是各種圖像處理工具和算法。隨著圖像分割研究的深入,許多學者開始將壹些圖像處理工具和算法應用到這項工作中,並取得了良好的效果。小波變換在數字圖像處理中起著重要的作用,它可以統壹時域和頻域來研究信號。特別是在圖像邊緣檢測中,小波變換可以檢測二元函數的局部突變能力。其次,圖像分割基於遺傳算法,主要借鑒了生物學中自然選擇和自然遺傳機制的隨機搜索方法。它模擬了生物種群受基因序列控制的進化過程,擅長全局搜索,但局部搜索能力不足。將遺傳算法應用於圖像處理也是當前研究的熱點問題。這裏選擇這種方法的主要原因是遺傳算法具有快速隨機搜索能力,其搜索能力與問題域無關。
此外,還有基於活動輪廓模型的分割方法,具有統壹開放的描述形式,為圖像分割技術的研究和創新提供了理想的框架。這種方法也是壹種檢測邊緣信息的方法,主要是利用曲線演化來檢測給定圖像中的目標。