當前位置:吉日网官网 - 傳統文化 - 機器人視覺系統中圖像分割技術傳統方法概論1

機器人視覺系統中圖像分割技術傳統方法概論1

姓名:寇世文

學號:21011110234

嵌牛導讀:隨著人工智能技術的不斷發展,智能機器人領域也得到了空前的發展。尤其是深度神經網絡廣泛應用於視覺系統中後,取得了許多很明顯的成效。對於自主移動機器人來說,視覺系統有著十分重要的作用,而圖像分割技術更是在這個系統中擔任著十分重要的角色。傳統的圖像分割技術基本上已經能夠將圖像的前景和後景分隔開來,但是近年來隨著深度學習算法的發展,人們開始將其應用到圖像分割中,提出了很多分割網絡,也達到了很好的分割效果。在實現圖像分割的基礎上,人們還使得分割具有了語義類別和標簽,就是現在的語義分割。本文在介紹了語義分割的基礎上又引出了新的任務分割場景,實例分割和全景分割。並且介紹了最近研究的熱點三維點雲的語義分割問題,闡述了其實現的必要性。

嵌牛鼻子智能機器人,圖像分割、語義分割、計算機視覺

嵌牛提問圖像分割技術的傳統常見方法

嵌牛正文

壹、引言

計算機視覺,即computer vision,就是通過計算機來模擬人的視覺工作原理,來獲取和完成壹系列圖像信息處理的機器。計算機視覺屬於機器學習在視覺領域的應用,是壹個多學科交叉的研究領域,其涉及數學、物理、生物、計算機工程等多個學科。

計算機視覺的主要應用有無人駕駛、人臉識別、無人安防、車輛車牌識別、智能傳圖、3D重構、VR/AR、智能拍照、醫學圖像處理、無人機、工業檢測等。人駕駛又稱自動駕駛,是目前人工智能領域壹個比較重要的研究方向,讓汽車可以進行自主駕駛,或者輔助駕駛員駕駛,提升駕駛操作的安全性。人臉識別技術目前已經研究得相對比較成熟,並在很多地方得到了應用,且人臉識別準確率目前已經高於人眼的識別準確率。安防壹直是我國比較重視的問題,也是人們特別重視的問題,在很多重要地點都安排有巡警巡查,在居民小區以及公司壹般也都有保安巡查來確保安全。車輛車牌識別目前已經是壹種非誠成熟的技術了,高速路上的違章檢測,車流分析,安全帶識別,智能紅綠燈,還有停車場的車輛身份識別等都用到了車輛車牌識別。3D重構之前在工業領域應用比較多,可以用於對三維物體進行建模,方便測量出物體的各種參數,或者對物體進行簡單復制。計算機視覺還有很多應用,隨著技術的發展,應用領域也會越來越多。在工業領域的應用,在機器人技術方面的應用等。

對於傳統的圖像分割過程,通常可以分為5個步驟,即特征感知、圖像預處理、特征提取、特征篩選和推理預測與識別。通過研究發現,在視覺的早期的發展過程中,人們對於圖像中的特征並沒有表現出足夠的關註。且傳統的分割過程是把特征提取和分類分開來做的,等到需要輸出結果的時候再結合到壹起,可想而知其實現的困難程度。

在深度學習算法出來之後,卷積神經網絡被廣泛應用於計算機視覺技術中,也因此衍生出了很多的研究方向。深度學習主要是以特征為基礎來進行比對,如在人臉識別方面,使用卷積神經網絡分別對兩張人臉進行不同位置的特征提取,然後再進行相互比對,最後得到比對結果。目前的計算機視覺的主要研究方向有圖像分類、目標檢測、圖像分割、目標跟蹤、圖像濾波與降噪、圖像增強、風格化、三維重建、圖像檢索、GAN等。本文主要是針對圖像分割這壹領域,進行簡要的概述。

圖像分割技術是計算機視覺領域的個重要的研究方向,是圖像語義理解的重要壹環。圖像分割是指將圖像分成若幹具有相似性質的區域的過程,從數學角度來看,圖像分割是將圖像劃分成互不相交的區域的過程。近些年來隨著深度學習技術的逐步深入,圖像分割技術有了突飛猛進的發展,該技術相關的場景物體分割、人體前背景分割、人臉人體Parsing、三維重建等技術已經在無人駕駛、增強現實、安防監控等行業都得到廣泛的應用。

二、發展現狀

近來已經有很多學者將圖像分割技術應用到移動機器人的控制中,能夠做到在機器人運動的同時定位、構建地圖並分割出不同的前景和後景,使視覺系統掃描到的圖像具有語義信息。並有學者也致力於分割得更為準確和精細,不僅能夠做到區分不同類的物體,也能夠實現對同類的不同物體的分類,甚至可以做到在此基礎上加上對背景的分割。由於我們生活的世界是三維空間,還有學者將圖像場景還原到三維中,然後使用相關方法對整個三維場景進行分割。作為計算機視覺的研究中的壹個較為經典的難題,圖像分割這壹領域也越來越被人們所關註。

首先是傳統的圖像分割方法。在傳統分割方面,人們使用數字圖像處理、拓撲學、數學等方面的知識來進行圖像分割。雖然現在的算力逐漸增加且深度學習不斷發展,壹些傳統的分割方法所取得的效果不如深度學習,但是其分割的思想仍有很多值得我們去學習的。

第壹種方法是基於閾值的圖像分割方法。這種方法的核心思想是想根據圖像的灰度特征來給出壹個或多個灰度閾值,將此閾值作為壹個標準值與圖像中的每個像素逐壹進行比較。很容易想到,通過這個逐壹比較過程能夠得到兩類結果,壹類是灰度值大於閾值的像素點集,另壹類是灰度值小於閾值的像素點集,從而很自然地將圖像進行了分割。所以,不難發現,此方法的最關鍵的壹步就是按照壹定的準則函數來得到最佳灰度閾值,這樣才能夠得到合適的分類結果。值得壹提的是,如果圖像中需要分割的目標和背景分別占據了不同的灰度值甚至是不同的等級,那使用這種方法會得到很好的效果。並且,假如對於壹張圖像的處理,我們只需要設定壹個閾值時,可以將其稱為單閾值分割。但是圖像中如果不止壹個目標,即有多個目標需要進行提取的時候,單壹閾值分割就無法做到將它們都分割開來,此時應選取多個閾值對其進行處理,這個分割的過程為多閾值分割。總的來說,閾值分割法有著其獨特的特點,其計算簡單、效率較高。但是,由於這種方法只考慮的是單個像素的灰度值及其特征,而完全忽略了空間特征,這也就導致了其對噪聲比較敏感且魯棒性不高。

第二種方法是基於區域的圖像分割方法。這種方法具有兩種基本形式:壹種是區域生長,這種分割方法是從單個像素出發,逐漸將相似的區域進行合並,最終得到需要的區域。另壹種方法是直接從圖像的全局出發,壹點壹點逐步切割至所需要的區域。區域生長指的是,給定壹組種子像素,其分別代表了不同的生長區域,然後讓這些種子像素逐漸合並鄰域裏符合條件的像素點。如果有新的像素點添加進來,同樣把它們作為種子像素來處理。

區域分裂合並的分割過程可以說是區域生長的逆過程,這種方法是從圖像的全局出發通過不斷分裂得到各個子區域,然後提取目標的過程。此外,在此過程中,還需要合並前景區域。

在區域分割方法中還有壹種分水嶺算法。受啟發於分水嶺的構成,這種分割方法將圖像看作是測地學上的拓撲地貌,這樣圖像中每壹個像素點對應的海拔高度可以用該點的灰度值來表示。分水嶺的形成過程實際上可以通過模擬浸入過程來實現。具體做法是,在每個局部極小值的表面都刺穿壹個小孔,然後把模型慢慢浸入水中,隨著水慢慢浸入其中,分水嶺就隨之形成了。

第三種方法是基於邊緣檢測的分割方法。邊緣檢測的思想就是試圖通過檢測不同物體的邊緣來將圖像分割開來,這種方法是人們最先想到的也是研究最多的方法之壹。如果我們將圖片從空間域變換到頻率域中去,其中物體的邊緣部分就對應著高頻部分,很容易就能夠找到邊緣信息,因此也使得分割問題變得容易。邊緣檢測的方法能夠實現快而且準確的定位,但是其不能保證邊緣的連續性和封閉性,且當壹幅圖像的細節信息過多時,其就會在邊緣處產生大量的細碎邊緣,在形成完整的分割區域時就會有缺陷。

第四種圖像分割方法結合了特定的工具。這裏所說的特定工具是各種圖像處理工具以及算法等,隨著圖像分割研究工作的深入,很多學者開始將壹些圖像處理的工具和壹些算法應用到此工作中,並取得了不錯的結果。小波變換在數字圖像處理中發揮著很重要的作用,它能夠將時域和頻域統壹起來研究信號。尤其是在圖像邊緣檢測方面,小波變換能夠檢測二元函數的局部突變能力。其次是基於遺傳算法的圖像分割,遺傳算法主要借鑒了生物界自然選擇和自然遺傳機制的隨機化搜索方法。其模擬了由基因序列控制的生物群體的進化過程,其擅長於全局搜索,但是局部搜多能力不足。將遺傳算法應用到圖像處理中也是當前研究的壹個熱點問題,在此選擇這種方法的主要原因是遺傳算法具有快速的隨機搜索能力,而且其搜索能力與問題的領域沒有任何關系。

除此之外,還有基於主動輪廓模型的分割方法,這種方法具有統壹的開放式的描述形式,為圖像分割技術的研究和創新提供了理想的框架。此方法也是對邊緣信息進行檢測的壹種方法,主要是在給定圖像中利用曲線演化來檢測目標。

  • 上一篇:有誰知道四川的豆豉是怎樣制作的?
  • 下一篇:枇杷怎麽吃
  • copyright 2024吉日网官网