計(jì)算機(jī)視覺和機(jī)器人視覺概述
1. 核算機(jī)視覺的概念
核算機(jī)視覺就是用各種成像體系替代視覺器官作為輸入靈敏手法,由核算機(jī)來替代大腦完結(jié)處理和解說。核算機(jī)視覺的終究研討方針就是使核算機(jī)能像人那樣經(jīng)過視覺觀察和了解國(guó)際,具有自主習(xí)慣環(huán)境的才能。但在完結(jié)終究方針曾經(jīng),人們盡力的中期方針是建立一種視覺體系,這個(gè)體系能依據(jù)視覺靈敏和反響的某種程度的智能完結(jié)必定的使命。(這里要指出的一點(diǎn)是在核算機(jī)視覺體系中核算機(jī)起替代人腦的效果,但并不意味著核算機(jī)必須按人類視覺的辦法完結(jié)視覺信息的處理。核算機(jī)視覺能夠而且應(yīng)該依據(jù)核算機(jī)體系的特色來進(jìn)行視覺信息的處理、指導(dǎo)。)
2. 核算機(jī)視覺的開展
視覺研討是在Roberts之前都是依據(jù)二維的,而且多數(shù)是選用模式辨認(rèn)的辦法完結(jié)分類作業(yè)的。Roberts首要用程序成功地對(duì)三維積木國(guó)際進(jìn)行解說,在之后類似的研討中,Huffman。 Clowes以及Waltz等人對(duì)積木國(guó)際進(jìn)行了研討并別離處理了由線段解說景象和處理暗影等問題。積木國(guó)際的研討反映了視覺前期研討中的一些特色,即從簡(jiǎn)化的國(guó)際動(dòng)身進(jìn)行研討。這些作業(yè)對(duì)視覺研討的開展起了促進(jìn)效果,但關(guān)于略微雜亂的景象便難以見效。
20世紀(jì)70年代中期,以Marr, Barrow和Tenebaum等人為代表的一些研討者提出了一整套視覺核算的理論來描述視覺進(jìn)程,其中心是從圖畫康復(fù)物體的三維形狀。在視覺研討的理論上,以Marr的理論影響最為深遠(yuǎn)。其理論著重標(biāo)明的重要性,提出要從不同層次去研討信息處理的問題。關(guān)于核算理論和算法完結(jié),他又特別著重核算理論的重要性。這一結(jié)構(gòu)盡管在細(xì)節(jié)上甚至在主導(dǎo)思想上還存在不齊備的方面,許多方面還有許多爭(zhēng)議,但至今仍是現(xiàn)在核算機(jī)視覺研討的基本結(jié)構(gòu)。
進(jìn)入80年代中后期,跟著移動(dòng)式機(jī)器人等的研討,視覺研討與之親近結(jié)合,許多引進(jìn)了空間幾許的辦法以及物理常識(shí),其首要方針是完結(jié)對(duì)路途和妨礙的辨認(rèn)處理。這一時(shí)期引進(jìn)自動(dòng)視覺的研討辦法,運(yùn)用了間隔傳感器,并選用了多傳感器交融等技能。
3. 核算機(jī)視覺研討存在的問題
國(guó)際各國(guó)的研討者們依照Marr提出的基本理論結(jié)構(gòu),對(duì)核算機(jī)視覺體系的各個(gè)研討層次進(jìn)行了許多的研討,并提出了相應(yīng)的處理辦法,但總的來講,這些辦法都存在著一些問題,或缺少通用性,或抗干擾才能差,或存在多解性,其原因如下:一是核算機(jī)視覺是一個(gè)逆問題,即輸入圖畫為二維圖畫的灰度,它是三維物體幾許特征、光照、物體資料外表性質(zhì)、物體的色彩、攝像機(jī)參數(shù)等許多要素的函數(shù)。由灰度反推以上各種參數(shù)是逆問題,而這些問題大都是非線形的,問題的解不具有唯一性,而且對(duì)噪聲或離散化引起的差錯(cuò)都極端靈敏;另一個(gè)原因是Marr的視覺體系結(jié)構(gòu)是一個(gè)自上而下的、模塊的、單向的、數(shù)據(jù)驅(qū)動(dòng)型的結(jié)構(gòu)。神經(jīng)生理學(xué)的深入研討標(biāo)明,這種結(jié)構(gòu)與人的視覺體系還有很大距離,生物視覺體系的認(rèn)知進(jìn)程是一種與外界交互效果的有意圖、自動(dòng)性進(jìn)程,而不只僅是一種被迫式的反響。
4. 機(jī)器人視覺的概念
1. 機(jī)器人視覺體系是指用核算機(jī)來完結(jié)人的視覺功用,也就是用核算機(jī)來完結(jié)對(duì)客觀的三維國(guó)際的辨認(rèn)。2. 機(jī)器人視覺首要研討用核算機(jī)來模擬人的視覺功用從客觀事物的圖畫中提取信息,進(jìn)行處理并加以了解,終究用于實(shí)踐檢測(cè)、丈量和操控。
人類視覺體系的感觸部分是視網(wǎng)膜,它是一個(gè)三維采樣體系。三維物體的可見部分投影到視網(wǎng)膜上,人們依照投影到視網(wǎng)膜上的二維成像來對(duì)該物體進(jìn)行三維了解。如果把三維客觀國(guó)際到二維投印象看作是一種正改換的話,則機(jī)器視覺系統(tǒng)所要做的是從這種二維投影圖畫(灰度陣列)到三維客觀國(guó)際的逆改換,也就是依據(jù)這種二維投影圖畫去重建三維的客觀國(guó)際。
5. 機(jī)器人視覺的開展
機(jī)器人視覺體系按其開展可分為三代。第一代機(jī)器人視覺的功用一般是按規(guī)定流程對(duì)圖畫進(jìn)行處理并輸出效果。這種體系一般由一般數(shù)字電路搭成,首要用于平板資料的缺點(diǎn)檢測(cè)。第二代機(jī)器人視覺體系一般由一臺(tái)核算機(jī),一個(gè)圖畫輸入設(shè)備和效果輸出硬件構(gòu)成。視覺信息在機(jī)內(nèi)以串行辦法流動(dòng),有必定學(xué)習(xí)才能以習(xí)慣各種新狀況。第三代機(jī)器人視覺體系是現(xiàn)在國(guó)際上正在開發(fā)運(yùn)用的體系。選用高速圖畫處理芯片,并行算法,具有高度的智能和一般的習(xí)慣性,能模擬人的高度視覺功用。
6. 核算機(jī)視覺和機(jī)器人視覺的比較
核算機(jī)視覺與機(jī)器人視覺有許多的類似之處,兩者的基本理論結(jié)構(gòu)、底層理論、算法等是類似的,但核算機(jī)視覺與機(jī)器人視覺研討的終究意圖不同:前者首要研討視覺查驗(yàn),精度要求高,速度不是首要考慮的問題;而機(jī)器人視覺首要研討在視覺引導(dǎo)下機(jī)器人對(duì)環(huán)境的效果,有實(shí)時(shí)性的要求。因而機(jī)器人視覺研討存在更多的困難。
7. 機(jī)器人視覺體系的辦法(本文略)
8. 機(jī)器人視覺國(guó)內(nèi)外的使用
國(guó)外機(jī)器視覺系統(tǒng)使用于許多方面,如用于海洋石油挖掘,海底勘查的水下機(jī)器人;用于醫(yī)療外科手術(shù)及研討的醫(yī)用機(jī)器人;協(xié)助人類了解宇宙的空間機(jī)器人;完結(jié)特殊使命的核工業(yè)機(jī)器人等。盡管我國(guó)在機(jī)器視覺方面的開展與國(guó)際先進(jìn)水平比較還有必定距離,但機(jī)器視覺系統(tǒng)的研制作業(yè)也獲得了必定的效果。我國(guó)視覺機(jī)器人使用首要有以下意圖:用以替代人類從事風(fēng)險(xiǎn)、有害和惡劣環(huán)境、超凈環(huán)境下的作業(yè);把人從齷齪、深重的勞作中解放出來;進(jìn)步勞作生產(chǎn)率,改進(jìn)產(chǎn)品質(zhì)量,快速呼應(yīng)商場(chǎng)要求,加強(qiáng)在國(guó)際商場(chǎng)的競(jìng)爭(zhēng)才能。
9. 機(jī)器人視覺現(xiàn)在存在的首要問題
現(xiàn)在的機(jī)器人視覺存在以下一些問題:
1. 怎么精確、高速(實(shí)時(shí))地辨認(rèn)出方針。
2.怎么有效地結(jié)構(gòu)和組織出牢靠的辨認(rèn)算法,而且順暢地完結(jié)。這期待著高速的陣列處理單元,以及算法(如神經(jīng)網(wǎng)絡(luò)法、小波改換等算法)的新打破,這樣就能夠用極少的核算量高度地并行完結(jié)功用。
3.實(shí)時(shí)性是一個(gè)難以處理的重要問題.圖畫采集速度較低以及圖畫處理需要較長(zhǎng)時(shí)刻給體系帶來顯著的時(shí)滯,此外視覺信息的引進(jìn)也顯著增大了體系的核算量,例如核算圖畫雅可比矩陣、估量深度信息等等.圖畫處理速度是影響視覺體系實(shí)時(shí)性的首要瓶頸之一。
4.穩(wěn)定性是一切操控體系首要考慮的問題,關(guān)于視覺操控體系,無論是依據(jù)方位、依據(jù)圖畫或許混合的視覺伺服辦法都面臨著如下問題:當(dāng)初始點(diǎn)遠(yuǎn)離方針點(diǎn)時(shí),怎么確保體系的穩(wěn)定性,即增大穩(wěn)定區(qū)域和確保大局收斂;為了防止伺服失敗,怎么確保特征點(diǎn)一直處在視場(chǎng)內(nèi)。
10. 機(jī)器人視覺應(yīng)當(dāng)進(jìn)一步研討的問題
依據(jù)現(xiàn)在狀況,機(jī)器人視覺應(yīng)在以下幾個(gè)方面進(jìn)一步加強(qiáng)研討:
1.圖畫特征的挑選問題。視覺伺服的功能親近依賴于所用的圖畫特征,特征的挑選不只要考慮辨認(rèn)的目標(biāo),還要考慮操控目標(biāo)。從操控的觀念看,用冗余特征可抑制噪聲的影響,進(jìn)步視覺伺服的功能,但又會(huì)給圖畫處理添加難度。因而怎么挑選功能最優(yōu)的特征,怎么處理特征以及怎么評(píng)估特征,都是需要進(jìn)一步研討的問題。針對(duì)使命有時(shí)可能需要從一套特征切換到另一套,能夠考慮把大局特征與部分特征結(jié)合起來。
2.結(jié)合核算機(jī)視覺及圖畫處理的研討效果,建立機(jī)器人視覺體系的專用軟件庫(kù)。
3.加強(qiáng)體系的動(dòng)態(tài)功能研討。現(xiàn)在的研討多集中于依據(jù)圖畫信息斷定希望的機(jī)器人運(yùn)動(dòng)這一環(huán)節(jié)上,而對(duì)整個(gè)視覺伺服體系的動(dòng)態(tài)功能缺少研討。
4.使用智能技能的效果。
5.使用自動(dòng)視覺的效果。自動(dòng)視覺是當(dāng)今核算機(jī)視覺和機(jī)器人視覺研討領(lǐng)域中的一個(gè)熱門課題。它著重的是視覺體系與其所處環(huán)境之間的交互效果才能。與傳統(tǒng)的通用視覺不同,自動(dòng)視覺著重兩點(diǎn),一是以為視覺體系應(yīng)具有自動(dòng)感知的才能,二是以為視覺體系應(yīng)依據(jù)必定的使命(Task Directed)或意圖(Purposive Directed)。自動(dòng)視覺以為在視覺信息獲取進(jìn)程中,應(yīng)更自動(dòng)地調(diào)整攝像機(jī)的參數(shù),如方向、焦距、孔徑等并能使攝像機(jī)迅速對(duì)準(zhǔn)感興趣的物體。更一般地,它著重凝視機(jī)制(Attention),著重對(duì)散布于不同空間范圍和時(shí)刻段上的信號(hào)選用不同的分辨率有挑選性地感知,這種自動(dòng)感知既可在硬件層上經(jīng)過攝像機(jī)物理參數(shù)的調(diào)整完結(jié),也能夠在依據(jù)被迫攝像機(jī)的前提下,在算法和標(biāo)明層上經(jīng)過對(duì)已獲得的數(shù)據(jù)有挑選性地處理完結(jié)。一起,自動(dòng)視覺以為不依據(jù)任何意圖的視覺進(jìn)程是毫無意義的,必須將視覺體系與具有的意圖(如導(dǎo)航、辨認(rèn)、操作等)相聯(lián)系,然后構(gòu)成感知/效果環(huán)(Perception/Action Cycle)。
6.多傳感器交融問題。視覺傳感器具有必定的運(yùn)用范圍,如能有效地結(jié)合其它傳感器,使用它們之間功能互補(bǔ)的優(yōu)勢(shì),便能夠消除不斷定性,獲得愈加牢靠、精確的效果。