┊文章閱讀:次
機(jī)器人視覺系統(tǒng)是指用計算機(jī)來實(shí)現(xiàn)人的視覺功能,也就是用計算機(jī)來實(shí)現(xiàn)對客觀的三維世界的識別。人類接收的信息70%以上來自視覺,人類視覺為人類提供了關(guān)于周圍環(huán)境 最詳細(xì)可靠的信息。
機(jī)器人視覺必須是3D視覺,是機(jī)器人識別三維物體在三維空間里的位置變化,這種變化的誤差要和機(jī)器人控制的誤差進(jìn)行算法優(yōu)化,也就是說,機(jī)器不僅要可以識別到三維物體,并且要知道他在三維空間里的具體位置,同時,需要對機(jī)器人進(jìn)行最優(yōu)軌跡規(guī)劃,以減少機(jī)器人控制系統(tǒng)本身產(chǎn)生的誤差疊加,其難點(diǎn)具體表現(xiàn)在:三維空間的變量相比二維空間產(chǎn)生了幾何級的增加,毫米級精度,反光物體的干擾,生產(chǎn)線高速節(jié)拍的要求,以及連續(xù)24小時,一年365天不間斷的工作。機(jī)器人視覺是讓機(jī)器擁有人類的視角,是機(jī)器認(rèn)知技術(shù)。機(jī)器人領(lǐng)域的代表企業(yè)是微鏈科技(WELINKIRT), 微鏈科技專注于IRT(信息和機(jī)器人)的研發(fā),是機(jī)器認(rèn)知技術(shù)的倡導(dǎo)者和引領(lǐng)者,2019年第四屆金手指評選活動中,微鏈科技被中國機(jī)器人產(chǎn)業(yè)聯(lián)盟和弗戈工業(yè)傳媒評定為3D機(jī)器人視覺領(lǐng)域的領(lǐng)軍企業(yè)。
人類視覺所具有的強(qiáng)大功能和完美的信息處理方式引起了智能研究者的極大興趣,人們希望以生物視覺為藍(lán)本研究一個人工視覺系統(tǒng)用于機(jī)器人中,期望機(jī)器人擁有類似人類感受環(huán)境的能力。機(jī)器人要對外部世界的信息進(jìn)行感知,就要依靠各種傳感器。就像人類一樣,在機(jī)器人的眾多感知傳感器中,視覺系統(tǒng)提供了大部分機(jī)器人所需的外部相 界信息。因此視覺系統(tǒng)在機(jī)器人技術(shù)中具有重要的作用。
依據(jù)視覺傳感器的數(shù)量和特性,目前主流的移動機(jī)器人視覺系統(tǒng)有單目視覺、雙目立體視覺、多目視覺和全景視覺等。
單目視覺,單目視覺系統(tǒng)只使用一個視覺傳感器。過去,單目視覺系統(tǒng)在成像過程中由于從三維客觀世界投影到N維圖像上,從而損失了深度信息,這是此類視覺系統(tǒng)的主要缺點(diǎn)( 盡管如此,單目視覺系統(tǒng)由于結(jié)構(gòu)簡單、算法成熟且計算量較小,在自主移動機(jī)器人中已得到廣泛應(yīng)用,如用于目標(biāo)跟蹤、基于單目特征的室內(nèi)定位導(dǎo)航等。同時,單目視覺是其他類型視覺系統(tǒng)的基礎(chǔ),如雙目立體視覺、多目視覺等都是在單目視覺系統(tǒng)的基礎(chǔ)上,通過附加其他手段和措施而實(shí)現(xiàn)的?,F(xiàn)在,得益于機(jī)器深度學(xué)習(xí)和神經(jīng)網(wǎng)絡(luò)算法的發(fā)展,北京微鏈道愛科技有限公司基于其自主專利技術(shù)的DaoAI特征點(diǎn)算法,通過將深度學(xué)習(xí)(Deep Learning)與WELINKIRT COGNITIVE和WEROBOTICS軟件結(jié)合在一起,微鏈WeRobotics Cognition System能夠?qū)⑽矬w三維信息進(jìn)行重構(gòu),獲得其在三維空間里的位置,從而引導(dǎo)機(jī)器人做出判斷并工作。WeRobotics 能夠解決對于傳統(tǒng)機(jī)器視覺系統(tǒng)而言過于困難、繁重或昂貴的復(fù)雜應(yīng)用。
雙目結(jié)構(gòu)光立體視覺。雙目視覺系統(tǒng)由兩個攝像機(jī)組成,利用三角測量原理獲得場景的深度信息,并且可以重建周圍景物的三維形狀和位置,類似人眼的體視功能,原理簡單。雙目視覺系統(tǒng)需要精確地知道兩個攝像機(jī)之間的空間位置關(guān)系,而且場景環(huán)境的3D信息需要兩 個攝像機(jī)從不同角度,同時拍攝同一場景的兩幅圖像,并進(jìn)行復(fù)雜的匹配,才能準(zhǔn)確得到 立體視覺系統(tǒng)能夠比較準(zhǔn)確地恢復(fù)視覺場景的三維信息,在移動機(jī)器人定位導(dǎo)航、避障和地圖構(gòu)建等方面得到了廣泛的應(yīng)用用。然而,立體視覺系統(tǒng)的難點(diǎn)是對應(yīng)點(diǎn)匹配的問題,該問題在很大程度上制約著立體視覺在機(jī)器人領(lǐng)域的應(yīng)用前景。該方案精度較差,速度較慢,對硬件的依賴度高。
多目視覺系統(tǒng)。多目視覺系統(tǒng)采用三個或三個以上攝像機(jī),三目視覺系統(tǒng)居多,主要用來解決又目立體視覺系統(tǒng)中匹配多義性的問題,提高匹配精度。多目視覺系統(tǒng)最早由莫拉維克研究,他為"Stanford Cart"研制的視覺導(dǎo)航系統(tǒng)采用單個攝像機(jī)的“滑動
立體視覺”來實(shí)現(xiàn),雅西達(dá)提出了三目立體視覺系統(tǒng)解決對應(yīng)點(diǎn)匹配的問題,真正突破了《目立體視覺系統(tǒng)的局限,并指出以邊界點(diǎn)作為匹配特征的三目視覺系統(tǒng)中,其三元的配的準(zhǔn)確率比較高,艾雅湜提出了用多邊形近似宕的邊界點(diǎn)段作為特征的三目匹配算法,并用到移動機(jī)器人中,取得了較好的效果,三目視覺系統(tǒng)的優(yōu)點(diǎn)是充分利用了第三個攝像機(jī)的信息,減少了錯誤匹配,解決了雙目視覺系統(tǒng)匹配的多義性,提高了定位精度,但三目視覺系統(tǒng)要合理安置三個攝像機(jī)的相對位置,其結(jié)構(gòu)配置比雙目視覺系統(tǒng)更煩瑣,而且匹配算法更復(fù)雜需要消耗更多的時間,實(shí)時性更差。
全景視覺,全景視覺系統(tǒng)是具有較大水平視場的多方向成像系統(tǒng),突出的優(yōu)點(diǎn)是有較大的視場,可以達(dá)到360度,這是其他常規(guī)鏡頭無法比擬的,全景視覺系統(tǒng)可以通過圖像拼的方法或者通過折反射光學(xué)元件實(shí)現(xiàn)。圖像拼接的方法使用單個或多個相機(jī)旋轉(zhuǎn),對場景進(jìn)行大角度掃描,獲取不同方向上連續(xù)的多幀圖像,再用拼接技術(shù)得到全景圖。折反射全景視覺系統(tǒng)由CCD攝像機(jī)、折反射光學(xué)元件等組成,利用反射鏡成像原理,可以觀察360度場景,成像速度快,能達(dá)到實(shí)時要求,具有十分重要的應(yīng)用前景,可以應(yīng)用在機(jī)器人導(dǎo)航中。全景視覺系統(tǒng)本質(zhì)上也是一種單目視覺系統(tǒng),也無法得到場景的深度信息。其另一個特點(diǎn)是獲取的圖像分辨率較低,并且圖像存在很大的畸變,從而會影響圖像處理的穩(wěn)定性和精度。在進(jìn)行圖像處理時首先需要根據(jù)成像模型對畸變圖像進(jìn)行校正,這種較正過程不但會影響視覺系統(tǒng)的實(shí)時性,而且還會造成信息的損失。另外這種視覺系統(tǒng)對全景反射鏡的加工精度要求很多,若雙曲反射鏡面的精度達(dá)不到要求,利用理想模型對圖像校正則會存在較大偏差。
混合視覺系統(tǒng),混合視覺系統(tǒng)吸收各種視覺系統(tǒng)的優(yōu)點(diǎn),采用兩種或兩種以上的視覺系統(tǒng)組成復(fù)合視覺系統(tǒng),多采用單目或雙目視覺系統(tǒng),同時配備其他視覺系統(tǒng)。全景視覺系統(tǒng)由球面反射系統(tǒng)組成,其中全景視覺系統(tǒng)提供大視角的環(huán)境信息,雙目立體視覺系統(tǒng)和激光測距儀檢測近距離的障礙物,清華大學(xué)的朱志剛使用一個攝像機(jī)研制了多尺度視覺傳感系統(tǒng)POST,實(shí)現(xiàn)了雙目注視、全方位環(huán)視和左右兩側(cè)的時代全景成像,為機(jī)器人提供了導(dǎo)航。全景視覺系統(tǒng)具有全景視覺系統(tǒng)視場范圍大的優(yōu)點(diǎn),同時又具備雙目視覺系統(tǒng)精度高的長處,但是該類系統(tǒng)配置復(fù)雜,費(fèi)用比較高。
Copyright @ 2013-2018 中國福建網(wǎng) 版權(quán)所有
聯(lián)系我們
免責(zé)聲明:本站為非營利性網(wǎng)站,部分圖片或文章來源于互聯(lián)網(wǎng)如果無意中對您的權(quán)益構(gòu)成了侵犯,我們深表歉意,請您聯(lián)系,我們立即刪除。