激光SLAM與視覺SLAM的現(xiàn)狀與趨勢

2019-05-24 09:19 性質(zhì)：轉(zhuǎn)載作者：智車科技來源：智車科技

免責(zé)聲明：AGV網(wǎng)（www.xmydyc.com)尊重合法版權(quán)，反對侵權(quán)盜版。（凡是我網(wǎng)所轉(zhuǎn)載之文章，文中所有文字內(nèi)容和圖片視頻之知識(shí)產(chǎn)權(quán)均系原作者和機(jī)構(gòu)所有。文章內(nèi)容觀點(diǎn)，與本網(wǎng)無關(guān)。如有需要?jiǎng)h除，敬請來電商榷！）

一般來講，SLAM系統(tǒng)通常都包含多種傳感器和多種功能模塊。而按照核心的功能模塊來區(qū)分，目前常見的機(jī)器人SLAM系統(tǒng)一般具有兩種形式：基于激光雷達(dá)的SLAM(激光SLAM)和基于視覺的SLAM(Visual SLAM...

一般來講，SLAM 系統(tǒng)通常都包含多種傳感器和多種功能模塊。而按照核心的功能模塊來區(qū)分，目前常見的機(jī)器人SLAM系統(tǒng)一般具有兩種形式：基于激光雷達(dá)的SLAM(激光SLAM)和基于視覺的SLAM(Visual SLAM或VSLAM)。

同時(shí)定位與地圖構(gòu)建(Simultaneous Localization And Mapping,簡稱SLAM)，通常是指在機(jī)器人或者其他載體上，通過對各種傳感器數(shù)據(jù)進(jìn)行采集和計(jì)算，生成對其自身位置姿態(tài)的定位和場景地圖信息的系統(tǒng)。SLAM技術(shù)對于機(jī)器人或其他智能體的行動(dòng)和交互能力至為關(guān)鍵，因?yàn)樗砹诉@種能力的基礎(chǔ)：知道自己在哪里，知道周圍環(huán)境如何，進(jìn)而知道下一步該如何自主行動(dòng)。它在自動(dòng)駕駛、服務(wù)型機(jī)器人、無人機(jī)、AR/VR等領(lǐng)域有著廣泛的應(yīng)用，可以說凡是擁有一定行動(dòng)能力的智能體都擁有某種形式的SLAM系統(tǒng)。

一般來講，SLAM系統(tǒng)通常都包含多種傳感器和多種功能模塊。而按照核心的功能模塊來區(qū)分，目前常見的機(jī)器人SLAM系統(tǒng)一般具有兩種形式：基于激光雷達(dá)的SLAM(激光SLAM)和基于視覺的SLAM(Visual SLAM或VSLAM)。

激光SLAM簡介

激光SLAM脫胎于早期的基于測距的定位方法(如超聲和紅外單點(diǎn)測距)。激光雷達(dá)(Light Detection And Ranging)的出現(xiàn)和普及使得測量更快更準(zhǔn)，信息更豐富。激光雷達(dá)采集到的物體信息呈現(xiàn)出一系列分散的、具有準(zhǔn)確角度和距離信息的點(diǎn)，被稱為點(diǎn)云。通常，激光SLAM系統(tǒng)通過對不同時(shí)刻兩片點(diǎn)云的匹配與比對，計(jì)算激光雷達(dá)相對運(yùn)動(dòng)的距離和姿態(tài)的改變，也就完成了對機(jī)器人自身的定位。

激光雷達(dá)距離測量比較準(zhǔn)確，誤差模型簡單，在強(qiáng)光直射以外的環(huán)境中運(yùn)行穩(wěn)定，點(diǎn)云的處理也比較容易。同時(shí)，點(diǎn)云信息本身包含直接的幾何關(guān)系，使得機(jī)器人的路徑規(guī)劃和導(dǎo)航變得直觀。激光SLAM理論研究也相對成熟，落地產(chǎn)品更豐富。

圖1，激光SLAM的地圖構(gòu)建(谷歌Cartographer[1])

VSLAM簡介

眼睛是人類獲取外界信息的主要來源。視覺SLAM也具有類似特點(diǎn)，它可以從環(huán)境中獲取海量的、富于冗余的紋理信息，擁有超強(qiáng)的場景辨識(shí)能力。早期的視覺SLAM基于濾波理論，其非線性的誤差模型和巨大的計(jì)算量成為了它實(shí)用落地的障礙。近年來，隨著具有稀疏性的非線性優(yōu)化理論(Bundle Adjustment)以及相機(jī)技術(shù)、計(jì)算性能的進(jìn)步，實(shí)時(shí)運(yùn)行的視覺SLAM已經(jīng)不再是夢想。

通常，一個(gè)VSLAM系統(tǒng)由前端和后端組成(圖2)。前端負(fù)責(zé)通過視覺增量式計(jì)算機(jī)器人的位姿，速度較快。后端，主要負(fù)責(zé)兩個(gè)功能：

一是在出現(xiàn)回環(huán)(即判定機(jī)器人回到了之前訪問過的地點(diǎn)附近)時(shí)，發(fā)現(xiàn)回環(huán)并修正兩次訪問中間各處的位置與姿態(tài)；
二是當(dāng)前端跟蹤丟失時(shí)，根據(jù)視覺的紋理信息對機(jī)器人進(jìn)行重新定位。簡單說，前端負(fù)責(zé)快速定位，后端負(fù)責(zé)較慢的地圖維護(hù)。

VSLAM的優(yōu)點(diǎn)是它所利用的豐富紋理信息。例如兩塊尺寸相同內(nèi)容卻不同的廣告牌，基于點(diǎn)云的激光SLAM算法無法區(qū)別他們，而視覺則可以輕易分辨。這帶來了重定位、場景分類上無可比擬的巨大優(yōu)勢。同時(shí)，視覺信息可以較為容易的被用來跟蹤和預(yù)測場景中的動(dòng)態(tài)目標(biāo)，如行人、車輛等，對于在復(fù)雜動(dòng)態(tài)場景中的應(yīng)用這是至關(guān)重要的。第三，視覺的投影模型理論上可以讓無限遠(yuǎn)處的物體都進(jìn)入視覺畫面中，在合理的配置下(如長基線的雙目相機(jī))可以進(jìn)行很大尺度場景的定位與地圖構(gòu)建。

圖2，視覺SLAM的前端定位與后端地圖維護(hù)(ORB-SLAM2[2])

接下來我們將在細(xì)分項(xiàng)目上比較激光SLAM和VSLAM。

應(yīng)用場景

在應(yīng)用場景上，激光SLAM依據(jù)所使用的激光雷達(dá)的檔次基本被分為涇渭分明的室內(nèi)應(yīng)用和室外應(yīng)用，而VSLAM在室內(nèi)外都有豐富的應(yīng)用環(huán)境。VSLAM的主要挑戰(zhàn)是光照變化，例如在室外正午和夜間的跨時(shí)間定位與地圖構(gòu)建，其工作穩(wěn)定性不如高端室外多線激光雷達(dá)。近年來，光照模型修正和基于深度學(xué)習(xí)的高魯棒性特征點(diǎn)被廣泛應(yīng)用于視覺SLAM的研究中，體現(xiàn)出良好的效果，應(yīng)當(dāng)說VSLAM隨著這些技術(shù)的進(jìn)步將會(huì)在光照變化的環(huán)境中擁有更穩(wěn)定的表現(xiàn)。

影響穩(wěn)定工作的因素

激光SLAM不擅長動(dòng)態(tài)環(huán)境中的定位，比如有大量人員遮擋其測量的環(huán)境，也不擅長在類似的幾何環(huán)境中工作，比如在一個(gè)又長又直、兩側(cè)是墻壁的環(huán)境。由于重定位能力較差，激光SLAM在追蹤丟失后很難重新回到工作狀態(tài)。而視覺SLAM在無紋理環(huán)境(比如面對整潔的白墻面)，以及光照特別弱的環(huán)境中，表現(xiàn)較差。

定位和地圖構(gòu)建精度

在靜態(tài)且簡單的環(huán)境中，激光SLAM定位總體來講優(yōu)于視覺SLAM；但在較大尺度且動(dòng)態(tài)的環(huán)境中，視覺SLAM因?yàn)槠渚哂械募y理信息，表現(xiàn)出更好的效果。在地圖構(gòu)建上，激光SLAM的特點(diǎn)是單點(diǎn)和單次測量都更精確，但地圖信息量更??；視覺SLAM特別是通過三角測距計(jì)算距離的方法，在單點(diǎn)和單次測量精度上表現(xiàn)總體來講不如激光雷達(dá)，但可以通過重復(fù)觀測反復(fù)提高精度，同時(shí)擁有更豐富的地圖信息。

累計(jì)誤差問題

激光SLAM總體來講較為缺乏回環(huán)檢測的能力，累計(jì)誤差的消除較為困難。而視覺SLAM使用了大量冗余的紋理信息，回環(huán)檢測較為容易，即使在前端累計(jì)一定誤差的情況下仍能通過回環(huán)修正將誤差消除。

傳感器成本

激光雷達(dá)事實(shí)上有許多檔次，成本都高于視覺傳感器。最昂貴如Velodyne的室外遠(yuǎn)距離多線雷達(dá)動(dòng)輒數(shù)十萬元人民幣，而室外使用的高端中遠(yuǎn)距離平面雷達(dá)如SICK和Hokuyo大約在數(shù)萬元人民幣的等級。室內(nèi)應(yīng)用較廣的中低端近距離平面激光雷達(dá)也需要千元級—，其價(jià)格相當(dāng)于比較高端的工業(yè)級攝像頭和感光芯片。激光雷達(dá)量產(chǎn)后成本可能會(huì)大幅下降，但能否降到同檔次攝像頭的水平仍有一個(gè)大大的問號。

傳感器安裝和穩(wěn)定性

目前常見的激光雷達(dá)都是旋轉(zhuǎn)掃描式的，內(nèi)部長期處于旋轉(zhuǎn)中的機(jī)械結(jié)構(gòu)會(huì)給系統(tǒng)帶來不穩(wěn)定性，在顛簸震動(dòng)時(shí)影響尤其明顯。而攝像頭不包含運(yùn)動(dòng)機(jī)械結(jié)構(gòu)，對空間要求更低，可以在更多的場景下安裝使用(圖3)。不過，固態(tài)激光雷達(dá)的逐步成熟可能會(huì)為激光SLAM扳回這項(xiàng)劣勢。

圖3 激光雷達(dá)和視覺系統(tǒng)的安裝應(yīng)用。谷歌無人車上的多線激光雷達(dá)

DJI精靈4上的視覺系統(tǒng)

算法難度

激光SLAM由于其研究的成熟以及誤差模型的相對簡單，在算法上門檻更低，部分開源算法甚至已經(jīng)被納入了ROS系統(tǒng)成為了標(biāo)配。而反觀視覺SLAM，首先圖像處理本身就是一門很深的學(xué)問，而基于非線性優(yōu)化的地圖構(gòu)建上也是非常復(fù)雜和耗時(shí)的計(jì)算問題?，F(xiàn)在已經(jīng)有許多優(yōu)秀的開源算法(如ORB-SLAM[2]、LSD-SLAM[3])，但在實(shí)際環(huán)境中優(yōu)化和改進(jìn)現(xiàn)有的視覺SLAM框架，比如加入光照模型、使用深度學(xué)習(xí)提取的特征點(diǎn)、以及使用單雙目及多目融合視角等技術(shù)，將是視覺SLAM進(jìn)一步提升性能和實(shí)用性的必由之路。這些技術(shù)的算法門檻也遠(yuǎn)遠(yuǎn)高于激光SLAM。

計(jì)算需求

毫無疑問，激光SLAM的計(jì)算性能需求大大低于視覺SLAM。主流的激光SLAM可以在普通ARM CPU上實(shí)時(shí)運(yùn)行，而視覺SLAM基本都需要較為強(qiáng)勁的準(zhǔn)桌面級CPU或者GPU支持。但業(yè)界也看到了這其中蘊(yùn)藏的巨大機(jī)會(huì)，為視覺處理定制的ASICS市場已經(jīng)蠢蠢欲動(dòng)。一個(gè)很好的例子是Intel旗下的Movidius，他們設(shè)計(jì)了一種特殊的架構(gòu)來進(jìn)行圖像、視頻與深度神經(jīng)網(wǎng)絡(luò)的處理，在瓦級的超低功耗下達(dá)到桌面級GPU才擁有的吞吐量。DJI的精靈4系列產(chǎn)品就是使用這類專用芯片，實(shí)現(xiàn)了高速低功耗的視覺計(jì)算，為無人機(jī)避障和近地面場景導(dǎo)航提供根據(jù)。

多機(jī)協(xié)作

視覺主要是被動(dòng)探測，不存在多機(jī)器人干擾問題。而激光雷達(dá)主動(dòng)發(fā)射，在較多機(jī)器人時(shí)可能產(chǎn)生干擾。尤其是固態(tài)激光雷達(dá)的大量使用，可能使得場景中充滿了信號污染，從而影響激光SLAM的效果。

未來趨勢

激光SLAM和視覺SLAM各擅勝場，單獨(dú)使用都有其局限性，而融合使用則可能具有巨大的取長補(bǔ)短的潛力。例如，視覺在紋理豐富的動(dòng)態(tài)環(huán)境中穩(wěn)定工作，并能為激光SLAM提供非常準(zhǔn)確的點(diǎn)云匹配，而激光雷達(dá)提供的精確方向和距離信息在正確匹配的點(diǎn)云上會(huì)發(fā)揮更大的威力(圖4)。而在光照嚴(yán)重不足或紋理缺失的環(huán)境中，激光SLAM的定位工作使得視覺可以借助不多的信息進(jìn)行場景記錄。

圖4，KITTI數(shù)據(jù)集視覺里程計(jì)。ORB-SLAM[2]，雙目視覺

V-LOAM[4]，視覺引導(dǎo)激光修正

現(xiàn)實(shí)中的激光與視覺SLAM系統(tǒng)幾乎都會(huì)配備慣性元件、輪機(jī)里程計(jì)、衛(wèi)星定位系統(tǒng)、室內(nèi)基站定位系統(tǒng)等輔助定位工具，而近年來SLAM系統(tǒng)與其他傳感器的融合成為了一大熱點(diǎn)。不同于以往基于卡爾曼濾波的松耦合融合方法，現(xiàn)在學(xué)界的熱點(diǎn)是基于非線性優(yōu)化的緊耦合融合。例如與IMU的融合和實(shí)時(shí)相互標(biāo)定，使得激光或視覺模塊在機(jī)動(dòng) (猛烈加減速和旋轉(zhuǎn)) 時(shí)可以保持一定的定位精度，防止跟蹤丟失，極大的提高定位與地圖構(gòu)建的穩(wěn)定性。

激光點(diǎn)云信息本身也仍有潛力可挖。在高端的遠(yuǎn)距離多線激光雷達(dá)上，返回的點(diǎn)云除了包含方向和距離信息，還可以加入目標(biāo)點(diǎn)的反射率信息。當(dāng)線數(shù)較多較密時(shí)，由反射率信息構(gòu)成的數(shù)據(jù)可以視為一種紋理信息，因此可以在一定程度上享受視覺算法和紋理信息帶來的重定位等方面的優(yōu)勢。這些信息一旦融入到高精度地圖中，高精度地圖就可以在點(diǎn)云紋理兩種形式間無縫切換，使得利用高精度地圖的定位可以被只擁有廉價(jià)攝像頭的自動(dòng)駕駛汽車分享。這也是目前國外一些團(tuán)隊(duì)的研究方向([5])。

同時(shí)，視覺所依賴的投影模型，蘊(yùn)含著非常豐富的“混搭”玩法。長、短基線的單雙目結(jié)合，可以在保證大尺度定位水平的同時(shí)提高中近距離的障礙探測和地圖構(gòu)建精度；廣角魚眼和360度全向攝像頭與標(biāo)準(zhǔn)單雙目的結(jié)合，使得VSLAM的覆蓋范圍可以進(jìn)一步提升，特別適合對場景按照距離的遠(yuǎn)近進(jìn)行不同精度不同速度的定位。被動(dòng)視覺與深度相機(jī)的結(jié)合，催生了RGB-D SLAM，而深度相機(jī)量程的逐步擴(kuò)大，將給這種特殊VSLAM帶來更大的應(yīng)用空間。

VSLAM的另一個(gè)也許更宏大的擴(kuò)展在AI端。端到端的深度學(xué)習(xí)所帶來的圖像特征，已經(jīng)在識(shí)別和分類領(lǐng)域大大超越了人類手工選擇的SIFT/SURF/ORB等特征。我們可以很安全的說，未來在低紋理、低光照等環(huán)境下，深度學(xué)習(xí)所訓(xùn)練出的提取、匹配和定位估算等方法，也一定會(huì)超越目前VSLAM領(lǐng)域最先進(jìn)的手工方法。更不用說，圖像本身所大量攜帶的信息，可以廣泛用于場景理解、場景分類、物體識(shí)別、行為預(yù)測等重要方面。一個(gè)很可能的情況是，未來視覺處理系統(tǒng)將直接包含定位、地圖構(gòu)建、運(yùn)動(dòng)規(guī)劃、場景理解以及交互等多個(gè)功能模塊，更緊密的聯(lián)合帶來更加智能的機(jī)器人行動(dòng)能力。

如果想深入了解SLAM技術(shù)的過去、現(xiàn)在和未來趨勢，我們推薦文獻(xiàn)[6]。

結(jié)語

SLAM技術(shù)將賦予為機(jī)器人和智能體前所未有的行動(dòng)能力。作為當(dāng)前SLAM框架的主要類型，激光SLAM與視覺SLAM必將在相互競爭和融合中發(fā)展，必將帶來機(jī)器人技術(shù)和人工智能技術(shù)的真正革命，也將使得機(jī)器人從實(shí)驗(yàn)室和展示廳中走出來，真正服務(wù)和解放人類。

0贊 0踩

下一篇工業(yè)自動(dòng)化為什么需要機(jī)器視覺技術(shù)

上一篇寶雞：機(jī)器人產(chǎn)業(yè)成為追趕超越的“加速器”

網(wǎng)友評論
文明上網(wǎng)，理性發(fā)言，拒絕廣告
0條評論

相關(guān)資訊
更多>>

美國工業(yè)車輛協(xié)會(huì)宣布第12屆全國叉車安全日將于6月10日舉行聚焦操作員培訓(xùn)與安全文化建設(shè)

2025年4月16日，美國工業(yè)車輛協(xié)會(huì)（Industrial Truck Association，簡稱ITA）正式宣布，第12屆全國叉車安全日（National Forklift Safety Day）將于2025年6月10日（星期二）在美國華盛頓特區(qū)...

2025-04-18 08:54
Automate 2025?（北美自動(dòng)化展）5 月 12 日在底特律開幕

創(chuàng)紀(jì)錄的2024年Automate展會(huì)彰顯行業(yè)的快速增長和創(chuàng)新，A3 贊助的活動(dòng)創(chuàng)下新紀(jì)錄，注冊人數(shù)達(dá) 42,895 人，比去年增長 40%。自 2019 年在芝加哥舉辦以來，Automate 的參與人數(shù)增加了一倍多。...

2025-04-18 08:53
秀出機(jī)器人產(chǎn)業(yè)硬實(shí)力！吳中亮相“中國第一展”！

出口展參展企業(yè)首次突破3萬家、首次增設(shè)服務(wù)機(jī)器人專區(qū)、首次新設(shè)集成房屋專區(qū)、首個(gè)城市美食文化活動(dòng)……4月15日，第137屆中國進(jìn)出口商品交易會(huì)（廣交會(huì)）在廣州盛大啟幕，并以“開放共贏未來”的...

2025-04-17 08:16
物流機(jī)器人"小白"暖心上線，開啟醫(yī)藥服務(wù)"加速度"

在湛江市第一中醫(yī)醫(yī)院，一場科技與醫(yī)療的深度融合正悄然展開——智能物流機(jī)器人"小白"正式加入住院藥品配送隊(duì)伍，以科技之力為患者的健康護(hù)航。這位身披潔白戰(zhàn)袍的"配送員"，不僅是醫(yī)院智能化升級...

2025-04-17 08:13
《Roboticsandautomationnews》:2025年20強(qiáng)自動(dòng)送貨機(jī)器人公司

作者：Mark Allinson早在 2019 年，當(dāng)我們發(fā)布類似的報(bào)告時(shí)，自動(dòng)送貨機(jī)器人就是一種未來主義的奇觀——可愛、緩慢移動(dòng)的箱子沿著人行道緩慢移動(dòng)，主要在大學(xué)校園或試點(diǎn)項(xiàng)目中?？爝M(jìn)到2025年，A...

2025-04-16 10:55
央視點(diǎn)贊！京東物流智狼、地狼機(jī)器人助力激發(fā)消費(fèi)活力

今年以來，隨著消費(fèi)品以舊換新政策持續(xù)深入，3C和家電產(chǎn)品迎來換新熱潮。近日，央視記者探訪京東物流武漢“亞洲一號”智能產(chǎn)業(yè)園（簡稱“武漢亞一”），京東物流“智狼”穿梭版機(jī)器人、“地狼”智...

2025-04-16 08:50
【智能制造】搬運(yùn)工不好招？工人不愿意干？人工搬運(yùn)碰撞多？……——看AGV如何一車解千愁

2025-04-14 14:57
中國AGV網(wǎng)本周熱點(diǎn)回顧（2025年4月7日-4月12日)

AGV網(wǎng)(www.xmydyc.com)是中國自動(dòng)導(dǎo)航機(jī)器人(AGV)和自主移動(dòng)機(jī)器人(AMR)行業(yè)網(wǎng)站!團(tuán)隊(duì)擁有超過23年的行業(yè)垂直門戶運(yùn)營經(jīng)驗(yàn)，多年來見證了傳統(tǒng)內(nèi)部物料搬運(yùn)從粗放化、低效率沿著更加智能化、...

2025-04-14 14:53
甘其毛都口岸AGV自動(dòng)導(dǎo)引車今年跨境運(yùn)輸貨物突破100萬噸

截至4月7日，甘其毛都口岸AGV自動(dòng)導(dǎo)引車今年跨境運(yùn)輸貨物突破100萬噸，達(dá)到100.7萬噸。AGV自動(dòng)導(dǎo)引車跨境運(yùn)輸貨物甘其毛都口岸是中蒙兩國間貨運(yùn)量最大的公路口岸，占內(nèi)蒙古14個(gè)沿邊口岸貨運(yùn)總量的1...

2025-04-09 12:40
《人民日報(bào)》頭版頭條點(diǎn)贊極氪5G智慧工廠

2025年4月6日《人民日報(bào)》頭版頭條點(diǎn)贊極氪5G智慧工廠數(shù)字大腦融合AI人工智能以數(shù)字孿生驅(qū)動(dòng)產(chǎn)品綠色研發(fā)以智能化生產(chǎn)牢控產(chǎn)品質(zhì)量以工業(yè)互聯(lián)網(wǎng)平臺(tái)實(shí)現(xiàn)高效協(xié)作打造新質(zhì)生產(chǎn)力智造新標(biāo)桿《人民日...

2025-04-08 08:51