速感科技CEO陳震在機(jī)器人大會(huì)的演講
陳震:謝謝安冉的介紹,謝謝今天大會(huì)在創(chuàng)新創(chuàng)業(yè)論壇有機(jī)會(huì)可以向大家來介紹一下分享一下過去我們做的事情。我是速感科技的創(chuàng)始人陳震,今天分享的題目“為機(jī)器賦能‘看得懂’的智慧”。我們本身定位而言不是做像智行者還有納恩博做toC級(jí)的消費(fèi)機(jī)器人,我們是做關(guān)鍵的部件,剛才介紹服務(wù)級(jí)的機(jī)器人的時(shí)候都提到關(guān)于行動(dòng)移動(dòng)決策的時(shí)候如何為機(jī)器人和無人駕駛汽車做多傳感器融合的定位和導(dǎo)航方案。其實(shí)這里面最關(guān)鍵的核心,我們認(rèn)為其實(shí)我們?cè)谧龅氖虑榫褪墙o現(xiàn)在的機(jī)器人加了一雙眼睛,主要用今天的視覺為主的低成本高效的視覺融合方法來幫助這些設(shè)備解決在三維空間當(dāng)中的定位、感知、導(dǎo)航、避障和路徑規(guī)劃,所以起了這樣一個(gè)名字。
速感科技2014年10月份成立,主要致力于幫助下游的行業(yè)客戶包括今天的VR/AR設(shè)備公司,包括今天的服務(wù)機(jī)器人公司,還有掃地機(jī)器人、自動(dòng)化叉車企業(yè)解決它們的智能設(shè)備在實(shí)際過程實(shí)際作業(yè)當(dāng)中如何去進(jìn)行自主決策、自主移動(dòng)和自主定位和感知。今天上午有嘉賓提到,在今天的高校而言,我們這場(chǎng)論壇更偏向青年的創(chuàng)新創(chuàng)業(yè)論壇,里面有老師提出,現(xiàn)在很多的高校對(duì)于研究生培養(yǎng)計(jì)劃,對(duì)于博士、碩士培養(yǎng)計(jì)劃里面提到雙導(dǎo)師制。很榮幸從2014年慢慢成立公司走到今天,感謝在創(chuàng)新創(chuàng)業(yè)的環(huán)境下高校包括北航、清華給了我們這樣的機(jī)會(huì),我在研究生剛?cè)雽W(xué)有兩位雙導(dǎo)師制,上午老師提到一位導(dǎo)師是學(xué)術(shù)導(dǎo)師,在整個(gè)研究生入學(xué)一年到兩年時(shí)間里面對(duì)我們進(jìn)行學(xué)術(shù)性的指導(dǎo),包括我的主攻方向是關(guān)于機(jī)器人視覺計(jì)算機(jī)人機(jī)交互,如何探討機(jī)器和人之間的交互方式和視覺的交互進(jìn)程的演進(jìn)。第二位導(dǎo)師來自微軟亞洲研究院的許老師,主要幫助我們通過在清華、北航、微軟進(jìn)行合作間的項(xiàng)目型的建立,我主要擔(dān)任的課題就是特種飛行器和特種機(jī)器人,包括服務(wù)機(jī)器人、火場(chǎng)救援機(jī)器人、掃地機(jī)器人和清潔家電機(jī)器人,利用整體的視覺感知系統(tǒng)來達(dá)到實(shí)時(shí)的常規(guī)性作業(yè)。基于這樣的環(huán)境下,2014年成立速感科技致力于幫助下游的用戶解決相關(guān)問題。
今年的WRC看到工業(yè)、消費(fèi)兩個(gè)大的展區(qū),分別展示了今天的服務(wù)機(jī)器人包括無人機(jī)包括快遞機(jī)器人、掃地機(jī)器人,還有AR/VR設(shè)備。我們看到在過去的三到五年時(shí)間已經(jīng)不斷融入我們的生活,通過一代兩代三代不斷迭代,讓它們更好滿足我們之間的用戶體驗(yàn)。在這些體驗(yàn)過程當(dāng)中,大家可能沒有意識(shí)到在整個(gè)體驗(yàn)過程當(dāng)中視覺技術(shù)在里面起到非常關(guān)鍵和決定性的作用,它決定了在整個(gè)用戶體驗(yàn)當(dāng)中包括我們的掃地機(jī)器人產(chǎn)品,包括AR/VR設(shè)備如何更好地滿足用戶端在使用防暈眩、更智能的行走這樣一些相關(guān)問題。
提到視覺技術(shù)不得不說在過去的30多年將近40年時(shí)間里面,視覺技術(shù)的起源和發(fā)展的關(guān)系。30多年時(shí)間機(jī)器人行業(yè)一個(gè)重要性的里程碑事件,美國斯坦福機(jī)器人研究嚴(yán)在1980年提出來智能移動(dòng)機(jī)器人shakey,當(dāng)時(shí)搭載了幾乎所有市面上電子行業(yè)能看到的傳感器,包括電子攝像頭、微博測(cè)距、接近傳感器,整個(gè)完成了自底向上的頂層設(shè)計(jì)分層設(shè)計(jì)的智能機(jī)器人。這套機(jī)器人在當(dāng)時(shí)可以完成局部的環(huán)境數(shù)據(jù)采集,達(dá)到局部的路徑規(guī)劃,在當(dāng)時(shí)應(yīng)該是這樣一套自底層向頂層。我們分析底層有機(jī)器人的移動(dòng)層、決策控制層,中間層有系統(tǒng)中間件,頂層有機(jī)器人的交互系統(tǒng),基本這套系統(tǒng)在今天所有的智能設(shè)備里面一直是在沿用。1980年shakey機(jī)器人的發(fā)明自此拉開智能移動(dòng)機(jī)器人研究的大幕。
2004年美國發(fā)射了兩顆火星探測(cè)車,機(jī)遇號(hào)、勇氣號(hào),當(dāng)時(shí)應(yīng)該是全球最早搭載多目立體視覺傳感器的探測(cè)車,視覺領(lǐng)域應(yīng)用的這些設(shè)備都是最典型的軍轉(zhuǎn)民甚至是航空器轉(zhuǎn)民的過程。最早搭載的好奇號(hào)的火星探測(cè)車上通過雙目電子攝像機(jī)模擬人眼拿到深度信息,就是今天的距離信息,更好地幫助它在未知的環(huán)境下進(jìn)行移動(dòng)和決策。在這個(gè)時(shí)間點(diǎn)2004年提出了一套視覺的同步定位與地圖構(gòu)建算法VSLAM,今天被應(yīng)用到各種各樣的智能設(shè)備里面。2013年中國的第一臺(tái)月球探測(cè)車玉兔號(hào)發(fā)射升空,搭載了更為先進(jìn)的技術(shù),2013年在軍方包括航空器里面已經(jīng)開始應(yīng)用結(jié)構(gòu)光技術(shù)的傳感器,利用雙目立體視覺特別是主動(dòng)光源的結(jié)構(gòu)光和TOF光源進(jìn)行未知環(huán)境下的探測(cè)。在2013年之后的2015年、2016年明星創(chuàng)業(yè)公司深圳大疆發(fā)布SLAM雙目立體視覺定位導(dǎo)航系統(tǒng),可以實(shí)時(shí)提取出前端人的信息、環(huán)境信息,讓環(huán)境和前景進(jìn)行分離。我們大家都玩過大疆最新的精靈4,上面有自動(dòng)跟隨的系統(tǒng),主要應(yīng)用這樣一套立體視覺的成像方法,幫助鎖定移動(dòng)物體進(jìn)行跟蹤。
2015年GOOGLE發(fā)布了Tango手機(jī),美國的創(chuàng)新公司發(fā)布了結(jié)構(gòu)光傳感器,2016年微軟發(fā)布了HoloLens傳感器,在今天的VR/AR設(shè)備,結(jié)合最先進(jìn)的視覺傳感器以及視覺傳感器背后的溶融合視覺方法,解決地圖構(gòu)建和環(huán)境自身定位的相關(guān)問題。整個(gè)發(fā)展過程當(dāng)中可以看到,傳統(tǒng)的計(jì)算機(jī)視覺領(lǐng)域CV領(lǐng)域在幾何學(xué)上一直分有兩個(gè)重要的研究方向,就是今天的學(xué)習(xí)幾何和非學(xué)習(xí)幾何。學(xué)習(xí)幾何過去五年為機(jī)器學(xué)習(xí)深度學(xué)習(xí)為代表的,包括今天的卷積神經(jīng)網(wǎng)絡(luò),還有搭載的淺層和深層的深度學(xué)習(xí),可以幫助我們解決識(shí)別感知、場(chǎng)景語義相關(guān)的方式。今天可以看到的最早把字符通過16線的分割來進(jìn)行模式識(shí)別,通過搭載一個(gè)淺層的深度學(xué)習(xí)網(wǎng)絡(luò),可以幫助它進(jìn)行更好提取到高層的語義特征,進(jìn)行整個(gè)特征識(shí)別。在今天人臉識(shí)別物體識(shí)別做得非常好了,特別是人臉識(shí)別前段時(shí)間Image.Net宣布結(jié)束它的時(shí)代任務(wù)已經(jīng)完成。今天大的明星創(chuàng)業(yè)公司包括商湯、曠視做的事情已經(jīng)把人臉識(shí)別包括今天的學(xué)習(xí)和感知的算法提升到一個(gè)堪比人甚至超過人的高度。
過去三年時(shí)間里面ICCV包括CVPR大會(huì)上更關(guān)注的一點(diǎn)和更新的起點(diǎn),在非學(xué)習(xí)多面幾何里面的實(shí)時(shí)性的SLAM,同步定位與地圖構(gòu)建的算法原理。今年國際的計(jì)算機(jī)視覺大會(huì)上,我們看到戴文森教授提出深度學(xué)習(xí)和實(shí)時(shí)SLAM結(jié)合幫助我們進(jìn)行整體的場(chǎng)景語義和同步定位的理解。SLAM系統(tǒng)究竟是什么?為什么過去五年當(dāng)中可以說是一夜爆火,幾乎看到的所有智能硬件里面都應(yīng)用到這樣一個(gè)SLAM算法技術(shù)。簡單來說,同步定位和地圖構(gòu)建智行者剛剛提到,很長一段時(shí)間里面被人們認(rèn)為是一個(gè)雞生蛋和蛋生雞的問題,達(dá)到一個(gè)精度的實(shí)時(shí)定位需要高精度的地圖,依據(jù)地圖能夠知道在環(huán)境當(dāng)中的具體位置。第二,我只有知道了具體位置才能對(duì)一個(gè)未知的環(huán)境地圖進(jìn)行更好的拼接地圖構(gòu)件,需要同步地位和地圖構(gòu)建不斷相互補(bǔ)充融合迭代,達(dá)到非常理想的實(shí)時(shí)定位效果。舉個(gè)簡單的例子,讓一個(gè)機(jī)器人在執(zhí)行任務(wù)的過程當(dāng)中讓它看到冰箱并且去抓取冰箱里面的牛奶,這時(shí)候用的是學(xué)習(xí)幾何里面的識(shí)別和感知。第二點(diǎn),我如何讓機(jī)器人從我現(xiàn)在的位置到達(dá)冰箱的位置,在到達(dá)過程當(dāng)中選取最簡單最直接的路徑,并且在過程當(dāng)中如果有人阻擋有障礙物要學(xué)會(huì)躲避障礙物躲開人。在這個(gè)過程當(dāng)中應(yīng)用的是SLAM技術(shù)。
在SLAM技術(shù)里面,我們認(rèn)為它有三個(gè)關(guān)鍵式的里程碑,最為關(guān)鍵的里程碑2003年英國帝國理工學(xué)院的安卓戴維森教授是當(dāng)時(shí)最早提出來MonoSLAM系統(tǒng),它的誕生到今天影響了很多服務(wù)機(jī)器人廠商。全球的家電領(lǐng)導(dǎo)者戴森推出的唯一一款掃地機(jī)器人應(yīng)用的就是戴維森教授在2003年提出的MonoSLAM系統(tǒng)。軟銀最近一段時(shí)間增持了IROBOT5%的股份,IROBOT最近五年股價(jià)從30塊錢到110塊錢/股,整個(gè)過程當(dāng)中體現(xiàn)出SLAM系統(tǒng)朝著實(shí)時(shí)性、低成本、高效的視覺融合的方案演進(jìn)。基于SLAM系統(tǒng)和基于圖形圖象的視覺VSLAM當(dāng)中可以延伸出來不同跟機(jī)器人的決策相關(guān)算法,包括融合定位、路徑規(guī)劃、檢測(cè)跟蹤和自主導(dǎo)航,速感科技在過去三年多的時(shí)間里面,基于核心的VSLAM系統(tǒng)四個(gè)不同方向進(jìn)行更深一步的研究,為下游的工業(yè)和消費(fèi)類的客戶體了四個(gè)方向上的算法和相關(guān)解決方案。
在2012年,我在實(shí)驗(yàn)室跟著師兄師姐一起做項(xiàng)目,用當(dāng)時(shí)2010年以色列的PrimeSense和微軟發(fā)布了第一代Kinect傳感器,我們?cè)趯?shí)驗(yàn)室進(jìn)行系統(tǒng)性搭建用了這樣一套傳感器結(jié)合英特爾的嵌入式計(jì)算機(jī)。當(dāng)時(shí)搭載這樣一套視覺系統(tǒng)整個(gè)的功耗還有當(dāng)時(shí)的實(shí)時(shí)運(yùn)算處理效果,在機(jī)器人無人機(jī)上考慮它的有效載荷,整個(gè)成本報(bào)價(jià),在去年年底把整個(gè)前端的視覺采集裝置和后面的嵌入式計(jì)算融合到一起推出了傳感器M32,今年推出M01,可以達(dá)到1瓦以內(nèi)的實(shí)時(shí)功耗,整個(gè)定位采集的數(shù)據(jù)可以達(dá)到90赫茲,整個(gè)傳感器的重量只有20克。現(xiàn)在面向下游的企業(yè)推出來的這款傳感器的價(jià)格是200塊錢左右。在2012、2013年國內(nèi)也好包括國際市場(chǎng)也好,在各個(gè)大會(huì)上已經(jīng)看到,所有的算法所有的圖形圖樣的算法一直朝著小型化、模塊化和前端化的趨勢(shì)上走。
今天也看到非常非常多的前端傳感器公司在開發(fā)FPGA,包括在DSP還有自己的SOC上進(jìn)行開發(fā),都是朝著芯片的專用化包括算法的專用化和模塊化方向上做。在整個(gè)VSLAM系統(tǒng)里面如何去選取到不同的市場(chǎng)特征點(diǎn),作為整個(gè)坐標(biāo)原點(diǎn),我們的視覺算法和單純的依靠成績碼盤的服務(wù)機(jī)器人做的整個(gè)視覺效果的對(duì)比,對(duì)于SLAM系統(tǒng)里面分了前端后端兩塊。最主要的一塊是后端進(jìn)行回還檢測(cè),整個(gè)服務(wù)機(jī)器人里面剛剛蒲立學(xué)長講過,我們遇到即使是今天的會(huì)場(chǎng)環(huán)境下,有非常非常多的環(huán)境問題,包括毛毯、地毯、上下斜坡,這樣過程當(dāng)中我們所用到的貫導(dǎo)儀器失靈的程度非常大,我們必須依賴其它傳感器的融合來幫助服務(wù)機(jī)器人進(jìn)行作業(yè)和執(zhí)行任務(wù)過程當(dāng)中解決定位精度和零偏漂移的問題,我們應(yīng)用的是視覺的辦法。藍(lán)色的線是我們今天看到的視覺,除了進(jìn)行回還檢測(cè),在局部特征的時(shí)候基于所有的市場(chǎng)特征進(jìn)行全部回還的優(yōu)化。
速感科技推出的掃地機(jī)器人視覺傳感器
作為今天而言,現(xiàn)在的云計(jì)算成立更多成為大家所用的功能,在今年的6月份美國IROBOT掃地機(jī)器人廠商發(fā)布最新的如何利用深度學(xué)習(xí),后端云計(jì)算和前端服務(wù)機(jī)器人進(jìn)行更好地有機(jī)結(jié)合。首先在第一步可以利用視覺SLAM算法對(duì)家庭地圖進(jìn)行構(gòu)建,視覺加載了比其它二維線狀、激光、雷達(dá),慣性測(cè)量單元更具備的圖象信息,所以在地圖構(gòu)建過程當(dāng)中可以進(jìn)行嵌入式本地化的特征場(chǎng)景識(shí)別,包括識(shí)別到家庭里面的沙發(fā)、家庭里面的電視。第三步,可以基于這些特征點(diǎn)把這些高維的特征點(diǎn)通過深度學(xué)習(xí)的方式上傳到我的云端進(jìn)行云端的更深層次的理解,包括場(chǎng)景語義的理解,場(chǎng)景的分割和地圖標(biāo)簽的標(biāo)注。
最后一點(diǎn),服務(wù)機(jī)器人可以基于云端深度學(xué)習(xí)的理解,對(duì)家庭場(chǎng)景進(jìn)行更深層次的理解,從而對(duì)家庭場(chǎng)景達(dá)到特定任務(wù)的執(zhí)行。今天的掃地機(jī)器人按下開關(guān)進(jìn)行全覆蓋式的路徑規(guī)劃,今天以后在Irobot可以有針對(duì)性進(jìn)行特定點(diǎn)、特定場(chǎng)景的工作和作業(yè)。我們?cè)诮衲甑?月份面向全部的下游客戶推出來掃地機(jī)器人視覺關(guān)鍵部件,剛剛提到對(duì)于掃地機(jī)器人從過去的17年左右的時(shí)間一共分為三代掃地機(jī)器人。第一代掃地機(jī)器人做類布朗形式的亂撞,不會(huì)搭載任何傳感器,碰到墻壁就會(huì)旋轉(zhuǎn)135度進(jìn)行下一個(gè)位置的清掃和作業(yè)。第二代掃地機(jī)器人,隨著工作時(shí)間的累計(jì)和增加,陀螺儀、碼盤的數(shù)據(jù)隨著飄移的程度越來越大,我們?cè)诮衲?月份推出第三代掃地機(jī)器人關(guān)鍵傳感器,讓整個(gè)掃地機(jī)器人和未來服務(wù)的服務(wù)機(jī)器人達(dá)到更低功耗的智能行走,有效降低漏掃率和重復(fù)清掃。
在工業(yè)的場(chǎng)景里面,WSC會(huì)議上也有一些下游的合作廠商利用我們的SLAM定位控制器幫助現(xiàn)在的做HV的廠商解決在物料運(yùn)輸過程當(dāng)中HV的自然導(dǎo)航和有特征點(diǎn)和有mark點(diǎn)的相關(guān)信息,SLAM最核心的應(yīng)用場(chǎng)景基于消費(fèi)核工業(yè)的兩個(gè)場(chǎng)景。
最后介紹一下我們的整個(gè)產(chǎn)品系列,我們是做一家toB的解決方案廠商,面向下游的客戶提供了包括消費(fèi)級(jí)的核心傳感器、工業(yè)級(jí)的導(dǎo)航定位控制器,我們和英特爾合作的服務(wù)機(jī)器人開發(fā)控制平臺(tái),這樣一個(gè)開發(fā)控制平臺(tái)在過去一年多的時(shí)間里面已經(jīng)幫助國內(nèi)的30多家服務(wù)機(jī)器人廠商解決了它們服務(wù)機(jī)器人商用具體場(chǎng)景里面的場(chǎng)景對(duì)接和場(chǎng)景落地問題。
謝謝!
(以上講演內(nèi)容為速感科技供稿,中國AGV網(wǎng)整理編寫)
北京辰天科技有限公司(原速感(北京)科技有限公司事業(yè)部)專注于工業(yè)AGV的核心技術(shù)即工業(yè)定位導(dǎo)航設(shè)備及相關(guān)軟硬件技術(shù)的研發(fā)和實(shí)施。公司核心技術(shù)人員是國內(nèi)最早從事工業(yè)定位導(dǎo)航算法研發(fā)的技術(shù)團(tuán)隊(duì),自2017年起,國內(nèi)已有數(shù)十家用戶采用本公司產(chǎn)品,獲得了市場(chǎng)的高度認(rèn)可,合作客戶目前處于快速增長階段。辰天科技與多個(gè)高校、研究機(jī)構(gòu)和知名企業(yè)深度合作,在產(chǎn)品研發(fā)的過程中,吸收了大量先進(jìn)的技術(shù)和理念,開發(fā)了基于反光標(biāo)的工業(yè)激光定位器、基于SLAM的激光定位導(dǎo)航器和基于激光和視覺雙SLAM的工業(yè)級(jí)高精度、高可靠的定位導(dǎo)航設(shè)備,并采用AI技術(shù)實(shí)現(xiàn)了徹底解決行業(yè)痛點(diǎn)的完美方案。
辰天科技致力于成為智能制造核心技術(shù)的領(lǐng)跑者,為行業(yè)客戶提供先進(jìn)可靠的產(chǎn)品和優(yōu)質(zhì)的服務(wù),全力為“中國制造2025”貢獻(xiàn)出自己的一份力量。
2025-04-11 12:24
2025-04-11 12:23
2025-04-11 12:22
2025-04-11 12:21
2025-04-11 12:20
2025-04-11 12:20
2025-04-11 12:19
2025-04-11 12:18
2025-04-10 05:16
2025-04-10 05:15