當(dāng)前,全球機(jī)器人市場規(guī)模持續(xù)擴(kuò)大,工業(yè)機(jī)器人市場增速穩(wěn)定,服務(wù)機(jī)器人增速突出。2018 年,全球機(jī)器人市場規(guī)模達(dá) 298.2 億美元, 2013-2018 年的平均增長率約為 15.1%。 在裝備制造領(lǐng)域,機(jī)械臂憑借強(qiáng)大的負(fù)重能力和精準(zhǔn)的抓取操作代替著工人的雙手;在物流領(lǐng)域,智能倉儲機(jī)器人和無人搬運車不斷提高著運輸效率;在生活服務(wù)領(lǐng)域,家用清潔機(jī)器人和服務(wù)機(jī)器人正成為許多家庭的私人保姆和小秘書。
本期的智能內(nèi)參,我們推薦來自英特爾的報告, 全面闡述機(jī)器人4.0的發(fā)展情況,以及云邊端融合的機(jī)器人系統(tǒng)和架構(gòu) 。
一、 邁向云-邊-端融合的機(jī)器人4.0 時代
1、機(jī)器人技術(shù)發(fā)展主要階段分析
2017年,中國信息通信研究院、 IDC 國際數(shù)據(jù)集團(tuán)和英特爾共同發(fā)布的《人工智能時代的機(jī)器人3.0 新生態(tài)》白皮書把機(jī)器人的發(fā)展歷程劃分為三個時代,分別稱之為機(jī)器人1.0、機(jī)器人2.0、機(jī)器人3.0。
機(jī)器人發(fā)展階段示意圖
機(jī)器人1.0(1960-2000),機(jī)器人對外界環(huán)境沒有感知,只能單純復(fù)現(xiàn)人類的示教動作,在制造業(yè)領(lǐng)域替代工人進(jìn)行機(jī)械性的重復(fù)體力勞動。
機(jī)器人2.0(2000-2015), 通過傳感器和數(shù)字技術(shù)的應(yīng)用構(gòu)建起機(jī)器人的感覺能力,并模擬部分人類功能,不但促進(jìn)了機(jī)器人在工業(yè)領(lǐng)域的成熟應(yīng)用,也逐步開始向商業(yè)領(lǐng)域拓展應(yīng)用。
機(jī)器人3.0(2015-),伴隨著感知、計算、控制等技術(shù)的迭代升級和圖像識別、自然語音處理、深度認(rèn)知學(xué)習(xí)等新型數(shù)字技術(shù)在機(jī)器人領(lǐng)域的深入應(yīng)用,機(jī)器人領(lǐng)域的服務(wù)化趨勢日益明顯,逐漸滲透到社會生產(chǎn)生活的每一個角落。在機(jī)器人2.0 的基礎(chǔ)上,機(jī)器人3.0 實現(xiàn)從感知到認(rèn)知、推理、決策的智能化進(jìn)階。
2、 應(yīng)用領(lǐng)域分析
當(dāng)前,全球機(jī)器人市場規(guī)模持續(xù)擴(kuò)大,工業(yè)機(jī)器人市場增速穩(wěn)定,服務(wù)機(jī)器人增速突出。2018 年,全球機(jī)器人市場規(guī)模達(dá) 298.2 億美元, 2013-2018 年的平均增長率約為 15.1%。 在裝備制造領(lǐng)域,機(jī)械臂憑借強(qiáng)大的負(fù)重能力和精準(zhǔn)的抓取操作代替著工人的雙手;在物流領(lǐng)域,智能倉儲機(jī)器人和無人搬運車不斷提高著運輸效率;在生活服務(wù)領(lǐng)域,家用清潔機(jī)器人和服務(wù)機(jī)器人正成為許多家庭的私人保姆和小秘書。
工業(yè)制造領(lǐng)域分析。目前,工業(yè)機(jī)器人在汽車、金屬制品、電子、橡膠及塑料等行業(yè)已經(jīng)得到了廣泛的應(yīng)用。隨著性能的不斷提升,以及各種應(yīng)用場景的不斷清晰, 2013 年以來,工業(yè)機(jī)器人的市場規(guī)模正以年均 12.1%的速度快速增長,預(yù)計到 2020 年將達(dá)到 230 億美元的銷售額。 隨著人力成本的上升, 工業(yè)制造領(lǐng)域的應(yīng)用前景良好,將會保持快速增長的勢頭。同時,工業(yè)機(jī)器人需要擁有更高的靈活性、更強(qiáng)的自主避障和快速配置的能力,提高整體產(chǎn)品的易用性和穩(wěn)定性。
消費服務(wù)領(lǐng)域分析。服務(wù)機(jī)器人雖然整體銷售額低于工業(yè)機(jī)器人,但近幾年一直維持著較高的年增長率,商用服務(wù)機(jī)器人在商嘗銀行、酒店、機(jī)場等應(yīng)用場景有了更多的落地部署,主要提供導(dǎo)覽、問詢、送物等基礎(chǔ)服務(wù)。同時,家用服務(wù)機(jī)器人悄然進(jìn)入千家萬戶,掃地機(jī)器人銷量在家用服務(wù)機(jī)器人銷量中占主要份額,成為目前家務(wù)機(jī)器人中的主導(dǎo)品類。 由于本體能力不足, 隱私、安全方面的問題, 家庭管家機(jī)器人和陪伴型機(jī)器人的市場滲透率較低。 2013 年以來全球服務(wù)機(jī)器人市場規(guī)模年均增速達(dá) 23.5%,預(yù)計 2020 年將快速增長至 156.9 億美元。
從整個技術(shù)發(fā)展和市場環(huán)境看,機(jī)器人產(chǎn)業(yè)擁有以下發(fā)展推力:1、成熟的生態(tài)系統(tǒng);2、老齡化人口趨勢和新興市場;3、更多智能產(chǎn)品互聯(lián)和智能家庭建設(shè);4、人工智能、自然語言理解能力的增強(qiáng) 。
3、機(jī)器人4.0 的定義和發(fā)展機(jī)會
機(jī)器人3.0 預(yù)計將在 2020 年完成, 在此之后,機(jī)器人將進(jìn)入 4.0 時代, 把云端大腦分布在從云到端的各個地方,充分利用邊緣計算去提供更高性價比的服務(wù),把要完成任務(wù)的記憶場景的知識和常識很好的組合起來,實現(xiàn)規(guī)模化部署。機(jī)器人除了具有感知能力實現(xiàn)智能協(xié)作, 還具有理解和決策的能力,達(dá)到自主的服務(wù)。 在某些不確定的情況下,它需要叫遠(yuǎn)程的人進(jìn)行增強(qiáng),或者做一些決策輔助,但是它在 90%,甚至 95%的情況可以自主完成任務(wù)。
要達(dá)到這一目標(biāo), 首先需要利用人工智能和5G技術(shù)。 利用人工智能技術(shù)提高機(jī)器人本體感知能力的同時, 提升個性化自然交互能力。利用5G技術(shù), 大大縮短從終端到接入網(wǎng)的時間,帶寬大幅度上升,很多東西可以放到邊緣端,加入更多的計算能力,包括云端大腦的一些擴(kuò)展,助力機(jī)器人規(guī)模化部署。
實現(xiàn)機(jī)器人跳躍式發(fā)展
類似互聯(lián)網(wǎng)的三級火箭發(fā)展模式,第一階段關(guān)鍵場景, 把握垂直應(yīng)用,提高場景、任務(wù)、能力的匹配,提高機(jī)器人在關(guān)鍵應(yīng)用場景的能力,擴(kuò)大用戶基礎(chǔ);第二階段人工增強(qiáng),通過加入持續(xù)學(xué)習(xí)和場景自適應(yīng)的能力,延伸服務(wù)能力,取代部分人力,逐步實現(xiàn)對人的替代,讓機(jī)器人的能力滿足用戶預(yù)期; 第三階段規(guī)模化, 通過云邊端融合的機(jī)器人系統(tǒng)和架構(gòu),讓機(jī)器人達(dá)到數(shù)百萬千萬級水平,從而降低價格成本,實現(xiàn)大規(guī)模商用。
二、 云-邊技術(shù)推動機(jī)器人結(jié)構(gòu)創(chuàng)新
1、 云端大腦對機(jī)器人能力的增強(qiáng)
2010 年提出的云機(jī)器人概念引入了云端大腦,機(jī)器人嘗試引入云計算、云存儲及其它云技術(shù),達(dá)到機(jī)器人融合基礎(chǔ)設(shè)施和共享服務(wù)的優(yōu)點。相比于獨立的機(jī)器人本體,連接云端大腦后的機(jī)器人擁有以下四個核心優(yōu)勢。
1)信息和知識共享: 一個云端大腦可以控制很多機(jī)器人,云端大腦可以匯集來自所有連接機(jī)器人的視覺、語音和環(huán)境信息,經(jīng)云端大腦智能分析處理后的數(shù)據(jù)信息可以被所有連接機(jī)器人使用。利用云服務(wù)器,各機(jī)器人本體獲取和處理的信息可以保持最新,并安全備份。
2)平衡計算負(fù)載: 一些機(jī)器人功能需要較高的計算能力,利用云端平衡計算負(fù)載可以降低機(jī)器人本體的硬件需求,在保證能力的同時,讓機(jī)器人更輕、更孝更便宜。
3)協(xié)同合作: 通過云端大腦,機(jī)器人本體不再獨立工作, 多機(jī)器人可以協(xié)同工作,例如共同搬運貨物,配合完成一整套工作流程等。
4)獨立于本體持續(xù)升級: 借助云端大腦,機(jī)器人可以獨立于本體持續(xù)升級,不再依賴于本體硬件設(shè)備。
2) 邊緣計算對機(jī)器人服務(wù)的提升
IoT 應(yīng)用的快速發(fā)展,使得大量數(shù)據(jù)在網(wǎng)絡(luò)邊緣產(chǎn)生,推動了邊緣計算的產(chǎn)生和發(fā)展。邊緣計算的提出始于4G時代,將計算和存儲資源部署到網(wǎng)絡(luò)邊緣,不僅可以減少核心網(wǎng)和互聯(lián)網(wǎng)上的流量,還可以顯著降低傳輸時延, 提高網(wǎng)絡(luò)可靠性。
低時延的業(yè)務(wù)需要終端、移動蜂窩網(wǎng)(接入網(wǎng)和核心網(wǎng))、互聯(lián)網(wǎng)、數(shù)據(jù)中心的端到端的保障。目前的測試結(jié)果表明5G手機(jī)和基站的數(shù)據(jù)通路延時可以達(dá)到 4 毫秒,在 URLLC 模式下,手機(jī)和基站的延時可以達(dá)到 1 毫秒以下, 相比4G的 20毫秒提高了 20倍左右。對于互聯(lián)網(wǎng)和數(shù)據(jù)中心的時延,一般情況下由于地理位置分布廣和未針對低時延優(yōu)化,從核心網(wǎng)網(wǎng)關(guān)到互聯(lián)網(wǎng)數(shù)據(jù)中心可在幾十到幾百毫秒之間。在5G中,其核心網(wǎng)引入了分布式網(wǎng)關(guān),網(wǎng)關(guān)可以下沉到基站附近,邊緣服務(wù)器可以直接連接到分布式網(wǎng)關(guān)上,大大降低網(wǎng)絡(luò)的端到端時延。
邊緣計算的引入將解決終端能力受限和云計算的實時響應(yīng)的問題,增強(qiáng)機(jī)器人云端大腦的實時響應(yīng)能力,對于滿足機(jī)器人4.0 的要求十分關(guān)鍵,比如實時的推理、 場景理解、 操控等等。邊緣計算和云計算的結(jié)合,將突破終端的計算能力和存儲的限制,提高AI算法的訓(xùn)練和推理能力,比如提升精度和降低訓(xùn)練時間。同時將大部分機(jī)器人的智能布署在邊緣和云端,通過協(xié)作和不斷的訓(xùn)練,持續(xù)不斷的提高機(jī)器人智能,比如通過邊緣計算能更好的支持實時的多機(jī)協(xié)作,支持實時的知識圖譜提娶理解和決策,持續(xù)不斷的提高機(jī)器人的智能。邊緣計算和云計算還可以解決機(jī)器人終端升級維護(hù)的困難,在機(jī)器人本體的生命周期內(nèi)不斷升級,提高機(jī)器人的能力, 增強(qiáng)數(shù)據(jù)安全和隱私保護(hù), 充分利用摩爾定律帶來的性能提升。
3、 云-邊-端一體化對機(jī)器人系統(tǒng)的支撐
云邊端一體化構(gòu)建了一個通過機(jī)器人提供多樣化服務(wù)的規(guī)模化運營平臺。其中,服務(wù)機(jī)器人本體是服務(wù)的實施者,而實際功能則根據(jù)服務(wù)的需要無縫地在終端計算(機(jī)器人本體)、邊緣計算和云計算之間分布和協(xié)同。機(jī)器人系統(tǒng)類似現(xiàn)在智能手機(jī)上的各種 APP,主要關(guān)注如何實現(xiàn)高性價比的多模態(tài)感知融合、自適應(yīng)交互和實時安全計算。
多模態(tài)感知融合: 為了支持機(jī)器人的移動、避障、交互和操作,機(jī)器人系統(tǒng)必須裝備多種傳感器(如攝像頭、麥克風(fēng)陣列、激光雷達(dá)、超聲波等)。 同時,環(huán)境里的傳感器可以補(bǔ)足機(jī)器人的物理空間局限性。大部分?jǐn)?shù)據(jù)需要在時間同步的前提下進(jìn)行處理,并且調(diào)用不同復(fù)雜度的算法模塊(例如 SLAM,圖像處理,人和物體的識別等)。機(jī)器人硬件系統(tǒng)和邊緣計算需要協(xié)同來支持(可能來自多個機(jī)器人的)多傳感器數(shù)據(jù)同步和計算加速,因此應(yīng)該采用能靈活組合 CPU、 FPGA 和 DSA (Domain-Specific Accelerator) 的異構(gòu)計算平臺。另一部分沒有強(qiáng)實時性要求的感知任務(wù)(如人的行為識別、場景識別等),可以由云計算支持。
自適應(yīng)交互: 為了支持機(jī)器人的個性化服務(wù)和持續(xù)學(xué)習(xí)能力, 需要將感知模塊的輸出與知識圖譜結(jié)合對環(huán)境和人充分理解,并且逐步提取和積累與服務(wù)場景和個人相關(guān)的個性化知識。通用知識和較少變化的領(lǐng)域知識應(yīng)該存放在云端,而與地域和個性化服務(wù)相關(guān)的知識應(yīng)該存放在邊緣或者終端。無論知識存放在哪里,在機(jī)器人系統(tǒng)中應(yīng)該有統(tǒng)一的調(diào)用接口,并可以保證實時通訊。基于 ROS2 構(gòu)造涵蓋終端和網(wǎng)絡(luò)側(cè)的軟件系統(tǒng)框架可以滿足未來的需求。
實時安全計算: 未來的服務(wù)機(jī)器人應(yīng)用將有大量需要實時響應(yīng)的情形(如語音交互、協(xié)同操作等),因此需要在邊緣服務(wù)器部署相應(yīng)的加速硬件。同時,機(jī)器人也將處理大量涉及用戶隱私的數(shù)據(jù)(如視頻、圖像、對話等)。云邊端一體化架構(gòu)需要構(gòu)建隱私數(shù)據(jù)的安全傳輸和存儲機(jī)制,并且限定物理范圍。對于可以進(jìn)行物理操作的機(jī)器人,要構(gòu)建獨立的安全監(jiān)測機(jī)制,保證即使機(jī)器人系統(tǒng)被遠(yuǎn)程攻擊劫持后也不會造成物理安全損害。
三、機(jī)器人4.0 核心技術(shù)
在機(jī)器人3.0 時代,服務(wù)機(jī)器人可以做到一些物體識別、人臉識別,在 4.0 時代需要加上自適應(yīng)能力。因為用深度學(xué)習(xí)做物體識別、人臉識別的時候需要很多的數(shù)據(jù)來源,但是真正到家庭場景時沒有那么多數(shù)據(jù), 這就要求機(jī)器人必須通過少量數(shù)據(jù)去建立識別能力,自己去找到不同的位置,不同的角度做訓(xùn)練。
這些就是機(jī)器人4.0 要做的,首先對三維環(huán)境語義的理解, 在知道它是什么的基礎(chǔ)上,把看到的信息變成知識, 讓存儲就變得更加合理,而且可搜索, 可查詢,可關(guān)聯(lián),也可推理。應(yīng)用層可以根據(jù)這個知識和觀測為現(xiàn)場場景做出智能的提醒, 尋找物品,進(jìn)行行為檢測。例如,老人要出門,機(jī)器人的知識庫告訴他,今天預(yù)報要下雨,但是檢測到老人沒有帶傘,然后查詢傘的位置,機(jī)器人就可以把傘送到老人手里。這都是結(jié)合內(nèi)部知識和外部情況所做的決策。
知識圖譜在整個學(xué)術(shù)界和工業(yè)界越來越受到重視。獲得圖靈獎的杰夫 辛頓教授在加入谷歌的時候就說要建一個知識圖譜給全世界用。阿里研究院發(fā)布 2019年的十大技術(shù)趨勢里面也專門提到了知識圖譜的重要性。這是人工智能邁向下一個階段的必由之路,也是必做之事。
總結(jié)下來,機(jī)器人4.0 主要有以下幾個核心技術(shù),包括云邊端的無縫協(xié)同計算、 持續(xù)學(xué)習(xí)、 協(xié)同學(xué)習(xí)、 知識圖譜、 場景自適應(yīng)和數(shù)據(jù)安全。
機(jī)器人4.0 時代的能力升級
2025-04-03 09:11
2025-04-03 08:56
2025-04-03 08:51
2025-04-03 08:47
2025-04-02 09:01
2025-03-31 15:35
2025-03-31 15:33
2025-03-26 11:46
2025-03-26 11:45
2025-03-25 08:58