創(chuàng)澤機器人 |
CHUANGZE ROBOT |
傳統(tǒng)的機器人控制方法依賴于精確的動力學(xué)模型和專家知識,難以適應(yīng)非結(jié)構(gòu)化環(huán)境的不確定性和復(fù)雜性。近年來,學(xué)習(xí)型控制的發(fā) 展使得機器人能夠從數(shù)據(jù)中學(xué)習(xí)控制策略,但其泛化能力和魯棒性仍 難以滿足復(fù)雜場景需求。大模型為機器人控制引入了豐富的先驗知識 和泛化能力,有望進(jìn)一步突破傳統(tǒng)控制方法的局限性。整體上看,目前展廳迎賓機器人的“小腦”核心技術(shù)正在從基于模型的控制方法向基于學(xué)習(xí)的控制方法演進(jìn)。
在強化學(xué)習(xí)領(lǐng)域,大模型為引入先驗知識和提高樣本效率提供了 新的思路。以 LanguagePlan 為例,該模型利用 GPT-3 根據(jù)任務(wù)描述 生成抽象的行動計劃,如“先走到門口,然后打開門,再走出房間”。 然后,LanguagePlan 將該行動計劃嵌入到狀態(tài)空間中,作為額外的觀 察信息,用于訓(xùn)練一個分層強化學(xué)習(xí)智能體。實驗表明,LanguagePlan 能夠顯著提高樣本效率和泛化性能,加速復(fù)雜任務(wù)的學(xué)習(xí)。類似地,LOFT、T-EBM 等模型也展示了利用語言模型引導(dǎo)策略學(xué)習(xí)的能力。
在模仿學(xué)習(xí)方面,視覺-語言模型為機器人學(xué)習(xí)復(fù)雜技能提供了新的范式。以 CLIP-ASAP 為例,該模型首先利用 CLIP 將視頻幀編 碼為語義特征,然后通過因果語言建模學(xué)習(xí)動作與視覺變化之間的關(guān) 系。在控制階段,CLIP-ASAP 根據(jù)語言指令和當(dāng)前視覺觀察,預(yù)測下 一時刻的關(guān)鍵幀,并將其傳遞給低層控制器執(zhí)行。實驗表明,CLIPASAP 能夠?qū)W習(xí)復(fù)雜的長期技能,如烹飪、家政等,且具有很強的泛化能力,能夠根據(jù)不同的指令組合技能。類似地,R3M、Pix2R 等模 型也展示了利用視覺-語言對齊進(jìn)行模仿學(xué)習(xí)的能力。
盡管大模型在機器人控制中展現(xiàn)出了廣闊的應(yīng)用前景,但如何進(jìn) 一步提高其實時性、魯棒性和可解釋性仍然是亟待解決的問題。此外, 如何將控制與感知、決策和規(guī)劃更緊密地結(jié)合,構(gòu)建端到端的自主系 統(tǒng),也是未來的重要研究方向。
機器人底盤 Disinfection Robot 消毒機器人 講解機器人 迎賓機器人 移動機器人底盤 商用機器人 智能垃圾站 智能服務(wù)機器人 大屏機器人 霧化消毒機器人 紫外線消毒機器人 消毒機器人價格 展廳機器人 服務(wù)機器人底盤 核酸采樣機器人 智能配送機器人 導(dǎo)覽機器人 |