產(chǎn)品系列

行業(yè)應(yīng)用

技術(shù)支持

關(guān)于創(chuàng)澤

創(chuàng)澤機(jī)器人

CHUANGZE ROBOT

當(dāng)前位置：首頁 > 新聞資訊 > 機(jī)器人開發(fā) > 大模型與智能機(jī)器人結(jié)合,用語言指導(dǎo)機(jī)器人抓取物體

大模型與智能機(jī)器人結(jié)合,用語言指導(dǎo)機(jī)器人抓取物體

來源：CAAI認(rèn)知系統(tǒng)與信息處理專委會編輯：創(chuàng)澤時間：2023/9/6 主題：其他 [加盟]

從斯坦福大學(xué)的 VIMA 機(jī)器人智能體，到谷歌 DeepMind 推出首個控制機(jī)器人的視覺 - 語言 - 動作（VLA）的模型 RT-2，大模型加持的機(jī)器人研究備受關(guān)注。

當(dāng)前，自監(jiān)督和語言監(jiān)督的圖像模型已經(jīng)包含豐富的世界知識，這對于泛化來說非常重要，但圖像特征是二維的。我們知道，機(jī)器人任務(wù)通常需要對現(xiàn)實世界中三維物體的幾何形狀有所了解。

基于此，來自 MIT CSAIL 和 IAIFI 的研究者利用蒸餾特征場（Distilled Feature Field，DFF），將準(zhǔn)確的 3D 幾何圖形與來自 2D 基礎(chǔ)模型的豐富語義結(jié)合起來，讓機(jī)器人能夠利用 2D 基礎(chǔ)模型中豐富的視覺和語言先驗，完成語言指導(dǎo)的操作。

論文地址：https://arxiv.org/abs/2308.07931

具體來說，該研究提出了一種用于 6-DOF 抓取和放置的小樣本學(xué)習(xí)方法，并利用強(qiáng)大的空間和語義先驗泛化到未見過物體上。使用從視覺 - 語言模型 CLIP 中提取的特征，該研究提出了一種通過開放性的自然語言指令對新物體進(jìn)行操作，并展示了這種方法泛化到未見過的表達(dá)和新型物體的能力。

研究團(tuán)隊用一個講解視頻詳細(xì)介紹了 F3RM 方法的技術(shù)原理：

控制器在機(jī)器人運(yùn)動控制系統(tǒng)中發(fā)揮核心作用

運(yùn)動控制器以傳感器為信號敏感元件,以電機(jī)或動力裝置和執(zhí)行單元為控制對象的一種控制裝置,為電機(jī)或其它動力和執(zhí)行裝置提供正確的控制信號

機(jī)器人整體電子電氣結(jié)構(gòu)以電控系統(tǒng)為基礎(chǔ)

典型的機(jī)器人電子電氣結(jié)構(gòu)主要由以下部分組成, 電源管理,環(huán)境感知,中央控制單元,電機(jī)控制,人機(jī)界面, 可選組件和其他應(yīng)用

氣壓/液壓驅(qū)動型機(jī)器人靈巧手特點

通過動力元件推動工作介質(zhì)(液體或氣體)在缸體內(nèi)產(chǎn) 生壓力差而驅(qū)動執(zhí)行元件,與其他驅(qū)動方式相比,液壓和氣壓驅(qū)動具有輸出功率密度大,易于實現(xiàn)遠(yuǎn)距離控制以及輸出力大等優(yōu)點

電機(jī)驅(qū)動型機(jī)器人靈巧手特點

微型驅(qū)動器和減速器的發(fā)展為手指驅(qū)動系統(tǒng)的微型化和集成化創(chuàng)造了條件,其直線驅(qū)動器將旋轉(zhuǎn)電機(jī),旋轉(zhuǎn)直線轉(zhuǎn)換結(jié)構(gòu)和減速機(jī)都集成在靈巧手內(nèi)部

驅(qū)動器混合置型機(jī)器人靈巧手特點

混合置式靈巧手將一部分驅(qū)動器放在手臂，既保證了驅(qū)動力，也降低了靈巧手本體的體積，使得靈巧手更加擬人化

驅(qū)動器內(nèi)置型機(jī)器人靈巧手特點

驅(qū)動器內(nèi)置式靈巧手各關(guān)節(jié)具有較好的剛性,更利于傳感器的直接測量,且模塊化設(shè)計利于更換維護(hù);整手尺寸較大,關(guān)節(jié)靈活度下降

驅(qū)動器外置型機(jī)器人靈巧手特點

靈巧手的外觀設(shè)計更加擬人化,手指本體更加纖細(xì);可以采用更大的驅(qū)動電機(jī),從而增大手指的輸出力;驅(qū)動器與手本體之間距離遠(yuǎn)增加了控制器設(shè)計的難度

機(jī)器人多指靈巧手經(jīng)歷了三個階段

第一階段是從 20 世紀(jì) 70 年代—20 世紀(jì) 90 年代,典型代表是日本的 Okada、美國的 Stanford/JPL 和 Utah/MIT;第二階段是從 20 世紀(jì) 90 年代到 2010 年

機(jī)器人靈巧手是指數(shù)≥3，自由度≥9 的末端執(zhí)行器

靈巧手是機(jī)器人操作和動作執(zhí)行的末端工具,滿足兩個條件：指關(guān)節(jié)運(yùn)動時能使物體產(chǎn)生任意運(yùn)動,指關(guān)節(jié)固定時能完全限制物體的運(yùn)動,定義靈巧手是指數(shù)≥3,自由度≥9 的末端執(zhí)行器

智能類人機(jī)器人特斯拉擎天柱 (Optimus) 執(zhí)行機(jī)構(gòu)分析

特斯拉公布了 6 種規(guī)格的執(zhí)行器,旋轉(zhuǎn)執(zhí)行器采用諧波減速器+電機(jī)的方案，線性執(zhí)行器采用絲杠+電機(jī)的方案,對于手掌關(guān)節(jié),其采用了空心杯電機(jī)+蝸輪蝸桿的結(jié)構(gòu)

人形機(jī)器人前主要聚焦于運(yùn)動控制能力的提升

人形機(jī)器人有更強(qiáng)的柔性化水平,更好的環(huán)境感知能力和判斷能力,首要需要解決的問題是如何實現(xiàn)像人一樣去運(yùn)動,能夠兼顧可靠性

特斯拉機(jī)器人軀干共有28個關(guān)節(jié)

28個執(zhí)行器分別為肩關(guān)節(jié)(單側(cè)三自由度旋轉(zhuǎn)關(guān)節(jié))6個,肘關(guān)節(jié)(單側(cè)直線關(guān)節(jié))2個,腕部關(guān)節(jié)(單側(cè)2個直線+1個旋轉(zhuǎn))6個,腰部(二自由度旋轉(zhuǎn)關(guān)節(jié))2個

資料獲取

機(jī)器人開發(fā)

== 最新資訊 ==

大模型與智能機(jī)器人結(jié)合,用語言指導(dǎo)機(jī)器人

我國機(jī)器人產(chǎn)業(yè)場景拓展，“機(jī)器人+”應(yīng)用

控制器在機(jī)器人運(yùn)動控制系統(tǒng)中發(fā)揮核心作用

機(jī)器人整體電子電氣結(jié)構(gòu)以電控系統(tǒng)為基礎(chǔ)

服務(wù)機(jī)器人中國市場規(guī)模-2024年CAG

人形機(jī)器人提供算力支撐：FSD芯片與Do

仿真學(xué)習(xí)：不斷訓(xùn)練算法，提升機(jī)器人能力

智能服務(wù)機(jī)器人手部抓取，算法要求極高

人形整機(jī)平衡與行走步態(tài)是基本

人形機(jī)器人行為規(guī)劃難度遠(yuǎn)高于自動駕駛

人形機(jī)器人是頭部科技公司的競爭

軟件決定人形機(jī)器人高度，算法需與硬件匹配

人形機(jī)器人空間測算：25年起步，30年開

人形機(jī)器人商業(yè)化：細(xì)分領(lǐng)域突破到通用型，

人形機(jī)器人難點：軟硬件均存在難點，降本與

== 機(jī)器人推薦 ==

迎賓講解服務(wù)機(jī)器人

服務(wù)機(jī)器人(迎賓、講解、導(dǎo)診...)

智能消毒機(jī)器人

智能消毒機(jī)器人

機(jī)器人開發(fā)平臺

機(jī)器人開發(fā)平臺

機(jī)器人底盤 Disinfection Robot 消毒機(jī)器人講解機(jī)器人迎賓機(jī)器人移動機(jī)器人底盤商用機(jī)器人智能垃圾站智能服務(wù)機(jī)器人大屏機(jī)器人霧化消毒機(jī)器人紫外線消毒機(jī)器人消毒機(jī)器人價格展廳機(jī)器人服務(wù)機(jī)器人底盤核酸采樣機(jī)器人機(jī)器人代工廠智能配送機(jī)器人噴霧消毒機(jī)器人圖書館機(jī)器人導(dǎo)引機(jī)器人移動消毒機(jī)器人導(dǎo)診機(jī)器人迎賓接待機(jī)器人前臺機(jī)器人消殺機(jī)器人導(dǎo)覽機(jī)器人

版權(quán)所有 創(chuàng)澤智能機(jī)器人集團(tuán)股份有限公司 中國運(yùn)營中心：北京清華科技園九號樓5層中國生產(chǎn)中心：山東日照太原路71號
銷售1：4006-935-088 銷售2：4006-937-088 客服電話： 4008-128-728