創(chuàng)澤機(jī)器人
CHUANGZE ROBOT
當(dāng)前位置:首頁(yè) > 新聞資訊 > 行業(yè)動(dòng)態(tài) > ICRA 自然語(yǔ)義引導(dǎo)的機(jī)器人技能操作

ICRA 自然語(yǔ)義引導(dǎo)的機(jī)器人技能操作

來(lái)源:CAAI認(rèn)知系統(tǒng)與信息處理專(zhuān)委會(huì)     編輯:創(chuàng)澤   時(shí)間:2023/11/7   主題:其他 [加盟]

隨著自然語(yǔ)言處理技術(shù)的發(fā)展以及客戶(hù)需求的提高,當(dāng)機(jī)器人進(jìn)入以人為主的環(huán)境時(shí),必須學(xué)會(huì)理解人類(lèi)語(yǔ)言,完成指定任務(wù)。相較于傳統(tǒng)只對(duì)場(chǎng)景做出反應(yīng)的機(jī)器人操作方法,結(jié)合語(yǔ)義輸入,讓機(jī)器人理解人類(lèi)語(yǔ)言,根據(jù)場(chǎng)景和自然語(yǔ)言指令完成相應(yīng)任務(wù),能為人機(jī)協(xié)作帶來(lái)更大的便利性。然而,目前該方法具有如下限制:

(1)依賴(lài)手工編碼任務(wù)符號(hào)來(lái)實(shí)現(xiàn)語(yǔ)義表達(dá),限制了語(yǔ)義層面的泛化性。

(2)從指令中推斷動(dòng)作序列時(shí),需要密集的子目標(biāo)監(jiān)督。

(3)缺乏更深層次的以目標(biāo)為中心的推理方法,在解釋復(fù)雜指令時(shí)不連貫。

針對(duì)上述問(wèn)題,該文章提出了一種可感知視覺(jué)場(chǎng)景,同時(shí)處理語(yǔ)言輸入的端到端可訓(xùn)練的模型。該模型使用視覺(jué)輸入得到當(dāng)前場(chǎng)景中物體在初始狀態(tài)下的位置關(guān)系,以語(yǔ)義文字推理目標(biāo)狀態(tài)下對(duì)應(yīng)的位置關(guān)系,實(shí)現(xiàn)由自然語(yǔ)言引導(dǎo)機(jī)器人進(jìn)行技能操作。 相關(guān)成果以“Learning Neuro-symbolic Programs for Language Guided Robot Manipulation”為題發(fā)表于International Conference on Robotic and Automation (ICRA)會(huì)議中。

該文章提出了一種新型神經(jīng)符號(hào)模型,使用自然語(yǔ)言推理目標(biāo)場(chǎng)景,實(shí)現(xiàn)在給定初始場(chǎng)景和目標(biāo)場(chǎng)景的情況下即可學(xué)習(xí)執(zhí)行復(fù)雜的操作任務(wù),并展示了如何在不需要任何中間監(jiān)督的情況下,僅使用初始與目標(biāo)兩個(gè)場(chǎng)景作為監(jiān)督來(lái)獲取機(jī)器人操作動(dòng)作的密集表示。 實(shí)驗(yàn)表明,該文章的方法可通過(guò)端到端的訓(xùn)練而不需進(jìn)行任何子目標(biāo)監(jiān)督,即可展現(xiàn)出強(qiáng)大的指令理解能力,并對(duì)新場(chǎng)景和指令展現(xiàn)出強(qiáng)大的泛化能力,為將來(lái)基于自然語(yǔ)言的人機(jī)協(xié)作,機(jī)器人的語(yǔ)義指令集的拓展提供了新的參考思路。

1、模型結(jié)構(gòu)設(shè)計(jì)

該端到端模型的結(jié)構(gòu)如圖1所示,由視覺(jué)提取器、語(yǔ)言解釋器、視覺(jué)解釋器、動(dòng)作模擬器組成。輸入初始場(chǎng)景和基于自然語(yǔ)言的任務(wù)指令,模型輸出完成該指令所需的動(dòng)作參數(shù),以及預(yù)測(cè)完成任務(wù)后的最終場(chǎng)景。

視覺(jué)提取器相當(dāng)于一個(gè)目標(biāo)檢測(cè)模型,用于識(shí)別初始場(chǎng)景下的物體信息。以圖11為例,輸入桌面初始狀態(tài)的圖像,視覺(jué)提取器輸出各個(gè)物體的外接框、顏色信息及物體名稱(chēng),并由外接框在桌面上的相對(duì)位置推斷物體的位置信息。

語(yǔ)言解釋器用于處理自然語(yǔ)言指令推理任務(wù)中隱含的操作動(dòng)作。例如圖中“移動(dòng)綠色骰子后面的紅色骰子至紅色方塊的右邊”這句指令,語(yǔ)言解釋器經(jīng)過(guò)推理會(huì)得到完成該任務(wù)需要進(jìn)行“移動(dòng)”動(dòng)作,移動(dòng)的物體是“位于綠色骰子后面的紅色骰子”,目標(biāo)是“紅色方塊右邊”,并可屏蔽“綠色方塊”和“藍(lán)色骰子”這些與完成任務(wù)無(wú)關(guān)的信息。推理完畢后,以專(zhuān)用指令集組合出推理結(jié)果。

專(zhuān)用指令集的結(jié)構(gòu)如圖2所示,分為“關(guān)鍵詞”和“操作詞”,前者用于描述物體信息,后者用于表示操作信息。

視覺(jué)解釋器結(jié)合前二者輸出的場(chǎng)景信息和任務(wù)指令集,輸出完成該任務(wù)所需的參數(shù)化表示,交由任務(wù)模擬器生成機(jī)器人所能執(zhí)行的動(dòng)作參數(shù),并預(yù)測(cè)完成任務(wù)后的場(chǎng)景情況。

以預(yù)測(cè)場(chǎng)景和數(shù)據(jù)集中提前設(shè)定好的目標(biāo)場(chǎng)景做差,設(shè)置損失函數(shù),即可實(shí)現(xiàn)端到端的訓(xùn)練過(guò)程。


人形機(jī)器人的落地思考-場(chǎng)景聚焦明確產(chǎn)品形態(tài)考慮成本設(shè)計(jì)

要立足場(chǎng)景正向設(shè)計(jì)產(chǎn)品從場(chǎng)景出發(fā)解決問(wèn)題;續(xù)航能力將是制約人形機(jī)器人應(yīng)用和發(fā)展的又一個(gè)重要因素;需要做到萬(wàn)元級(jí)別的成本才有可能大面積進(jìn)入家庭

中國(guó)公共服務(wù)機(jī)器人產(chǎn)業(yè)鏈研究報(bào)告2023-市場(chǎng)規(guī)模總量提升較快,企業(yè)總量增速放緩

服務(wù)機(jī)器人的市場(chǎng)規(guī)模在2019年后快速增長(zhǎng),預(yù)計(jì)到2025年CAGR將達(dá)到近65%;人形機(jī)器人會(huì)是未來(lái)公共服務(wù)機(jī)器人主要形態(tài),軟件升級(jí)引領(lǐng)硬件發(fā)展

中國(guó)服務(wù)機(jī)器人行業(yè)未來(lái)的主要發(fā)展趨勢(shì)

商業(yè)模式創(chuàng)新,打造一體化服務(wù),持續(xù)拓展下游細(xì)分賽道;業(yè)務(wù)模式創(chuàng)新,多場(chǎng)景融合,實(shí)現(xiàn)實(shí)現(xiàn)一個(gè)服務(wù)機(jī)器人可以完成在多場(chǎng)景下完成工作

中國(guó)服務(wù)機(jī)器人行業(yè)發(fā)展目前面臨的潛在風(fēng)險(xiǎn)

新科技的出現(xiàn)可能會(huì)對(duì)傳統(tǒng)服務(wù)機(jī)器人廠商造成 一些沖擊;優(yōu)秀畢業(yè)生首選行業(yè)是軟件和信息服務(wù)可能會(huì)導(dǎo)致人才供給不足等風(fēng)險(xiǎn);行業(yè)內(nèi)公司經(jīng)營(yíng)模式相似度過(guò)高

中國(guó)服務(wù)機(jī)器人行業(yè)發(fā)展目前面臨的主要挑戰(zhàn)

收入和研發(fā)費(fèi)用的比例均超過(guò)了5%;國(guó)產(chǎn)機(jī)器人推廣應(yīng)用面臨新場(chǎng)景拓展慢的挑戰(zhàn);代理商分銷(xiāo)的方式可以有效的幫助服務(wù)機(jī)器人廠商也會(huì)造成市場(chǎng)的惡意競(jìng)價(jià)

服務(wù)機(jī)器人在中國(guó)市場(chǎng)短期迎來(lái)向好拐點(diǎn) 需求增長(zhǎng)

在已使用或計(jì)劃使用服務(wù)機(jī)器人的企業(yè)中,酒旅,金融服務(wù),餐飲快消行業(yè)滲透率最高,均超過(guò)20%;2023年6月我國(guó)服務(wù)機(jī)器人產(chǎn)量為662658臺(tái),同比增長(zhǎng)40%

服務(wù)機(jī)器人產(chǎn)業(yè)迎來(lái)向好拐點(diǎn) 增長(zhǎng)空間巨大

進(jìn)入2023年后服務(wù)機(jī)器人產(chǎn)量同比增長(zhǎng)47.6%,結(jié)束了連續(xù)12個(gè)月的同比下滑;人工智能技術(shù)的突破也將給服務(wù)機(jī)器人從語(yǔ)音,視覺(jué),決策,控制四個(gè)方面帶來(lái)賦能

創(chuàng)澤上市輔導(dǎo)進(jìn)展情況報(bào)告(第十三期)20230414

中原證券參與輔導(dǎo)工作的人員為高巖,趙巖,鄒堅(jiān)貞,胡殿軍,李雅璇,開(kāi)展輔導(dǎo)的方式主要包括持續(xù)關(guān)注相關(guān)行業(yè)領(lǐng)域熱點(diǎn)信息

環(huán)境感知的核心SLAM算法基本結(jié)構(gòu)可分為前端和后端

算法在前端完成占據(jù)柵格地圖的構(gòu)建,得出激光雷達(dá)掃描幀的最佳位姿后,后端根據(jù)掃描幀間的位姿關(guān)系進(jìn)行全局的地圖優(yōu)化,得出閉環(huán)掃描幀在全局地圖中的最佳位姿

環(huán)境感知模塊中基于激光雷達(dá)或視覺(jué)傳感器的SLAM算法是核心

環(huán)境感知模塊的基礎(chǔ)硬件是各類(lèi)不同的傳感器,收集不同的測(cè)量信息,SLAM算法用于融合收集的信息數(shù)據(jù),機(jī)器人可以在未知環(huán)境中進(jìn)行自主探索和導(dǎo)航

運(yùn)動(dòng)控制、環(huán)境感知與人機(jī)交互是公共服務(wù)機(jī)器人三大核心技術(shù)模塊

環(huán)境感知模塊主要依靠如激光雷達(dá)實(shí)現(xiàn)對(duì)內(nèi)外部環(huán)境狀態(tài)信息的獲取;運(yùn)動(dòng)控制模塊主要依靠控制器等硬件實(shí)現(xiàn)派發(fā)的位置指令;人機(jī)交互模塊主要依靠多模態(tài)信息理解交互技術(shù)

公共服務(wù)機(jī)器人產(chǎn)業(yè)鏈價(jià)值集中于上游核心技術(shù)與下游商業(yè)服務(wù)環(huán)節(jié)

公共服務(wù)機(jī)器人產(chǎn)業(yè)鏈符合“微笑曲線”理論,產(chǎn)業(yè)鏈附加價(jià)值集中于上游核心技術(shù)部分以及中游機(jī)器人廠商對(duì)下游用戶(hù)的商業(yè)行為,中游機(jī)器人 整機(jī)制造商一般具備部分上游核心技術(shù)
資料獲取
行業(yè)動(dòng)態(tài)
== 最新資訊 ==
ICRA 自然語(yǔ)義引導(dǎo)的機(jī)器人技能操作
2023語(yǔ)義增強(qiáng)可編程知識(shí)圖譜SPG白皮
2023 中國(guó)人工智能系列白皮書(shū)--人工
2023中國(guó)人工智能系列白皮書(shū)《人工智能
AI大模型市場(chǎng)研究報(bào)告(2023)邁向通
深圳2023人工智能發(fā)展白皮書(shū)-人工智能
人形機(jī)器人的落地思考-場(chǎng)景聚焦明確產(chǎn)品形
銀行保險(xiǎn)金融機(jī)構(gòu)生成式人工智能戰(zhàn)略報(bào)告-
中小學(xué)階段的人工智能課程報(bào)告-人工智能課
中國(guó)公共服務(wù)機(jī)器人產(chǎn)業(yè)鏈研究報(bào)告2023
上海機(jī)器人產(chǎn)業(yè)園產(chǎn)業(yè)政策及入住代表性企業(yè)
2023年中國(guó)AI技術(shù)變革企業(yè)服務(wù)白皮書(shū)
中國(guó)服務(wù)機(jī)器人行業(yè)未來(lái)的主要發(fā)展趨勢(shì)
中國(guó)服務(wù)機(jī)器人行業(yè)發(fā)展目前面臨的潛在風(fēng)險(xiǎn)
中國(guó)服務(wù)機(jī)器人行業(yè)發(fā)展目前面臨的主要挑戰(zhàn)
== 機(jī)器人推薦 ==
迎賓講解服務(wù)機(jī)器人

服務(wù)機(jī)器人(迎賓、講解、導(dǎo)診...)

智能消毒機(jī)器人

智能消毒機(jī)器人

機(jī)器人開(kāi)發(fā)平臺(tái)

機(jī)器人開(kāi)發(fā)平臺(tái)


機(jī)器人底盤(pán) Disinfection Robot 消毒機(jī)器人  講解機(jī)器人  迎賓機(jī)器人  移動(dòng)機(jī)器人底盤(pán)  商用機(jī)器人  智能垃圾站  智能服務(wù)機(jī)器人  大屏機(jī)器人  霧化消毒機(jī)器人  紫外線消毒機(jī)器人  消毒機(jī)器人價(jià)格  展廳機(jī)器人  服務(wù)機(jī)器人底盤(pán)  核酸采樣機(jī)器人  機(jī)器人代工廠  智能配送機(jī)器人  噴霧消毒機(jī)器人  圖書(shū)館機(jī)器人  導(dǎo)引機(jī)器人  移動(dòng)消毒機(jī)器人  導(dǎo)診機(jī)器人  迎賓接待機(jī)器人  前臺(tái)機(jī)器人  消殺機(jī)器人  導(dǎo)覽機(jī)器人 
版權(quán)所有 創(chuàng)澤智能機(jī)器人集團(tuán)股份有限公司 中國(guó)運(yùn)營(yíng)中心:北京 清華科技園九號(hào)樓5層 中國(guó)生產(chǎn)中心:山東日照太原路71號(hào)
銷(xiāo)售1:4006-935-088 銷(xiāo)售2:4006-937-088 客服電話: 4008-128-728