首頁(yè)
產(chǎn)品系列
行業(yè)應(yīng)用
渠道合作
新聞中心
研究院
投資者關(guān)系
技術(shù)支持
關(guān)于創(chuàng)澤
| En
 
  當(dāng)前位置:首頁(yè) > 新聞資訊 > 機(jī)器人應(yīng)用 > 機(jī)器人示教學(xué)習(xí):高級(jí)技能學(xué)習(xí)方法(學(xué)習(xí)計(jì)劃和學(xué)習(xí)目標(biāo))  
 

機(jī)器人示教學(xué)習(xí):高級(jí)技能學(xué)習(xí)方法(學(xué)習(xí)計(jì)劃和學(xué)習(xí)目標(biāo))

來源:CAAI認(rèn)知系統(tǒng)與信息處理專委會(huì)      編輯:創(chuàng)澤      時(shí)間:2020/6/9      主題:其他   [加盟]
機(jī)器人可以在人類教師反饋的基礎(chǔ)上來探索某項(xiàng)任務(wù)。反饋提供了關(guān)于機(jī)器人嘗試的任務(wù)滿足目標(biāo)的程度的信息。大多數(shù)基于反饋的工作傾向于采用強(qiáng)化學(xué)習(xí)。傳統(tǒng)的RL算法提供了一個(gè)反饋(獎(jiǎng)勵(lì))信號(hào),在這種情況下使用了人工響應(yīng)。在某些情況下,除了人類的反饋,任務(wù)的表現(xiàn)直接受到老師的影響,老師允許選擇下一步行動(dòng)。在[10]中,這種方法將任務(wù)學(xué)習(xí)表現(xiàn)提高了約50%。

需要注意的是,有時(shí)選擇的示教方法和獲取的數(shù)據(jù)類型與學(xué)習(xí)算法的選擇有關(guān)。一方面來自多個(gè)模態(tài)的示范增加了維數(shù),增加了學(xué)習(xí)的復(fù)雜性。數(shù)據(jù)的維數(shù)可以降低,但是有些信息被忽略,導(dǎo)致從示教數(shù)據(jù)中學(xué)習(xí)不當(dāng)。另一方面,缺少傳感模態(tài)可能會(huì)在一開始就提供不完整的信息,導(dǎo)致學(xué)習(xí)算法表現(xiàn)不理想。

高級(jí)技能可以認(rèn)為是一組低級(jí)技能或一組動(dòng)作基元。除此之外,高級(jí)技能還包括對(duì)象可視性,涉及構(gòu)建物理世界對(duì)象和機(jī)器人動(dòng)作之間關(guān)系的知識(shí)。高級(jí)技能學(xué)習(xí)方法可以大致分為學(xué)習(xí)計(jì)劃和學(xué)習(xí)目標(biāo)。

1)學(xué)習(xí)計(jì)劃:在這種高級(jí)技能的學(xué)習(xí)方法中,學(xué)習(xí)計(jì)劃為從初始狀態(tài)到最終狀態(tài)的一系列動(dòng)作。因此,動(dòng)作是根據(jù)前置條件和后置條件定義的。前置條件為動(dòng)作執(zhí)行前的狀態(tài),后置條件為動(dòng)作執(zhí)行后的狀態(tài)。除此之外,人類教師還用注釋的形式提供附加信息。注釋可以通過觸覺、視覺或語義來提供。額外的信息允許更好地概括高水平的技能?蓤(zhí)行的動(dòng)作可以是簡(jiǎn)單的低級(jí)技能,如抓住目標(biāo)對(duì)象,拾起綠色的對(duì)象等,組合起來形成一個(gè)高級(jí)任務(wù),如排序綠色的對(duì)象。另一方面,有一些方法可以通過在示教數(shù)據(jù)中尋找重復(fù)的結(jié)構(gòu)來從高級(jí)技能示教中提取低級(jí)技能,這樣就可以在不同的示教中識(shí)別它。在[2]中,一個(gè)示教學(xué)習(xí)范例是通過人類示教和在程序界面輸入的用戶目的來描述的。在[18]中,一些涉及一系列順序旋轉(zhuǎn)和轉(zhuǎn)換的日常對(duì)象操作的示教被用來提取順序的低級(jí)技能,并進(jìn)一步構(gòu)建一個(gè)計(jì)劃。這項(xiàng)工作還示教了從一個(gè)對(duì)象到其他類似對(duì)象的學(xué)習(xí)知識(shí)轉(zhuǎn)移。


2)學(xué)習(xí)目標(biāo):推斷高級(jí)技能的目標(biāo)。人類教師提供的示教被用來推斷執(zhí)行高級(jí)技能的意圖。通過生成假設(shè),可以從重復(fù)的示教中推斷出目標(biāo),F(xiàn)代方法也使用基于獎(jiǎng)勵(lì)函數(shù)的強(qiáng)化學(xué)習(xí)方法來實(shí)現(xiàn)期望目標(biāo)。如果獎(jiǎng)勵(lì)函數(shù)是從給定的示教中學(xué)習(xí)的,那么它就被認(rèn)為是目標(biāo)學(xué)習(xí)。一些基于強(qiáng)化學(xué)習(xí)的方法得到了很好的研究[19]。


3、討論總結(jié)

技能的學(xué)習(xí)直接依賴于示教的準(zhǔn)確性。大多數(shù)方法[20]手動(dòng)消除了部分示教中的噪聲。結(jié)合強(qiáng)化學(xué)習(xí),在獎(jiǎng)勵(lì)和探索機(jī)制的基礎(chǔ)上對(duì)技能學(xué)習(xí)進(jìn)行改進(jìn)。另一種改進(jìn)技能的方法涉及示教者反饋[21]。當(dāng)機(jī)器人在一個(gè)稍微不熟悉的情況下執(zhí)行學(xué)習(xí)到的技能時(shí),從人類教師那里得到關(guān)于執(zhí)行技能可取性的反饋。目前為了實(shí)現(xiàn)這種技能細(xì)化的方法,研究人員主要從兩個(gè)方面進(jìn)行了研究:(1)控制機(jī)器人和人類教師之間的信息交互,(2)提供反饋。





機(jī)器人示教學(xué)習(xí):學(xué)習(xí)低級(jí)技能運(yùn)動(dòng)基元軌跡運(yùn)動(dòng)技能

低級(jí)技能學(xué)習(xí)或建模的三種主要方法:動(dòng)態(tài)運(yùn)動(dòng)基元(DMP),高斯混合建模與回歸(GMM-GMR),隱馬爾科夫模型(HMM)

商業(yè)化移動(dòng)機(jī)器人的感知系統(tǒng)設(shè)計(jì)

機(jī)器人感知系統(tǒng)包括傳感器的選擇和配置,以及算法和實(shí)現(xiàn),利用了一個(gè)單目相機(jī),一個(gè)短程二維激光測(cè)距儀,車輪編碼器和慣性測(cè)量單元。

教育機(jī)器人發(fā)展階段及特點(diǎn)

教育機(jī)器人經(jīng)歷了從概念先行到價(jià)格營(yíng)銷到回歸內(nèi)容與價(jià)值本質(zhì)的發(fā)展階段變遷

教育機(jī)器人與機(jī)器人教育的區(qū)別

教育服務(wù)機(jī)器人:指具有教與學(xué)智能的服務(wù)機(jī)器人,機(jī)器人教育:模塊化機(jī)器人和機(jī)器人套件是機(jī)器人教育中常見 的輔助產(chǎn)品

機(jī)器人常用外部傳感器參數(shù)及性能對(duì)比

機(jī)器人對(duì)環(huán)境的感知大多通過激光雷達(dá)、攝像頭、毫米波雷達(dá)、超聲波傳感器、GPS這五類傳感器及其之間的組合來實(shí)現(xiàn)自主移動(dòng)功能

人與機(jī)器人交互時(shí)代的社會(huì)認(rèn)知

與機(jī)器人互動(dòng)時(shí)研究人的大腦將有助于更清晰、更深入地了解人機(jī)交互,從而為社交機(jī)器人的春天奠定基礎(chǔ),將社會(huì)維度整合到人與這些機(jī)器的交流中來加速人與機(jī)器人的交互研究,有助于推動(dòng)創(chuàng)造真正的社交機(jī)器人

電子皮膚和機(jī)器學(xué)習(xí)在智能軟體機(jī)器人的應(yīng)用

基于電子皮膚的軟體機(jī)器人傳感、機(jī)器學(xué)習(xí)在柔性電子皮膚上的應(yīng)用、形狀感知、面向軟體機(jī)器人的反饋控制和機(jī)器人的操作

機(jī)器人常用避障傳感器

避障使用的傳感器各種各樣,其特點(diǎn)和適用范圍也不同。根據(jù)不同的原理,可分為:超聲波傳感器、紅外傳感器、激光傳感器和視覺傳感器等

機(jī)器人輔助穿衣過程中用戶上肢運(yùn)動(dòng)實(shí)時(shí)追蹤方法

機(jī)器人輔助穿衣過程中,使用一種多傳感器信息融合的人體骨骼實(shí)時(shí)追蹤方法,使機(jī)器人既可以基于力的信息自動(dòng)改變運(yùn)動(dòng)軌跡從而保證用戶安全,又可以完成穿衣任務(wù)

下肢外骨骼機(jī)器人步態(tài)建模及其控制方法研究

在下肢外骨骼機(jī)器人的穩(wěn)定性評(píng)估、步態(tài)規(guī)劃和平衡控制中,人機(jī)系統(tǒng)質(zhì)心是重要的參數(shù)之一

火爆的貨箱倉(cāng)儲(chǔ)機(jī)器人

多臺(tái)貨箱到人機(jī)器人正在運(yùn)行,攜帶著貨箱輕巧敏捷地來回穿梭于存儲(chǔ)區(qū)和工位之間,高速完成美妝產(chǎn)品的存揀作業(yè)。這是業(yè)內(nèi)首個(gè)多層貨箱到人機(jī)器人解決方案的落地應(yīng)用,相較同等面積的人工倉(cāng),效率提升2.5倍。

結(jié)合人工智能技術(shù),5G+MR全息教室創(chuàng)新教學(xué)模式

基于計(jì)算機(jī)視覺的智能識(shí)別技術(shù) 和SLAM定位技術(shù)的引入,則實(shí)現(xiàn)了目標(biāo)與用戶的動(dòng)態(tài)精準(zhǔn)識(shí)別和交互。能夠輔助課堂教學(xué),提升遠(yuǎn)程教學(xué)和溝通效率,營(yíng)造場(chǎng)景化教學(xué)新體驗(yàn)
 
資料獲取

智能教育機(jī)器人功能介紹
新聞資訊
== 資訊 ==
» 人形機(jī)器人未來3-5年能夠?qū)崿F(xiàn)產(chǎn)業(yè)化的方
» 導(dǎo)診服務(wù)機(jī)器人上崗門診大廳 助力醫(yī)院智慧
» 山東省青島市政府辦公廳發(fā)布《數(shù)字青島20
» 關(guān)于印發(fā)《青海省支持大數(shù)據(jù)產(chǎn)業(yè)發(fā)展政策措
» 全屋無主燈智能化規(guī)范
» 微波雷達(dá)傳感技術(shù)室內(nèi)照明應(yīng)用規(guī)范
» 人工智能研發(fā)運(yùn)營(yíng)體系(ML0ps)實(shí)踐指
» 四驅(qū)四轉(zhuǎn)移動(dòng)機(jī)器人運(yùn)動(dòng)模型及應(yīng)用分析
» 國(guó)內(nèi)細(xì)分賽道企業(yè)在 AIGC 各應(yīng)用場(chǎng)景
» 國(guó)內(nèi)科技大廠布局生成式 AI,未來有望借
» AIGC領(lǐng)域相關(guān)初創(chuàng)公司及業(yè)務(wù)場(chǎng)景梳理
» ChatGPT 以 GPT+RLHF 模
» AIGC提升文字 圖片滲透率,視頻 直播
» AI商業(yè)化空間前景廣闊應(yīng)用場(chǎng)景豐富
» AI 內(nèi)容創(chuàng)作成本大幅降低且耗時(shí)更短 優(yōu)
 
== 機(jī)器人推薦 ==
 
迎賓講解服務(wù)機(jī)器人

服務(wù)機(jī)器人(迎賓、講解、導(dǎo)診...)

智能消毒機(jī)器人

智能消毒機(jī)器人

機(jī)器人底盤

機(jī)器人底盤

 

商用機(jī)器人  Disinfection Robot   展廳機(jī)器人  智能垃圾站  輪式機(jī)器人底盤  迎賓機(jī)器人  移動(dòng)機(jī)器人底盤  講解機(jī)器人  紫外線消毒機(jī)器人  大屏機(jī)器人  霧化消毒機(jī)器人  服務(wù)機(jī)器人底盤  智能送餐機(jī)器人  霧化消毒機(jī)  機(jī)器人OEM代工廠  消毒機(jī)器人排名  智能配送機(jī)器人  圖書館機(jī)器人  導(dǎo)引機(jī)器人  移動(dòng)消毒機(jī)器人  導(dǎo)診機(jī)器人  迎賓接待機(jī)器人  前臺(tái)機(jī)器人  導(dǎo)覽機(jī)器人  酒店送物機(jī)器人  云跡科技潤(rùn)機(jī)器人  云跡酒店機(jī)器人  智能導(dǎo)診機(jī)器人 
版權(quán)所有 © 創(chuàng)澤智能機(jī)器人集團(tuán)股份有限公司     中國(guó)運(yùn)營(yíng)中心:北京·清華科技園九號(hào)樓5層     中國(guó)生產(chǎn)中心:山東日照太原路71號(hào)
銷售1:4006-935-088    銷售2:4006-937-088   客服電話: 4008-128-728