創(chuàng)澤機(jī)器人
CHUANGZE ROBOT
當(dāng)前位置:首頁 > 新聞資訊 > 機(jī)器人應(yīng)用 > 機(jī)器人示教學(xué)習(xí):高級技能學(xué)習(xí)方法(學(xué)習(xí)計(jì)劃和學(xué)習(xí)目標(biāo))

機(jī)器人示教學(xué)習(xí):高級技能學(xué)習(xí)方法(學(xué)習(xí)計(jì)劃和學(xué)習(xí)目標(biāo))

來源:CAAI認(rèn)知系統(tǒng)與信息處理專委會(huì)     編輯:創(chuàng)澤   時(shí)間:2020/6/9   主題:其他 [加盟]
機(jī)器人可以在人類教師反饋的基礎(chǔ)上來探索某項(xiàng)任務(wù)。反饋提供了關(guān)于機(jī)器人嘗試的任務(wù)滿足目標(biāo)的程度的信息。大多數(shù)基于反饋的工作傾向于采用強(qiáng)化學(xué)習(xí)。傳統(tǒng)的RL算法提供了一個(gè)反饋(獎(jiǎng)勵(lì))信號,在這種情況下使用了人工響應(yīng)。在某些情況下,除了人類的反饋,任務(wù)的表現(xiàn)直接受到老師的影響,老師允許選擇下一步行動(dòng)。在[10]中,這種方法將任務(wù)學(xué)習(xí)表現(xiàn)提高了約50%。

需要注意的是,有時(shí)選擇的示教方法和獲取的數(shù)據(jù)類型與學(xué)習(xí)算法的選擇有關(guān)。一方面來自多個(gè)模態(tài)的示范增加了維數(shù),增加了學(xué)習(xí)的復(fù)雜性。數(shù)據(jù)的維數(shù)可以降低,但是有些信息被忽略,導(dǎo)致從示教數(shù)據(jù)中學(xué)習(xí)不當(dāng)。另一方面,缺少傳感模態(tài)可能會(huì)在一開始就提供不完整的信息,導(dǎo)致學(xué)習(xí)算法表現(xiàn)不理想。

高級技能可以認(rèn)為是一組低級技能或一組動(dòng)作基元。除此之外,高級技能還包括對象可視性,涉及構(gòu)建物理世界對象和機(jī)器人動(dòng)作之間關(guān)系的知識(shí)。高級技能學(xué)習(xí)方法可以大致分為學(xué)習(xí)計(jì)劃和學(xué)習(xí)目標(biāo)。

1)學(xué)習(xí)計(jì)劃:在這種高級技能的學(xué)習(xí)方法中,學(xué)習(xí)計(jì)劃為從初始狀態(tài)到最終狀態(tài)的一系列動(dòng)作。因此,動(dòng)作是根據(jù)前置條件和后置條件定義的。前置條件為動(dòng)作執(zhí)行前的狀態(tài),后置條件為動(dòng)作執(zhí)行后的狀態(tài)。除此之外,人類教師還用注釋的形式提供附加信息。注釋可以通過觸覺、視覺或語義來提供。額外的信息允許更好地概括高水平的技能。可執(zhí)行的動(dòng)作可以是簡單的低級技能,如抓住目標(biāo)對象,拾起綠色的對象等,組合起來形成一個(gè)高級任務(wù),如排序綠色的對象。另一方面,有一些方法可以通過在示教數(shù)據(jù)中尋找重復(fù)的結(jié)構(gòu)來從高級技能示教中提取低級技能,這樣就可以在不同的示教中識(shí)別它。在[2]中,一個(gè)示教學(xué)習(xí)范例是通過人類示教和在程序界面輸入的用戶目的來描述的。在[18]中,一些涉及一系列順序旋轉(zhuǎn)和轉(zhuǎn)換的日常對象操作的示教被用來提取順序的低級技能,并進(jìn)一步構(gòu)建一個(gè)計(jì)劃。這項(xiàng)工作還示教了從一個(gè)對象到其他類似對象的學(xué)習(xí)知識(shí)轉(zhuǎn)移。


2)學(xué)習(xí)目標(biāo):推斷高級技能的目標(biāo)。人類教師提供的示教被用來推斷執(zhí)行高級技能的意圖。通過生成假設(shè),可以從重復(fù)的示教中推斷出目標(biāo)。現(xiàn)代方法也使用基于獎(jiǎng)勵(lì)函數(shù)的強(qiáng)化學(xué)習(xí)方法來實(shí)現(xiàn)期望目標(biāo)。如果獎(jiǎng)勵(lì)函數(shù)是從給定的示教中學(xué)習(xí)的,那么它就被認(rèn)為是目標(biāo)學(xué)習(xí)。一些基于強(qiáng)化學(xué)習(xí)的方法得到了很好的研究[19]。


3、討論總結(jié)

技能的學(xué)習(xí)直接依賴于示教的準(zhǔn)確性。大多數(shù)方法[20]手動(dòng)消除了部分示教中的噪聲。結(jié)合強(qiáng)化學(xué)習(xí),在獎(jiǎng)勵(lì)和探索機(jī)制的基礎(chǔ)上對技能學(xué)習(xí)進(jìn)行改進(jìn)。另一種改進(jìn)技能的方法涉及示教者反饋[21]。當(dāng)機(jī)器人在一個(gè)稍微不熟悉的情況下執(zhí)行學(xué)習(xí)到的技能時(shí),從人類教師那里得到關(guān)于執(zhí)行技能可取性的反饋。目前為了實(shí)現(xiàn)這種技能細(xì)化的方法,研究人員主要從兩個(gè)方面進(jìn)行了研究:(1)控制機(jī)器人和人類教師之間的信息交互,(2)提供反饋。





蘇州行政審批局實(shí)現(xiàn)導(dǎo)引機(jī)器人導(dǎo)覽服務(wù)

蘇州行政審批局實(shí)現(xiàn)機(jī)器人導(dǎo)覽服務(wù)。5G 高速互聯(lián)網(wǎng)接入服務(wù)。異地超高清視頻通話

農(nóng)業(yè)機(jī)器人視覺識(shí)別雜草技術(shù)

由于機(jī)器視覺可以提供目標(biāo)物的顏色、形狀、紋理、深度等豐富的信息,且精度相當(dāng)高,成本相對較低,因此以往關(guān)于植物檢測的研究大多基于機(jī)器視覺

武漢大學(xué)研發(fā)可精準(zhǔn)控制迷你軟體機(jī)器人

武漢大學(xué)薛龍建教授團(tuán)隊(duì)研制出一種迷你軟體機(jī)器人Geca-Robot,其可精準(zhǔn)控制方向和速度,可在廢墟狹縫、生物體內(nèi)完成各種復(fù)雜作業(yè)

方濱興院士:人工智能安全之我見

人工智能技術(shù)在安全領(lǐng)域的應(yīng)用需求日益迫切,人工智能自身的安全問題也不容小覷,安全與人工智能并舉,雙方的融合發(fā)展與創(chuàng)新是我強(qiáng)國戰(zhàn)略中不可忽視的重要助推因素

淺談機(jī)器人的靈巧手

專注于極簡主義設(shè)計(jì)方法。在保留擬人化設(shè)計(jì)的許多優(yōu)點(diǎn)的同時(shí),在設(shè)計(jì)和控制方面進(jìn)行原則性的簡化,可以合理地降低系統(tǒng)的復(fù)雜度,包括執(zhí)行器、傳感器和程序代碼的數(shù)量

輔助機(jī)器人對機(jī)器人靈巧手的應(yīng)用要求

輔助機(jī)器人必須能夠在日常生活活動(dòng)中與環(huán)境和人類安全地互動(dòng)和合作,這意味著手需要小、輕、靈活

獵戶星空:醫(yī)療服務(wù)機(jī)器人

醫(yī)療服務(wù)機(jī)器人根據(jù)醫(yī)院需求分別執(zhí)行遞送化驗(yàn)單、藥物等工作,用機(jī)器人代替醫(yī)護(hù)過程中簡單但耗力的流程化工作

極飛科技:無人機(jī)抗疫解決方案

在巨大的公共衛(wèi)生危機(jī)面前,無人機(jī)能夠進(jìn)入疫情嚴(yán)重區(qū)域自動(dòng)噴灑消毒劑,降低應(yīng)急人員被病毒感染的風(fēng)險(xiǎn)

水下機(jī)器人靈巧操作的新型觸覺感知

泵和傳感器可以安裝在靠近手臂的機(jī)器人底座上進(jìn)行保護(hù),并實(shí)現(xiàn)與機(jī)械手遠(yuǎn)程連接

國內(nèi)安防AI芯片型號,類型,處理速度和功能一覽表

Hi3559AV100 Hi3519AV100 Hi3516DV300 Hi3516CV500 昇騰310 旭日 聽濤 思元220 BM1682 BM1880 DeepEye1000 T01

機(jī)器人守護(hù)人類生命線,六大趨勢凸顯前景無限

機(jī)器人也都成為應(yīng)急救援搶險(xiǎn)的標(biāo)配,救援機(jī)器人發(fā)展空間和潛力的爆發(fā),既得益于需求的釋放,也離不開技術(shù)突破與商用價(jià)值的支撐

追一科技:智能營銷機(jī)器人應(yīng)用案例

智能營銷機(jī)器人能夠基于營銷、催收等不同場景配置外呼對話流程,細(xì)分場景、描繪精準(zhǔn)客戶畫像并對應(yīng)采取不同話術(shù),成為該銀行智能化轉(zhuǎn)型的合作廠商。
資料獲取
機(jī)器人應(yīng)用
== 最新資訊 ==
ChatGPT:又一個(gè)“人形機(jī)器人”主題
ChatGPT快速流行,重構(gòu) AI 商業(yè)
中國機(jī)器視覺產(chǎn)業(yè)方面的政策
中國機(jī)器視覺產(chǎn)業(yè)聚焦于中國東部沿海地區(qū)(
從CHAT-GPT到生成式AI:人工智能
工信部等十七部門印發(fā)《機(jī)器人+應(yīng)用行動(dòng)實(shí)
全球人工智能企業(yè)市值/估值 TOP20
創(chuàng)澤智能機(jī)器人集團(tuán)股份有限公司第十一期上
諧波減速器和RV減速器比較
機(jī)器人減速器:諧波減速器和RV減速器
人形機(jī)器人技術(shù)難點(diǎn) 高精尖技術(shù)的綜合
機(jī)器人大規(guī)模商用面臨的痛點(diǎn)有四個(gè)方面
青島市機(jī)器人產(chǎn)業(yè)概況:機(jī)器人企業(yè)多布局在
六大機(jī)器人產(chǎn)業(yè)集群的特點(diǎn)
機(jī)械臂-高度非線性強(qiáng)耦合的復(fù)雜系統(tǒng)
== 機(jī)器人推薦 ==
迎賓講解服務(wù)機(jī)器人

服務(wù)機(jī)器人(迎賓、講解、導(dǎo)診...)

智能消毒機(jī)器人

智能消毒機(jī)器人

機(jī)器人開發(fā)平臺(tái)

機(jī)器人開發(fā)平臺(tái)


機(jī)器人招商 Disinfection Robot 機(jī)器人公司 機(jī)器人應(yīng)用 智能醫(yī)療 物聯(lián)網(wǎng) 機(jī)器人排名 機(jī)器人企業(yè) 機(jī)器人政策 教育機(jī)器人 迎賓機(jī)器人 機(jī)器人開發(fā) 獨(dú)角獸 消毒機(jī)器人品牌 消毒機(jī)器人 合理用藥 地圖
版權(quán)所有 創(chuàng)澤智能機(jī)器人集團(tuán)股份有限公司 中國運(yùn)營中心:北京 清華科技園九號樓5層 中國生產(chǎn)中心:山東日照太原路71號
銷售1:4006-935-088 銷售2:4006-937-088 客服電話: 4008-128-728