首頁
產(chǎn)品系列
行業(yè)應(yīng)用
渠道合作
新聞中心
研究院
投資者關(guān)系
技術(shù)支持
關(guān)于創(chuàng)澤
| En
 
  當(dāng)前位置:首頁 > 新聞資訊 > 機器人開發(fā) > 一種基于層次強化學(xué)習(xí)的機械手魯棒操作  
 

一種基于層次強化學(xué)習(xí)的機械手魯棒操作

來源:CAAI認(rèn)知系統(tǒng)與信息處理專委會      編輯:創(chuàng)澤      時間:2020/6/24      主題:其他   [加盟]
1.  研究背景

機械手內(nèi)操作(in-hand manipulation)是指使用單只機械手,通過移動手指、手掌等部位來改變物體在手中的相對位置和姿態(tài)。這種能力對于機器人實現(xiàn)人類水平的靈巧操作極為重要,因為在日常生活中有很多類似的任務(wù),例如抓取一件工具并調(diào)整它在手中的位置和旋轉(zhuǎn)角度。我們注意到,在實現(xiàn)復(fù)雜的操作目標(biāo)時,人在操作物體時常常改變抓取物體的手指接觸點位置,從而極大的提高物體在手中的位姿范圍。

傳統(tǒng)上,手內(nèi)操作有兩類解決方案,一類是基于模型的方法(model-based method),通過對抓取的動力學(xué)建模,來控制手指移動帶動物體姿態(tài)。這種辦法好處在于穩(wěn)定性強,模型簡單,但問題在于難以實現(xiàn)較長和復(fù)雜的手內(nèi)操作流程,特別是目標(biāo)位姿和起始位姿相距很遠(yuǎn)的情況,因為它們很難規(guī)劃手指接觸點的移動;另一類方法是無模型方法(model-free method),通常使用深度強化學(xué)習(xí)的方法。這類方法優(yōu)點在于不需要系統(tǒng)模型,但缺點在于穩(wěn)定性差,并且需要大量數(shù)據(jù)進(jìn)行訓(xùn)練。而我們的方法結(jié)合了這兩種方法:在底層使用傳統(tǒng)的動力學(xué)建模方式保持穩(wěn)定的抓取和實現(xiàn)簡單基本的操作單元,在中層通過深度強化學(xué)習(xí)來進(jìn)行規(guī)劃,選擇不同的操作單元,最終實現(xiàn)穩(wěn)定且復(fù)雜的操作流程。我們的方法結(jié)合了兩種方法的優(yōu)點:在底層通過使用基于模型的操作單元,保證了手指與物體之間持續(xù)穩(wěn)定的抓。辉谥袑邮褂脧娀瘜W(xué)習(xí)進(jìn)行規(guī)劃,從而實現(xiàn)較長和復(fù)雜的手內(nèi)操作流程。

 

2.  研究方法

在底層,我們使用柔性力矩控制器定義了三個操作單元,分別是reposing,sliding和flipping。Reposing是指在不改變手指與物體接觸點的前提下,通過控制機械手改變物體的位姿;sliding是指在不改變物體位姿的前提下,沿著物體滑動指尖改變接觸點;flipping是指將指頭從一側(cè)移動到另一側(cè),從而改變抓握方式。在中層,我們使用深度強化學(xué)習(xí)網(wǎng)絡(luò)學(xué)習(xí)在給定目標(biāo)位姿下選擇底層操作單元,最終形成一條由大量不同操作單元組成的序列,實現(xiàn)復(fù)雜的操作目標(biāo)。



  



ICRA2020論文分享:基于視觸融合感知的可形變物體抓取狀態(tài)評估

人類可以通過視覺和觸覺融合感知快速確定抓取可變形物體所需力的大小,以防止其發(fā)生滑動或過度形變,但這對于機器人來說仍然是一個具有挑戰(zhàn)性的問題

如何搭建一個GPU加速的分布式機器學(xué)習(xí)系統(tǒng),遇到的問題和解決方法

能快速將現(xiàn)有算法在實際生產(chǎn)環(huán)境落地,并能利用GPU加速實現(xiàn)大規(guī)模計算,我們自己搭建了一個GPU加速的大規(guī)模分布式機器學(xué)習(xí)系統(tǒng),取名小諸葛

拯救渣畫質(zhì),馬賽克圖秒變高清,杜克大學(xué)提出AI新算法

杜克大學(xué)的一種 AI 算法PULSE可以將模糊、無法識別的人臉圖像轉(zhuǎn)換成計算機生成的圖像,其細(xì)節(jié)比之前任何時候都更加精細(xì)、逼真

餓了么推薦算法的演進(jìn)及在線學(xué)習(xí)實踐

餓了么算法專家劉金介紹推薦業(yè)務(wù)背景,包括推薦產(chǎn)品形態(tài)及算法優(yōu)化目標(biāo);然后是算法的演進(jìn)路線;最后重點介紹在線學(xué)習(xí)是如何在餓了么推薦領(lǐng)域?qū)嵺`的

百變應(yīng)用場景下,優(yōu)酷基于圖執(zhí)行引擎的算法服務(wù)框架筑造之路

優(yōu)酷推薦業(yè)務(wù),算法應(yīng)用場景眾多,需求靈活多變,需要一套通用業(yè)務(wù)框架,支持運行時的算法流程的裝配,提升算法服務(wù)場景搭建的效率

內(nèi)容流量管理的關(guān)鍵技術(shù):多任務(wù)保量優(yōu)化算法實踐

通過分析其中的關(guān)鍵問題,建立了新熱內(nèi)容曝光敏感模型,并最終給出一種曝光資源約束下的多目標(biāo)優(yōu)化保量框架與算法

CVPOS自助收銀的挑戰(zhàn)以及商品識別算法工程落地方法和經(jīng)驗

針對結(jié)算收銀場景中商品識別的難點,從商品識別落地中的模型選擇、數(shù)據(jù)挑選與標(biāo)注、前端和云端部署、模型改進(jìn)等方面,進(jìn)行了深入講解

面向動態(tài)記憶和學(xué)習(xí)功能的神經(jīng)電晶體可塑性研究

神經(jīng)形態(tài)結(jié)構(gòu)融合學(xué)習(xí)和記憶功能領(lǐng)域的研究主要集中在人工突觸的可塑性方面,同時神經(jīng)元膜的固有可塑性在神經(jīng)形態(tài)信息處理的實現(xiàn)中也很重要

人工智能和機器學(xué)習(xí)之間的差異及其重要性

機器學(xué)習(xí)就是通過經(jīng)驗來尋找它學(xué)習(xí)的模式,而人工智能是利用經(jīng)驗來獲取知識和技能,并將這些知識應(yīng)用于新的環(huán)境

滴滴機器學(xué)習(xí)平臺調(diào)度系統(tǒng)的演進(jìn)與K8s二次開發(fā)

滴滴機器學(xué)習(xí)場景下的 k8s 落地實踐與二次開發(fā)的技術(shù)實踐與經(jīng)驗,包括平臺穩(wěn)定性、易用性、利用率、平臺 k8s 版本升級與二次開發(fā)等內(nèi)容

如何更高效地壓縮時序數(shù)據(jù)?基于深度強化學(xué)習(xí)的探索

大型商用時序數(shù)據(jù)壓縮的特性,提出了一種新的算法,分享用深度強化學(xué)習(xí)進(jìn)行數(shù)據(jù)壓縮的研究探索

基于深度學(xué)習(xí)目標(biāo)檢測模型優(yōu)缺點對比

深度學(xué)習(xí)模型:OverFeat、R-CNN、SPP-Net、Fast、R-CNN、Faster、R-CNN、R-FCN、Mask、R-CNN、YOLO、SSD、YOLOv2、416、DSOD300、R-SSD
 
資料獲取
新聞資訊
== 資訊 ==
» 人形機器人未來3-5年能夠?qū)崿F(xiàn)產(chǎn)業(yè)化的方
» 導(dǎo)診服務(wù)機器人上崗門診大廳 助力醫(yī)院智慧
» 山東省青島市政府辦公廳發(fā)布《數(shù)字青島20
» 關(guān)于印發(fā)《青海省支持大數(shù)據(jù)產(chǎn)業(yè)發(fā)展政策措
» 全屋無主燈智能化規(guī)范
» 微波雷達(dá)傳感技術(shù)室內(nèi)照明應(yīng)用規(guī)范
» 人工智能研發(fā)運營體系(ML0ps)實踐指
» 四驅(qū)四轉(zhuǎn)移動機器人運動模型及應(yīng)用分析
» 國內(nèi)細(xì)分賽道企業(yè)在 AIGC 各應(yīng)用場景
» 國內(nèi)科技大廠布局生成式 AI,未來有望借
» AIGC領(lǐng)域相關(guān)初創(chuàng)公司及業(yè)務(wù)場景梳理
» ChatGPT 以 GPT+RLHF 模
» AIGC提升文字 圖片滲透率,視頻 直播
» AI商業(yè)化空間前景廣闊應(yīng)用場景豐富
» AI 內(nèi)容創(chuàng)作成本大幅降低且耗時更短 優(yōu)
 
== 機器人推薦 ==
 
迎賓講解服務(wù)機器人

服務(wù)機器人(迎賓、講解、導(dǎo)診...)

智能消毒機器人

智能消毒機器人

機器人底盤

機器人底盤

 

商用機器人  Disinfection Robot   展廳機器人  智能垃圾站  輪式機器人底盤  迎賓機器人  移動機器人底盤  講解機器人  紫外線消毒機器人  大屏機器人  霧化消毒機器人  服務(wù)機器人底盤  智能送餐機器人  霧化消毒機  機器人OEM代工廠  消毒機器人排名  智能配送機器人  圖書館機器人  導(dǎo)引機器人  移動消毒機器人  導(dǎo)診機器人  迎賓接待機器人  前臺機器人  導(dǎo)覽機器人  酒店送物機器人  云跡科技潤機器人  云跡酒店機器人  智能導(dǎo)診機器人 
版權(quán)所有 © 創(chuàng)澤智能機器人集團股份有限公司     中國運營中心:北京·清華科技園九號樓5層     中國生產(chǎn)中心:山東日照太原路71號
銷售1:4006-935-088    銷售2:4006-937-088   客服電話: 4008-128-728