<kbd id="773g9"><pre id="773g9"></pre></kbd>

<li id="773g9"><dl id="773g9"></dl></li>

產(chǎn)品系列

行業(yè)應(yīng)用

投資者關(guān)系

技術(shù)支持

關(guān)于創(chuàng)澤

當(dāng)前位置：首頁 > 新聞資訊 > 機(jī)器人開發(fā) > 一種基于層次強(qiáng)化學(xué)習(xí)的機(jī)械手魯棒操作

一種基于層次強(qiáng)化學(xué)習(xí)的機(jī)械手魯棒操作

來源：CAAI認(rèn)知系統(tǒng)與信息處理專委會編輯：創(chuàng)澤時間：2020/6/24 主題：其他 [加盟]

1. 研究背景

機(jī)械手內(nèi)操作（in-hand manipulation）是指使用單只機(jī)械手，通過移動手指、手掌等部位來改變物體在手中的相對位置和姿態(tài)。這種能力對于機(jī)器人實(shí)現(xiàn)人類水平的靈巧操作極為重要，因?yàn)樵谌粘Ｉ钪杏泻芏囝愃频娜蝿?wù)，例如抓取一件工具并調(diào)整它在手中的位置和旋轉(zhuǎn)角度。我們注意到，在實(shí)現(xiàn)復(fù)雜的操作目標(biāo)時，人在操作物體時常常改變抓取物體的手指接觸點(diǎn)位置，從而極大的提高物體在手中的位姿范圍。

傳統(tǒng)上，手內(nèi)操作有兩類解決方案，一類是基于模型的方法（model-based method），通過對抓取的動力學(xué)建模，來控制手指移動帶動物體姿態(tài)。這種辦法好處在于穩(wěn)定性強(qiáng)，模型簡單，但問題在于難以實(shí)現(xiàn)較長和復(fù)雜的手內(nèi)操作流程，特別是目標(biāo)位姿和起始位姿相距很遠(yuǎn)的情況，因?yàn)樗鼈兒茈y規(guī)劃手指接觸點(diǎn)的移動；另一類方法是無模型方法（model-free method），通常使用深度強(qiáng)化學(xué)習(xí)的方法。這類方法優(yōu)點(diǎn)在于不需要系統(tǒng)模型，但缺點(diǎn)在于穩(wěn)定性差，并且需要大量數(shù)據(jù)進(jìn)行訓(xùn)練。而我們的方法結(jié)合了這兩種方法：在底層使用傳統(tǒng)的動力學(xué)建模方式保持穩(wěn)定的抓取和實(shí)現(xiàn)簡單基本的操作單元，在中層通過深度強(qiáng)化學(xué)習(xí)來進(jìn)行規(guī)劃，選擇不同的操作單元，最終實(shí)現(xiàn)穩(wěn)定且復(fù)雜的操作流程。我們的方法結(jié)合了兩種方法的優(yōu)點(diǎn)：在底層通過使用基于模型的操作單元，保證了手指與物體之間持續(xù)穩(wěn)定的抓��；在中層使用強(qiáng)化學(xué)習(xí)進(jìn)行規(guī)劃，從而實(shí)現(xiàn)較長和復(fù)雜的手內(nèi)操作流程。

2. 研究方法

在底層，我們使用柔性力矩控制器定義了三個操作單元，分別是reposing，sliding和flipping。Reposing是指在不改變手指與物體接觸點(diǎn)的前提下，通過控制機(jī)械手改變物體的位姿；sliding是指在不改變物體位姿的前提下，沿著物體滑動指尖改變接觸點(diǎn)；flipping是指將指頭從一側(cè)移動到另一側(cè)，從而改變抓握方式。在中層，我們使用深度強(qiáng)化學(xué)習(xí)網(wǎng)絡(luò)學(xué)習(xí)在給定目標(biāo)位姿下選擇底層操作單元，最終形成一條由大量不同操作單元組成的序列，實(shí)現(xiàn)復(fù)雜的操作目標(biāo)。

查看更多相似文章

ICRA2020論文分享：基于視觸融合感知的可形變物體抓取狀態(tài)評估

人類可以通過視覺和觸覺融合感知快速確定抓取可變形物體所需力的大小，以防止其發(fā)生滑動或過度形變，但這對于機(jī)器人來說仍然是一個具有挑戰(zhàn)性的問題

如何搭建一個GPU加速的分布式機(jī)器學(xué)習(xí)系統(tǒng)，遇到的問題和解決方法

能快速將現(xiàn)有算法在實(shí)際生產(chǎn)環(huán)境落地，并能利用GPU加速實(shí)現(xiàn)大規(guī)模計(jì)算，我們自己搭建了一個GPU加速的大規(guī)模分布式機(jī)器學(xué)習(xí)系統(tǒng)，取名小諸葛

拯救渣畫質(zhì)，馬賽克圖秒變高清，杜克大學(xué)提出AI新算法

杜克大學(xué)的一種 AI 算法PULSE可以將模糊、無法識別的人臉圖像轉(zhuǎn)換成計(jì)算機(jī)生成的圖像，其細(xì)節(jié)比之前任何時候都更加精細(xì)、逼真

餓了么推薦算法的演進(jìn)及在線學(xué)習(xí)實(shí)踐

餓了么算法專家劉金介紹推薦業(yè)務(wù)背景，包括推薦產(chǎn)品形態(tài)及算法優(yōu)化目標(biāo)；然后是算法的演進(jìn)路線；最后重點(diǎn)介紹在線學(xué)習(xí)是如何在餓了么推薦領(lǐng)域?qū)嵺`的

百變應(yīng)用場景下，優(yōu)酷基于圖執(zhí)行引擎的算法服務(wù)框架筑造之路

優(yōu)酷推薦業(yè)務(wù)，算法應(yīng)用場景眾多，需求靈活多變，需要一套通用業(yè)務(wù)框架，支持運(yùn)行時的算法流程的裝配，提升算法服務(wù)場景搭建的效率

內(nèi)容流量管理的關(guān)鍵技術(shù)：多任務(wù)保量優(yōu)化算法實(shí)踐

通過分析其中的關(guān)鍵問題，建立了新熱內(nèi)容曝光敏感模型，并最終給出一種曝光資源約束下的多目標(biāo)優(yōu)化保量框架與算法

CVPOS自助收銀的挑戰(zhàn)以及商品識別算法工程落地方法和經(jīng)驗(yàn)

針對結(jié)算收銀場景中商品識別的難點(diǎn)，從商品識別落地中的模型選擇、數(shù)據(jù)挑選與標(biāo)注、前端和云端部署、模型改進(jìn)等方面，進(jìn)行了深入講解

面向動態(tài)記憶和學(xué)習(xí)功能的神經(jīng)電晶體可塑性研究

神經(jīng)形態(tài)結(jié)構(gòu)融合學(xué)習(xí)和記憶功能領(lǐng)域的研究主要集中在人工突觸的可塑性方面，同時神經(jīng)元膜的固有可塑性在神經(jīng)形態(tài)信息處理的實(shí)現(xiàn)中也很重要

人工智能和機(jī)器學(xué)習(xí)之間的差異及其重要性

機(jī)器學(xué)習(xí)就是通過經(jīng)驗(yàn)來尋找它學(xué)習(xí)的模式，而人工智能是利用經(jīng)驗(yàn)來獲取知識和技能，并將這些知識應(yīng)用于新的環(huán)境

滴滴機(jī)器學(xué)習(xí)平臺調(diào)度系統(tǒng)的演進(jìn)與K8s二次開發(fā)

滴滴機(jī)器學(xué)習(xí)場景下的 k8s 落地實(shí)踐與二次開發(fā)的技術(shù)實(shí)踐與經(jīng)驗(yàn)，包括平臺穩(wěn)定性、易用性、利用率、平臺 k8s 版本升級與二次開發(fā)等內(nèi)容

如何更高效地壓縮時序數(shù)據(jù)？基于深度強(qiáng)化學(xué)習(xí)的探索

大型商用時序數(shù)據(jù)壓縮的特性，提出了一種新的算法，分享用深度強(qiáng)化學(xué)習(xí)進(jìn)行數(shù)據(jù)壓縮的研究探索

基于深度學(xué)習(xí)目標(biāo)檢測模型優(yōu)缺點(diǎn)對比

深度學(xué)習(xí)模型：OverFeat、R-CNN、SPP-Net、Fast、R-CNN、Faster、R-CNN、R-FCN、Mask、R-CNN、YOLO、SSD、YOLOv2、416、DSOD300、R-SSD

資料獲取

新聞資訊

== 資訊 ==

» 人形機(jī)器人未來3-5年能夠?qū)崿F(xiàn)產(chǎn)業(yè)化的方

» 導(dǎo)診服務(wù)機(jī)器人上崗門診大廳助力醫(yī)院智慧

» 山東省青島市政府辦公廳發(fā)布《數(shù)字青島20

» 關(guān)于印發(fā)《青海省支持大數(shù)據(jù)產(chǎn)業(yè)發(fā)展政策措

» 全屋無主燈智能化規(guī)范

» 微波雷達(dá)傳感技術(shù)室內(nèi)照明應(yīng)用規(guī)范

» 人工智能研發(fā)運(yùn)營體系（ML0ps）實(shí)踐指

» 四驅(qū)四轉(zhuǎn)移動機(jī)器人運(yùn)動模型及應(yīng)用分析

» 國內(nèi)細(xì)分賽道企業(yè)在 AIGC 各應(yīng)用場景

» 國內(nèi)科技大廠布局生成式 AI，未來有望借

» AIGC領(lǐng)域相關(guān)初創(chuàng)公司及業(yè)務(wù)場景梳理

» ChatGPT 以 GPT+RLHF 模

» AIGC提升文字圖片滲透率,視頻直播

» AI商業(yè)化空間前景廣闊應(yīng)用場景豐富

» AI 內(nèi)容創(chuàng)作成本大幅降低且耗時更短優(yōu)

== 機(jī)器人推薦 ==

迎賓講解服務(wù)機(jī)器人

服務(wù)機(jī)器人(迎賓、講解、導(dǎo)診...)

智能消毒機(jī)器人

智能消毒機(jī)器人

機(jī)器人底盤

機(jī)器人底盤

商用機(jī)器人 Disinfection Robot 展廳機(jī)器人智能垃圾站輪式機(jī)器人底盤迎賓機(jī)器人移動機(jī)器人底盤講解機(jī)器人紫外線消毒機(jī)器人大屏機(jī)器人霧化消毒機(jī)器人服務(wù)機(jī)器人底盤智能送餐機(jī)器人霧化消毒機(jī) 機(jī)器人OEM代工廠消毒機(jī)器人排名智能配送機(jī)器人圖書館機(jī)器人導(dǎo)引機(jī)器人移動消毒機(jī)器人導(dǎo)診機(jī)器人迎賓接待機(jī)器人前臺機(jī)器人導(dǎo)覽機(jī)器人酒店送物機(jī)器人云跡科技潤機(jī)器人云跡酒店機(jī)器人智能導(dǎo)診機(jī)器人

版權(quán)所有 © 創(chuàng)澤智能機(jī)器人集團(tuán)股份有限公司 中國運(yùn)營中心：北京·清華科技園九號樓5層中國生產(chǎn)中心：山東日照太原路71號
銷售1：4006-935-088 銷售2：4006-937-088 客服電話： 4008-128-728

<label id="e8nsi"></label>

<label id="e8nsi"></label>

<rt id="e8nsi"><small id="e8nsi"><style id="e8nsi"></style></small></rt>