首頁(yè)
產(chǎn)品系列
行業(yè)應(yīng)用
渠道合作
新聞中心
研究院
投資者關(guān)系
技術(shù)支持
關(guān)于創(chuàng)澤
| En
 
  當(dāng)前位置:首頁(yè) > 新聞資訊 > 機(jī)器人開(kāi)發(fā) > 基于深度學(xué)習(xí)和傳統(tǒng)算法的人體姿態(tài)估計(jì),技術(shù)細(xì)節(jié)都講清楚了  
 

基于深度學(xué)習(xí)和傳統(tǒng)算法的人體姿態(tài)估計(jì),技術(shù)細(xì)節(jié)都講清楚了

來(lái)源:AI科技大本營(yíng)      編輯:創(chuàng)澤      時(shí)間:2020/5/29      主題:其他   [加盟]

計(jì)算機(jī)視覺(jué)的一大研究熱點(diǎn)是人體姿態(tài)估計(jì),還有很多問(wèn)題急需解決,比如遮擋,交互等等。在最近的CVPR2020里邊也有很多這方面的工作。本文站長(zhǎng)主要是想談?wù)劵谏疃葘W(xué)習(xí)的實(shí)時(shí)多人姿態(tài)估計(jì)。


人體姿態(tài)估計(jì)要干嘛?

關(guān)于人類活動(dòng)規(guī)律的研究,必定是計(jì)算機(jī)視覺(jué)領(lǐng)域首要關(guān)注的內(nèi)容。其中,人體姿態(tài)估計(jì)便是計(jì)算機(jī)視覺(jué)領(lǐng)域現(xiàn)有的熱點(diǎn)問(wèn)題,其主要任務(wù)是讓機(jī)器自動(dòng)地檢測(cè)場(chǎng)景中的人“在哪里”和理解人在“干什么”。

隨著信息化時(shí)代的迅速發(fā)展,人類每時(shí)每刻都在通過(guò)多種多樣的手段和途徑獲得海量的可視化圖像數(shù)據(jù),這使得基于自然場(chǎng)景圖像的人姿態(tài)估計(jì)研究在現(xiàn)實(shí)生活中擁有很多潛在的應(yīng)用價(jià)值。圖1展示了自然場(chǎng)景圖像中人體姿態(tài)估計(jì)的研究應(yīng)用。

Fig.1: 自然場(chǎng)景圖像人體姿態(tài)估計(jì)的研究應(yīng)用

在信息化的時(shí)代,視頻監(jiān)控正在銀行、超市以及公安機(jī)關(guān)等關(guān)乎人民財(cái)產(chǎn)、人身安全的重要場(chǎng)所發(fā)揮著舉足輕重的角色。面對(duì)海量的視頻圖像序列,為了及時(shí)地制止現(xiàn)場(chǎng)事故的進(jìn)一步發(fā)生,工作人員必須長(zhǎng)時(shí)間且精神高度集中地觀察視頻監(jiān)控畫面并對(duì)異常事件作出處理。

除了工作人員很難長(zhǎng)時(shí)間地保持高度警惕外,長(zhǎng)期投入大量的人力來(lái)監(jiān)測(cè)小概率發(fā)生的事件也不是單位機(jī)構(gòu)提倡的做法。因此,實(shí)現(xiàn)視頻監(jiān)控的智能化成為一種互聯(lián)網(wǎng)時(shí)代的必然趨勢(shì)。但是,實(shí)現(xiàn)智能視頻監(jiān)控的前提條件是讓機(jī)器自動(dòng)地識(shí)別視頻圖像序列中的人體姿態(tài),從而進(jìn)一步分析視頻圖像中人類的行為活動(dòng)。

這就涉及到了我們下面所要說(shuō)的人體行為分析了。


人體行為分析又為那般?

人體行為分析理解成為了近幾年研究的熱點(diǎn)之一。在人體行為分析理解的發(fā)展過(guò)程中,研究人員攻克了很多技術(shù)上的難關(guān),并形成了一些經(jīng)典算法,但仍有很多尚未解決的問(wèn)題。從研究的發(fā)展趨勢(shì)來(lái)看,人體行為分析的研究正由采用單一特征、單一傳感器向采用多特征、多傳感器的方向發(fā)展。而人體姿態(tài)估計(jì)作為人體行為識(shí)別的一個(gè)重要特征,是進(jìn)行人體行為分析的基礎(chǔ),是人體行為分析領(lǐng)域備受關(guān)注的研究方向之一。

人體姿態(tài)估計(jì)是指從圖像中檢測(cè)人體各部分的位置并計(jì)算其方向和尺度信息。人體行為分析是基于多幀圖像的前后關(guān)系進(jìn)行分析理解,而人體姿態(tài)識(shí)別是針對(duì)單幀靜態(tài)圖像進(jìn)行處理。正確識(shí)別出多幀連續(xù)的靜態(tài)圖像的姿態(tài)信息,為實(shí)現(xiàn)正確的行為分析理解提供了可能。因此,人體姿態(tài)估計(jì)的準(zhǔn)確性與實(shí)時(shí)性直接影響人體行為分析的準(zhǔn)確性和實(shí)時(shí)性,確保實(shí)時(shí)準(zhǔn)確的姿態(tài)識(shí)別是進(jìn)行下一步行為分析的基礎(chǔ)。

現(xiàn)在,我們的人體姿態(tài)估計(jì)課題的發(fā)展已越來(lái)越貼近實(shí)際,例如在步態(tài)分析、人機(jī)交互以及視頻監(jiān)控等領(lǐng)域,人體姿態(tài)估計(jì)均具有廣泛的應(yīng)用前景。所以呢,研究人體姿態(tài)估計(jì)還是蠻有意思的,好玩 !


當(dāng)前姿態(tài)估計(jì)算法有哪些?

目前主流的人體姿態(tài)估計(jì)算法可以劃分為傳統(tǒng)方法和基于深度學(xué)習(xí)的方法。

基于傳統(tǒng)方法的人體姿態(tài)估計(jì)

傳統(tǒng)方法一般是基于圖結(jié)構(gòu)和形變部件模型,設(shè)計(jì)2D人體部件檢測(cè)器,使用圖模型建立各部件的連通性,并結(jié)合人體運(yùn)動(dòng)學(xué)的相關(guān)約束不斷優(yōu)化圖結(jié)構(gòu)模型來(lái)估計(jì)人體姿態(tài)。

其缺點(diǎn)是什么?

First,傳統(tǒng)方法雖然擁有較高的時(shí)間效率,但是由于其提取的特征主要是人工設(shè)定的HOG和SHIFT特征,無(wú)法充分利用圖像信息,導(dǎo)致算法受制于圖像中的不同外觀、視角、遮擋和固有的幾何模糊性。同時(shí),由于部件模型的結(jié)構(gòu)單一,當(dāng)人體姿態(tài)變化較大時(shí),部件模型不能精確地刻畫和表達(dá)這種形變,同一數(shù)據(jù)存在多個(gè)可行的解,即姿態(tài)估計(jì)的結(jié)果不唯一,導(dǎo)致傳統(tǒng)方法適用范圍受到很大限制。
Second,另一方面,傳統(tǒng)方法很多是基于深度圖等數(shù)字圖像提取姿態(tài)特征的算法,但是由于采集深度圖像需要使用專業(yè)的采集設(shè)備,成本較高,所以很難適用于所有的應(yīng)用場(chǎng)景,而且采集過(guò)程需要同步多個(gè)視角的深度攝像頭以減小遮擋問(wèn)題帶來(lái)的影響,導(dǎo)致人體姿態(tài)數(shù)據(jù)的獲取過(guò)程復(fù)雜困難。因此這種傳統(tǒng)的基于手工提取特征,并利用部件模型建立特征之間聯(lián)系的方法大多數(shù)是昂貴和低效的。
基于深度學(xué)習(xí)的人體姿態(tài)估計(jì)算法

隨著大數(shù)據(jù)時(shí)代的到來(lái),深度學(xué)習(xí)在計(jì)算機(jī)視覺(jué)領(lǐng)域得到了成功的應(yīng)用。因此,考慮如何將深度學(xué)習(xí)用于解決人體姿態(tài)估計(jì)問(wèn)題,是人體姿態(tài)估計(jì)領(lǐng)域的學(xué)者們繼圖結(jié)構(gòu)模型后所要探索的另一個(gè)重點(diǎn)。早期利用深度學(xué)習(xí)估計(jì)人體姿態(tài)的方法,都是通過(guò)深度學(xué)習(xí)網(wǎng)絡(luò)直接回歸出輸入圖像中關(guān)節(jié)點(diǎn)的坐標(biāo)。

總結(jié)

六階段雙分支網(wǎng)絡(luò)結(jié)構(gòu)在關(guān)節(jié)點(diǎn)預(yù)測(cè)精度上略高于現(xiàn)有傳統(tǒng)的的人體姿態(tài)估計(jì)算法。本次站長(zhǎng)采用的算法利用自底向上的思想,首先預(yù)測(cè)出所有骨點(diǎn)位置,并將骨點(diǎn)連接形成圖結(jié)構(gòu),通過(guò)圖優(yōu)化實(shí)現(xiàn)多人體姿態(tài)估計(jì)。算法運(yùn)行效率方面,由于網(wǎng)絡(luò)同時(shí)預(yù)測(cè)出關(guān)節(jié)點(diǎn)位置和關(guān)節(jié)點(diǎn)之間的空間關(guān)系,為多人姿態(tài)估計(jì)算法提供更加稀疏的二分圖,降低二分圖優(yōu)化復(fù)雜度而達(dá)到了實(shí)時(shí)的效果。





讓大規(guī)模深度學(xué)習(xí)訓(xùn)練線性加速、性能無(wú)損,基于BMUF的Adam優(yōu)化器并行化實(shí)踐

Adam 算法便以其卓越的性能風(fēng)靡深度學(xué)習(xí)領(lǐng)域,該算法通常與同步隨機(jī)梯度技術(shù)相結(jié)合,采用數(shù)據(jù)并行的方式在多臺(tái)機(jī)器上執(zhí)行

音樂(lè)人工智能、計(jì)算機(jī)聽(tīng)覺(jué)及音樂(lè)科技

音樂(lè)科技、音樂(lè)人工智能與計(jì)算機(jī)聽(tīng)覺(jué)以數(shù)字音樂(lè)和聲音為研究對(duì)象,是聲學(xué)、心理學(xué)、信號(hào)處理、人工智能、多媒體、音樂(lè)學(xué)及各行業(yè)領(lǐng)域知識(shí)相結(jié)合的重要交叉學(xué)科,具有重要的學(xué)術(shù)研究和產(chǎn)業(yè)開(kāi)發(fā)價(jià)值

【深度】未來(lái)5-10年計(jì)算機(jī)視覺(jué)發(fā)展趨勢(shì)為何?

專家(查紅彬,陳熙霖,盧湖川,劉燁斌,章國(guó)鋒)從計(jì)算機(jī)視覺(jué)發(fā)展歷程、現(xiàn)有研究局限性、未來(lái)研究方向以及視覺(jué)研究范式等多方面展開(kāi)了深入的探討

華南理工大學(xué)羅晶博士和楊辰光教授團(tuán)隊(duì)發(fā)文提出遙操作機(jī)器人交互感知與學(xué)習(xí)算法

羅晶博士和楊辰光教授團(tuán)隊(duì)提出,遙操作機(jī)器人系統(tǒng)可以自然地與外界環(huán)境進(jìn)行交互、編碼人機(jī)協(xié)作任務(wù)和生成任務(wù)模型,從而提升系統(tǒng)的類人化操作行為和智能化程度

實(shí)時(shí)識(shí)別卡扣成功裝配的機(jī)器學(xué)習(xí)框架

卡扣式裝配廣泛應(yīng)用于多種產(chǎn)品類型的制造中,卡扣裝配是結(jié)構(gòu)性的鎖定機(jī)制,通過(guò)一個(gè)機(jī)器學(xué)習(xí)框架將人類識(shí)別成功快速裝配的能力遷移到自主機(jī)器人裝配上。

基于多任務(wù)學(xué)習(xí)和負(fù)反饋的深度召回模型

基于行為序列的深度學(xué)習(xí)推薦模型搭配高性能的近似檢索算法可以實(shí)現(xiàn)既準(zhǔn)又快的召回性能,如何利用這些豐富的反饋信息改進(jìn)召回模型的性能

張帆博士與Yiannis Demiris教授團(tuán)隊(duì)提出高效的機(jī)器人學(xué)習(xí)抓取衣服方法

機(jī)器人輔助穿衣通常人工的將衣服附在機(jī)器人末端執(zhí)行器上,忽略機(jī)器人識(shí)別衣服抓取點(diǎn)并進(jìn)行抓取的過(guò)程,從而將問(wèn)題簡(jiǎn)化

百度算法大牛35頁(yè)P(yáng)PT講解基于EasyDL訓(xùn)練并部署企業(yè)級(jí)高精度AI模型

百度AI開(kāi)發(fā)平臺(tái)高級(jí)研發(fā)工程師餅干老師,為大家系統(tǒng)講解企業(yè)在AI模型開(kāi)發(fā)中的難點(diǎn),以及針對(duì)這些難點(diǎn),百度EasyDL專業(yè)版又是如何解決的

Technica公司發(fā)布智能霧計(jì)算平臺(tái)技術(shù)白皮書

SmartFog可以輕松地將人工智能分析微服務(wù)部署到云、霧和物聯(lián)網(wǎng)設(shè)備上,其架構(gòu)支持與現(xiàn)有系統(tǒng)的靈活集成,提供了大量的實(shí)現(xiàn)方案,要用下一代人工智能算法來(lái)彌補(bǔ)現(xiàn)有解決方案的不足。

深度學(xué)習(xí)在術(shù)前手術(shù)規(guī)劃中的應(yīng)用

深度學(xué)習(xí)對(duì)推動(dòng)術(shù)前手術(shù)規(guī)劃尤其重要,手術(shù)規(guī)劃中要根據(jù)現(xiàn)有的醫(yī)療記錄來(lái)計(jì)劃手術(shù)程序,而成像對(duì)于手術(shù)的成功至關(guān)重要
 
資料獲取
新聞資訊
== 資訊 ==
» 教大家如何使用Deepseek AI進(jìn)行
» DeepSeek隱藏玩法,不要用結(jié)構(gòu)化提
» DeepSeek神級(jí)提示詞,讓你輕松駕馭
» DeepSeek 30個(gè)喂飯指令-知識(shí)付
» DeepSeek 提問(wèn)攻略、使用實(shí)例和心
» DeepSeek實(shí)用萬(wàn)能提問(wèn)模板,(背景
» DeepSeek V3搭建個(gè)人知識(shí)庫(kù)教程
» Deepseek 不好用,是你真的不會(huì)用
» 2025年Manus智能體開(kāi)啟AI新范式
» 如何用 deepseek 做數(shù)據(jù)分析,有
» 如何用 deepseek 整理會(huì)議紀(jì)要,
» 如何用 deepseek 制定減肥計(jì)劃,
» 如何用deepseek寫產(chǎn)品比對(duì)方案,
» 如何用deepseek制定儲(chǔ)蓄方案,分析
» 如何用 deepseek 制定飲食建議,
 
== 機(jī)器人推薦 ==
 
迎賓講解服務(wù)機(jī)器人

服務(wù)機(jī)器人(迎賓、講解、導(dǎo)診...)

智能消毒機(jī)器人

智能消毒機(jī)器人

機(jī)器人底盤

機(jī)器人底盤

 

商用機(jī)器人  Disinfection Robot   展廳機(jī)器人  智能垃圾站  輪式機(jī)器人底盤  迎賓機(jī)器人  移動(dòng)機(jī)器人底盤  講解機(jī)器人  紫外線消毒機(jī)器人  大屏機(jī)器人  霧化消毒機(jī)器人  服務(wù)機(jī)器人底盤  智能送餐機(jī)器人  霧化消毒機(jī)  機(jī)器人OEM代工廠  消毒機(jī)器人排名  智能配送機(jī)器人  圖書館機(jī)器人  導(dǎo)引機(jī)器人  移動(dòng)消毒機(jī)器人  導(dǎo)診機(jī)器人  迎賓接待機(jī)器人  前臺(tái)機(jī)器人  導(dǎo)覽機(jī)器人  酒店送物機(jī)器人  云跡科技潤(rùn)機(jī)器人  云跡酒店機(jī)器人  智能導(dǎo)診機(jī)器人 
版權(quán)所有 © 創(chuàng)澤智能機(jī)器人集團(tuán)股份有限公司     中國(guó)運(yùn)營(yíng)中心:北京·清華科技園九號(hào)樓5層     中國(guó)生產(chǎn)中心:山東日照太原路71號(hào)
銷售1:4006-935-088    銷售2:4006-937-088   客服電話: 4008-128-728