創(chuàng)澤機(jī)器人
CHUANGZE ROBOT
當(dāng)前位置:首頁 > 新聞資訊 > 機(jī)器人開發(fā) > 基于深度學(xué)習(xí)和傳統(tǒng)算法的人體姿態(tài)估計,技術(shù)細(xì)節(jié)都講清楚了

基于深度學(xué)習(xí)和傳統(tǒng)算法的人體姿態(tài)估計,技術(shù)細(xì)節(jié)都講清楚了

來源:AI科技大本營     編輯:創(chuàng)澤   時間:2020/5/29   主題:其他 [加盟]

計算機(jī)視覺的一大研究熱點(diǎn)是人體姿態(tài)估計,還有很多問題急需解決,比如遮擋,交互等等。在最近的CVPR2020里邊也有很多這方面的工作。本文站長主要是想談?wù)劵谏疃葘W(xué)習(xí)的實(shí)時多人姿態(tài)估計。


人體姿態(tài)估計要干嘛?

關(guān)于人類活動規(guī)律的研究,必定是計算機(jī)視覺領(lǐng)域首要關(guān)注的內(nèi)容。其中,人體姿態(tài)估計便是計算機(jī)視覺領(lǐng)域現(xiàn)有的熱點(diǎn)問題,其主要任務(wù)是讓機(jī)器自動地檢測場景中的人“在哪里”和理解人在“干什么”。

隨著信息化時代的迅速發(fā)展,人類每時每刻都在通過多種多樣的手段和途徑獲得海量的可視化圖像數(shù)據(jù),這使得基于自然場景圖像的人姿態(tài)估計研究在現(xiàn)實(shí)生活中擁有很多潛在的應(yīng)用價值。圖1展示了自然場景圖像中人體姿態(tài)估計的研究應(yīng)用。

Fig.1: 自然場景圖像人體姿態(tài)估計的研究應(yīng)用

在信息化的時代,視頻監(jiān)控正在銀行、超市以及公安機(jī)關(guān)等關(guān)乎人民財產(chǎn)、人身安全的重要場所發(fā)揮著舉足輕重的角色。面對海量的視頻圖像序列,為了及時地制止現(xiàn)場事故的進(jìn)一步發(fā)生,工作人員必須長時間且精神高度集中地觀察視頻監(jiān)控畫面并對異常事件作出處理。

除了工作人員很難長時間地保持高度警惕外,長期投入大量的人力來監(jiān)測小概率發(fā)生的事件也不是單位機(jī)構(gòu)提倡的做法。因此,實(shí)現(xiàn)視頻監(jiān)控的智能化成為一種互聯(lián)網(wǎng)時代的必然趨勢。但是,實(shí)現(xiàn)智能視頻監(jiān)控的前提條件是讓機(jī)器自動地識別視頻圖像序列中的人體姿態(tài),從而進(jìn)一步分析視頻圖像中人類的行為活動。

這就涉及到了我們下面所要說的人體行為分析了。


人體行為分析又為那般?

人體行為分析理解成為了近幾年研究的熱點(diǎn)之一。在人體行為分析理解的發(fā)展過程中,研究人員攻克了很多技術(shù)上的難關(guān),并形成了一些經(jīng)典算法,但仍有很多尚未解決的問題。從研究的發(fā)展趨勢來看,人體行為分析的研究正由采用單一特征、單一傳感器向采用多特征、多傳感器的方向發(fā)展。而人體姿態(tài)估計作為人體行為識別的一個重要特征,是進(jìn)行人體行為分析的基礎(chǔ),是人體行為分析領(lǐng)域備受關(guān)注的研究方向之一。

人體姿態(tài)估計是指從圖像中檢測人體各部分的位置并計算其方向和尺度信息。人體行為分析是基于多幀圖像的前后關(guān)系進(jìn)行分析理解,而人體姿態(tài)識別是針對單幀靜態(tài)圖像進(jìn)行處理。正確識別出多幀連續(xù)的靜態(tài)圖像的姿態(tài)信息,為實(shí)現(xiàn)正確的行為分析理解提供了可能。因此,人體姿態(tài)估計的準(zhǔn)確性與實(shí)時性直接影響人體行為分析的準(zhǔn)確性和實(shí)時性,確保實(shí)時準(zhǔn)確的姿態(tài)識別是進(jìn)行下一步行為分析的基礎(chǔ)。

現(xiàn)在,我們的人體姿態(tài)估計課題的發(fā)展已越來越貼近實(shí)際,例如在步態(tài)分析、人機(jī)交互以及視頻監(jiān)控等領(lǐng)域,人體姿態(tài)估計均具有廣泛的應(yīng)用前景。所以呢,研究人體姿態(tài)估計還是蠻有意思的,好玩 !


當(dāng)前姿態(tài)估計算法有哪些?

目前主流的人體姿態(tài)估計算法可以劃分為傳統(tǒng)方法和基于深度學(xué)習(xí)的方法。

基于傳統(tǒng)方法的人體姿態(tài)估計

傳統(tǒng)方法一般是基于圖結(jié)構(gòu)和形變部件模型,設(shè)計2D人體部件檢測器,使用圖模型建立各部件的連通性,并結(jié)合人體運(yùn)動學(xué)的相關(guān)約束不斷優(yōu)化圖結(jié)構(gòu)模型來估計人體姿態(tài)。

其缺點(diǎn)是什么?

First,傳統(tǒng)方法雖然擁有較高的時間效率,但是由于其提取的特征主要是人工設(shè)定的HOG和SHIFT特征,無法充分利用圖像信息,導(dǎo)致算法受制于圖像中的不同外觀、視角、遮擋和固有的幾何模糊性。同時,由于部件模型的結(jié)構(gòu)單一,當(dāng)人體姿態(tài)變化較大時,部件模型不能精確地刻畫和表達(dá)這種形變,同一數(shù)據(jù)存在多個可行的解,即姿態(tài)估計的結(jié)果不唯一,導(dǎo)致傳統(tǒng)方法適用范圍受到很大限制。
Second,另一方面,傳統(tǒng)方法很多是基于深度圖等數(shù)字圖像提取姿態(tài)特征的算法,但是由于采集深度圖像需要使用專業(yè)的采集設(shè)備,成本較高,所以很難適用于所有的應(yīng)用場景,而且采集過程需要同步多個視角的深度攝像頭以減小遮擋問題帶來的影響,導(dǎo)致人體姿態(tài)數(shù)據(jù)的獲取過程復(fù)雜困難。因此這種傳統(tǒng)的基于手工提取特征,并利用部件模型建立特征之間聯(lián)系的方法大多數(shù)是昂貴和低效的。
基于深度學(xué)習(xí)的人體姿態(tài)估計算法

隨著大數(shù)據(jù)時代的到來,深度學(xué)習(xí)在計算機(jī)視覺領(lǐng)域得到了成功的應(yīng)用。因此,考慮如何將深度學(xué)習(xí)用于解決人體姿態(tài)估計問題,是人體姿態(tài)估計領(lǐng)域的學(xué)者們繼圖結(jié)構(gòu)模型后所要探索的另一個重點(diǎn)。早期利用深度學(xué)習(xí)估計人體姿態(tài)的方法,都是通過深度學(xué)習(xí)網(wǎng)絡(luò)直接回歸出輸入圖像中關(guān)節(jié)點(diǎn)的坐標(biāo)。

總結(jié)

六階段雙分支網(wǎng)絡(luò)結(jié)構(gòu)在關(guān)節(jié)點(diǎn)預(yù)測精度上略高于現(xiàn)有傳統(tǒng)的的人體姿態(tài)估計算法。本次站長采用的算法利用自底向上的思想,首先預(yù)測出所有骨點(diǎn)位置,并將骨點(diǎn)連接形成圖結(jié)構(gòu),通過圖優(yōu)化實(shí)現(xiàn)多人體姿態(tài)估計。算法運(yùn)行效率方面,由于網(wǎng)絡(luò)同時預(yù)測出關(guān)節(jié)點(diǎn)位置和關(guān)節(jié)點(diǎn)之間的空間關(guān)系,為多人姿態(tài)估計算法提供更加稀疏的二分圖,降低二分圖優(yōu)化復(fù)雜度而達(dá)到了實(shí)時的效果。





傳統(tǒng)目標(biāo)檢測算法對比

SIFT、PCA-SIFT、SURF 、ORB、 VJ 等目標(biāo)檢測算法優(yōu)缺點(diǎn)對比及使用場合比較

基于深度學(xué)習(xí)目標(biāo)檢測模型優(yōu)缺點(diǎn)對比

深度學(xué)習(xí)模型:OverFeat、R-CNN、SPP-Net、Fast、R-CNN、Faster、R-CNN、R-FCN、Mask、R-CNN、YOLO、SSD、YOLOv2、416、DSOD300、R-SSD

如何更高效地壓縮時序數(shù)據(jù)?基于深度強(qiáng)化學(xué)習(xí)的探索

大型商用時序數(shù)據(jù)壓縮的特性,提出了一種新的算法,分享用深度強(qiáng)化學(xué)習(xí)進(jìn)行數(shù)據(jù)壓縮的研究探索

滴滴機(jī)器學(xué)習(xí)平臺調(diào)度系統(tǒng)的演進(jìn)與K8s二次開發(fā)

滴滴機(jī)器學(xué)習(xí)場景下的 k8s 落地實(shí)踐與二次開發(fā)的技術(shù)實(shí)踐與經(jīng)驗,包括平臺穩(wěn)定性、易用性、利用率、平臺 k8s 版本升級與二次開發(fā)等內(nèi)容

人工智能和機(jī)器學(xué)習(xí)之間的差異及其重要性

機(jī)器學(xué)習(xí)就是通過經(jīng)驗來尋找它學(xué)習(xí)的模式,而人工智能是利用經(jīng)驗來獲取知識和技能,并將這些知識應(yīng)用于新的環(huán)境

面向動態(tài)記憶和學(xué)習(xí)功能的神經(jīng)電晶體可塑性研究

神經(jīng)形態(tài)結(jié)構(gòu)融合學(xué)習(xí)和記憶功能領(lǐng)域的研究主要集中在人工突觸的可塑性方面,同時神經(jīng)元膜的固有可塑性在神經(jīng)形態(tài)信息處理的實(shí)現(xiàn)中也很重要

CVPOS自助收銀的挑戰(zhàn)以及商品識別算法工程落地方法和經(jīng)驗

針對結(jié)算收銀場景中商品識別的難點(diǎn),從商品識別落地中的模型選擇、數(shù)據(jù)挑選與標(biāo)注、前端和云端部署、模型改進(jìn)等方面,進(jìn)行了深入講解

內(nèi)容流量管理的關(guān)鍵技術(shù):多任務(wù)保量優(yōu)化算法實(shí)踐

通過分析其中的關(guān)鍵問題,建立了新熱內(nèi)容曝光敏感模型,并最終給出一種曝光資源約束下的多目標(biāo)優(yōu)化保量框架與算法

百變應(yīng)用場景下,優(yōu)酷基于圖執(zhí)行引擎的算法服務(wù)框架筑造之路

優(yōu)酷推薦業(yè)務(wù),算法應(yīng)用場景眾多,需求靈活多變,需要一套通用業(yè)務(wù)框架,支持運(yùn)行時的算法流程的裝配,提升算法服務(wù)場景搭建的效率

餓了么推薦算法的演進(jìn)及在線學(xué)習(xí)實(shí)踐

餓了么算法專家劉金介紹推薦業(yè)務(wù)背景,包括推薦產(chǎn)品形態(tài)及算法優(yōu)化目標(biāo);然后是算法的演進(jìn)路線;最后重點(diǎn)介紹在線學(xué)習(xí)是如何在餓了么推薦領(lǐng)域?qū)嵺`的

拯救渣畫質(zhì),馬賽克圖秒變高清,杜克大學(xué)提出AI新算法

杜克大學(xué)的一種 AI 算法PULSE可以將模糊、無法識別的人臉圖像轉(zhuǎn)換成計算機(jī)生成的圖像,其細(xì)節(jié)比之前任何時候都更加精細(xì)、逼真

如何搭建一個GPU加速的分布式機(jī)器學(xué)習(xí)系統(tǒng),遇到的問題和解決方法

能快速將現(xiàn)有算法在實(shí)際生產(chǎn)環(huán)境落地,并能利用GPU加速實(shí)現(xiàn)大規(guī)模計算,我們自己搭建了一個GPU加速的大規(guī)模分布式機(jī)器學(xué)習(xí)系統(tǒng),取名小諸葛
資料獲取
機(jī)器人開發(fā)
== 最新資訊 ==
ChatGPT:又一個“人形機(jī)器人”主題
ChatGPT快速流行,重構(gòu) AI 商業(yè)
中國機(jī)器視覺產(chǎn)業(yè)方面的政策
中國機(jī)器視覺產(chǎn)業(yè)聚焦于中國東部沿海地區(qū)(
從CHAT-GPT到生成式AI:人工智能
工信部等十七部門印發(fā)《機(jī)器人+應(yīng)用行動實(shí)
全球人工智能企業(yè)市值/估值 TOP20
創(chuàng)澤智能機(jī)器人集團(tuán)股份有限公司第十一期上
諧波減速器和RV減速器比較
機(jī)器人減速器:諧波減速器和RV減速器
人形機(jī)器人技術(shù)難點(diǎn) 高精尖技術(shù)的綜合
機(jī)器人大規(guī)模商用面臨的痛點(diǎn)有四個方面
青島市機(jī)器人產(chǎn)業(yè)概況:機(jī)器人企業(yè)多布局在
六大機(jī)器人產(chǎn)業(yè)集群的特點(diǎn)
機(jī)械臂-高度非線性強(qiáng)耦合的復(fù)雜系統(tǒng)
== 機(jī)器人推薦 ==
迎賓講解服務(wù)機(jī)器人

服務(wù)機(jī)器人(迎賓、講解、導(dǎo)診...)

智能消毒機(jī)器人

智能消毒機(jī)器人

機(jī)器人開發(fā)平臺

機(jī)器人開發(fā)平臺


機(jī)器人招商 Disinfection Robot 機(jī)器人公司 機(jī)器人應(yīng)用 智能醫(yī)療 物聯(lián)網(wǎng) 機(jī)器人排名 機(jī)器人企業(yè) 機(jī)器人政策 教育機(jī)器人 迎賓機(jī)器人 機(jī)器人開發(fā) 獨(dú)角獸 消毒機(jī)器人品牌 消毒機(jī)器人 合理用藥 地圖
版權(quán)所有 創(chuàng)澤智能機(jī)器人集團(tuán)股份有限公司 中國運(yùn)營中心:北京 清華科技園九號樓5層 中國生產(chǎn)中心:山東日照太原路71號
銷售1:4006-935-088 銷售2:4006-937-088 客服電話: 4008-128-728