新電子雜誌 » 熱門新聞 » 即時偵測細部動作　電腦理解人類肢體語言

即時偵測細部動作　電腦理解人類肢體語言

作者：詹益瑋

2017 年 07 月 12 日

語音辨識技術日新月異的同時，電腦似乎也開始理解人類的肢體語言。卡內基美隆大學(CMU)機器人學院的研究團隊近日發布其最新成果，可讓電腦在單一鏡頭內即時偵測複數人的姿勢、動作，以至臉部、五指等細節，藉此辨識人與人、人與物之間的互動關係，以期開創新一種人機互動模式。

機器人學院副教授Yaser Sheikh指出，人們透過肢體動作溝通的頻率與透過言語相去不遠，現今的電腦對此仍多少存有一些障礙。透過此新發布的辨識技術，人們能以更自然的方式與機器溝通，比方單純指向某物來對電腦下指令等；機器也能感測周遭人類彼此間的非言語溝通細節，諸如當下的動作、情緒，適不適合被打斷等，在餐廳、車道等社會空間中提供更進一步的服務。提供新的人機互動機制之外，Sheikh也期望令人們藉此更了解周遭的世界。

辨識群體中每個人的動作，乃至彼此間可能的互動情形，對電腦是不小的挑戰；尤其當群體較龐大時，純靠單體動作捕捉程式顯然不敷使用。另一方面，鑑於單一鏡頭難以捕捉手部動作全貌，加上相對身體、表情等動作缺乏已標註過的影像資料庫，手勢辨識顯得更為棘手。為此，該新技術的研發主要借助於CMU的Panoptic Studio多重攝影系統完成–此圓頂攝影棚具備超過500顆影像感測器，包含30個高畫質攝影機，可360度辨識棚內所有人的動作。

Sheikh表示，Panoptic Studio可同步強化肢體、臉部與手部的辨識訓練，模型由2D轉3D亦有助於自動建立家住過的影像資料。藉此，該研究團隊由上而下，先單獨定義影像場景中出現的各個身體部分，諸如手臂、腿部與臉部等，最終將所有部分接合起來為特定個體，以利電腦進行辨識；至於較棘手的手勢辨識，則透過該系統加速建立資料庫，令電腦單憑部分手部影像即可連結其他500多個相關角度，以此較精準地判斷鏡頭內個體的手部動作。

此辨識技術賦予機器理解人類行為的能力，應用上具有不少潛力，諸如協助自動駕駛車輛監控周遭行人的行為，藉此預測其動向、強化安全性；以運動賽事分析來說，則可判斷各球員的場上位置、當下的動作，進一步推斷其目前甚至未來的行動；未來甚至可望針對特定病徵協助進行診斷、復健等醫療相關作業，比方自閉症、憂鬱症、學習障礙等。

現階段為強化推廣，Sheikh表示，其研究團隊已釋出多人、手勢判別相關的程式碼於網路上。目前該技術已被廣泛採用於諸多研究群組，並有超過20個含汽車廠商在內的商業組織對此表示興趣。

標籤

近期研討會 More

白皮書

Cookie	Duration	Description
cookielawinfo-checkbox-analytics	11 months	This cookie is set by GDPR Cookie Consent plugin. The cookie is used to store the user consent for the cookies in the category "Analytics".
cookielawinfo-checkbox-functional	11 months	The cookie is set by GDPR cookie consent to record the user consent for the cookies in the category "Functional".
cookielawinfo-checkbox-necessary	11 months	This cookie is set by GDPR Cookie Consent plugin. The cookies is used to store the user consent for the cookies in the category "Necessary".
cookielawinfo-checkbox-others	11 months	This cookie is set by GDPR Cookie Consent plugin. The cookie is used to store the user consent for the cookies in the category "Other.
cookielawinfo-checkbox-performance	11 months	This cookie is set by GDPR Cookie Consent plugin. The cookie is used to store the user consent for the cookies in the category "Performance".
viewed_cookie_policy	11 months	The cookie is set by the GDPR Cookie Consent plugin and is used to store whether or not user has consented to the use of cookies. It does not store any personal data.

聯發科開源AI語音辨識模型MR Breeze ASR 25 在地口音辨識更精準

聯電找Intel當靠山：兩個技術追趕者能負負得正嗎？

慧榮UFS方案通過高通數位座艙平台驗證

艾飛思成為台灣及亞洲首家PCI-SIG認證實驗室

慧與科技與NVIDIA推出全新AI工廠解決方案 加速各行業AI應用

超微執行長蘇姿丰：開放是超微一路走來的信念

聯電找Intel當靠山：兩個技術追趕者能負負得正嗎？

表前儲能通過實戰驗證 能源署三管齊下推動表後儲能

技術創新持續推進 全球RAN設備市場回穩

多重挑戰宇宙來襲 半導體產業打造韌性供應鏈

災難時刻不斷線：民間社群發力 織造台灣在地Meshtastic通訊網

自動駕駛感測融合限制大 純視覺路線成本效益突出

樹莓派從碳移除到全球銷售

SRAM微縮面臨瓶頸 SOT-MRAM技術可望接棒

掃碼領藥/AI螢幕互動 智慧運輸車解決偏鄉醫療痛點

全球個人電腦供應鏈轉向東南亞 生產基地多元化應對關稅風險

手機SoC製程節點轉移加速 2nm競賽啟動、5/4nm邁入主流

TrendForce：AI強勁需求驅動 1Q25全球前十大IC設計廠營收季增6%

超越生產力：人工智慧重塑下一代平板電腦

MicroLED應用場景擴展 透明及非顯示技術帶來新商機

ROHM第4代SiC MOSFET助力TOYOTA全新跨界電動車「bZ5」性能提升

Ceva推出新一代動作控制軟體MotionEngine Hex 實現智慧電視精準互動

Holtek推出HT16K24整合LCD控制及驅動IC 支援160點顯示及24鍵輸入

Holtek推出BS23B16CA Touch I/O OTP MCU 擴展至16 Key應用

PANJIT推出175°C高結溫HULV超低VF橋式整流器系列 提升高效能功率整流技術

即時偵測細部動作 電腦理解人類肢體語言

手勢/心跳皆可偵測 140GHz MIMO雷達超有感

NVIDIA新一代GPU助攻 資料中心機器學習能力大增

量宏發表新款紅外線相機模組 系統功耗減少50倍

強化AI邊緣運算性能/功耗比 賽靈思再推新方案

從駕駛監測走向智慧座艙 ST發表混合感測器

治理問題浮現 杰倫智能推AI生命周期管理平台

【重磅白皮書】免費下載！8位產業專家探討儀器儀錶在現代技術中的作用

【經典秘笈下載】電源監控器處理延長電池壽命並提高性能

【工程師必備收藏】SiC引領能源新革命: 高效儲能與轉換系統設計指南

【免費下載】解鎖未來智慧車關鍵議題！免費下載《AI智慧車與智慧座艙》白皮書

【成功案例分享】即刻下載！ROHM使用Siemens Tanner提供一流的dual MOSFET元件

超微執行長蘇姿丰：開放是超微一路走來的信念

Quobly共同創辦人暨執行長Maud Vinet：量子運算不是贏者全拿

英特爾散熱技術經理莊騏鴻：高功耗時代散熱技術的轉型路徑

Perstorp業務發展總監曾偉銓：散熱技術臨界點下的合成酯突圍戰略

金運營運長郭丁賀：八年前瞻布局液冷技術，領航AI時代散熱

超微執行長蘇姿丰：開放是超微一路走來的信念

ROHM第4代SiC MOSFET助力TOYOTA全新跨界電動車「bZ5」性能提升

聯發科開源AI語音辨識模型MR Breeze ASR 25 在地口音辨識更精準

Ceva推出新一代動作控制軟體MotionEngine Hex 實現智慧電視精準互動

聯電找Intel當靠山：兩個技術追趕者能負負得正嗎？

聯發科開源AI語音辨識模型MR Breeze ASR 25 在地口音辨識更精準

聯電找Intel當靠山：兩個技術追趕者能負負得正嗎？

表前儲能通過實戰驗證 能源署三管齊下推動表後儲能

技術創新持續推進 全球RAN設備市場回穩

自動駕駛感測融合限制大 純視覺路線成本效益突出

聯發科開源AI語音辨識模型MR Breeze ASR 25　在地口音辨識更精準

慧與科技與NVIDIA推出全新AI工廠解決方案　加速各行業AI應用

表前儲能通過實戰驗證　能源署三管齊下推動表後儲能

技術創新持續推進　全球RAN設備市場回穩

多重挑戰宇宙來襲　半導體產業打造韌性供應鏈

災難時刻不斷線：民間社群發力　織造台灣在地Meshtastic通訊網

自動駕駛感測融合限制大　純視覺路線成本效益突出

SRAM微縮面臨瓶頸　SOT-MRAM技術可望接棒

掃碼領藥/AI螢幕互動　智慧運輸車解決偏鄉醫療痛點

全球個人電腦供應鏈轉向東南亞　生產基地多元化應對關稅風險

手機SoC製程節點轉移加速　2nm競賽啟動、5/4nm邁入主流

TrendForce：AI強勁需求驅動　1Q25全球前十大IC設計廠營收季增6%

MicroLED應用場景擴展　透明及非顯示技術帶來新商機

Ceva推出新一代動作控制軟體MotionEngine Hex　實現智慧電視精準互動

PANJIT推出175°C高結溫HULV超低VF橋式整流器系列　提升高效能功率整流技術

即時偵測細部動作　電腦理解人類肢體語言

手勢/心跳皆可偵測　140GHz MIMO雷達超有感

NVIDIA新一代GPU助攻　資料中心機器學習能力大增

量宏發表新款紅外線相機模組　系統功耗減少50倍

強化AI邊緣運算性能/功耗比　賽靈思再推新方案

從駕駛監測走向智慧座艙　ST發表混合感測器

治理問題浮現　杰倫智能推AI生命周期管理平台

聯發科開源AI語音辨識模型MR Breeze ASR 25　在地口音辨識更精準

Ceva推出新一代動作控制軟體MotionEngine Hex　實現智慧電視精準互動

聯發科開源AI語音辨識模型MR Breeze ASR 25　在地口音辨識更精準

表前儲能通過實戰驗證　能源署三管齊下推動表後儲能

技術創新持續推進　全球RAN設備市場回穩

自動駕駛感測融合限制大　純視覺路線成本效益突出