新通訊首頁 | 設成首頁 | 加入我的最愛
 熱門關鍵字  802.11ac | LTE-Advanced | NFC | 穿戴式 | 無線充電
 快速查詢  Analog | Clock | Display | DSP | Embedded | FPGA | Interface | LED | MCU | Memory | MEMS | Photovoltaic | Power | Processor | RF | Sensor | Touch | 儀器
會員登入
帳號
密碼
忘記密碼
立即加入免費會員
學技術熱門文章排行
更多熱門文章
熱賣商品
更多熱賣商品
分享 將此篇文章跟 Facebook 上的朋友分享 將此篇文章跟 Plurk 上的朋友分享 將此篇文章跟 Twitter 上的朋友分享 轉寄列印 RSS
《最新臉部辨識技術剖析(3-3)》

突破技術瓶頸/使用限制 3D臉部辨識技術躍居主流

2008/9  鍾慶豐
在上期文章中,談到影響系統辨識效能的開放性因子,本文將繼續討論其他三種常見的開放性因子。此外,也將陸續介紹2D技術與3D技術使用上的差異,包含3D技術開發或使用上的限制,並在最後提出有關2D與3D技術上值得注意的研究見解。
姿勢改變處理技術 有利辨識新相位臉部資訊  

除了照明的改變對系統辨識率有顯著影響,受測者姿勢的變異亦是另一項影響系統正確辨識率的重要因子。  

傳統所用的多視角臉部辨識技術,乃延伸自正面臉部辨識技術而來,在資料庫中存有該受測者的各種臉部相位資料。不過實際上,不太可能為每個人建立各種相位的臉部資料,因此這種技術面臨的挑戰是如何讓系統正確辨識新相位的臉部資訊。解決此問題,必須借助受測姿勢處理的方法,但有關姿勢改變的處理技術,目前文獻研究不多,多數仍局限受測者必須看著某個方向作為辨識系統取樣的一個相位依據,此方法在公司行號的保全辨識固可被接受,但若是在公共場所,用在隨意走動的人群身上,恐怕無法勝任。為了解決此問題,2002年Okada及Malsburg基於線性次空間概念而提出LPCMAP模型與PPLS模型概念,然而,受測距離的基本問題依舊未獲解決。  

去除遮蔽物/利用局部演算法 可解決局部辨識障礙問題  

表徵式(Appearance-based)的辨識方法對部分表徵的遮蔽容易產生辨識錯誤,在許多應用中,因為攝影機幾乎都架設在受測者上方,受測者的臉部無法全部顯像在照相機裡面,系統在處理此類具有短缺的臉部資訊時可能導致無法處理或處理錯誤。欲解決此問題,有兩種基本方法,首先是想辦法除去遮蔽物;其次是利用局部演算法處理局部辨識障礙問題。這種局部演算法往往先將臉部區域分割成許多不同部分,並利用投票法則找出最可能存在的臉部特徵區域,以補償遮蔽部分的臉部資訊。為了分辨這些不同區域,一些統計技術也常被用來比較彼此差異,例如:高斯分布。此種統計技術在Martinez的研究中,其利用隱蓋受測者臉部區域的六分之一之後再進行辨識測試,並不會降低系統辨識精確度。不過其研究只局限在遮蔽一小部分臉部的情形,一旦遮蔽部分擴大時,系統在辨識精確度上就會有所影響。  

若要再細分臉部遮蔽問題,還可區分為完全遮蔽與部分遮蔽等概念,使用的策略也天差地別。在完全遮蔽方面,遮蔽部分完全須要依靠系統自動演譯與推算來組合,常用的技術便是逆向工程與遺傳演算法理論,但因其變異度太大,目前成就有限;在部分遮蔽問題裡面,臉部輪廓乃以模糊狀態出現,此時常用的策略乃是Fuzzy-based的方法與碎形演算法,另有學者提出渾沌理論,嘗試從蛛絲馬跡裡還原真相,此領域的進展也被應用在車禍現場的車牌還原。

臉部老化速度慢 少見模擬年齡研究  

臉部資料的更新似乎無法避免,主要原因就在於臉部的老化。所幸的是,老化速度通常不會很快,因此資料庫中的臉部資料多數情況下仍屬正確。目前已有一些方法可以模擬年齡的變化,例如座標轉換法、臉部合成法(Facial Composite)等等。另外,亦可利用生物學的觀念,嘗試建構符合人類物種的生物年齡函數(Age Functions),再以此函數所對應的值域作為系統額外的年齡參數,以反應受測體在年齡上的差異。但這些方法在目前臉部辨識資料庫裡面的實用程度研究上還是很少見,主要因素還是在於年齡所導致的臉部資料老化速度非常緩慢,在一定時間單位裡面可以略去不計。  

一般而言,輸入影像的解析度越高,影像獲得正確辨識的機率也越大,但所需要的處理時間往往也越久。因此為了提高運作效能,許多系統刻意將輸入影像的擷取限定在某個小範圍之內,甚至只採用一張參考影像。以這種方法面對臉部資訊出現差異時,可能造成誤判的情況。例如出去玩的時候,臉部被刮傷,比較保險的作法仍應採多張參考畫面,並且影像大小的限制必須以保有必要臉部特徵可供辨識為其下限,不可無限限縮。另外,為辨識體建立較大的探針集(Probe Set)與相片集,維持在最小比例,亦有助於達到節省容量並加速系統運算的目標。值得注意的是,開發臉部辨識演算法中,物體的低頻訊號往往保有更多不變性,而物件高頻部分的資訊,則易受環境的變化而有影響。

兩種主流3D模型 提升辨識精確性  

2D的影像處理方法是過去10年電腦圖學所著重的資料處理方式,在2D的影像處理概念中,色彩不變性與光強度等是很常用的處理技術。經A.F.Abate及M. Nappi等人研究也發現,這種方法在光線條件充分之下,可以發揮90%以上的精準辨識率,因此如果在隨意環境的條件下,這種方法便不太適合使用。另一種生物特徵的辨識技術亦廣被大家討論,如果考量生物獨特特徵,將有助於提升系統面對光線改變的抗性。2004年Xu等人比較了利用強度影像作為辨識的基礎系統與利用特徵深度影像作為辨識基礎的系統,研究發現利用特徵地圖為主要辨識方式的系統,對於環境光照的改變似乎比利用光照強度為基礎系統具有更佳抗變性。  

目前此方面的領域也從2D的思維慢慢走向3D深度特徵的研究方向,意圖使用深度的差異,降低環境改變對系統的衝擊。在此我們所稱的3D辨識,包含利用各種臉部特徵、頭形以及多邊形網眼(Polygonal Mesh)深度的概念來進行臉部的辨識工作,這種特徵深度的辨識方法可將臉部特徵的立體幾何資訊全部掌握。  

另外,相較於2D技術,3D辨識技術具有更精確的特徵辨識能力,也可有效的避開2D技術難以處理的瓶頸。基於3D辨識的種種優勢,在系統負載可承受下,此類技術似乎將慢慢成為未來研究與應用的主流。不過3D臉部模型的建立頗有不同方法,隨著臉部立體重建法的不同,3D的臉部辨識處理演算法也會有差異。目前主流的3D模型主要有兩種,一種是採2.5D的影像形成概念(即是將2D影像上再加上深度的表示);另一種是真正的3D影像(其中包含貼圖式與參數式立體模型)。通常在立體的臉部模型裡面,臉部的特徵可以用局部或全域的曲線來表示,這些曲線可以被視為一個區別實體的真實特徵。不過2.5D的3D影像概念無法完全掌握全部物件的3D資料,與真正的3D影像技術實屬有別。為了使系統順利建立2.5D的半立體影像,其視角的選擇是被固定住的(不具變換彈性),只能從某一個角度去建立2.5D的半立體影像,所幸這種限制已被目前的多視角掃描技術所解決。  

利用多視角掃描技術,可以得到不同視角的物件空間資料,隨後只要再利用貼圖技術便可重建物件的3D模型。合成後的3D模型可旋轉任意方向,有助於了解該物件的空間狀況,正因如此,生物醫學領域對此技術的應用相當廣泛(例如:新生兒的掃描)。  

自從多視角掃描技術普遍使用後,2.5D的成像技術已慢慢較少使用於臉部辨識領域。多視角掃描技術雖可提供物件較完整的D空間資料,但是對於其結構卻不得而知。因此另一種與貼圖技術不同的3D建構技術便發展出來,此技術展現一種全域式的外形與結構之間的關聯性,與僅靠外形在輔以貼圖技術所展現出的3D模型屬於不同的電腦圖學技術。這種貼圖式的立體模型容易受到環境因子的影響,但真實的3D影像技術其外形之展現並非完全取決於外部環境條件,還包含了物件結構的功能部分。  

一個最簡單的3D臉部模型表示法,便是利用3D多邊形網眼所建構之模型。在這種多邊形網眼模型中,其乃由網點(Point)與邊(Edge)所構成。雖然要建立3D Mesh圖有許多不同方法,而且其中有些方法還搭配以前的2.5D造影技術的使用,以先取得物件的3D外形模型。2.5D影像技術與真實3D影像技術之間有個很重要的區別點,在於真實3D影像技術可以不受自我遮蔽(Self-occlusions)的影響。這種遮蔽問題在傳統2D的臉部辨識方法裡,是一項不易解決的難題。因此,一個真實3D影像技術將具有其特群屬性,例如:對光線改變的抗性、旋轉或縮放模型問題。經過研究發現,使用3D資料確實可以改善2D影像在辨識上的缺點,並強化對視角的改變或照明變異之抗性,提升系統在辨識上的精確性,減少誤判的發生。  

不過要注意的是,3D真實影像技術並非萬靈丹,還有些問題不是3D影像技術所能解決,例如要以一個絕對的參考畫面作為校準3D多邊形網眼之方法可能還不是很適當,且這種校對會耗掉許多系統運算資源。此外,3D資料的取得及維護具有光線獨立性的說法,也不完全正確,因為3D感應器(Sensor)常常無法排除被強光來源或反射面所造成影響。因此,在不同光源條件下還是可能會出現不同的資料集。為了解決3D影像資料的擷取問題,目前有幾種方法被提出來討論,基本上可分成相機系統(例如:Geometrix)與光線系統來談。在光線系統法裡面,又可區分為結構化光線(Structured Light)掃描法與雷射範圍搜尋系統(Laser Range Finding System)。以結構化光線掃描法運作原理而言,是利用對可結構模型(Morphable Model)探索來擷取3D臉部模型。換句話說,先選擇一個大型的參數集合來適應各種任意的臉部,產生最符合實況的一般化3D臉部模型,適當的協調這些參數。此方法在應付姿勢的改變、旋轉以及縮放等問題上有較優異的表現,因為系統可依據實際影像,適時調整產生臉部模型之參數。但此方法運算成本高昂、系統精確度的取得決定於參數選擇與數量等缺點存在。  

三種常用影像辨識方法  

2D影像的臉部辨識演算法是大家比較熟悉的,儘管研究3D的臉部影像已有數年光景,但演算法的開發卻不容易,也不為大家所熟悉,此方面的討論可說是少之又少。在少數僅存的3D臉部辨識演算法裡,有些僅能處理中性表情的臉部模型,一旦面臨表情豐富的臉部模型時,處理效能並未如預期中好。前3D-based的辨識系統可以概分成三大類,分別是2D-based影像式、真實3D影像式與多模態系統(Multimodal Systems)。在2D-based的影像式系統中,其運作的原理是比較影像之間的強度(Intensity)差異為主要方法。此類方法的著名例子便是2003年由Blanz及Vetter所提議的可構造模型相關理論,其參數乃由臉部表情空間所組成,因此它可以建構同時具有形狀上及材質上變異的人類臉部模型,再利用這些不同的合成模型訓練2D臉部辨識系統,以提高系統對受測姿勢變異的處理能力。如果給定一個單一臉部影像,該演算法會自動評估其3D外形、材質以及所有有關姿勢、照明、距離等3D場景參數,並利用以Mahalanobis距離作為其辨識的依據。  

另外一種利用正面臉部3D影像來產生2D臉部模型者,以檢視各種姿勢、照明與臉部表情之改變者可以參考Lu等人於2004年的研究。其測量的方式是以各種不同測量結果所形成的次空間內之不相似度情形來判斷,不過這種方式的辨識率並沒有其他方法來的高(約85%)。藉由創造各種不同的2D合成臉部,可能是克服2D臉部辨識系統傳統問題中有關姿勢問題的另一項解決方法。但使用這種策略要注意兩個地方,首先是考慮合成影像的真實性成分有多高;其次注意由單一圖片所建構而來3D臉部模型之精準度有多高。  

另一種真實3D影像式的技術主要使用的是多邊形網眼建置法,而要做到3D臉部辨識將會遇到如何運作這些3D資料集中的資訊,尤其是必須做到正確配對兩個臉部的表面特徵。一種直覺式的作法是用一個已經預先定義的可結構模型協助配對,這種方法已有人研究其可行性(例如:Ansari等人),另外,Cook等人則提出另一種重複最近點法(Iteration Closest Point, ICP)建立3D表面之間的對應,以補償臉部非剛體(Non-rigid)部分的誤差,然後再利用GMM(Gaussian Mixture Model)統計模式來進行比較。經過其研究發現,其辨識率可高達97%以上。Irfanoglu等人在2004年則提出另一種與ICP-based技術很像的方法,只不過配對採點對點的方式,以及其利用點集距(Point Set Distance, PSD)作為測量兩臉部表面離散情形之依據。ICP對於臉部的非剛體區域,採用補償的方式處理,如果在臉部表情非常豐富的情況下,這類的運作方法對臉部真實性的反應就會稍嫌不足。  

有關處理3D臉部辨識所關心的焦點,通常是放在3D的臉部表面的分析上面,以方便外插(Extrapolation)形狀方面的資訊,另外亦可搭配曲線式分節法提高分析能力,因為某些曲線式的分節法可偵測到某些基本的區域集合。利用分節法處理臉部辨識問題是很常見的技術,尤其在處理臉部非剛體區域及臉部表情上的應用(因為這些區域是很難處理的區域)。實際運作上,每個3D臉部模型可以利用某些方法(例如:中位數法或高斯曲線)探索出不同的分節區域。為了增加運作效率,這些特徵區域會被精簡成更簡單的形式,最後以特徵向量的形式呈現。相關的研究裡面,一個含有數百個3D臉部模型特徵的資料被精簡成只剩六十幾個特徵存在,不過要注意精簡後可能使辨識率下降。  

Chua等人在2000年左右便注意到當人的臉部表情出現變化時,某些臉部區域是具有最小變動性的(例如:眼窩、鼻子等區域)。其更利用點簽名(Point Signature)方式二對二的比較出同一人在不同表情時所具有的臉部剛體區域。一旦找到這些剛體區域後,將之儲存起來,成為資料庫索引的一部分,並依據相似情形為這些模型分級。利用這種技術,實驗結果顯示辨識率可達100%。當然,臉部的外形表示亦可用數學式以局部或全域曲線的方式表達,此方法在分析臉部外形時亦非常有用。另外如同MPEG-4所採用的描述子概念,如果可用少數特徵描述子(Features Descriptor)特徵化一個臉部並計算其3D模型,將可能是個不錯的方法,目前也的確有些研究往此方向進行。利用精簡的描述子建構臉部模型,可省去繁瑣的計算時間,但主要缺點則是描述子的定義何在?為了分類臉部影像,同時減少影像輸入的資料維度,PCA技術是目前處理2D臉部辨識裡面最常使用的方法之一。但在3D臉部辨識概念裡,往往將資料視為一種點雲而非表面的概念,並且新維度的產生乃是透過矩陣方式來表達,此乃為2D與3D處理技術上最大的差異處。但PCA方法已行之有年,技術也相當成熟,可否直接應用在3D辨識方法裡頗耐人尋味。2002年時Hesher將PCA技術應用在範圍影像(Range Image)上,並以歐式距離作為這些特徵向量之間相似度的測量方法,經實驗結果顯示,辨識率亦高達100%,這開拓了PCA法在3D辨識上應用的興趣。  

最後一種多模態系統的運作概念,則是將前兩者混合使用作為辨識依據。2D與3D方法的整合是嘗試也是挑戰。Chang等人於2003年利用PCA法先處理輸入影像的強度及範圍資訊後,再將所得結果輸入到3D辨識系統,並歸納出四個結論。首先是當2D方法與3D方法被分開考慮時,其辨識效能有某種程度的相似性。其次,用簡單的加權策略結合2D與3D的結果,效能會比單獨使用2D方法或3D方法要好。第三點則是,用簡單的加權策略結合兩個或兩個以上的2D影像,辨識效能會比單獨使用一張2D影像要好。最後一點結論,同時結合2D與D頂向,其效能會比結合多張2D影像要好。不過要注意的是,許多混合系統均將2D資料與3D資料分開操作,之後再將結果整合。照樣的運作方式可能會產生一些問題,其中一項便是資料源的重複以及相同資料冗餘會造成的搜索費時。有關臉部表情的變化可以參考2003年A.M. Bronstein等人所提出的標準影像法(Canonical Image),這種影像的產生乃自臉部表情與姿勢變異模型所變形而來。實驗發現臉部表情的改變並非是任意的,可以藉由等量轉換(Isometric Transformation)加以模型化。這種標準化影像具有幾何不變性,並藉由計算臉部表面點的測地距離(Geodesic Distance)所建構而來。(更多有關標準影像相關資料可參考網站http://www.cs.technion.ac.il/~bron/ research.html)在此不另多作描述。  

為了解決受測臉部與相機之間的距離問題,距離參數的加入是必要的開發考量。此問題雖然可以藉由點對點的比對方式或是應用「體積逼近法(Volume Approxi-mation)」來解決,但對一個含有大量人臉資料的處理系統而言,用點對點比對或逼近方式均會使系統造成嚴重的遲延效應。因此,面對3D臉部辨識演算法的設計,效能與演算複雜度是最主要的限制因素。另外造成3D臉部辨識演算法設計不易的因素,還包含客觀評論其優劣的標準未定,每種演算法均有其用來測試的臉部資料庫,這些臉部資料庫既不存在共通性,也不存有標準性。依個別資料庫所完成的演算法,其效能到底如何,恐怕難得到一致的評價。目前有關3D臉部模型的資料庫並不多,原因在於臉部資料變異性不大,即使有其他臉部資料庫,也因受測樣本太少而對優良演算法的設計產生不良影響,要正確合理的評估3D臉部辨識演算法並不是容易的工作。  

臉部辨識系統技術發展遇瓶頸  

彩色影像的分析與研究一直是影像處理領域的重頭戲,藉由對色彩資訊的掌握,其不變性將有助於對其應用有更深刻的了解。正如大家所熟知的,彩色影像分析的發展潛能很多,機器視覺(電腦視覺)、居家保全以及神經機械學(Cybernetics)更是熾手可熱的研究領域。本文將重點放在影像技術在居家保全上的變革,尤其是臉部辨識技術的發展與變遷,更是本次關心的焦點所在。 在發展臉部辨識系統技術往往會面臨三個瓶頸,首先是臉部影像資料庫的管理,其次為背景與前景環境複雜度的掌握,最後則是辨識大小的取樣限制。這些限制因子可以概分為內部因子與外部因子,對這些因子的掌握程度攸關新技術能否被大眾接受。  

臉部辨識演算法的好壞並不容易靠著測試界定,困難之處在於目前沒有公認的測試標準;其次,所謂的好與壞往往依據系統用途不同而有差異評價,因此許多測試資料庫往往針對某種應用需求所測試,尚無提供各種全方位測試的資料庫。  

一個較妥適的評估,需要將系統的應用目的作為重要的參數考量,而非僅用識別率一概而論。換言之,每個因子對一個臉部辨識演算法所可能產生的影響,有其不同程度之別,並非所有因子都具有等同貢獻度,至於哪一種因子會影響系統特別深,端視系統的應用領域而定。不過,基於經驗法則可知,當可用的測試資料庫越多時,對演算法的效能評估就會具公信力及可靠性。然而,經由一些研究發現,輸入的維度與運作效能之間是否有絕對關聯性,某些學者仍持保留態度,但多數學者採肯定看法。  

不可否認的一點,當輸入的資料維度越高時,所需要的處理時間與系統運算資源往往就越高。所以如果要加速系統訓練或是運作效能,需要更高處理複雜資料的能力、降低輸入影像的大小或是複雜資料簡化的運算輔助才能達成。  

臉部辨識技術之所以發展困難,有其先天因素存在,除了系統本身的限制之外,歲月流逝也會影響系統的辨識正確率。實作上的真正困難在於談論臉部辨識技術之前,必須先學會掌握臉部偵測(Face Detection)。  

目前有關臉部偵測技術的方法有許多文獻可供參考,這些方法大多可被分成五大類,分別是模版配對(Template Matching)、主徵值分析(Principal Component Analysis, PCA)、類神經網路(Neural Network)、彈力圖配對法(Elastic Graph Matching, EGM)以及材質/色彩/移動法等五大類。除了五類方法外,當然還有其他技術存在,但囿於篇幅限制,無法一一介紹。回顧前述,一個實作架構的臉部辨識系統技術框架,如圖1所示。

點圖放大
圖1 一個實作架構的臉部辨識系統技術框架

圖1中可以了解臉部辨識的架構核心在正確的參數測量。圖中技術使用的臉部潛在區域尋找目的,主要在為正規化(Normalization)工作鋪路,因為這些潛在區域的正規化將有助降低距離或受測位置對系統所產生的影響。  

此外,臉部辨識可能涉及之肖像權保護(人格權的一種),也是人民的基本權利之一。國家要予以干涉、侵害除需有法律授權之外,其干預內容與範圍也必須明確可定,干預的手段與目的須具關聯性並正當合法,且在其他法律無特別規定之下,有行政程序法第七條規定之比例原則的適用,此乃憲法第二十三條所明訂之精神。  

不過多數人或許沒有肖像權的問題,有問題的是,如果該肖像經由臉部辨識系統分析及資料探勘後,分析出具有潛在的危險份子可能存在,是否得做為國家拘束其人身自由或其他強制處分的理由不無疑義。  

相關規範固可參照我國刑事訴訟法第101條之1的預防性羈押制度,惟該制度允許法官作出預防羈押的裁量,除被告犯特定之罪並具有重大犯罪嫌疑,以及有羈押的必要外,還必須有足夠的事實可認為有反覆實施同一犯罪之虞者始得為之。  

依據系統辨識與資料探勘而來的犯罪事實到底能有多真實(至少不會100%真實),如果根據系統辨識資料探勘作為為實體判決,在此方面恐將爭議不休,如恣意將其入罪或讓其結果做為強制處分之依據,恐怕有不當擴大刑罰之疑疑,也違背了無罪推定原則,讓罪疑唯利被告等刑事政策方面的努力付諸東流。  

針對涉及肖像權保護的解決之道,還須依靠政府立法的方式。明確規定其能否做為證據條件,或是作為補強證據,以符合法律授權明確性的要求。  

其他重要的臉部辨識問題之影響因子,還包含眼鏡與頭髮等,此在辨識技術上亦須稍作修正才能適用,但因其優先順位較後,因此本文內不對此多作論述。

上一篇
以延遲鎖相迴路為基礎 超寬頻頻率合成器實現有譜
下一篇
車輛自動化程度增高 車載資通訊邁向整合化發展
這篇文章讓你覺得?
非常滿意 滿意 普通 不滿意 非常不滿意
相關文章
R&S BTC廣播電視測試系統獲DTG測試認可
意法半導體MEMS出貨突破五十億顆
是德USB功率感測器適於無線應用
搶攻物聯網大餅 ICT廠解決方案競出籠
強攻磁共振無線充電 半導體廠厚植FOD/LOD戰力

資源中心
802.11ac通訊技術解析
更多資源
主題俱樂部
傳輸介面特輯
研討會訊息
近期研討會
2014年11月5日 物聯網創新應用與系統設計實務(連續兩天)
精彩回顧
2014年8月13日 人機互動技術探究與設計實務
2014年7月22日 聯網汽車商機探究與設計實務
2014年7月9日 高速傳輸介面標準探究與系統設計實務
2014年5月6日 中功率無線充電商機探究暨設計實務
2013年12月5日 穿戴式應用與技術趨勢研討會
更多研討會
本期雜誌
縮減手機測試費用/時間
通用無線測試儀瘋模組架構

為協助行動裝置製造商縮減產品測試成本和時間,量測業者不僅強推非信令(Non-signaling)通用無線測試儀,簡化量產測試步驟,更大力借助模組化設計,降低儀器成本,讓非信令模組化通用無線測試儀快速走紅行動裝置產線測試市場。
詳全文
訂閱雜誌 本期目錄
RSS訂閱 | 關於新電子 | 廣告委刊 | 聯絡編輯部 | 聯絡發行部 | 隱私權政策
城邦文化事業股份有限公司版權所有、轉載必究.Copyright (c) 2014 Cite Publishing Ltd.