單視角2D影像深度資訊不漏接 平面影像重建3D立體視覺(1)

不同於3D雙目相機感測系統,單視角的深度估測(Monocular Depth Estimation)系統只需輸入由單視角(Single View)拍攝的平面RGB影像,就能估算出圖像(Image)中每個物件的深度資訊。具有多鏡頭(Shots)和多場景(Scenes)的2D視訊影片,也能應用單視角的線索(Cue)和偵測技術,獲得在2D視訊影像內每個物件的深度資訊。 深度測量挑戰 當3D機器視覺系統在測量場景深度時,必然會遇到對應匹配(Correspondence...
2023 年 10 月 16 日

單視角2D影像深度資訊不漏接 平面影像重建3D立體視覺(2)

(承前文)不同於3D雙目相機感測系統,單視角的深度估測(Monocular Depth Estimation)系統只需輸入由單視角(Single View)拍攝的平面RGB影像,就能估算出圖像(Image)中每個物件的深度資訊。具有多鏡頭(Shots)和多場景(Scenes)的2D視訊影片,也能應用單視角的線索(Cue)和偵測技術,獲得在2D視訊影像內每個物件的深度資訊。 視訊分鏡偵測 由於視訊串流(Video...
2023 年 10 月 16 日

單視角2D影像深度資訊不漏接 平面影像重建3D立體視覺(3)

(承前文)不同於3D雙目相機感測系統,單視角的深度估測(Monocular Depth Estimation)系統只需輸入由單視角(Single View)拍攝的平面RGB影像,就能估算出圖像(Image)中每個物件的深度資訊。具有多鏡頭(Shots)和多場景(Scenes)的2D視訊影片,也能應用單視角的線索(Cue)和偵測技術,獲得在2D視訊影像內每個物件的深度資訊。 廣域的深度梯度 先辨別圖像的類型,然後才能算出廣域的深度梯度。有三種常見的圖像:風景照、直線透視圖、普通的前景聚焦照片,如圖6所示。就一張風景照而言,上方通常是天空,下方通常是地面或水系。利用HSI色彩空間的特性,可以使用式子(3)來判斷風景照中的像素(x,y)是否是天空、水或地面。其中,H(x,y)、S(x,y)、I(x,y)分別代表像素(x,y)的色調、飽和、亮度。符合((80<I(x,y)<255)&&(100...
2023 年 10 月 16 日

激盪AI創新應用 The Future AI論壇登場

科技部新竹科學工業園區管理局在科技部建構AI創新生態圈政策指導下,為促進我國人工智慧產業競爭力,與產學研界集思廣益尋找創新應用缺口,特委託台灣新竹科學園區產學訓協會於7月6日假新竹喜來登舉辦「The Future...
2018 年 07 月 06 日

布局邊緣運算 英特爾鎖定視覺應用

視覺應用商機潛力大,看好此一市場商機,半導體大廠英特爾(Intel)的邊緣運算布局戰略將先鎖定視覺應用,除了提供整合式繪圖晶片(Graphics)、Intel FPGA、Intel Movidius視覺處理器(VPU)等硬體外,近期更發布新款視覺推論與類神經網絡最佳化工具套件—OpenVINO,以加快網路邊緣環境開發各種高效能電腦視覺及深度學習推論(Inference)等應用。 英特爾透露,根據近期產業報告估計,2023年全球電腦視覺市場規模將成長到173.8億美元;視訊分析市場規模預估到2022年將成長至111.7億美元,而深度學習(Deep...
2018 年 06 月 13 日

人工智慧熱潮興 推升SoC記憶體測試需求

人工智慧(AI)將引發記憶體測試需求。AI發展持續升溫,深度學習(Deep learning)更是當中成長最為快速的領域,改變了電腦在現實世界中觀看、傾聽與認知事物的方式,並逐漸應用於智慧型手機、穿戴...
2017 年 01 月 06 日

高效能GPU助威 Deep Learning擴大應用範疇

深度學習(Deep Learning)技術將為生活帶來許多有趣的應用。半導體商NVIDIA利用本身繪圖處理器(GPU)的效能優勢,正加速推動深度學習技術的發展,並將之應用於圖像辨識、加速運算、自動駕駛等領域,至今已實現許多創新應用。例如中國微信(WeChat)所提供的一系列服務,即大量使用深度學習技術;這項技術也可應用於寵物的臉部辨識,用以記錄每隻寵物的飲食狀況,監控寵物健康。 微信首席技術顧問楊強表示,WeChat有一個完整的服務生態系統,加上這個通訊軟體在中國每天有六億個活躍用戶,每位使用者的性別、年齡、使用者間互相分享的資訊及使用服務的類型等,都可以成為機器學習的重要資訊來源。例如透過深度學習技術,可將使用者的數據加以分析,該應用軟體可依照用戶年齡或是時常造訪的網頁,判斷應該呈現的廣告是符合學生風格的碳酸飲料廣告,抑或是與高階白領階級相符的高級進口車廣告。 深度學習技術的應用不只在數據分析上,奇群科技聯合創辦人林志達表示,該公司研發出貓臉辨識功能,讓寵物貓站在餵食器前方時,系統可以自動判別該隻貓應該餵食的分量,並且監控、紀錄其飲食狀況。此應用較適用於有多隻貓的家庭,餵食器前方的影像感測器可以幫助主人清楚記錄每一隻貓的健康狀態。 另一方面,高通(Qualcomm)也利用先進的認知運算行為引擎,打造出在裝置上、即時的機器學習系統–...
2015 年 09 月 09 日