環球睿視執行長蘇育民:AI終端迎來自然語言互動新時代

AI終端裝置正迎來一場以自然語言為核心的互動革命。 隨著AI應用逐步從雲端服務走向終端裝置,語音逐漸成為最直覺、也最符合人類使用習慣的人機互動方式。然而,這場變革成功的關鍵,並不在於讓機器單純地「聽見」聲音,而在於AI是否具備「理解人類意圖」的能力。 環球睿視(Ubestream)執行長蘇育民指出,未來人類與機器的互動將不再受限於滑鼠、鍵盤或觸控介面,而是透過自然語言直接溝通。 環球睿視(Ubestream)執行長蘇育民表示,未來人類與機器的互動將擺脫滑鼠、鍵盤與觸控等傳統介面,轉而以自然語言進行更直接的溝通。   關鍵詞命中還不夠 精準理解意圖才是關鍵 這種轉變帶來了全新的技術挑戰:AI必須走出雲端機房,進入資源受限的邊緣(Edge)裝置,甚至晶片(Chip)中;唯有在終端真正解決「聽得懂人話」的難題,才能讓未來的AI,從被動工具,進化為能夠主動協助人類的智慧代理人。 在談論AI語音互動時,市場上往往將自然語言處理(NLP)與自然語言理解(NLU)混為一談。但這兩者在技術本質與應用場景上有著天壤之別。蘇育民進一步解釋,傳統的NLP技術擅長處理長篇文章,例如分析政治傾向、進行摘要或過濾敏感字詞。然而,當場景轉移到即時的人機語音互動時,AI面對的是充滿變數的短語。 「一句話的語氣抑揚頓挫,結尾是問號還是驚嘆號,都會徹底改變它的意圖。」蘇育民強調,在口語溝通中,單純依賴「關鍵詞命中(Keyword...
2026 年 02 月 26 日

強化透明化與可追溯性 XAI重塑人機協作信任基礎

當機器人逐漸深入交通、醫療與製造等關鍵場域,決策是否可信,成為不可忽視的核心問題。可解釋性人工智慧(XAI)正為黑盒系統帶來更多透明與理解的可能,並重新定義人類與機器人之間的信任與協作關係。 隨著可解釋性人工智慧(Explainable...
2026 年 01 月 15 日

預測性維護PdM成就數位轉型 感測器數據/資料解析加乘

為了提高一般製造業工廠的盈利能力,預防故障與支援除錯後迅速恢復的「設備維護」措施變得極其重要。而設備維護措施面臨的迫切議題包括:隨著工廠設備日益複雜化且規模化,導致設備維護技術越來越精細;以及隨著勞動人口減少而亟需節省勞動力等。 對此,以物聯網與感測技術及感測器數據為基礎的預測性維護(Predictive...
2025 年 08 月 14 日

三大需求引領技術演進 馬達應用生態系處處商機

便宜、耐操又省電,是馬達應用開發者與使用者對馬達不變的期待。因此,馬達產業在研發新一代馬達時,通常都是以成本、效率與可靠度的改良,作為最重要的三個設計目標。半導體、多物理模擬與人工智慧技術的進步,則是...
2024 年 12 月 11 日

先進成像結合AI技術 晶片缺陷檢測更精準

隨著半導體產業邁向下一代3D架構,業界對能讓良率在更短時間內達到量產水準的製程控制解決方案的需求日益增加。閘極全環(GAA)電晶體、極紫外光(EUV)微影和更小的記憶體裝置,對檢測技術提出了新的挑戰,因為檢測設備必須能檢測出埋在3D結構內的缺陷。而且,隨著關鍵尺寸縮小,這些缺陷的尺寸可能只有數奈米,甚至只有幾粒原子的厚度。 晶片製造商使用兩種工具來分辨和控制製造過程所產生的缺陷:先使用光學檢測來檢測晶圓上的潛在缺陷,再使用電子束檢查(eBeam...
2024 年 07 月 30 日

嵌入式AI應用持續成長 深度學習大顯神威(1)

深度學習可指導電腦以受人腦啟發的方式來處理資料,可以彈性滿足不同應用的需求。企業使用深度學習模型來分析資料,並在各種應用程式中進行預測,廣泛導入嵌入式AI系統中。 深度學習是人工智慧(AI)中的一種方法,可指導電腦以受人腦啟發的方式來處理資料。深度學習模型可識別圖片、文字、聲音和其他資料的複雜模式,藉此產生更準確的洞察和預測。使用者可以透過深度學習方法將通常需要人類智慧的任務自動化,例如描述影像或將聲音檔案轉錄為文字。  AI技術指的是開發人員試圖將電腦,訓練成能夠像人類一樣思考和學習的系統。深度學習技術驅動了許多日常產品中使用的AI應用程式,例如:數位助理、聲控電視遙控器、詐騙偵測、自動臉部辨識(圖1)。AI也是新興技術的關鍵組成部分,例如自動駕駛、虛擬實境等。  圖1 臉部辨識應用範例 深度學習模型是資料科學家經訓練後使用演算法,或一組預先定義步驟執行任務的電腦檔案。企業使用深度學習模型來分析資料,並在各種應用程式中進行預測。 深度學習在汽車、航太、製造、電子、醫學研究和其他領域中具有若干使用案例。深度學習應用包含自動駕駛汽車使用深度學習模型,自動偵測道路標示和行人。國防系統也使用深度學習,來自動標示衛星影像中感興趣的區域。而醫學影像分析使用深度學習來自動偵測癌細胞,以進行醫學診斷。工廠則使用深度學習應用程式,自動偵測人員或物件是否位於機器的不安全距離內。 深度學習五大應用 深度學習的應用主要可分為電腦視覺、語音辨識、自然語言處理(NLP),以及建議引擎五大類。 電腦視覺 電腦視覺是電腦從影像和影片中,擷取資訊和洞察的功能。電腦可以使用深度學習技術,進而以與人類相同的方式理解圖像。電腦視覺有多種應用,例如內容審核可自動從影像和影片封存中,移除不安全或不當的內容。臉部辨識可識別面部,並識別睜眼、眼鏡和面部毛髮等屬性。影像分類可以識別品牌標誌、服裝、安全裝備,和其他影像詳細資訊。 語音識別 儘管語音模式、音調、語氣、語言和口音不同,深度學習模型仍然可以分析人類語音。例如Amazon...
2024 年 06 月 18 日

嵌入式AI應用持續成長 深度學習大顯神威(2)

深度學習可指導電腦以受人腦啟發的方式來處理資料,可以彈性滿足不同應用的需求。企業使用深度學習模型來分析資料,並在各種應用程式中進行預測,廣泛導入嵌入式AI系統中。 機器學習背景下的深度學習 (承前文)深度學習是一種機器學習,深度學習演算法的出現是為了提高傳統的機器學習技術的效率。傳統的機器學習方法需要大量的人力來訓練軟體。例如,在動物影像識別中,使用者需要手動標記成千上萬的動物影像、讓機器學習演算法處理這些影像、在一組未知的影像上測試這些算法,接著確定某些結果不準確的原因,最後透過標記新影像來改善資料集,進而提高結果的準確性。 這個過程稱為監督學習。在監督學習中,只有當使用者擁有廣泛且多樣化的資料集時,結果準確性才會提高。例如,演算法可能會準確識別黑貓,而不是白貓,因為訓練資料集中的黑貓影像更多。在這種情況下,使用者將需要標記更多的白貓影像,然後再次訓練機器學習模型。 機器學習/深度學習各有優勢 有效處理非結構化資料  機器學習方法發現非結構化資料...
2024 年 06 月 18 日

嵌入式AI應用持續成長 深度學習大顯神威(3)

深度學習可指導電腦以受人腦啟發的方式來處理資料,可以彈性滿足不同應用的需求。企業使用深度學習模型來分析資料,並在各種應用程式中進行預測,廣泛導入嵌入式AI系統中。 深度學習的訓練 (承前文)深度學習的訓練(Training)可以分為三個步驟:定義網路架構(Define...
2024 年 06 月 18 日

整合嵌入式系統/神經網絡/邊緣運算 Easy Chat+為障礙者發聲(1)

無法有效表達自己的思想以及在與他人溝通方面的挑戰,已導致聽力損失和言語障礙者生活中的許多不便。透過整合嵌入式系統、神經網路和邊緣運算,團隊設計Easy Chat+替代人類言語和聽覺,為聽力和言語障礙者提供聲音。 聽覺及言語功能障礙者通常採用手語作為溝通手段,但他們收到的回應可能包括比手畫腳。然而並非每個人都精通手語,這可能導致誤解和溝通的困難。對於因手術而暫時不能說話或聽到聲音的患者來說,這一挑戰變得更為重要。因此,Easy...
2024 年 03 月 07 日

整合嵌入式系統/神經網絡/邊緣運算 Easy Chat+為障礙者發聲(2)

無法有效表達自己的思想以及在與他人溝通方面的挑戰,已導致聽力損失和言語障礙者生活中的許多不便。透過整合嵌入式系統、神經網路和邊緣運算,團隊設計Easy Chat+替代人類言語和聽覺,為聽力和言語障礙者提供聲音。 產品結構 系統運作 (承前文)Easy...
2024 年 03 月 07 日

整合嵌入式系統/神經網絡/邊緣運算 Easy Chat+為障礙者發聲(3)

無法有效表達自己的思想以及在與他人溝通方面的挑戰,已導致聽力損失和言語障礙者生活中的許多不便。透過整合嵌入式系統、神經網路和邊緣運算,團隊設計Easy Chat+替代人類言語和聽覺,為聽力和言語障礙者提供聲音。 測試方法 空中手寫與CNN模型 手勢 (承前文)使用Mediapipe進行手部節點識別,並定義四個手勢以利於空中書寫。 空中手寫操作 使用Mediapipe找出食指指尖位置,並記錄其位置移動軌跡。圖21為空中手寫操作流程圖,並展示全部使用之可能性,與其四大手勢使用方法,包括手寫、中斷、清除、儲存(表1)。 圖21 空中手寫操作流程圖...
2024 年 03 月 07 日

單視角2D影像深度資訊不漏接 平面影像重建3D立體視覺(1)

不同於3D雙目相機感測系統,單視角的深度估測(Monocular Depth Estimation)系統只需輸入由單視角(Single View)拍攝的平面RGB影像,就能估算出圖像(Image)中每個物件的深度資訊。具有多鏡頭(Shots)和多場景(Scenes)的2D視訊影片,也能應用單視角的線索(Cue)和偵測技術,獲得在2D視訊影像內每個物件的深度資訊。 深度測量挑戰 當3D機器視覺系統在測量場景深度時,必然會遇到對應匹配(Correspondence...
2023 年 10 月 16 日
1 2 3 ... 6