環球睿視執行長蘇育民:AI終端迎來自然語言互動新時代

作者: 林宗輝
2026 年 02 月 26 日

AI終端裝置正迎來一場以自然語言為核心的互動革命。

隨著AI應用逐步從雲端服務走向終端裝置,語音逐漸成為最直覺、也最符合人類使用習慣的人機互動方式。然而,這場變革成功的關鍵,並不在於讓機器單純地「聽見」聲音,而在於AI是否具備「理解人類意圖」的能力。

環球睿視(Ubestream)執行長蘇育民指出,未來人類與機器的互動將不再受限於滑鼠、鍵盤或觸控介面,而是透過自然語言直接溝通。

環球睿視(Ubestream)執行長蘇育民表示,未來人類與機器的互動將擺脫滑鼠、鍵盤與觸控等傳統介面,轉而以自然語言進行更直接的溝通。

 

關鍵詞命中還不夠 精準理解意圖才是關鍵

這種轉變帶來了全新的技術挑戰:AI必須走出雲端機房,進入資源受限的邊緣(Edge)裝置,甚至晶片(Chip)中;唯有在終端真正解決「聽得懂人話」的難題,才能讓未來的AI,從被動工具,進化為能夠主動協助人類的智慧代理人。

在談論AI語音互動時,市場上往往將自然語言處理(NLP)與自然語言理解(NLU)混為一談。但這兩者在技術本質與應用場景上有著天壤之別。蘇育民進一步解釋,傳統的NLP技術擅長處理長篇文章,例如分析政治傾向、進行摘要或過濾敏感字詞。然而,當場景轉移到即時的人機語音互動時,AI面對的是充滿變數的短語。

「一句話的語氣抑揚頓挫,結尾是問號還是驚嘆號,都會徹底改變它的意圖。」蘇育民強調,在口語溝通中,單純依賴「關鍵詞命中(Keyword Spotting)」往往無法正確解讀使用者的真實需求。唯有做到NLU層級的「意圖理解(Intent Understanding)」,機器才能真正從「學人說話」進化到「聽懂人話」。

為了達成理解意圖的目的,主流的技術路徑是單純依賴深度學習(Deep Learning)。不過,深度學習雖然強大,但它本質上是個「黑盒子」,特性容易產生「幻覺(Hallucination)」,在醫療、自駕或高精準商務場景中,機率性的錯誤答案是無法被接受的。因此,環球睿視在演算法中結合了機器學習(Machine Learning)的精準度與模糊語意的彈性,確保AI在理解語意時既能保留對話的自然度,又能嚴格控制輸出的準確性,避免AI「亂講話」的風險。

輕量化AI模型 擺脫硬體算力依賴

不僅如此,為了滿足邊緣裝置應用要求,環球睿視將AI模型極致輕量化,使其能夠寫入低功耗的微控制器(MCU)中。這項突破意味著,未來的家電、玩具、穿戴裝置等終端設備,將能在「不連網」、「無GPU」的條件下,具備完整的自然語意理解與語音聲控能力。

蘇育民以人類口語溝通來比喻,語音(Voice)是用耳朵聆聽,而語意(Semantic)則是用大腦理解。該公司透過將語音與語意結合,並採用模組化設計,將語音轉文字(STT)、語意理解、文字轉語音(TTS)等功能拆解為可堆疊的積木,讓整套解決方案,可以快速根據不同的算力環境進行靈活的配置。這種跨越雲、邊、端的全棧式(Full Stack)佈局,正是該公司的技術護城河。

突破多語夾雜挑戰 進駐臺灣國門四大機場

面對Google、OpenAI等AI大廠,也積極挾大語言模型(LLM)技術優勢,在語音語意應用市場攻城掠地,蘇育民對於自家技術方案依舊信心滿滿,他分析,當AI語音應用進入真實世界的實體場域時,立刻面臨兩大挑戰:環境噪音與多語言夾雜混用。對於通用型大型語言模型而言,這往往是其效能驟降的盲區。

蘇育民以新加坡式英語(Singlish)為例,當地人在對話中常夾雜中文、方言、英語及特殊語助詞。在2025年亞太資通訊科技聯盟大賽(APICTA Awards)的實測中,針對包含12個詞的混用語句,環球睿視的引擎能精準抓取10個以上的詞彙,而ChatGPT或Google則因為無法辨識口音與混雜詞彙,導致後續翻譯失準。

這種針對亞洲特殊口音與語境的深度優化,以及多國語言即時轉譯能力,成為環球睿視在市場上的關鍵競爭優勢,不僅受到來自歐美日與東南亞等地業者的青睞,近期更獲得臺灣交通部觀光署採用,於松山、桃園、台中及小港等臺灣四大國際機場的旅客服務中心導入,讓櫃檯人員能夠透過低延遲的即時雙向翻譯,提升服務品質與效率。

突顯可信任AI定位 搶進非紅供應鏈

隨著地緣政治緊張,蘇育民指出,歐美與日本市場對資料流向極度敏感,企業與公共機構在導入AI語音服務時,對資安與合規的要求日益提高。而環球睿視是原生於臺灣的AI公司,是目前市場上,同時擁有可信任AI(Trustworthy AI)背景,又具備高品質中文語音處理能力的稀缺選項,可滿足市場對於高資安標準AI引擎的需求。

為加速商業擴展,環球睿視採取軟體即服務(SaaS)的模式,同時向一般用戶(B2C)和商業用戶(B2B)進行推廣。蘇育民以該公司主力方案AIspeakin說明,其定位不僅是一個應用程式(APP),更是一個嵌入式引擎,一般用戶可直接下載APP使用,而商業用戶則有較多元的合作方式。以終端裝置或晶片業者來說,環球睿視可做為「AI引擎」供應商,協助硬體夥伴將產品升級為具備AI翻譯或互動能力的智慧裝置。

在蘇育民眼中,人機介面正迎來典範轉移;而環球睿視將以可信任的語意語音AI引擎,結合台灣強大的硬體製造能量,讓真正聽得懂人話的AI,走向全球市場。

標籤
相關文章

AI口譯官發展史

2018 年 05 月 31 日

NLU成就智慧金融投顧

2018 年 12 月 15 日

產業需求紛湧現 AI鋒頭銳不可擋

2019 年 01 月 17 日

融合深度學習與自然語言生成技術 BI分析平台淘金更厲害

2017 年 12 月 11 日

機器學習邁向物聯網終端 神經網路加值MCU邊緣智慧

2020 年 08 月 17 日

強化透明化與可追溯性 XAI重塑人機協作信任基礎

2026 年 01 月 15 日
前一篇
張懋中博士獲頒2025年John Fritz Medal 表彰其對半導體與AI架構的貢獻
下一篇
太空算力戰開打 AMD已搶先拿下星鏈心臟