AI浪潮下的音訊技術革命與創新應用特別報導

聽覺體驗邁入全新境界 AI/LE Audio玩轉音訊新可能(2)

作者: 范語瑄
2024 年 05 月 28 日

耳機、智慧音箱等音訊裝置正逐漸成為日常生活中的必需品,使用者對於音訊品質和多元功能的要求也隨之提高。音訊技術持續向前,除了優化既有聆聽體驗,也將透過新興技術找到全新應用,未來發展不可限量。

功耗/延遲同步降低 LE Audio實現多點傳輸

(承前文)提到音訊傳輸,藍牙自然是必不可少的元素,而近期藍牙音訊正處於從經典音訊(Classic Audio)朝低功耗音訊(LE Audio)演進的過程,在裝置中可以看到LE Audio的採用率持續上升。恩智浦半導體應用工程部經理江梓宏(圖4)表示,從2022年起,陸續出現具備LE Audio的手機等裝置,而恩智浦在開發晶片產品時,也曾使用Google Pixel手機進行測試,運作基本沒有什麼問題。

圖4 恩智浦半導體應用工程部經理江梓宏表示,Classic Audio採用SBC編碼,延遲較高(150~300ms),而LE Audio改採LC3編碼,延遲大幅降低(30~40ms)

LE Audio的大規模採用似乎只是時間問題,尤其新世代音訊標準帶來優化性能,為藍牙音訊換代創造誘因。江梓宏指出,Classic Audio採用SBC編碼,延遲較高(150~300ms),而LE Audio改採LC3編碼,延遲大幅降低(30~40ms)。此外,LE Audio也進一步降低功耗,並在使用一半的位元速率(Half Bitrate)時,可實現更佳的音訊品質。

除了音訊傳輸性能提升,LE Audio同時具備多點音訊串流/分享功能,開啟全新使用案例。江梓宏表示,過往Classic Audio以一對一(Point to Point)音訊傳輸實現手機對耳機、手機對藍牙喇叭等應用,而LE Audio則藉由多點音訊串流和音訊分享及廣播功能,創造實用的應用情境(圖5)。

圖5 Classic/LE Audio音訊傳輸方式 (圖片來源:恩智浦)

江梓宏進一步說明,LE Audio的多點音訊串流/分享功能分為單播(Unicast)的CIS(Connected Isochronous Streams),以及廣播(Broadcast)的BIS(Broadcast Isochronous Streams)。CIS可進行雙向或單向音訊串流,並且因為為單播,可進行配置(Configuration),例如恩智浦晶片便透過一個發射器來實現五個單播串流,能夠在家庭劇院等應用中,對不同裝置進行音訊串流;BIS則僅進行單向音訊串流,並且在封包送出後不做後續處理,例如恩智浦晶片也可藉由廣播技術,提供多種語言的音訊廣播,適合導覽機應用。

AI語音辨識應用多元 智慧互動潛力無窮

音訊處理和傳輸技術為串流體驗奠定基礎,有了相應技術之後,業界開始探索語音在各種音訊串流應用的發展可能,而智慧裝置數量逐年成長,結合AI技術進行語音互動,成為音訊技術持續關注的應用領域。

中央大學資訊工程系特聘教授暨創新AI研究中心主任王家慶(圖6)表示,語音是最自然的溝通方式,也是不論螢幕大小,唯一能夠在各種智慧裝置上進行互動的介面。王家慶說明,語音辨識系統最初從1952年貝爾實驗室研究員所設計的Audrey開始,一直到2011年的iPhone Siri,才開始漸漸成為能夠與消費者進行接觸的產品,而2015年的Alexa更是劃時代的進步,打造出真正具備採用誘因的產品應用。此後,Google的Home、蘋果的HomePod、微軟的Cortana及三星的Bixby等產品接續推出,帶起語音互動熱潮,證明語音互動在真實生活中的應用潛力。

圖6 中央大學資訊工程系特聘教授暨創新AI研究中心主任王家慶表示,語音是不論螢幕大小,唯一能夠在各種智慧裝置上進行互動的介面

然而,要實現與人類無異的自然互動,現階段仍面臨諸多挑戰。相較於傳統判別式AI,近期興起的生成式AI有機會使裝置更加聰明,升級互動體驗。王家慶認為,與前述智慧音箱的語音互動相比,下世代AI語音介面具有以下三大趨勢:多模態互動、有情感的互動、大型語言模型(LLM)的導入。新的趨勢將延伸出各式應用,王家慶表示,他們此前便成功開發出國內第一套國台語混合語音辨識系統,可用來操控家電裝置,2023年更以客家語語音辨識參加客委會2023客語語音辨認競賽,獲得學生組客語漢字組第一名,可將客語(語音)轉為華語(文字)。

需求/技術齊驅動 音訊應用百花齊放

俗話說,由奢入儉難,高品質的音訊也具有「聽過就回不去」的特性,隨著空間音訊應用普及,為越來越多使用者提供沉浸式體驗,預期整個空間音訊市場穩步成長。

此外,現在可以看到人們在各種場所配戴耳機,代表音訊處理技術需要能夠靈活適應不同的環境及需求,降噪演算法的多元性因此變得更加重要。除了使用需求的轉變,藍牙LE Audio和生成式AI等新興技術,也將為音訊應用帶來全新可能,未來發展值得期待。

聽覺體驗邁入全新境界 AI/LE Audio玩轉音訊新可能(1)

聽覺體驗邁入全新境界 AI/LE Audio玩轉音訊新可能(2)

》想看更多內容?快來【免費加入會員】【登入會員】,享受更多閱讀文章的權限喔!