多模態將創殺手級應用 LLM/SLM並肩向前

作者: 吳心予
2024 年 12 月 10 日

生成式人工智慧(GAI )的應用方向在2024年成型,除了ChatGPT的用戶數量快速成長,適合企業應用的客製化模型,以及用於終端裝置的小型語言模型(SLM)也嶄露頭角。參數更多的模型、多模態與AI代理人(AI Agent)的發展為市場帶來新的應用想像,AI除了生成文字,也能處理影片、圖片與音檔。也期望未來AI Agent帶來更直覺的人機互動,完整發揮生成式AI的潛能。

Arm應用工程總監徐達勇觀察,大型語言模型(LLM)是2024年火紅的題目之一,從ChatGPT、AI推論晶片與資料中心的發展,都積極支援多元的LLM應用。ChatGPT或是Llama的模型等,一直有新的模型出來,模型的參數(Parameter)越來越多,功能、準確度、效能都越來越好。生成式AI在2024年一整年,從硬體、軟體、整個生態系,都有不少廠商積極投入。包含運算單元、製程、介面到上層軟體的效能持續提升,應用也逐步深入垂直領域。

Arm應用工程總監徐達勇

大部分AI的訓練以雲端運算為主,不過生成式AI的推論工作走向邊緣端執行。例如Google在Gemini智慧手表內建瀏覽器,離線的時候也可以執行簡單的生成式AI功能。邊緣端的語言模型較小,支援單的內容搜尋。

小型語言模型主要應用於終端裝置,例如小型消費性產品與穿戴裝置。除了穿戴裝置,手機、PC等行動通訊裝置,已經具備處理大型語言模型的能力。日前Arm科技論壇展示的手機,可以執行Llama 3.2的10億參數。

多模態/AI Agent時勢所趨

展望生成式AI在2025年的趨勢,徐達勇認為LLM有三大趨勢,包含模型參數量增加、多模態(Multimodal Mod)模型創造殺手級應用,以及AI Agent將深入發展。首先,模型的參數量持續成長,目前語言模型的參數量現在已經從已從數十億、數百億增加至一兆以上,運算的效能與精準度隨之提高。針對終端應用的小型語言模型,發展重點則是如何在有限的模型尺寸與有限的硬體資源下提高精準度。

其次,多模態模型支援圖片生成文字、文字生成圖片,甚至影像生成文字、文字生成影像等應用,增加AI生成內容的多元性與方便性,未來將是殺手級應用。

而AI Agent不需要使用者下指令(Prompt)才回應,只需要為Agent設定目標。例如使用者想訂餐,只要問AI Agent:附近有什麼好吃的餐廳?Agent就可以自動找餐廳、訂餐,然後安排送餐,使用者在此期間不用再下任何的指令,即可自動完成目標。

不過市場對AI Agent的想像,不一定能在2025年實現。因為AI Agent的技術複雜度一定比單純由使用者下指令高很多,也需要更高的算力支援,並且將效率、耗能及上層軟體納入考量。也就是說,若要實現完整的AI Agent應用,需要花費一段時間,集結整個軟體框架與應用程式生態系的支援。

生成式AI的熱潮勢必從2024年延續到2025年,語言模型的參數量仍在成長,產業內也持續布局硬體運算設備,並積極健全軟體生態系,為AI廣泛落地應用鋪路。預期2025年除了更多垂直領域與邊緣運算的應用,AI Agent勢必降低生成式AI的使用門檻,並創造殺手級應用。

》想看更多內容?快來【免費加入會員】【登入會員】,享受更多閱讀文章的權限喔!
標籤
相關文章

軟硬體各提新解方 生成式AI突破運作成本挑戰

2023 年 12 月 11 日

PC生態系龍頭火力全開 AI PC來勢洶洶(1)

2024 年 01 月 04 日

算力/記憶體容量/低功耗技術缺一不可 GAI導入邊緣開發大顯神通(1)

2024 年 06 月 03 日

算力/記憶體容量/低功耗技術缺一不可 GAI導入邊緣開發大顯神通(2)

2024 年 06 月 03 日

算力/記憶體容量/低功耗技術缺一不可 GAI導入邊緣開發大顯神通(3)

2024 年 06 月 03 日

多模態/AI Agent多點開花 生成式AI生態系漸成型

2024 年 12 月 03 日
前一篇
Littelfuse擴充NanoT IP67級輕觸開關系列
下一篇
RAG整合工作流程 GAI走入嵌入式系統