新電子雜誌 » 熱門新聞 » NVIDIA推論效能升級　聊天機器人更智慧

NVIDIA推論效能升級　聊天機器人更智慧

作者：廖專崇

2021 年 07 月 29 日

輝達(NVIDIA)推出第八代人工智慧(AI)軟體TensorRT 8，讓語言查詢的推論時間減半，並讓開發人員得以打造高效能搜尋引擎、廣告建議與聊天機器人，並能從雲端到邊緣提供相關服務。

TensorRT 8的優化只需要1.2毫秒就能在BERT-Large上達到破紀錄的語言應用速度，而BERT-Large是被廣泛使用的Transformer模型之一。企業以往只能縮小模型的大小，但也因此造成較低的精準度，如今有了TensorRT 8，企業可以把模型的大小擴增兩倍或三倍，並提升精準度。

除了Transformer的優化，TensorRT 8還透過另外兩個關鍵功能達成AI推論的突破。稀疏性(Sparsity)是NVIDIA Ampere架構GPU中用以提升效率的效能技術，可以讓開發人員藉由減少運算作業以加速神經網路。

量化感知訓練讓開發人員可以在不犧牲精準度的情況下，運用已訓練好的模型和INT8的精度運行推論，這讓他們在Tensor核心上進行高效率推論時，可以減少運算與儲存的時間。

各產業的廠商紛紛採用TensorRT打造對話式AI與各種領域的深度學習推論應用。Hugging Face是全球各產業的AI服務供應商所仰賴的開源AI企業，該公司與NVIDIA密切合作，以導入能大規模執行文字分析、神經搜尋與對話式應用的開創性AI服務。

而提供醫療技術、診斷學及數位解決方案的GE Healthcare亦使用TensorRT協助加速超音波的電腦視覺應用。超音波是疾病初期檢測的重要工具，此應用可以讓臨床醫師透過該公司的智慧醫療照護解決方案，提供高品質的照護服務。

標籤

近期研討會 More

2025-08-13 【立即搶位】8月13日 Ansys Taiwan Simulation World 用戶技術大會

白皮書

Cookie	Duration	Description
cookielawinfo-checkbox-analytics	11 months	This cookie is set by GDPR Cookie Consent plugin. The cookie is used to store the user consent for the cookies in the category "Analytics".
cookielawinfo-checkbox-functional	11 months	The cookie is set by GDPR cookie consent to record the user consent for the cookies in the category "Functional".
cookielawinfo-checkbox-necessary	11 months	This cookie is set by GDPR Cookie Consent plugin. The cookies is used to store the user consent for the cookies in the category "Necessary".
cookielawinfo-checkbox-others	11 months	This cookie is set by GDPR Cookie Consent plugin. The cookie is used to store the user consent for the cookies in the category "Other.
cookielawinfo-checkbox-performance	11 months	This cookie is set by GDPR Cookie Consent plugin. The cookie is used to store the user consent for the cookies in the category "Performance".
viewed_cookie_policy	11 months	The cookie is set by the GDPR Cookie Consent plugin and is used to store whether or not user has consented to the use of cookies. It does not store any personal data.

英飛凌12吋氮化鎵晶圓量產目標不變 價格肉搏戰更形白熱化

川普稅收大禮：35%抵免讓台積電在美經營無後顧之憂

聯發科開源AI語音辨識模型MR Breeze ASR 25 在地口音辨識更精準

聯電找Intel當靠山：兩個技術追趕者能彼此提攜嗎？

UiPath Platform代理型自動化平台加速企業導入AI

地區電信/企業專網同步推動 日本Local 5G一冷一熱

滿足HPC晶片設計需求 Ansys工具平台全力應援

輔助服務市場提升ROI 交易變現可望帶動企業儲能

川普稅收大禮：35%抵免讓台積電在美經營無後顧之憂

台灣儲能產業邁入新篇章 表後儲能後勢可期

智慧即時監控突破三大挑戰 AI/電動車可靠度難題迎刃解

災難時刻不斷線：民間社群發力 織造台灣在地Meshtastic通訊網

自動駕駛感測融合限制大 純視覺路線成本效益突出

SRAM微縮面臨瓶頸 SOT-MRAM技術可望接棒

掃碼領藥/AI螢幕互動 智慧運輸車解決偏鄉醫療痛點

車用影像感測需求多元化 2030年產值上看87億美元

2025年全球電視出貨量微幅衰退0.1% MiniLED機種進入爆發期

全球個人電腦供應鏈轉向東南亞 生產基地多元化應對關稅風險

手機SoC製程節點轉移加速 2nm競賽啟動、5/4nm邁入主流

TrendForce：AI強勁需求驅動 1Q25全球前十大IC設計廠營收季增6%

全球製藥市場擴增 洛克威爾自動化推動Pharma 4.0轉型策略

Nothing/Ceva攜手提升音訊產品聆聽體驗

Reflex Drive選擇英飛凌半導體提升無人機馬達控制效率

2025 Ansys Simulation World台灣用戶技術大會啟動 徵文大賽熱烈募集

艾邁斯歐司朗第六代紅外線晶片IR:6 提升臉部辨識與智慧感測效能

NVIDIA推論效能升級 聊天機器人更智慧

NVIDIA AI推論效能/能源效率均佳

資料中心競合新局 邊緣運算開啟軟體附加價值

NVIDIA發表A100 80GB GPU 建構下世代超級電腦

NVIDIA人工智慧技術MLPerf測試大獲全勝

安提國際發表NVIDIA Turing系列 加速精確繪圖運算

NVIDIA企業伺服器A30/A10 GPU 效能領先MLPerf

【立即探索 抽好禮】英飛凌一站式電池管理系統，全方位支援BMS設計

【重磅白皮書】免費下載！8位產業專家探討儀器儀錶在現代技術中的作用

【經典秘笈下載】電源監控器處理延長電池壽命並提高性能

【工程師必備收藏】SiC引領能源新革命: 高效儲能與轉換系統設計指南

【免費下載】解鎖未來智慧車關鍵議題！免費下載《AI智慧車與智慧座艙》白皮書

輔助服務市場提升ROI 交易變現可望帶動企業儲能

台灣儲能產業邁入新篇章 表後儲能後勢可期

超微執行長蘇姿丰：開放是超微一路走來的信念

Quobly共同創辦人暨執行長Maud Vinet：量子運算不是贏者全拿

英特爾散熱技術經理莊騏鴻：高功耗時代散熱技術的轉型路徑

地區電信/企業專網同步推動 日本Local 5G一冷一熱

全球製藥市場擴增 洛克威爾自動化推動Pharma 4.0轉型策略

Nothing/Ceva攜手提升音訊產品聆聽體驗

Reflex Drive選擇英飛凌半導體提升無人機馬達控制效率

智慧即時監控突破三大挑戰 AI/電動車可靠度難題迎刃解

地區電信/企業專網同步推動 日本Local 5G一冷一熱

智慧即時監控突破三大挑戰 AI/電動車可靠度難題迎刃解

英飛凌12吋氮化鎵晶圓量產目標不變 價格肉搏戰更形白熱化

輔助服務市場提升ROI 交易變現可望帶動企業儲能

川普稅收大禮：35%抵免讓台積電在美經營無後顧之憂

英飛凌12吋氮化鎵晶圓量產目標不變　價格肉搏戰更形白熱化

聯發科開源AI語音辨識模型MR Breeze ASR 25　在地口音辨識更精準

地區電信/企業專網同步推動　日本Local 5G一冷一熱

滿足HPC晶片設計需求　Ansys工具平台全力應援

輔助服務市場提升ROI　交易變現可望帶動企業儲能

台灣儲能產業邁入新篇章　表後儲能後勢可期

智慧即時監控突破三大挑戰　AI/電動車可靠度難題迎刃解

災難時刻不斷線：民間社群發力　織造台灣在地Meshtastic通訊網

自動駕駛感測融合限制大　純視覺路線成本效益突出

SRAM微縮面臨瓶頸　SOT-MRAM技術可望接棒

掃碼領藥/AI螢幕互動　智慧運輸車解決偏鄉醫療痛點

車用影像感測需求多元化　2030年產值上看87億美元

2025年全球電視出貨量微幅衰退0.1%　MiniLED機種進入爆發期

全球個人電腦供應鏈轉向東南亞　生產基地多元化應對關稅風險

手機SoC製程節點轉移加速　2nm競賽啟動、5/4nm邁入主流

TrendForce：AI強勁需求驅動　1Q25全球前十大IC設計廠營收季增6%

全球製藥市場擴增　洛克威爾自動化推動Pharma 4.0轉型策略

2025 Ansys Simulation World台灣用戶技術大會啟動　徵文大賽熱烈募集

艾邁斯歐司朗第六代紅外線晶片IR:6　提升臉部辨識與智慧感測效能

NVIDIA推論效能升級　聊天機器人更智慧

資料中心競合新局　邊緣運算開啟軟體附加價值

NVIDIA發表A100 80GB GPU　建構下世代超級電腦

安提國際發表NVIDIA Turing系列　加速精確繪圖運算

NVIDIA企業伺服器A30/A10 GPU　效能領先MLPerf

【立即探索抽好禮】英飛凌一站式電池管理系統，全方位支援BMS設計

輔助服務市場提升ROI　交易變現可望帶動企業儲能

台灣儲能產業邁入新篇章　表後儲能後勢可期

地區電信/企業專網同步推動　日本Local 5G一冷一熱

全球製藥市場擴增　洛克威爾自動化推動Pharma 4.0轉型策略

智慧即時監控突破三大挑戰　AI/電動車可靠度難題迎刃解

地區電信/企業專網同步推動　日本Local 5G一冷一熱

智慧即時監控突破三大挑戰　AI/電動車可靠度難題迎刃解

英飛凌12吋氮化鎵晶圓量產目標不變　價格肉搏戰更形白熱化

輔助服務市場提升ROI　交易變現可望帶動企業儲能