2022年底以來,國內外醫院陸續試用ChatGPT協作病歷文件、加值醫療資訊系統。與此相對,Google在2023年7月公開其醫療專用大型語言模型Med-PaLM 2,在全球智慧醫院龍頭-美國梅奧診所(Mayo Clinic)自4月起展開測試。
梅奧將成Med-PaLM2商業化關鍵
除了具有提升Med-PaLM 2效能的潛力外,Google選擇與梅奧合作測試的另一關鍵,在於為AI產品打造通路。作為全球智慧醫院龍頭,梅奧在開發AI醫療應用上不遺餘力,2019年成立數據平台計畫,並在2020年推出全球首個以AI增進藥物研發的臨床數據分析平台。
該數據分析平台計畫將醫院長年累積的病歷、檢驗等資料數位化,如將病理檢驗的細胞玻片轉為數位病理影像,而後將病理影像資料標記以提供AI模型研發。2023年6月以色列新創Nucleai由該平台資料成功開發輔助病理檢驗AI產品。
此外,梅奧也透過投資新創如AI數據分析公司Nference,共同研發AI應用並商化。Nference更與梅奧合資成立Anumana,所開發應用在心電圖感測器的演算法已取得FDA許可,開始販售。
綜上,顯現梅奧在AI醫療應用從研發、驗證、落地,分別掌握資料、場域、通路及相關合作對象,而Google選中梅奧診所測試Med-PaLM 2,也有機會讓Med-PaLM 2衍生應用藉著梅奧數據平台,推廣至其他醫療機構。
醫學研究將是醫療大模型下一個應用
Med-PaLM 2在2023年3月Google Health發布以來,已在限定的Google雲端客戶進行測試,其中包括梅奧診所。而Med-PaLM 2技術文件指出,模型透過醫療健康相關資料微調,在醫療問答上有良好表現,且回覆品質通過專業醫師認可。
正在梅奧診所測試的Med-PaLM 2允許更多沒有程式撰寫背景的醫療人員,以對話方式提取、分析資料。儘管Med-PaLM 2還不可直接面對患者、一般大眾,但其在醫療資訊上的處理能力正應用於醫學研究,且在醫療問答的準確率、正確性上優於ChatGPT與GPT-4。
相較Med-PaLM 2與Med-PaLM皆是處理文本資料的單模態模型,Google於2023年7月底發表Med-PaLM M(Multimodal),該模型為多模態版的Med-PaLM,訓練資料在醫療問答集外,還包括放射報告、病理學、皮膚病學、胸部X光/乳房X光和基因組學等;其基礎模型是可以處理包括文本、影像資料的PaLM-E(Embodied)。
在Google發表的Med-PaLM M論文中,測試了Med-PaLM M可讀懂胸部X光影像,並產出放射報告內容,其中平均有40.5%內容可被臨床醫師採納。Med-PaLM M實現以同一個模型處理多種不同類型醫療資料,並學著像醫師般思考不同科別臨床數據、診斷結果的對應關係。
AI無法代替醫師進行診斷,但可一次處理比人類更大量的資料,尤其醫療大型語言模型已揭示在醫療資料上的理解與處理潛力。AI從單一科別的專家系統,發展到可處理「普遍」醫療健康問答、文件報告,隨著Google後續與梅奧外的其他醫療機構合作,並提出更多微調、精進醫療大型語言模型的方法,這類AI將可貢獻於處理更多元的醫學研究,並導入在醫療體系中。
台灣亦有發展中文醫療大模型的機會
Med-PaLM 2是由Google接近兆元級參數模型PaLM 2微調訓練而來,Med-PaLM的基礎模型PaLM亦有5,400億參數規模。這類大型語言模型運行在高規格算力資源的硬體,而台灣在2023年上半分別由國科會、華碩發展出自產大型語言模型TAIDE(70億參數)、Formosa(1,760億參數),兩者訓練過程都以繁體中文來強化。這兩大機構所訓練的中文大型語言模型,後續可能也有機會透過合作的醫院、AI醫療應用廠商等,微調訓練台灣醫療專用大模型。
醫療院所方面,台灣首先投入研發、測試醫療大模型為中國醫藥大學附設醫院,2023年7月底,與台灣微軟共同發表智海系統—全球第一個由中文建構的生成式語音AI醫療系統。
目前中國醫藥大學附設醫院或微軟還未對外發表智海系統所應用的醫療大型語言模型細節,而該系統使用微軟雲端平台Azure OpenAI的GPT-3系列模型、語音轉文字的Whisper模型,由醫院護理部收集100小時病患和護理師的真實對話,再請護理師整理中英內容逐字稿,做為系統AI訓練資料。智海正應用於草擬病歷報告、護理紀錄、會議記錄等,可處理中英文夾雜的內容。
智海是落地醫療場域端的生成式AI系統,並非醫療大模型本身,在中國醫藥大學附設醫院之外,其他積極研發AI應用的台灣醫院如北醫、台大、中榮等,將有機會在國內單位或國際大廠間選擇合作對象,並以其基礎模型訓練出台灣自產中文醫療大模型。
Goolge Med-PaLM 2展開實測 生成式AI進入醫療場域(1)
Goolge Med-PaLM 2展開實測 生成式AI進入醫療場域(2)