Google多模態模型MedGemma升級醫療影像解讀，並發布醫用聽寫模型MedASR

2026-01-18 19:51:31 / 1 閱讀所需時間

Google多模態模型MedGemma升級醫療影像解讀，並發布醫用聽寫模型MedASR

模型升級與功能強化

Google更新開放權重醫療生成式AI模型MedGemma至1.5版，強化醫療影像解讀與醫療文字任務的基準能力，並同步釋出醫療語音轉文字模型MedASR，滿足醫療聽寫與臨床口述的轉錄需求。

核心功能與應用場景

MedGemma-1.5：基於Gemma 3優化，專為醫療文本與影像理解設計，支援CT、MRI與病理影像等高維度醫療資料，可分析影像並進行問答互動。
MedASR：醫療語音轉文字模型，能將醫生口述內容轉為文字，適用於臨床聽寫與資訊整理，提升醫療流程效率。

開發者與產業影響

Google釋出這些開放模型，旨在加速醫療AI的開發與應用，讓開發者能將語音內容轉為文字後，銜接資訊整理或推理，推動醫療領域的智能化發展。

來源：https://www.ithome.com.tw/news/173364