Google多模態模型MedGemma升級醫療影像解讀,並發布醫用聽寫模型MedASR
模型升級與功能強化
Google更新開放權重醫療生成式AI模型MedGemma至1.5版,強化醫療影像解讀與醫療文字任務的基準能力,並同步釋出醫療語音轉文字模型MedASR,滿足醫療聽寫與臨床口述的轉錄需求。
核心功能與應用場景
- MedGemma-1.5:基於Gemma 3優化,專為醫療文本與影像理解設計,支援CT、MRI與病理影像等高維度醫療資料,可分析影像並進行問答互動。
- MedASR:醫療語音轉文字模型,能將醫生口述內容轉為文字,適用於臨床聽寫與資訊整理,提升醫療流程效率。
開發者與產業影響
Google釋出這些開放模型,旨在加速醫療AI的開發與應用,讓開發者能將語音內容轉為文字後,銜接資訊整理或推理,推動醫療領域的智能化發展。
