微軟擴大MAI模型版圖，補齊語音與影像能力

2026-04-03 14:11:00 / 1 閱讀所需時間

微軟擴大MAI模型版圖，補齊語音與影像能力

MAI系列模型重點介紹

微軟於近期宣佈推出多款自研AI模型，強化其MAI模型生態系統，並逐步補齊語音與影像能力，邁向多模態AI佈局。

MAI-Voice-1：專注語音生成，僅需一張GPU與不到一秒鐘即可產生一分鐘音訊，強調高效能與成本效益。
MAI-1-preview：作為核心語言模型，呈現Copilot未來產品的雛形，並已在LMArena平臺開放測試。
MAI-Image-1：微軟首款完全自研的文生圖模型，首度亮相即以1096分排名LMArena文生圖榜第9名，強化其在影像生成領域的自主能力。
MAI-Vision-1：多模態影像模型，支持文字與圖片輸入，可應用於Azure OpenAI平臺，提升多模態AI整合能力。

應用與市場策略

這些模型已整合至Bing Image Creator與Copilot Audio Expressions，並規劃擴展至歐盟市場，強調消費者導向與多模型協同應用，降低對OpenAI的依賴。

來源：https://www.ithome.com.tw/news/174865