微軟擴大MAI模型版圖,補齊語音與影像能力
MAI系列模型重點介紹
微軟於近期宣佈推出多款自研AI模型,強化其MAI模型生態系統,並逐步補齊語音與影像能力,邁向多模態AI佈局。
- MAI-Voice-1:專注語音生成,僅需一張GPU與不到一秒鐘即可產生一分鐘音訊,強調高效能與成本效益。
- MAI-1-preview:作為核心語言模型,呈現Copilot未來產品的雛形,並已在LMArena平臺開放測試。
- MAI-Image-1:微軟首款完全自研的文生圖模型,首度亮相即以1096分排名LMArena文生圖榜第9名,強化其在影像生成領域的自主能力。
- MAI-Vision-1:多模態影像模型,支持文字與圖片輸入,可應用於Azure OpenAI平臺,提升多模態AI整合能力。
應用與市場策略
這些模型已整合至Bing Image Creator與Copilot Audio Expressions,並規劃擴展至歐盟市場,強調消費者導向與多模型協同應用,降低對OpenAI的依賴。
