蘋果發佈VSSFlow模型:讓無聲視頻「開口說話」,加速為國行版AI鋪路?
模型背景與技術突破
蘋果聯合中國人民大學推出VSSFlow新型AI模型,宣佈在音頻生成技術取得突破。該模型採用10層架構設計,並引入「流匹配」技術,能夠從隨機噪聲中自主重構目標聲音信號。
技術應用與意義
VSSFlow模型可讓無聲視頻「開口說話」,實現音效與配音的同步生成,大幅提升視頻內容的沉浸感與表現力。此技術不僅展示蘋果在AI領域的實力,也預示其在國行版AI產品佈局上的深化。
行業影響與趨勢
該事件反映AI競賽下半場,國產大模型與國產算力正逐步合流,中國AI產業迎來換道提速。蘋果此舉被視為對全球AI生態的重要介入,也激發了本土企業在AI技術領域的更多探索。
