蘋果發佈VSSFlow模型：讓無聲視頻「開口說話」，加速為國行版AI鋪路？

模型背景與技術突破

蘋果聯合中國人民大學推出VSSFlow新型AI模型，宣佈在音頻生成技術取得突破。該模型採用10層架構設計，並引入「流匹配」技術，能夠從隨機噪聲中自主重構目標聲音信號。

VSSFlow模型可讓無聲視頻「開口說話」，實現音效與配音的同步生成，大幅提升視頻內容的沉浸感與表現力。此技術不僅展示蘋果在AI領域的實力，也預示其在國行版AI產品佈局上的深化。

該事件反映AI競賽下半場，國產大模型與國產算力正逐步合流，中國AI產業迎來換道提速。蘋果此舉被視為對全球AI生態的重要介入，也激發了本土企業在AI技術領域的更多探索。