視聽分離SOTA提速6倍,清華髮布首個6M高性能模型
模型突破與性能提升
Dolphin不僅是首個將參數量壓縮至6M級別(計入視覺編碼器)的兼顧高質量與高性能的AVSS模型,更在GPU推理速度上實現了相對於現有SOTA模型6倍以上的提升。
技術意義與應用前景
該模型在保持高質量音視頻分離能力的同時,大幅降低了計算能耗,突破了傳統高能耗模型的瓶頸,為實際場景中的實時應用提供了可行方案。
Dolphin不僅是首個將參數量壓縮至6M級別(計入視覺編碼器)的兼顧高質量與高性能的AVSS模型,更在GPU推理速度上實現了相對於現有SOTA模型6倍以上的提升。
該模型在保持高質量音視頻分離能力的同時,大幅降低了計算能耗,突破了傳統高能耗模型的瓶頸,為實際場景中的實時應用提供了可行方案。