視聽分離SOTA提速6倍,清華髮布首個6M高性能模型

視聽分離SOTA提速6倍,清華髮布首個6M高性能模型

模型突破與性能提升

Dolphin不僅是首個將參數量壓縮至6M級別(計入視覺編碼器)的兼顧高質量與高性能的AVSS模型,更在GPU推理速度上實現了相對於現有SOTA模型6倍以上的提升。

技術意義與應用前景

該模型在保持高質量音視頻分離能力的同時,大幅降低了計算能耗,突破了傳統高能耗模型的瓶頸,為實際場景中的實時應用提供了可行方案。

資訊來源

36氪 – 視聽分離SOTA提速6倍,清華髮布首個6M高性能模型

來源:https://36kr.com/p/3681357950643840

返回頂端