視聽分離SOTA提速6倍，清華髮布首個6M高性能模型

模型突破與性能提升

Dolphin不僅是首個將參數量壓縮至6M級別（計入視覺編碼器）的兼顧高質量與高性能的AVSS模型，更在GPU推理速度上實現了相對於現有SOTA模型6倍以上的提升。

該模型在保持高質量音視頻分離能力的同時，大幅降低了計算能耗，突破了傳統高能耗模型的瓶頸，為實際場景中的實時應用提供了可行方案。