主要以鳥鳴資料訓練的Perch 2.0模型跨域水下聲學,少量標註就能區分鯨豚聲音
模型背景與訓練資料
Google研究院與Google DeepMind合作研發的生物聲學基礎模型Perch 2.0,其訓練資料主要來自鳥類與其他陸域發聲動物,並未包含任何水下音訊或海洋哺乳類類別。
跨域應用與轉移學習
儘管訓練資料完全來自陸域動物聲音,Perch 2.0仍能將所學的聲學嵌入向量應用於水下錄音的分類任務。研究團隊透過「遷移學習」技術,讓模型能夠有效區分不同種類的鯨魚,甚至能辨識虎鯨的不同亞群。
技術意義與應用前景
此研究成果顯示,即使模型最初僅學習鳥類鳴叫,也能透過跨域遷移學習,成功應用於水下聲學任務,為海洋哺乳類聲音分類提供了一種高效且低成本的解決方案。
