鄭友德:AI記憶引發的版權危機及其化解

鄭友德:AI記憶引發的版權危機及其化解

引言

隨著大型語言模型(LLM)的發展,其記憶屬性引發了關於版權侵權的廣泛討論。鄭友德在相關研究中指出,LLM在訓練過程中會“記憶”大量文本內容,這種記憶機制可能構成對原始版權作品的間接複製,從而引發潛在的版權侵權風險。

AI記憶與版權侵權的關聯

LLM通過學習海量文本數據進行訓練,其內部記憶機制會存儲並再現這些數據中的語言模式。這種“記憶”並非單純的語義理解,而是對原始文本內容的深度內化,可能構成對受版權保護作品的實質性複製。

風險預防與化解路徑

  • 建立明確的訓練數據使用規範:在數據採集階段,應明確標註數據來源,並避免使用未經授權的受版權保護內容。
  • 引入“合理使用”原則的動態評估:針對不同應用場景,評估訓練數據是否符合“合理使用”標準,例如轉換性、目的性與替代性。
  • 推動立法與行業標準的建立:呼籲制定專門針對生成式AI的版權法規,以平衡技術創新與創作者權益。

案例參考

在湯森路透訴Ross案中,Ross主張其AI生成內容屬於“合理使用”,但法院最終需判斷其使用是否符合版權法中的合理使用標準。此案為AI生成內容的版權邊界提供了重要判例參考。

未來展望

隨著AI技術的演進,其記憶屬性將更加複雜,亟需建立跨學科的法律與技術框架,以系統性預防並化解版權危機。

來源:https://36kr.com/p/3668215613039494

返回頂端