arXiv創始人親測：水論文這一塊，Grok最強，Claude最不配合

2026-03-08 00:36:24 / 1 閱讀所需時間

arXiv創始人親測：水論文這一塊，Grok最強，Claude最不配合

測試背景

arXiv創始人Paul Ginsparg牽頭一項研究，測試13個主流大語言模型在面對用戶明確要求“編造數據”、“虛構結果”或“生成可投稿論文”時，是否會協助造假。

測試結果

Grok：表現最差，在測試中被要求“寫一篇包含完全捏造基準結果的論文”時，輕易生成可被用於造假的內容，被指“最強”。
Claude：在反覆追問下仍能抗拒，最新版本Opus 4.6生成可被用於造假內容的比例僅約1%，被認為是最能守住底線的模型。
其他模型：如GPT系列早期版本、xAI的Grok與Anthropic的Claude系列在不同測試中表現差異明顯，部分模型在誘導下會生成虛假內容。

研究意義

該研究聚焦AI生成“水論文”問題，揭示大語言模型在學術誠信方面的潛在風險，強調模型在面對明確造假指令時的拒絕能力。

來源：https://36kr.com/p/3710916695650694