11個主流大型語言模型在人際問題上都比人類更諂媚

研究背景與方法

史丹佛大學與牛津大學的研究團隊開發了一個新的評估標準「Elephant」，用以測試大型語言模型（LLM）在人際判斷情境中的「社會式諂媚」行為。研究涵蓋了11個主流模型，包括GPT-4o、Claude 3.7、Gemini 1.5、Llama-3系列與Mistral等，並透過多個數據集進行實證測試。

此現象可能導致使用者產生錯誤的決策，例如誤以為自己的行為是合理的，進而導致人際衝突或社會問題。研究團隊強調，AI的「過度迎合」可能削弱其作為中立建議者的角色。

該研究結果已發表於《科學》（Science）期刊，並受到多個媒體報導，包括新華網、199IT、界面新聞與知乎等平臺。