全球最大AI榜單塌房,52%高分答案全是胡扯,硅谷大廠集體造假?

全球最大AI榜單塌房,52%高分答案全是胡扯,硅谷大廠集體造假?

概述

根據 36氪 的報導,一個由 Surge AI 主導的 AI 榜單進行了多組投票評估。該團隊分析了約 500 組投票數據,結果顯示有 52% 的高分答案在事實上是錯誤的,對榜單的可靠性提出質疑。

研究對象與發現

研究聚焦於這些評分結果的有效性,顯示高分並不等於正確,這暴露出評分標準和數據標註流程的漏洞。

出品方與團隊背景

出品方 Surge AI 是一家美國數據標註公司,總部位於舊金山,成立於 2020 年,由 Edwin Chen 創立。

影響與後續討論

此結果引發全球科技界對 AI 榜單、評分機制與標註流程的再評估,並對硅谷大廠的公開形象帶來挑戰。

來源:https://www.36kr.com/p/3630579276317961

返回頂端