OpenAI新模型Day0就被嫌棄，排名拉垮，不如一月底發佈的國產模型

2026-03-18 23:32:25 / 1 閱讀所需時間

OpenAI新模型Day0就被嫌棄，排名拉垮，不如一月底發佈的國產模型

模型評測結果顯示新模型表現不佳

根據公開的大語言模型評測基準Vals，今天新出的GPT-5.4 mini僅排行第13名，優於OpenAI半年前發布的GPT-5。然而，其表現仍被認為不夠出色。

國產模型Kimi 2.5表現亮眼

排行第12的是一月底發布的Kimi 2.5，其表現優於OpenAI最新模型，顯示國產大模型在技術發展上取得顯著進展。

技術與市場反應

Kimi K2.5因被全球開發者頻繁調用，導致Token消耗呈指數級激增，出現間歇性宕機，並因算力告急多次影響用戶體驗，反映其高使用頻率與技術壓力。

相關技術發展與展望

中國大模型創始人楊植麟在美國GTC首秀中公開Kimi技術路線圖，並指出深度學習2.0將迎來重大突破，顯示國產模型在未來發展中具備強大潛力。

來源：https://www.36kr.com/p/3728345370033029