OpenAI新模型Day0就被嫌棄,排名拉垮,不如一月底發佈的國產模型

OpenAI新模型Day0就被嫌棄,排名拉垮,不如一月底發佈的國產模型

模型評測結果顯示新模型表現不佳

根據公開的大語言模型評測基準Vals,今天新出的GPT-5.4 mini僅排行第13名,優於OpenAI半年前發布的GPT-5。然而,其表現仍被認為不夠出色。

國產模型Kimi 2.5表現亮眼

排行第12的是一月底發布的Kimi 2.5,其表現優於OpenAI最新模型,顯示國產大模型在技術發展上取得顯著進展。

技術與市場反應

Kimi K2.5因被全球開發者頻繁調用,導致Token消耗呈指數級激增,出現間歇性宕機,並因算力告急多次影響用戶體驗,反映其高使用頻率與技術壓力。

相關技術發展與展望

中國大模型創始人楊植麟在美國GTC首秀中公開Kimi技術路線圖,並指出深度學習2.0將迎來重大突破,顯示國產模型在未來發展中具備強大潛力。

來源:https://www.36kr.com/p/3728345370033029

返回頂端