OpenAI新模型Day0就被嫌棄,排名拉垮,不如一月底發佈的國產模型
模型評測結果顯示新模型表現不佳
根據公開的大語言模型評測基準Vals,今天新出的GPT-5.4 mini僅排行第13名,優於OpenAI半年前發布的GPT-5。然而,其表現仍被認為不夠出色。
國產模型Kimi 2.5表現亮眼
排行第12的是一月底發布的Kimi 2.5,其表現優於OpenAI最新模型,顯示國產大模型在技術發展上取得顯著進展。
技術與市場反應
Kimi K2.5因被全球開發者頻繁調用,導致Token消耗呈指數級激增,出現間歇性宕機,並因算力告急多次影響用戶體驗,反映其高使用頻率與技術壓力。
相關技術發展與展望
中國大模型創始人楊植麟在美國GTC首秀中公開Kimi技術路線圖,並指出深度學習2.0將迎來重大突破,顯示國產模型在未來發展中具備強大潛力。
