20歲寫出Transformer的人,真開源了2180億大模型

20歲寫出Transformer的人,真開源了2180億大模型

模型發佈詳情

剛剛,Cohere 放出 2180 億參數的 MoE 大模型 Command A+,單張 B200 可運行,支援 48 種語言,並具備原生引用能力。

關鍵特點與許可證

這次發布最引人注目的,不在參數表上,而在許可證:採用 Apache 2.0 許可證,這是一個開放源碼的標準許可證,讓模型可以被廣泛使用與修改。

背景與人物

「20歲寫出 Transformer」的作者,指的是 Aidan Gomez,他是《Attention is All You Need》這篇開創性論文的最年輕作者,當時為多倫多大學的本科生,後進入 Google Brain 實習。

相關資訊與來源

來源:https://36kr.com/p/3820298133819778

返回頂端