20歲寫出Transformer的人,真開源了2180億大模型
模型發佈詳情
剛剛,Cohere 放出 2180 億參數的 MoE 大模型 Command A+,單張 B200 可運行,支援 48 種語言,並具備原生引用能力。
關鍵特點與許可證
這次發布最引人注目的,不在參數表上,而在許可證:採用 Apache 2.0 許可證,這是一個開放源碼的標準許可證,讓模型可以被廣泛使用與修改。
背景與人物
「20歲寫出 Transformer」的作者,指的是 Aidan Gomez,他是《Attention is All You Need》這篇開創性論文的最年輕作者,當時為多倫多大學的本科生,後進入 Google Brain 實習。
