里程碑時刻，100B擴散語言模型跑出892 Tokens /秒，AI的另一條路走通了

LLaDA2.1完成擴散語言模型的「成人禮」

而這一次，LLaDA2.1 幾乎憑一己之力完成了擴散語言模型的「成人禮」——892 Tokens / 秒的峰值速度讓理論上的效率優勢第一次照進現實。

LLaDA2.1 搭載邊生成邊糾錯的機制，打破了「生成後才編輯」的傳統模式，實現了更高效、更精準的語言生成流程。

被長期視為學術玩具的擴散語言模型，直接在複雜編程任務中飆出了892 tokens/秒的速度！你沒看錯，當主流大模型還在以幾十token的速度逐字蹦詞時，這個非主流架構已展現出顯著優勢。

這一突破標誌著擴散語言模型從理論走向實際應用，為AI在編程、內容創作等領域的落地提供了新路徑，也預示著AI技術發展將呈現多元化路線。