Nvidia釋出鎖定AI代理人的多模態模型Nemotron 3 Nano Omni
模型功能與效能
Nvidia週二(4/28)發布Nemotron 3 Nano Omni,這是一款鎖定AI代理人(AI Agent)設計的多模態模型,可在單一模型中同時處理影片、音訊、圖片與文字,在維持相同互動品質的條件下,處理效率最高可達同類開源模型的9倍。
技術架構與應用
該模型採用30B-A3B混合MoE設計,總共有300億參數,但每次推論僅啟動其中的30個專家(experts),有效降低計算負載,提升運算效率。
此模型將視覺、音訊與語言處理能力整合於單一系統,徹底解決過去AI代理必須在多個模型間切換所導致的延遲問題,並為企業級AI Agent提供更穩定與高效的運作基礎。
來源與資訊
iThome、NVIDIA官方部落格、Yahoo新聞 等媒體均有報導。
