國際產經:輝達開源全模態新模型,AI Agent落地效率最高提升9倍

【財訊快報/陳孟朔】輝達(Nvidia,美股代碼NVDA)週二宣布推出全新開源模型Nemotron 3 Nano Omni,主打原生全模態理解與高效推理,瞄準企業級AI智能體(AI Agent)落地需求。這款模型可整合語音、視覺、文字與推理能力,被輝達定位為面向代理式AI的生產級開放模型,號稱可協助AI智能體效率最高提升9倍,顯示輝達正從GPU算力供應商,進一步向模型平台、工具鏈與企業AI解決方案供應商延伸。
市場人士指出,Nemotron 3 Nano Omni的關鍵在於「一個模型」打通多種資料型態,而非傳統多模態系統以多個子模型拼接。該模型可同時處理文字、圖像、音訊與影片輸入,並在統一架構內完成理解與推理,適用於從影片、文件、語音紀錄與視覺文字中抽取資訊,進一步支援跨模態推理。架構上,Nemotron 3 Nano Omni延續Nemotron 3系列混合路線,結合Transformer與Mamba機制,並導入混合專家(MoE)設計,在維持能力擴展的同時降低推理成本。
分析師指出,這次發布真正瞄準的不是單純聊天機器人,而是能執行任務的企業AI智能體。Nemotron 3 Nano Omni支援長上下文、多步驟推理與工具調用,並引入GUI訓練資料,使AI可理解與操作軟體介面元素,應用場景包括自動化辦公流程、文件處理、軟體操作、客服支援與複雜企業工作流。富士康、Palantir、Aible、ASI、Eka Care、H Company與Pyler等公司已採用新模型,戴爾(Dell)、DocuSign、Infosys、K-Dense、Lila、甲骨文(Oracle)與Zefr則正在評估導入。
