A- A+

《大陸產業》DeepSeek-V4 沒擺脫輝達

時報新聞   2026/04/25 10:16

【時報-台北電】大陸AI開發商DeepSeek於24日推出新一代大語言模型DeepSeek-V4預覽版,官方稱其在評測中達到開源模型的最佳水準,性能比肩頂尖閉源模型,且大陸國產晶片廠商華為昇騰、天數智芯等皆已支持該模型。

 值得注意的是,據DeepSeek介紹,V4並不只在體系內做優化,還同時在輝達的GPU與昇騰NPU上完成驗證,使其推理路徑已經具備跨算力平台的適配能力。但在開源層面,當前釋放的仍主要是基於輝達CUDA的MegaMoE和DeepGEMM,底層實現深度綁定輝達工具鏈。

 此次公布的DeepSeek-V4分為「Pro」與「Flash」兩個版本。Pro版據稱使用體驗優於Claude Sonnet 4.5,接近Opus 4.6的非思考模式。Flash版則強調成本效益,雖在知識儲備上略低於Pro版,但推理能力相近,並提供更具價格競爭力的API服務。模型評測平台Arena.ai指出,Pro版V4在其代碼競技場中排名開源模型第3、綜合排名第14,並稱其為「相較V3.2的重大飛躍」。另一家平台Vals AI則指出,V4不僅以壓倒性優勢成為開源模型第一,更擊敗Gemini 3.1 Pro等頂尖閉源模型。

 技術方面,DeepSeek-V4採用自研DSA稀疏注意力機制,降低運算資源需求,具備百萬字上下文的能力。同時,模型針對Claude Code、OpenClaw等主流AI代理框架進行適配,提升程式碼與文件生成的準確性;DeepSeek並未披露訓練所使用的晶片型號,但強調已完成與華為昇騰晶片的適配。DeepSeek指出,隨昇騰950超節點於下半年量產後,服務價格將大幅下調。

 據CNBC報導,MorningStar分析師Ivan Su指出,V4難以複製R1當年的市場震撼,因為投資者早已瞭解大陸模型兼具競爭力與成本優勢。DeepSeek此次明確將其他大陸開源模型視為對手,該定位框架在R1時代並不存在。(新聞來源 : 工商時報一張全慶/綜合報導)

注目焦點

推薦排行

點閱排行

你的新聞