DeepSeek发布V4预览版:称推理与“代理”能力显著增强,部分采用华为芯片

中国人工智能初创公司DeepSeek在周五推出其最新大模型V4的预览版,引发市场关注。这一更新被用户长期期待,外界正准备检验其与OpenAI、Anthropic和谷歌等美国对手的差距。在中美AI竞逐加剧之际,DeepSeek的动向尤为引人注目。该公司去年因发布新品引发全球市场震动。 DeepSeek表示,V4属于其“开源”系列,包含Pro与Flash两个版本,在知识、推理以及“代理”能力(即模型自主完成复杂任务和工作流的能力)方面有显著改进。公司称,V4部分由华为芯片提供支持,从而降低对英伟达等美国芯片商的依赖。一些行业分析师此前预计,V4会在农历新年初亮相,比本次发布时间早两个多月。 在性能对比上,DeepSeek称其“V4 Pro Max”在标准推理基准上相对优于OpenAI的GPT-5.2和谷歌的Gemini 3.0-Pro,但相较GPT-5.4与Gemini
3.1-Pro仍“略有不及”。此次发布距OpenAI周四推出新模型GPT-5.5仅数小时。就“代理”能力而言,DeepSeek表示,V4 Pro在公司自评中可超过Anthropic的Claude Sonnet 4.5,并接近Claude Opus 4.5;V4 Flash在简单代理任务上与Pro表现相当,推理能力也十分接近。 在模型规格上,DeepSeek称V4 Pro与Flash均支持100万token上下文窗口,并以更高效率运行,相比之下,前代V3仅支持128,000 token。该公司还提供免费的网页与移动端聊天机器人。与Anthropic、谷歌和OpenAI的顶级模型不同,DeepSeek将其技术描述为“开源”,即允许开发者访问、修改并在其核心技术上进行构建。
V4是DeepSeek于2024年底发布的V3的继任者。但真正令市场意外的是该公司今年1月推出的专用“推理”模型R1。DeepSeek当时称R1相较OpenAI的同类模型在成本效益上更具优势,并被一些观察者视为中国在关键技术上追赶的象征。与此同时,Anthropic与OpenAI指控DeepSeek不公平地在其技术基础上进行构建。 华为周五在一份独立声明中表示,其昇腾芯片及相关技术与DeepSeek V4兼容。悉尼科技大学副教授Marina Zhang认为,V4的发布是中国AI产业的“关键里程碑”,尤其在全球竞赛加剧、力求在关键技术上实现更高自主的背景下。她还表示,这显示出在中美科技脱钩持续的情况下,脱离英伟达主导的算力生态进行运作在技术上具备可行性。Omdia首席分析师Lian Jye Su则指出,从基准结果看,DeepSeek V4“很可能对美国对手具有相当竞争力”。
微软今年1月的一份报告显示,DeepSeek在许多发展中国家的使用率正在上升,尤其在华为手机普及的市场中。然而,也有声音保持谨慎。晨星高级股票分析师Ivan Su表示,V4是一次“称职”的迭代,但突破性不及R1;自R1面世以来,国内竞争显著加剧。就与美国模型的对比而言,他指出,根据DeepSeek自身的评估,V4在大多数方面大体相当,但仍需要独立评测加以验证。 接下来,开发者与普通用户预计将对V4开展更广泛的测试,比较其在推理、执行任务与长上下文处理方面的实际表现。随着第三方基准与测评结果的公布,其相对实力与定位将更为清晰。
