Technology & InnovationAI EnhancedSource: www.cnbc.com
AI竞赛加剧之际,DeepSeek发布V4大模型预览版
杭州初创公司DeepSeek周五推出备受期待的V4大语言模型预览版,向用户开放新能力测试,继续走开源路线。公司称V4在代理类任务、知识处理与推理方面对标国内竞品,并提供“pro”和“flash”两种版本。
China

在中国人工智能竞争提速之际,杭州的DeepSeek周五发布其久候的V4大语言模型预览版,向用户开放新功能与能力测试。 与此前的V3一样,最新升级版继续采用开源模式,开发者可下载代码、本地运行并进行修改。公司表示,DeepSeek‑V4相较国内竞品在代理类任务、知识处理与推理等方面表现强劲,并已针对常用代理工具进行了优化,其中包括Anthropic的Claude Code和OpenClaw。该模型按规模提供“pro”和“flash”两个版本。 成立于2023年的DeepSeek在2024年末凭借免费开源的V3受到关注,称其以更弱算力芯片、远低于OpenAI和Google等对手的成本完成训练。数周之后,即2025年1月,公司推出推理模型R1,在多项基准上达到相近水平或超过多款全球领先的大语言模型;尽管据称其开发成本远低于美国对手,R1凭借性能与效率在全球科技市场引发震动。
此次发布距R1已逾一年。其间,DeepSeek陆续推出多个版本升级,但影响力未及R1。V4预览版显示公司在开源路线和代理生态上的最新推进,同时也为开发者提供了新的测试入口。 DeepSeek面临的竞争也在加剧。中国AI行业快速扩张之下,阿里巴巴、字节跳动等公司今年相继发布新模型。业内将关注V4正式版的时间表与实际表现,以及它是否会进一步影响市场对AI基础设施投入规模的预期——此前,一个具全球竞争力的开源模型已引发相关讨论。
