国际

DeepSeek发布新版R1 能力接近美国顶尖模型

(北京30日综合电)中国人工智能起步公司深度求索(DeepSeek)发布热门推理模型R1的首次更新版本,声称新版R1模型深度思考能力得到强化,整体表现上已接近美国OpenAI和谷歌推出的顶尖模型。

DeepSeek周四晚上在官方微信公众号发文,DeepSeek R1模型已完成小版本升级,当前版本为DeepSeek-R1-0528。

Advertisement

文章指出,DeepSeek-R1-0528仍然使用去年12月所发布的DeepSeek V3 Base模型作为基座,在后训练过程中投入了更多算力,显着提升了模型的思维深度与推理能力。相比于旧版R1,新版模型在复杂推理任务中的表现有了显着提升。

文章特别提到,更新后的R1模型对“幻觉”问题(错误或误导性输出)进行了优化,在改写润色、总结摘要、阅读理解的场景中,幻觉率降低了45%至50%。其他方面的提升,包括更贴近人类偏好的创意写作,和更好的前端代码生成、角色扮演能力。

DeepSeek表示,更新后的R1模型在数学、编程与通用逻辑等多个基准测评中,取得当前中国“所有模型中首屈一指的成绩”,在整体表现上已接近OpenAI的o3和谷歌的Gemini-2.5-Pro的美国顶尖模型。

公司在蒸馏DeepSeek-R1-0528的思维链后,训练中国科技巨头阿里巴巴的Qwen3-8B基础模型,得到了DeepSeek-R1-0528-Qwen3-8B,在性能上比原版模型高出10%。

ADVERTISEMENT

DeepSeek指出:“我们相信,DeepSeek-R1-0528 的思维链对于学术界推理模型的研究和工业界针对小模型的开发都将具有重要意义。”

DeepSeek也将继续开源新版R1模型,允许用户利用模型输出、通过模型蒸馏等方式训练其他模型。

另外,路透社报道,今年1月发布的R1在全球引发热议,导致中国以外的科技股暴跌,挑战了“扩展人工智能需要巨大算力和投资”这一观点。阿里巴巴和腾讯在内中国科技巨头此后纷纷发布声称超越DeepSeek的模型。

报道说,DeepSeek的成功也颠复美国出口管制阻碍中国人工智能进步的看法,因为它以极低成本发布了与美国行业领先模型相当甚至更好的人工智能模型。

为了应对来自DeepSeek的竞争,谷歌的Gemini已推出折扣版本,OpenAI也降低了价格,并发布对算力要求更低的o3 Mini模型。

DeepSeek曾在3月发布V3大型语言模型的升级版。外界普遍预计DeepSeek将推出R1的后续版本R2,路透社3月曾引述消息人士的话说,R2最初计划在5月发布。

標籤
你也可能感兴趣...
Close