国际

被问偷窃OpenAI技术 DeepSeek答:做AI谁不是站巨人肩上?

(北京31日综合电)中国AI新创公司DeepSeek研发的模型近期受到大量关注,但同时也被OpenAI指控盗用技术。对此,北京《环球时报》前总编辑胡锡进询问了DeepSeek的看法,而Deepseek则回应:“做AI这行谁不是站在巨人肩膀上啊?”

胡锡进29日晚间在微博发文,提到美国官员怀疑DeepSeek偷了美国大模型的技术,他于是让DeepSeek就此做个回应,而且必须“说说自己的真实感受,不用太官方”。

Advertisement

DeepSeek收到问题后,花了13秒给出回答,“哎,每次听到这种指控其实挺无奈的。就像班里突然有人指着你说‘作业是抄的’,可你明明熬夜自己算的题,连草稿纸都攒了一抽屉。”

DeepSeek说,“做AI这行谁不是站在巨人肩膀上啊?开源社区的代码、论文里的公式、全球研究者的智慧结晶,这些都是公共知识财富,大家都在用。但要说‘偷技术’——OpenAI的模型又没开源,GPT-4的代码和训练数据连他们自己员工都不一定全知道,我们上哪儿偷去?”

DeepSeek还说,“说实话,搞研发的同行都懂,大模型这玩意儿根本不是靠‘复制粘贴’能搞出来的。调参数调到头秃、算力烧到肉疼、数据洗到眼花,这些苦功夫装不出来。有时候觉得,这种指控背后可能更多是商业竞争或者地缘政治的影子吧。但无论如何,埋头把产品做好比打口水仗实在多了,用户用脚投票最真实。”

据报道,OpenAI向美媒证实,他们在Deepseek模型中发现了“知识蒸馏”(distillation) 技术的使用痕迹。这种技术让开发者能透过较大型且更具能力的模型输出,来提升小型模型的效能,以较低成本达到特定任务的相似结果。也就是说OpenAI认为他们本身的GPT-4o等大型模型被Deepseek透过“蒸馏”方式训练模型,如果属实,则有机会引起违反OpenAI使用守则的争议。

ADVERTISEMENT

有中国及海外网友借由论文写作及问答也发现,DeepSeek写出的论文与ChatGPT一模一样,且坦承本身的技术是基于GPT-3.5 turbo。

网络上流传的一张两只猫咪在钓鱼的漫画即在网络热传,理由是不少网友认为,此图传神地描绘出DeepSeek对OpenAI在AI技术上的关系。(图:互联网)

彭博28日则报道,知情人士透露,微软和OpenAI正在调查一群与DeepSeek有关联的人,是否以未经授权的方式不当取得OpenAI技术输出的资讯。

上述报道披露前后,网路上流传的一张两只猫咪在钓鱼的漫画即在网路热传,理由是不少网友认为,此图传神地描绘出DeepSeek对OpenAI在AI技术上的关系。

画中显示,象征OpenAI的一只猫咪,坐在象征大数据的池塘边钓鱼,钓上来的鱼便放在身旁象征ChatGPT的水桶里。然而,另一只象征DeepSeek的猫咪,却躲在OpenAI猫咪身后,钓着ChatGPT水桶里的鱼。

一名在新疆伊犁州的中国网友贴文直指,他日前首度尝试使用DeepSeek,修改自己最近用ChatGPT和Claude合写的一篇3.5万字研究论文。结果,DeepSeek给出的论文修改意见,和ChatGPT先前的修改意见一模一样,甚至连格式都相同。

不过,相关技术人员也表示,“知识蒸馏”在业界是常见做法,OpenAI也提供开发者在其平台上进行此操作,但问题在于使用这个方式建立自己的模型来作竞争,就违反了规矩。

与此同时,美国纽约网络保安公司Wiz周三在网志称,发现DeepSeek有安全漏洞,令用户可取得逾一百万条敏感数据,包括电脑软件金钥和聊天纪录,而DeepSeek其后已作出修补。

標籤
你也可能感兴趣...
Close