发布低成本新AI系统引瞩目 中企DeepSeek或赶超OpenAI
![](https://webcdn.guangming.com.my/wp-content/uploads/2025/01/vzsbdxb.jpg)
(北京26日综合电)一家名为深度求索(DeepSeek)的中国小型初创公司发布了一个新的人工智能(AI)系统,标榜成本低廉,性能可与OpenAI和谷歌等公司的尖端聊天机器人比肩,引起了硅谷和《纽约时报》等多家西方媒体关注,硅谷形容DeepSeek为“来自东方的神秘力量”。另有经济学者认为,美国禁制AI晶片流入中国,却导致DeepSeek-V3诞生,质疑禁令无用。
杭州对冲基金兼AI公司幻方量化旗下公司DeepSeek上月发布全新AI模型DeepSeek-V3首个版本,引起全球科网界关注,卖点是其使用次级GPU(图形处理器),表现却足与全球一线AI语言模型媲美,包括OpenAI的ChatGPT-4o。
自从OpenAI 2022年发布了ChatGPT,引发AI热潮以来,许多专家和投资者曾得出结论认为,如果不投入数亿美元购买AI专用晶片的话,没有公司能与行业领军者竞争。
性能已超越美最好模型
CNBC报道,DeepSeek在去年底推出的免费开源大型语言模型,其制造成本不到600万美元(约2627万令吉)、使用的晶片也就是辉达功能较低的H800晶片,但在多项测试中,其性能已超越美国最好模型,也让美国在AI领域的领先地位遭到威胁。
据美国AI公司一直使用的行业基准测试,DeepSeek聊天机器人能回答问题、解决逻辑问题,并编写自己的电脑程序,其能力不亚于市场上已有的任何产品。
微软:对DeepSeek新模型印象深刻
微软首席执行员纳德拉表示,“看到DeepSeek的新模型,无论是在开源模型的表现,还是在推理过程中的计算效率,都令人印象相当深刻。我们应该非常认真看待来自中国的发展。”
长期为硅谷输出人才的斯坦福佛大学和Epoch AI的研究人员在2024年中发表一项研究表明,到2027年,最大型的模型的训练成本将超过10亿美元(约43.78亿令吉)。Gartner预测,谷歌、微软和AWS等超大规模企业到2028年止,仅在AI服务器上的支出就将高达5000亿美元(约2.19兆令吉)。
财经记者:美巨资效用令人怀疑
知名财经记者Zschaepitz上周六提到,DeepSeek以极低的价格建立了一个突破性的AI模型,而且没有使用尖端晶片,这让人们怀疑。该行业数千亿美元资本支出的效用。
一名自称Meta员工24日在匿名平台teamblind上的贴文在网络上疯传。他提到,Meta内部因为DeepSeek的模型,已经进入恐慌模式,“工程师们正在疯狂地剖析DeepSeek,并从中复制任何我们能得到的东西。我一点也不夸张。”不过,该文章并未获得官方出面回应。
主要为OpenAI、谷歌和Meta等主要AI参与者提供训练数据的Scale AI公司首席执行员Alexandr Wang上周五也在采访中表示,DeepSeek在他们的测试里是表现最好的,与美国最好的模型相当。
此前,Alexander Wang评价说,DeepSeek-V3是中国科技界带给美国的苦涩教训。“当美国休息时,中国(科技界)在工作,以更低的成本、更快的速度和更强的实力赶上。”
《纽约时报》指出,DeepSeek大模型的表现让人们对美国政府贸易限制的意外后果产生了质疑。美国的出口管制措施已迫使中国研究人员使用互联网上免费提供的各种工具来发挥创造力。
中官媒:DeepSeek成功证明 大模型创新无需最先进硬件
中国官媒发文称DeepSeek的成功证明,大模型创新不一定要依赖最先进的硬件,而是可以通过聪明的工程设计和高效的训练方法实现。
官媒《经济日报》星期日发表以《大模型身廋路更宽》为题的文章提出上述观点,指这种技术突破不仅降低了AI大模型的硬件门槛和能源消耗,更重要的是为AI技术普惠化铺平了道路。因为更小的模型意味着更低的部署成本、更快的响应速度和更广泛的应用场景。在医疗、教育、制造等诸多领域,轻量级AI模型都将带来革命性的转变。
DeepSeek的创始人梁文锋出生于1985年,17岁就读浙江大学,硕士研究生毕业后,在杭州创业。
360集团创始人周鸿祎曾点赞梁文锋,“另辟蹊径,做了前人没做过的事情。”
DeepSeek技术与前景严重被低估
周鸿祎在微博写道:“中国AI公司的创造力已经刹不住车了,DeepSeek这家公司最近的表现简直逆天。我相信将来如果要对抗美国的AI技术霸权,中国大模型技术复仇者联盟战队里,一定有DeepSeek一份。”
他说:“因为这家公司和它的创始人非常的低调,他们的技术能力和未来前景被市场严重低估了。更奇怪的是,DeepSeek在国内的媒体上很冷淡,很多人还老批评他们,反而是在国外的社交媒体上让外国人惊艳四座。”