国际
DeepSeek低成本骗人? 研究机构:GPU支出逾5亿美元
![](https://webcdn.guangming.com.my/wp-content/uploads/2025/02/khiuu..jpg)
(纽约1日综合电)中国新创公司DeepSeek的模型成本引发质疑,并且造成股市震荡。研究机构SemiAnalysis在报告中指出,光是硬体绘图处理器(GPU)上的支出远超过5亿美元(22.31亿令吉)。
SemiAnalysis指出,中国对冲基金幻方量化(High-Flyer)在2023年5月成立推动AI技术研究。之前,幻方量化于2021年,也就是任何出口管制生效前投资购买1万颗辉达A100 GPU,光在投资上已超过5亿美元。
Advertisement
报告说,辉达根据法规要求生产了多款H100的变化版,比如H800、H20,仅有H20可销售予中国。辉达过去9个月来已生产超过100万颗专供中国市场的H20 GPU。分析显示,DeepSeek的伺服器总资本支出(CapEx)约16亿美元(71.38亿令吉)。
DeepSeek从中国本土招募人才,目前约有150名员工,仍在急速扩张。DeepSeek的价格和效能在本周因出现模型训练成本低于600万美元(2676万令吉)的说法引起讨论。报告强调,训练成本仅是总成本的一小部分,不代表完整支出。
DeepSeek论文中提到的600万美元成本是指预训练运行(pre-training run)时的GPU成本,是模型总成本的一部分,未算入重要支出包括研发、硬体总拥有成本的关键因素。
报道也提到,DeepSeek能获得大量算力资源与出口管制存在时间滞后(lag)有关。
ADVERTISEMENT
美国智库兰德公司(RAND)研究人员海姆分析,硬体的出口管制存在时间滞后,目前尚未完全发挥影响力。真正的考虑将出现在数据中心需要升级或扩展时,这对美国企业较为容易,可是对出口管制的中国企业而言将是挑战。