DeepSeek低成本骗人？研究机构：GPU支出逾5亿美元

2025-02-01

（纽约1日综合电）中国新创公司DeepSeek的模型成本引发质疑，并且造成股市震荡。研究机构SemiAnalysis在报告中指出，光是硬体绘图处理器（GPU）上的支出远超过5亿美元（22.31亿令吉）。

SemiAnalysis指出，中国对冲基金幻方量化（High-Flyer）在2023年5月成立推动AI技术研究。之前，幻方量化于2021年，也就是任何出口管制生效前投资购买1万颗辉达A100 GPU，光在投资上已超过5亿美元。

报告说，辉达根据法规要求生产了多款H100的变化版，比如H800、H20，仅有H20可销售予中国。辉达过去9个月来已生产超过100万颗专供中国市场的H20 GPU。分析显示，DeepSeek的伺服器总资本支出（CapEx）约16亿美元（71.38亿令吉）。

DeepSeek从中国本土招募人才，目前约有150名员工，仍在急速扩张。DeepSeek的价格和效能在本周因出现模型训练成本低于600万美元（2676万令吉）的说法引起讨论。报告强调，训练成本仅是总成本的一小部分，不代表完整支出。

DeepSeek论文中提到的600万美元成本是指预训练运行（pre-training run）时的GPU成本，是模型总成本的一部分，未算入重要支出包括研发、硬体总拥有成本的关键因素。

报道也提到，DeepSeek能获得大量算力资源与出口管制存在时间滞后（lag）有关。

美国智库兰德公司（RAND）研究人员海姆分析，硬体的出口管制存在时间滞后，目前尚未完全发挥影响力。真正的考虑将出现在数据中心需要升级或扩展时，这对美国企业较为容易，可是对出口管制的中国企业而言将是挑战。

標籤