DeepSeek或绕开辉达适配中国产GPU

2025-02-03

（北京3日综合电）中国媒体周一引述消息报道，中国初创企业深度求索（DeepSeek）研发大语言模型时据报绕过了美国人工智能巨头辉达的 CUDA 框架，为其在未来适配中国国产晶片做好准备。

由辉达开发的软硬体整合技术“统一计算架构”（Compute Unified Device Architecture，CUDA）是一种通用编程框架，允许开发者利用辉达的图形处理器（GPU）进行计算。

北京航空航天大学副教授黄雷受访指出，若DeepSeek真的绕过了CUDA，可直接根据GPU 的驱动函数做一些新开发，从而实现更细粒度的操作。分析指，CUDA会导致训练模型时损失一些灵活性，DeepSeek的做法相当于绕过硬件对训练速度的限制，意味其他模型需训练10天，DeepSeek只需5天。

由于CUDA大大降低了研发大模型的难度，因此全球大模型开发商都倾向选择使用辉达的 CUDA 技术，助力辉达占据全球人工智能领域的垄断地位。

然而，据美国科技网站 Tom’s Hardware 报道，韩国未来资产证券在对 DeepSeek 技术论文进行分析时发现，该模型的硬件效率之所以能比 Meta 等高出10倍，因为“他们从头开始重建了一切”。

分析指出，DeepSeek 使用辉达H800晶片进行训练时，使用了辉达的底层硬件指令PTX（Parallel Thread Execution）语言，而不是高级编程语言CUDA。

消息人士透露，DeepSeek拥有一些擅长写PTX语言的内部开发者，假如之后使用国产 GPU，其在硬件适配方面将更得心应手，只要了解这些硬件驱动提供的一些基本函数接口，就可以仿照辉达GPU硬件的编程接口去写相关代码，从而让自家大模型更容易适配国产硬件。

不过，这种编程非常复杂且难以维护，行业通用的做法是使用CUDA这类高级编程语言。

华为云与硅基流动发布推理服务

另据香港01报道，华为云1日宣布，大模型云服务平台硅基流动和华为云团队已上线基于华为云昇腾云服务的DeepSeek-V3以及DeepSeek-R1推理服务。

华为云表示，这次上线的推理服务有两个特点。一是得益于自研推理加速引擎加持，硅基流动和华为云昇腾云服务支持部署的DeepSeek模型，可获得持平全球高端GPU部署模型的效果。

其次是提供稳定及生产级服务能力，让模型能够在大规模生产环境中稳定运行，满足业务商用部署需求。华为云昇腾云服务可以提供澎湃、弹性、充足的算力。

消息一出，大量用户涌入使用。硅基流动创始人袁进辉在微信朋友圈表示，这波“全套国产”带来的巨大流量，远比团队想像中的大得多。在官宣上线服务的第10个小时开始，SiliconCloud只能限制流量。

標籤