DeepSeek热度飚升來认识创始人梁文锋

2025-01-28

DeepSeek备受全球关注。自中国人工智能公司深度求索（DeepSeek）本月20日发布了最新大语言模型DeepSeek-R1，市场相信发展AI毋须再投入大量成本，能以极低成本实现与OpenAI去年底才发布的最新模型“o1”同等性能。

根据香港《明报新闻网》，对于一款中国大模型来说，能够在美国力压ChatGPT，业界评论是历史性一刻。

DeepSeek去年底释出开源大型语言模型DeepSeek V3，到本月20公布DeepSeek-R1模型正式版。DeepSeek发布DeepSeek-V3时宣称，依靠2048颗英伟达晶片H800完成6710亿参数模型的训练，成本约560万美元（约2465万令吉），远低于其他模型的训练成本。

内地红星新闻报道，DeepSeek-R1的训练只调用了2000余块显卡，为期53天，总训练成本为558万美元（约4352万港元），不到其他世界顶级大模型一次训练成本的十分之一。

DeepSeek创始人梁文锋1985年生于广东吴川，曾以当地高考状元身分考入浙江大学，对人工智能兴趣浓厚，攻读硕士期间将技术应用在量化交易上，毕业后创立的“幻方量化”成为内地量化私募基金龙头。

2015年中证500股指期货上市，梁文锋紧贴潮流自立门户，立志将幻方量化打造为世界顶级量化对冲基金。2018年，幻方量化首次获内地私募证券领域最高奖项“私募金牛奖”，并确立以AI为发展方向。2023年DeepSeek正式成立，因训练成本极低而被称为“AI界的拼多多”。

梁文锋表示，目前阶段是技术创新的爆发期，并非应用的爆发期，最重要是参与全球创新的浪潮。

DeepSeek有将自家技术开源，与大众分享。梁文锋说，在颠复性的技术面前，闭源形成的护城河是短暂的。即使OpenAI闭源，也无法阻止被别人追赶。

根据中国红星新闻，DeepSeek团队成员约超过一半为95后，90后占比超过75%。梁文锋曾表示，公司员工都是一些高校的应届毕业生、没毕业的博四、博五实习生，还有一些毕业才几年的年轻人。

DeepSeek内部的团队氛围也较为宽松，梁文锋曾称团队中每一个成员可以无上限调用，并非常推崇扁平化（即减少管理层级）。

標籤