DeepSeek热度飚升 來认识创始人梁文锋
![](https://webcdn.guangming.com.my/wp-content/uploads/2025/01/zsvdbn.jpg)
DeepSeek备受全球关注。自中国人工智能公司深度求索(DeepSeek)本月20日发布了最新大语言模型DeepSeek-R1,市场相信发展AI毋须再投入大量成本,能以极低成本实现与OpenAI去年底才发布的最新模型“o1”同等性能。
根据香港《明报新闻网》,对于一款中国大模型来说,能够在美国力压ChatGPT,业界评论是历史性一刻。
DeepSeek去年底释出开源大型语言模型DeepSeek V3,到本月20公布DeepSeek-R1模型正式版。DeepSeek发布DeepSeek-V3时宣称,依靠2048颗英伟达晶片H800完成6710亿参数模型的训练,成本约560万美元(约2465万令吉),远低于其他模型的训练成本。
内地红星新闻报道,DeepSeek-R1的训练只调用了2000余块显卡,为期53天,总训练成本为558万美元(约4352万港元),不到其他世界顶级大模型一次训练成本的十分之一。
DeepSeek创始人梁文锋1985年生于广东吴川,曾以当地高考状元身分考入浙江大学,对人工智能兴趣浓厚,攻读硕士期间将技术应用在量化交易上,毕业后创立的“幻方量化”成为内地量化私募基金龙头。
2015年中证500股指期货上市,梁文锋紧贴潮流自立门户,立志将幻方量化打造为世界顶级量化对冲基金。2018年,幻方量化首次获内地私募证券领域最高奖项“私募金牛奖”,并确立以AI为发展方向。2023年DeepSeek正式成立,因训练成本极低而被称为“AI界的拼多多”。
梁文锋表示,目前阶段是技术创新的爆发期,并非应用的爆发期,最重要是参与全球创新的浪潮。
DeepSeek有将自家技术开源,与大众分享。梁文锋说,在颠复性的技术面前,闭源形成的护城河是短暂的。即使OpenAI闭源,也无法阻止被别人追赶。
根据中国红星新闻,DeepSeek团队成员约超过一半为95后,90后占比超过75%。梁文锋曾表示,公司员工都是一些高校的应届毕业生、没毕业的博四、博五实习生,还有一些毕业才几年的年轻人。
DeepSeek内部的团队氛围也较为宽松,梁文锋曾称团队中每一个成员可以无上限调用,并非常推崇扁平化(即减少管理层级)。