半导体研究机构 DeepSeek硬件投资逾5亿美元

行业动态

2025/02/04 21:42:21

  中国人工智能(AI)新创公司“深度求索”(DeepSeek),以仅约560万美元及使用2048颗英伟达“H800”绘图处理器(GPU),推出的新模型DeepSeek-R1,由于成本远低于美国科技巨头,引发全球市场关注。不过,半导体研究机构SemiAnalysis近日发布报告估计,DeepSeek历来的硬件投资支出,应远高于5亿美元。

  SemiAnalysis报告估计,DeepSeek使用5万颗英伟达Hopper架构GPU,包括1万颗“H800”、1万颗“H100”,还有特供中国的“H20”,这些GPU主要用于AI训练、研究及财务模型。换算下来,DeepSeek总资本支出约为16亿美元,其中营运成本估计有9.44亿美元,对GPU的投资额超过5亿美元。

  SemiAnalysis报告里提到,2023年5月,中国对冲基金“幻方量化”成立“深度求索”(DeepSeek),以推动AI技术研发,但早在2021年,幻方量化已在出口管制生效前,投资购买了1万颗英伟达A100 GPU。

  DeepSeek论文提到的近600万美元成本,是指预训练运行的GPU成本,只占部分的模型总成本,不代表完整支出。另外未计入的重要支出,还包括研发(R&D)、硬件总拥有成本等关键因素。

  同时,DeepSeek自中国本土招募人才,目前约有150名员工,也正急速扩张中。

  先前DeepSeek宣称,使用6710亿个参数进行训练的“V3”模型,仅用2048颗英伟达“H800”GPU、费时2个月训练完成,相当于280万个GPU小时。相较之下,Facebook母公司Meta Platforms使用4050亿个参数训练的“Llama 3”模型,其采用的超级电脑内建16384颗“H100”GPU、费时54天,等于后者花费的计算资源(3080万个GPU小时),是V3的11倍。

次阅读

分享到

精品推荐

相关资讯

大家都在搜

网友热议

    Copyright © 2012-现在 书生家电网, All Rights Reserved.

    会员登录

    分享到

    取 消