关于DeepSeek, 黄仁勋首度回应

英伟达将于2月26日公布其第四季度业绩。就在英伟达即将发布业绩之际,黄仁勋终于出来谈DeepSeek了!

据券商中国报道,黄仁勋表示,DeepSeek及其开源推理模型所带来的能量“令人无比兴奋”,但投资人“判断错误”,误以为这对英伟达及人工智能(AI)产业是不利的。它不仅不会终结AI计算需求,反而会扩大并加速市场对更高效AI模型的追求,从而推动整个行业的发展。

黄仁勋解释道,投资人所考虑的框架与现实不同。他表示,从投资人的角度而言,心智模型(mentalmodel)认为AI世界是“预训练”然后是“推理”,但事实并非如此。“我不知道这是谁的错,但显然这种思维方式是错的”。

黄仁勋表示,市场对DeepSeek的技术进步及其可能对芯片制造商的业务产生负面影响的判断是错误的。相反,黄仁勋称DeepSeek的R1开源推理模型“令人兴奋不已”。

黄仁勋表示,R1的发布本质上对人工智能市场有利,并将加速人工智能的采用,而这次发布意味着市场仍然需要计算资源——比如英伟达生产的资源。“这让每个人都注意到,模型的效率远超我们的想象,”黄仁勋说道,“因此,它正在不断扩大,并加速人工智能的普及。”

他还指出,尽管DeepSeek在预训练AI模型方面取得了进步,但后期训练仍然很重要,并且需要大量资源。

他进一步说明了正确的思维方式,指出“预训练是因为我们想要奠定基础,以便进行第二部分,即后训练”。他强调,后续训练将持续发挥重要作用,因为这个阶段是“学习解决问题”的过程。此外,黄仁勋提到第三扩展定律,即在回答问题之前,推理得越多,效果就越好。他强调,“推理本身是一个运算密集的过程”。

黄仁勋的言论发表之际,距离DeepSeek发布R1模型的开源版本已有近一个月的时间。该消息在整个人工智能市场掀起波澜,并对英伟达产生了较大冲击。

另据报道,2月21日,DeepSeek在社交平台X发文称,构建了一支探索AGI(通用人工智能)小团队,从下周起将开源5个代码库,以完全透明的方式分享研究进展。