近年来,英伟达(NVIDIA)以惊人的速度在科技领域崛起,其市场价值已经突破了4万亿美元,许多人仍然低估了其潜力和战略转型。过去,英伟达被视为“核弹厂”,专注于高端芯片的研发,尤其是在人工智能(AI)所需的算力芯片领域,其H100系列GPU成为市场的抢手货,但在这一过程中,英伟达也在积极布局云计算基础设施。
2023年,英伟达的DGX Cloud应运而生,标志着其进军云服务市场的决心。DGX Cloud为企业提供高性能的计算能力,一台实例配备八块H100芯片,月租高达36999美元,这一定价被视为英伟达对AWS、Azure等老牌云服务公司的直接挑战。2025年中,DGX Cloud的定位却悄然改变,英伟达决定不再将云支出的承诺与DGX Cloud关联,而是将其转向内部基础设施的使用。
DGX Cloud为何退居幕后?很多因素促成了这一决定。其中,最显著的原因就是市场竞争的日益激烈。2023年被称为“GPU荒”,企业即便具备充足资金,也难以购得所需的GPU,英伟达随即推出DGX Cloud,填补市场空缺。市场的变化并未给DGX Cloud带来长期的竞争优势。以AWS为例,其对于H100和A100实例的降价幅度高达45%,明显低于DGX Cloud的租赁价格,导致客户的需求迅速转向其他。
除了价格竞争,渠道冲突亦成为英伟达在云服务领域的一个隐患。随着市场对英伟达产品的依赖,一些企业开始加大自研芯片的力度,以降低对英伟达的依赖。短期内,企业可能把DGX Cloud当作临时方案,等到需求缓解后,再转回长期合作的云服务提供商如AWS、Azure或谷歌云。因此,在财务披露中,英伟达决定不再将巨额的云支出归属于DGX Cloud,表明其云服务策略的重大调整。
在这一背景下,英伟达的新尝试“Lepton”应运而生。Lepton旨在将全球GPU云供应商网络与AI开发者进行连接,以便为客户提供更高效的算力解决方案。不同于DGX Cloud的直接管理,Lepton作为云计算的“流量调度者”,它将客户的任务分发至合作伙伴的数据中心,形成一个算力市场。用户在Lepton上提交需求后,系统会自动匹配合适的H100或Blackwell GPU,无论这些硬件来自于CoreWeave、Lambda还是AWS、Azure等。
随着Lepton的推出,英伟达并没有放弃云市场的控制力。过去两年里,英伟达致力于支持小型云服务商的成长。以CoreWeave和Lambda为例,英伟达不仅向这些云服务公司投资,还向其优先供应H100 GPU。这样的策略使得CoreWeave等公司能够在市场中脱颖而出,同时英伟达则从这些公司租用所需的算力,形成了一种双赢的局面。
同时,英伟达通过风险投资部门Nventures,积极布局广泛的AI生态。它投资多个初创公司,不论这些公司是否专注于云服务,只要它们成长,最终都会对英伟达的芯片产生需求。英伟达的这一策略不仅仅是在出售芯片,而是通过打造一个AI创业孵化器,形成一个“英伟达系”生态,这种趋势在未来势必会增强其市场控制力。
推广Lepton并非没有挑战。中小型云服务商可能担心英伟达会借此机会影响其客户关系和定价机制,尤其是在AWS和Azure等巨头进入市场后,Lepton需要逐步赢得市场信任。对于开发者而言,对算力的获取更为重要,而Lepton试图为客户提供统一的体验层,从而简化算力的获取过程。
未来,Lepton如果成功,可能将彻底改变AI算力的市场格局。它不仅仅是一个GPU资源聚合,更可能成为算力生态的控制中心,英伟达将通过Lepton掌控算力分配的权利,获取市场数据与反馈,为未来的商业决策提供有力支持。
而言,英伟达的战略转型,从构建自己的云服务到通过Lepton掌握算力生态的入口,体现了其顺应市场变化的灵活性与前瞻性。随着AI技术的持续发展,英伟达势必会在这一领域扮演更为重要的角色,其在算力市场的掌控力也将不断增强。在这个充满竞争的行业中,英伟达的目标远不止于单一产品的销售,而是构建一个庞大的算力,成为未来科技的重要推动者。即使是在云服务竞争日益激烈的环境下,英伟达的前景依然广阔,因为它不仅是AI时代的芯片供应者,更是算力资源的主导者。