国产DeepSeek R2大模型来袭,或将引发全球AI格局变革

来源: 小世评选

2022年11月30日,美国OpenAI正式发布了备受瞩目的ChatGPT 3.5版本,该模型以其出色的自然语言处理能力,引发了全球范围内的广泛关注。ChatGPT不仅能够进行流畅的多轮对话,还能高效地回答问题,生成编程代码、电子邮件、论文及小说等各类文本。在ChatGPT的迅速崛起之下,一位工程师甚至因此绕过了系统限制,利用AI制定了一份“毁灭人类”的计划,此事件引发了大量关于AI潜在威胁的讨论,凸显了人工智能技术的双刃剑特性。

随着ChatGPT在AI领域独占鳌头,许多国家,尤其是中国,开始对美国在人工智能方面的霸权感到深深的不安和无力。在此背景下,除了在算法及软件层面追赶美国的脚步,中国在硬件上也面临着极大的挑战。许多国内企业在运算能力上高度依赖于英伟达等美国企业提供的高性能芯片与服务器。2023年初,一款来自中国的划时代AI产品——深度求索DeepSeek的R1大模型将这一困境彻底打破。

DeepSeek R1的发布引发了美国AI行业的震动,NVIDIA的股价应声暴跌,甚至让美国感受到威胁。因此,美国开始对华为及DeepSeek采取各种措施,希望阻断其继续发展的势头,尤其是在对英伟达的合规芯片出口实施了多重限制后,寄希望于DeepSeek的技术进展能够因此停滞不前。

美国的这种阻挠策略并没有达到预期效果。最新消息显示,DeepSeek的R2大模型即将发布,这是DeepSeek团队在R1模型基础上的一次重大升级。根据透露的信息,R2将采用更为先进的混合专家模型(MoE),其总参数量将较R1大幅提升,预计达到1.2万亿参数,相较于R1的6710亿参数提升了约1倍。这样的规模与ChatGPT-4 Turbo以及谷歌Gemini 2.0 Pro相当,显示出其在技术上的大幅跃进。

更重要的是,DeepSeek R2将实现完全的自主可控和去NVIDIA化。此前,DeepSeek在R1训练中仍依赖于NVIDIA的显卡,而R2的训练全程将不再使用NVIDIA的硬件,而是基于华为的昇腾910B芯片集群进行运算。昇腾910B是一款高性能的AI芯片,具备强大的并行计算能力,不仅提升了训练效率,更大幅度降低了推理成本,相较于GPT-4,R2的推理单位成本将下降97.4%。

华为正计划推出其最新的昇腾910D芯片,并开始进入测试阶段。这款芯片针对高端AI计算,其性能预计将超越NVIDIA在2022年发布的热门AI训练芯片H100。黄仁勋对此也曾表示,华为已经成为NVIDIA在高端AI领域的重要竞争对手。DeepSeek R2在即将问世的背景下,确实让人期待国产AI产品在全球市场的冲击力。

整体来看,DeepSeek R2的推出将不仅是中国在AI领域追赶国际先进水平的一次突破,更是对全球人工智能格局的一次深远影响。伴随着技术的不懈进步,DeepSeek R2有望激发更多中国科技企业的潜力,助力国产AI技术崛起,从而形成新的竞争生态。

国产DeepSeek R2的问世,标志着中国在AI技术研发上的一次重要跨越。随着技术的不断进步与创新,中国有望在全球AI产业中占据更加重要的位置,从而重新定义全球AI格局。我们期待未来在这一领域中,国产AI能够大放异彩,为全球科技发展做出更大贡献。

相关阅读
精品推荐