百度低调发布文心4.5与文心X1大模型,开启免费服务与技术新赛道

来源: 小世评选

近日,百度在没有举行发布会也未邀请CEO李彦宏的情况下,低调推出了两款重要的大模型——文心4.5与深度推理模型文心X1。这一举措标志着百度在生成式AI领域的持续努力,特别是在免费服务及技术创新的推动下,试图重塑其在AI行业中的竞争地位。

两年前,百度发布了文心一言,这一产品旨在与ChatGPT竞争,成为全球首个生成式AI产品。这一发布在行业内引起了不小的轰动,展示了百度对AI技术布局的野心。不过,随着时间的推移,文心一言的表现未能达到预期,其产品性能和收费策略未能吸引到足够用户,逐渐被后起者如豆包、Kimi等所超越。

根据行业反馈,DeepSeek的崛起使得百度重新审视自身的AI战略。百度决定取消文心一言的收费政策并承诺开源新一代模型。文心4.5于近期发布,并计划在6月30日起开源,标志着百度将再次向市场释放其技术实力。

文心4.5是百度在文心4.0基础上进行的一次重大发展。相比前一版本,文心4.5在多个基准测试中表现出色,特别是在文档图像问答能力的DocVQA测试中,显示出其超越GPT-4o的潜力。文心4.5支持文字、图片、音频和视频等多种模态的输入与理解,并且在功能上新增了对视频和语音的支持。

文心X1的推出则是百度在推理模型赛道上的一次全新尝试。尽管该模型的发布晚于OpenAI的o1六个月,但其支持多模态数据处理的特性和调用工具的能力,展示了其尝试在激烈竞争中争取份额的潜力。文心X1强调长思维链功能,尤其擅长中文问答与文学创作,其具体性能尚未与其他同类模型进行详细对比。

从定价策略来看,文心4.5的API定价为4元/百万tokens,输出为16元/百万tokens,相比文心4.0-Turbo的价格降低了78%。目前来看,这一价格仅为其他顶级模型的5%至20%之间,显示出百度在成本控制和市场竞争方面的决心。文心X1的输入和输出价格亦具有明显的优势。

在新模型的实际应用中,初步测试表明,文心X1在复杂问题的处理能力上尚有待提高。例如,在对数字比较的问题上,文心X1进行了较为复杂的思考,但DeepSeek则直接给出了解答和详细步骤,展现了其更强的逻辑处理能力。文心X1在生成公关声明等任务上的表现,虽有些亮眼,但仍显出较强的局限性。

对于文心4.5与文心X1的具体优势与劣势,业内人士提交了分歧的评价。一部分人认为百度的这两款新产品没有展示出令人惊艳的技术突破,甚至评论文心4.5像是个未完成的“半成品”。而在海外,知名投资机构的合伙人也对百度的动态表示了关注,强调美国AI企业应当更多地专注于创新,而非游说政策保护。

值得一提的是,百度为文心4.5与X1引入了多项技术优化,包括自研的FlashMask动态注意力掩码和多模态异构专家扩展技术等,显著提升了长序列模型的处理能力和训练效率。这些技术创新使得文心4.5在视频上传与理解能力上具备了一定的差异化优势。

展望未来,百度将持续推动文心系列模型的发展,计划在下半年推出文心5.0版。业界期待,百度是否能够通过技术创新在多模态和推理模型的融合中抢占先机,实现真正的突破。成功的关键在于百度能否在竞争日益激烈的AI市场中,加快技术创新和产品迭代的步伐,适应不断变化的用户需求。

相关阅读
精品推荐