在全球人工智能市场的竞争日益激烈的背景下,DeepSeek于21日发布了其最新的V3.1版本。此次更新引入了混合推理架构与智能体(Agent)能力的重大增强,为开发者和企业用户提供了更为强大的智能编程与信息处理功能。
V3.1版本的核心特点与提升
DeepSeek V3.1版本的核心亮点在于其卓越的编程能力和工具使用效率。根据官方公告,新模型经过后期优化,不仅在编程和搜索等智能体任务上表现优异,更是在多个基准测试中取得了出色的成绩。特别是在最近的Aider多语言编程基准测试中,DeepSeek V3.1的得分达到了71.6%,超越了包括Anthropic的Claude 4 Opus在内的多个知名人工智能模型。该模型的运行成本也极具竞争力,完成一次编程任务的费用仅为1.01美元,远低于一些闭源模型的价格,这使得DeepSeek在商业化应用方面的吸引力大大提升。
混合推理架构:引领智能体时代
DeepSeek在V3.1版本中采用的混合推理架构,标志着技术的一个重要进步。新模型支持思考模式与非思考模式的并行操作,这使其在处理复杂任务时更加灵活且高效。与早期版本DeepSeek-R1-0528相比,V3.1-Think在响应时间和任务完成速度上都有显著提升。这一架构的成功实施为未来的智能体应用奠定了基础,使其能够在更短时间内输出更加精准的答案。
强化编程与搜索能力
在编程与搜索能力方面,DeepSeek V3.1经过专门设计和优化,特别强化了其在代码修复(SWE)和命令行任务(Terminal-Bench)中的表现。第三方测试进一步证实了这些改进,模型在复杂的搜索测试(如
owsecomp)中也显示出优异的多步推理能力。这些技术进步表明,DeepSeek不仅能够加速软件开发周期,还能在复杂的数据处理、自动化测试等领域发挥重要作用。
开放策略与接口更新
继续推动开源战略,DeepSeek已在Hugging Face及其他社区上发布V3.1的基础模型及后训练模型。与以往模型不同,这一版本采用了UE8M0 FP8 Scale的参数精度,并对分词器和聊天流程进行了优化,开发者在部署时需要参考最新文档。除了上下文长度增加至128K外,DeepSeek还增强了工具调用的能力,支持严谨的函数调用模式,以确保输出结果的标准化。
为了降低开发者在生态迁移中的成本,DeepSeek还新增了对Anthropic API格式的兼容支持,从而帮助习惯使用Claude Code框架的开发者更容易地接入DeepSeek模型。这一努力不仅提升了的易用性,也为不同背景的开发者提供了更多选择。
商业化步伐加速:即将调整API定价
在技术与产品更新的同时,DeepSeek也在加速其商业化进程。公司在公告中指出,将于2025年9月6日起实施新的API定价方案,届时将取消一直以来实行的夜间优惠。这一措施被认为是DeepSeek在提升服务能力后,推动商业模式的重要一步。
根据即将生效的定价方案,API服务的定价结构将有所调整:缓存命中的输入费用为0.5元每百万tokens,缓存未命中的输入费用为4元每百万tokens,而输出服务费用将定为12元每百万tokens。这些变化旨在更好地满足用户需求,并因应公司API服务资源的扩容。
在新价格政策生效之前,用户仍然可以按照原定价进行API服务的调用。DeepSeek表示,此次调整是基于对市场需求和用户反馈的深入分析,旨在为用户提供更高效、更具性价比的服务。
深度学习技术的快速发展意味着AI行业的竞争正在变得愈发激烈。DeepSeek通过推出V3.1版本,成功在编程能力、智能体任务执行和用户接口兼容性等方面取得了显著突破,同时,加速商业化进程并调整API定价策略,展现出其在市场中的竞争优势。随着技术的不断进步,DeepSeek将继续推动AI在多个领域的应用,助力开发者与企业实现更高效的创新。