随着人工智能技术的迅猛发展,阿里巴巴再次在AI领域引起了一次巨大的轰动。就在昨天,阿里旗下最新的深度研究Agent模型——通义DeepResearch正式开源,此举标志着阿里在人工智能研究能力上的又一个质的飞跃。

通义DeepResearch这款模型凭借其仅30B参数(激活3B)的强大性能,在多项权威评测基准上展现出其出色能力。有趣的是,这一模型在被誉为“人类的考试榜单”HLE(Humanity's Last Exam)上取得了最高分,超越了DeepSee-V3.1(29.8%)和OpenAI的DeepResearch(26.6%),成功夺得全球第一的位置。在OpenAI侧推出的超高难度BrowseComp榜单中,通义DeepResearch也以超高的准确率稳居开源榜单的顶部。
通义DeepResearch的开源不仅极大地推动了研究社区的不断创新,使得大量开发者可以通过Hugging Face或GitHub轻松获取这一新技术,也引发了广泛的关注与讨论。截止目前,通义DeepResearch在GitHub上的项目已经获得了大量的星标,是技术分享的典范。
通义DeepResearch不仅仅是一个普通的问答工具,其真正的进化在于它能以研究员的姿态自主处理更为复杂的问题。传统的AI模型多为“问答”式,而通义DeepResearch则摒弃了这一模式,开始自主规划研究路径,真正模拟人类专家的思维活动。对于一个复杂问题,它的处理步骤可以分为:深度搜索、多来源交叉、结构化归纳和报告生成。它能够提供一份来源可追溯、过程透明、有力的方案。
通过几个简单的示例,我们可以更直观地感受到通义DeepResearch的强大能力。比如,当用户询问关于房产销售情况时,通义DeepResearch能够拆解指令,联网抓取数据并确认无误后,准确给出答案。又如在法律领域,如果用户面临一个复杂的法律纠纷,通义DeepResearch能通过获取相关法条案例和学术观点,提供全面的法律解决方案。
这项技术的出色表现得益于通义DeepResearch团队在模型的核心构建以及训练策略上的深厚积累。该团队在不断的试错和探索中,构建了一套“智能体合成数据”体系,致力于通过机器生成数据来弥补稀缺的人工标注数据,进而提升训练效率和数据质量。
在技术细节上,通义DeepResearch引入了“增量预训练”的新概念,帮助模型掌握“使用知识”的能力。同时,团队还构建了基于知识图谱的“开放世界记忆”,集合海量知识文档与真实的思考轨迹,自动生成无数“问题-答案”对。这种从数据到智能体的全链路打造,为其后续的性能提升奠定了坚实的基础。
更为重要的是,通义DeepResearch还支持多种推理模式,以适应不同复杂度的任务。在标准任务中,模型使用传统的“ReAct”模式,实现高效的多轮次交互。对于长程复杂任务,模型则可以切换到“重构模式”,逐步提炼信息,保持高质量的推理能力。
阿里的通义DeepResearch开源项目不仅展现了强大的AI研究能力,也为全球的开发者提供了前所未有的机遇去构建自己专属的深度研究智能体。这一里程碑式的事件不仅是阿里人工智能研究领域的一大亮点,同时也为整个AI社区的未来发展铺平了道路。
通义DeepResearch正在不断推动着AI领域的创新和进步,为越来越多的行业带来了新的可能性。AI圈内的科研人员和开发者们可以期待,基于通义DeepResearch的更多应用和场景将会接踵而至,AI的应用与研究将迎来更广阔的未来。
