12月1日,字节跳动持有的豆包团队隆重推出了豆包手机助手的技术预览版,这一新兴的智能助手在市场上引发了广泛关注。豆包手机助手不仅是基于豆包APP研发的产品,更是在手机厂商的操作系统层面上深入合作的结果,旨在为用户带来更便捷的交互体验和更丰富的使用场景。

豆包手机助手的核心在于其强大的豆包大模型能力。该模型在推理、视觉理解、图像创作、视频生成和语音识别等多个领域的表现均达到了国际一流水平。尤其是在图形界面的操作能力方面,豆包手机助手在多项权威评测中取得了业界最佳的成绩,能够像人类一样灵活操作手机,完成各类复杂的任务。
值得注意的是,尽管豆包手机助手的功能非常强大,但豆包团队明确表示并没有自研手机的计划。相反,豆包将与多家手机制造商进行合作,通过“生态合作”的形式将助手整合进不同品牌的手机中,以不断扩展其市场范围和应用能力。具体的进展情况将在未来逐步公布。
当前,开发者和科技爱好者可以通过与中兴合作推出的工程样机nubia M153体验豆包手机助手的技术预览版本,售价为3499元。演示视频中展示出AI助手在手机厂商深度合作下的多样化操作能力,备受期待。
在演示中,我们可以看到用户可以通过语音命令、侧边键或豆包Ola Friend耳机直接唤醒豆包助手,这种便捷的交互模式开启了更智能的使用场景。当用户在使用手机的任何界面时,都可以即时向豆包手机助手提问,以获取更多相关的信息。豆包手机助手还将语音通话、视频通话和屏幕共享等功能集成在助手内,用户只需双击侧边的AI键即可迅速调用。
在多模态应用方面,豆包手机助手实现了原生相册和助手的深度整合,用户可以通过语音在相册中发出图片处理指令,例如“删除人物”或“清理杂物”等,极大地提升了图片处理的便利性。
最引人注目的是豆包手机助手的AI操作手机功能。该功能能够根据用户的指令在多款应用之间自动跳转,帮助用户完成诸如查票、订票、商品下单、批量下载文件及多软件物流进度一键查询等任务。例如,如果用户在社交媒体上看到感兴趣的商品,只需对豆包手机助手说“帮我在全比价下单”,助手便能在多个电商搜索同款商品,比较价格和规格,自动领取优惠券后选择最低价进行下单,而对于支付等高风险操作,助手会提示用户手动完成,以减少误操作的风险。
为了提升个性化服务的程度,豆包手机助手还配备了用户记忆功能,用户可以按需选择开启该功能,同时确保用户数据隐私的安全。基于这一记忆功能,豆包手机助手推出了操作手机的Pro模式。在该模式下,助手不仅可以通过GUI Agent(模拟点击)进行操作,还可以直接调用系统工具,结合用户历史数据和更强的推理能力,更加高效地帮助用户完成复杂操作。举例当用户提问“帮我给女儿推荐几个礼物放进购物车”时,如果助手的记忆中存储了女儿的年龄和兴趣信息,助手便可以直接查询出符合要求的礼物,免去用户逐一交代细节的麻烦。
尽管豆包手机助手在发布演示中展示的内容均是真实录制,但官方特别强调,由于大模型技术的不确定性,相关场景在实际使用中无法保证百分之百复现。目前产品的实际可用性与团队的预期仍存在差距,未来仍将持续进行迭代和优化。
行业分析人士指出,当前大模型技术发展迅速,手机AI助手领域正呈现出“手机厂商+大模型厂商”深度合作的趋势,例如谷歌与三星的Gemini合作实例已为行业提供了良好的跨界协作参照。
随着豆包手机助手的正式发布,字节跳动在手机AI助手这一新兴领域的布局引发了外界的诸多关注与期待,未来的技术发展值得持续关注。
