12月以来,豆包手机助手成为科技圈最为关注的热点话题。1日惊艳发布、2日手机“一机难求”、3日微信异常退出后引发权限争议、4日5日陆续遭第三方产品限制登录……各路人马围绕这款AI手机助手的功能、安全性以及其蕴含的可能改变现有互联网商业模式的力量争论不休。
继12月1日开始至今,已经过去了10天。当最猛烈的风波过后,这款搭载了豆包手机助手的豆包中兴合作工程样机nubia M153(以下简称“豆包手机”)还能否保有其最初宣发时的功能?在科技逻辑、安全逻辑与商业逻辑一周的摩擦碰撞下,豆包手机目前守住了哪些阵地?其核心的AI手机助手功能有没有受到影响?对此,新京报贝壳财经记者在这款手机上,围绕点外卖、订机票、导航等日常场景进行实测,并邀请专家进行了分析。
23款App中8款使用受限,15款仍可通过AI操作
在推出初期,豆包手机曾展现跨平台比价、发送微信等功能,但以12月3日有用户反映微信账号异常退出,豆包手机随即下线其自动操作微信能力这一事件为开端,豆包手机一头撞上了App的“风控墙”,后续接连限制了多个场景的AI能力。甚至有用户担忧,豆包手机将变成不能用的“板砖”。
对此,新京报贝壳财经记者在12月8日以“这是一部新手机,需要安装一些日常所需要的App,帮我推荐并下载”为提示词,一共下载了23款App,涉及社交通讯、生活服务、购物消费、办公学习、娱乐休闲五大类。
记者使用豆包手机实测发现,在这23款App中,淘宝、美团、支付宝、拼多多、猫眼5款App直接无法登录;微信、高德地图、大麦网3款App可以手动登录但无法通过AI操作;而滴滴、QQ、京东等15款App的使用则完全不受影响,既可以登录,也可以通过AI操作。具体情况见下表:

贝壳财经记者梳理发现,上述被限制功能的8款App分别隶属于腾讯、阿里巴巴、美团、拼多多以及光线传媒五家大厂旗下。此外,根据豆包手机助手官方在12月5日发布的信息,出于金融安全和游戏公平的考虑,其对银行等金融类应用以及游戏场景的应用也进行了限制。
豆包手机助手无法打开微信。
从上述结果来看,目前豆包这一“光明顶”已然遭遇了“五大派”围攻,但也可以发现,大厂对豆包手机的限制也并非“一刀切”,比如腾讯旗下的QQ,阿里旗下的夸克依然可以正常被豆包手机助手调取。
那么,“还能用”的豆包手机,现在可以带给用户怎样的新体验呢?
全新AI助手体验:一句话记住用户喜好,跳过弹窗和广告,可后台运行
新京报贝壳财经记者通过2天的实测发现,目前豆包手机所搭载的AI助手能力确实到了“可以落地”的阶段,并且一些功能极具实用性。
让记者印象最深的就是,当使用豆包手机助手打开App执行任务时,其可以精准识别并点击关闭广告、找到用户指定的功能入口。
要知道,当前不同App的各式弹窗“防不胜防”,一些弹窗的关闭手段极其隐蔽,极易误导用户。但当豆包手机助手打开这些App时,它会针对不同的弹窗形式采取“点击关闭”或“等待弹窗消失”等处理措施。且成功率极高,很少点击进入广告。

另外,在面对一些App的引诱式选项时,它也能清楚分辨,例如记者经常使用某OTA平台购买飞机票,此类平台在购买机票步骤的末尾通常会通过选项颜色加深等方式“引导”用户购买保险等附加服务,而当记者本次测试时,豆包手机助手就在这一步进行了提示,“清楚明了”地咨询记者“是否要添加附加服务”。

而面对任务执行中遇到的突发事件,豆包手机助手也展示了相当程度的灵活性,其可以通过尝试不同路径解决问题。当记者唤醒豆包手机助手,要求其导航时,它首先打开了高德地图,但遭遇打开限制,便再次打开了百度地图。而要求豆包手机助手P图时,其首先尝试了手机自带的美颜功能,之后又上小红书寻找了P图方法,在上述两个方法均失败后,又登录了浏览器,通过咨询“哪些App可以P图”,最后下载了美图秀秀,直至任务完成,它共尝试了4条路径。
这种灵活性在记者要求其上哔哩哔哩对某UP主的视频进行评论时达到了令人惊叹的地步:豆包手机助手按照记者要求登录哔哩哔哩,但在视频评论时发现记者的账号等级不够,无法评论,要评论就必须得邀请好友或答题。此时,记者通过手机助手的“补充”功能添加了指令“帮我答题”。结果,豆包手机助手真的开始一题题帮助记者进行了答题(每答一题的思考时间不同),并在8分钟后回答了60道哔哩哔哩“考题”,最终通过了哔哩哔哩的测试,升级到LV2后发表了任务最开始所要求的评论。

豆包手机助手正在进行B站答题(视频为8倍速)。
最后,面对用户的模糊要求,豆包手机助手也有一定的“主见”,甚至还能通过记忆力帮助用户进行选择。
例如,记者此前曾通过豆包手机助手在便签中输入了“我想吃猪脚饭”。而之后,记者通过豆包手机助手下达指令“帮我订一份晚饭,点什么你看着办,便宜点,离我近的都行”这样的模糊指令之后,豆包手机助手的执行逻辑显示为“搜索猪脚饭,筛选便宜近的”。而在京东外卖的页面,当遭遇起送价不够,需要凑单的情况时,面对记者下达的“你看着凑”的指令,选择了卤蛋和卤丸子作为推荐的凑单商品,而类似的选项还有卤豆干、紫菜蛋花汤、烤肠、荷包蛋等,这一“选择”正属于豆包手机助手的“主观”推荐。

不过,贝壳财经记者在测试中发现,豆包手机助手也存在一定的局限性,在一些复杂任务中也会发生错误。如其在执行“购买12月9日天津到北京的高铁票”这一任务时,其执行逻辑是首先遍阅当日所有车票,但由于当日两地高铁票数量过多,该任务在执行数分钟后自动停止了。此外,在执行一个“打开QQ音乐,播放某歌手传唱度最高的歌曲”这一任务时,豆包手机助手播放了该歌手歌单列表中第一首歌曲,但该歌曲的浏览量和点赞量并非最高。
同时,豆包手机助手在12月5日更新后,无法完成一些激励场景,如记者要求其“帮忙打开网易云音乐并看广告领取免费听VIP歌曲时长”时,豆包手机助手回应“涉及用户账户和激励体系的操作,无法直接为您执行”。
“豆包手机助手的工程化水平很高,完成度很好,是未来智能终端的雏形。不过,对于需要实时响应的场景,如摄像头采集的高清视频理解等,豆包手机助手的响应速度还不够。”面壁智能首席科学家刘知远在接受贝壳财经记者采访时表示。
豆包手机助手丝滑运行的背后:高系统权限与阅读屏幕能力
贝壳财经记者注意到,之所以豆包手机能够带给人“丝滑”的AI手机助手体验,和该手机在系统层面就给豆包手机助手让渡了INJECT_EVENTS权限,以及豆包本身的大模型能力都有关系。
记者在实测中发现,当唤醒豆包手机助手执行一个任务时,其会在接受任务后默认最小化到手机屏幕正上方,在后台执行该任务,这就给了用户无感的任务执行体验,而这正是通过INJECT_EVENTS权限才能达到的效果。
事实上,AI手机助手并非豆包首创,华为、小米、荣耀等都有过AI手机助手的尝试,并使用INJECT_EVENTS权限,实现一些特定场景的操作手机任务,例如通过语音指令定闹钟、打开某个App等。第三方App则只能通过无障碍权限实现“读取屏幕+模拟点击”,如智谱的AutoGLM手机智能体演示过的发红包操作,这种方式会占用手机终端的屏幕,用户无法同时在手机上操作其他事项。
对此,网络安全专家曲子龙向记者解释,无障碍权限的工作逻辑,完全是模仿用户的前台应用操作。手机智能体若是依附这项应用层的权限,中止无障碍权限就等同于退出一款应用,自然不会继续执行任务。而豆包助手是一个拥有手机系统底层权限的应用,所以具备后台执行任务的能力。但INJECT_EVENTS权限只负责模拟用户指令的操作,“允许后台活动”需要系统提供其他的权限才能完成。
技术上,AI手机助手的核心逻辑实际上是“阅读理解手机屏幕”的能力。根据量子位消息,豆包手机助手的图形界面操作能力,建立在字节自研的UI-TARS模型基础之上,这是一款今年1月字节Seed团队与清华联手开源的模型。而“豆包手机”使用的是UI-TARS闭源版本,不仅性能优于其开源版本,还针对Mobile Use进行了大量优化,这为豆包手机提供了关键的技术支撑。
两套“组合拳”下来,才形成了豆包手机当前所展现出的功能。
不过,上文中所提到的INJECT_EVENTS权限因其本身属于“系统签名权限”,在12月3日一度成为豆包手机助手遭遇质疑的理由。当日晚间,豆包手机助手官方立即进行了辟谣,表示只有用户主动授权才可以调用该权限,“豆包手机助手不存在任何黑客行为。”
12月9日,一名曾经编写过国内信息安全相关法规的专家在复盘此事件时告诉贝壳财经记者,豆包手机相当于拥有了一把“万能钥匙”,因此才能带来流畅的用户体验,但可能会触及多个App的风控机制,“不同App的风控机制不一样,有些安全系数比较高的,可能会认为一些异常行为不是用户操作,而是机器代理操作,判断为黑灰产的‘猫池’,最终限制登录”。
对于AI手机助手可能在执行用户任务中获取用户信息的问题,有声音认为将AI助手的能力限制在本地,采用端侧模型或许是较好的解决之道。
刘知远多年从事端侧大模型研发,对此,他告诉贝壳财经记者,“豆包手机助手里面应该也有一个本地的语音模型,算是比较简单的端云协同。未来一定是端云协同共同完成端侧智能的任务,主要是端云如何分工的问题,我觉得大致应该是 personalized to professional,即端侧负责个性化,云侧负责专业化(如数学、代码等)。”
技术能否突破隐私的高墙和商业的围城
当前,挡在豆包手机以及所有AI手机助手面前的有两大难关:除了对隐私安全的担忧,还有打破现有商业模式所面临的阻力。
事实上,除去隐私安全这一顾虑,令其他App更加难以接受的或许是AI手机出现本身将彻底打破移动互联网时代,一个个App“割地为王”抢占用户流量的现有生态。
举个例子,贝壳财经记者在实测中可以通过语音方式唤起豆包手机助手,让它进行“放歌”操作。如果是用户来操作,首先需要打开音乐App,看完或跳过开屏广告,再取消几个“办会员”等广告弹窗后,最后搜索并点击所想要听的歌曲。
但通过豆包手机助手,上述行为可以完全在后台进行,用户本身对此完全无感。那么对于音乐App来说,所有的弹窗广告行为都将无效,该App的商业价值也将打折扣,最终可能彻底沦为AI手机助手的一个“通道”。
在这一逻辑下,许多App对豆包手机助手进行“抵制”不难理解。曲子龙告诉贝壳财经记者,对于如何发现用户所使用的是豆包手机,“手机App获取设备型号、品牌、制造商、硬件信息、系统版本这个是完全开放的,通过运行环境阻断是最简单办法,当然也可以用权限检测,当检测到在使用INJECT_EVENTS权限,进行模拟输入时直接拒绝。”这也是上述App能够对豆包手机“设限”的技术原因。
“AI手机助手方便归方便,但撬动不了背后的利益。如果要解决这一问题,最后的逻辑是必须形成一个紧密的联盟,在这个联盟里,大家的利益完全可以协调,没有任何利益冲突,但这过于理想了,这本身就是一个重塑生态的过程。”上述专家告诉贝壳财经记者。
“被第三方App封杀是一定会发生的,所以需要从一些特定场景开始切入可能更有机会,如工作场景。”刘知远说。
中国社会科学院大学互联网法治研究中心主任刘晓春表示,在获得用户明确授权、确保个人信息处理等行为合规的前提下,AI代替用户访问第三方应用,是用户意志的合法体现。AI智能代理行业尚处于初期,技术与规范尚在探索。对这类创新技术,需以包容审慎态度,在精准规范风险的同时为创新留出空间,助力行业良性发展。
“AI带来的变革是真实存在的,用户需求也是真实存在的,豆包和中兴的探索是一个开始。”12月9日,抖音副总裁李亮发布了这样一条微博。














