三一博士 25-12-12 13:42
微博认证:哈工大博士、哈工大商学院青年科创导师

#豆包手机获取权限有多狠##豆包手机##多家APP对豆包手机禁用# 这权限设计真是刷新认知!根据网友拆解的debug信息,豆包手机的AI agent靠两个“狠活权限”实现了超灵活操作,普通人可能没意识到这背后的影响。

核心是“读”和“写”两大权限:一是直接读取GPU渲染缓存(android.permission.READ_FRAME_BUFFER),不用调用截图API,哪怕是银行APP这类禁止截图的应用,它也能获取界面原始画面;

二是通过注入事件权限(android.permission.INJECT_EVENTS),直接模拟点击、滑动等操作。更关键的是,它能在虚拟屏幕上干活,你前台看电影、刷视频,后台就能自动完成统计、订外卖等任务,完全不依赖主屏。

这套逻辑其实不复杂:每隔3-5秒把200-300K的界面画面传给云端,云端模型梳理后下发指令,本地再用注入权限一步步执行,循环直到完成任务。对比其他AI agent,它不用依赖APP接口,适配性更强,但权限也野得多——能碰支付、金融类APP的私密界面,这也是为啥腾讯这类公司会封禁,支付相关应用大概率都会跟进限制。

创新确实大胆,但风险也很直观:权限太大容易触及隐私和资金安全,毕竟能直接读取敏感界面、模拟操作,一旦出现漏洞或被滥用,后果不堪设想。AI agent想更实用是好事,但“灵活”和“安全”的平衡得拿捏住,目前来看道阻且长啊!

发布于 上海