林毅没有v 25-12-14 18:46
微博认证:微博基金合作作者 财经知识分享官 头条文章作者

#林毅没有V[超话]#🔥豆包inside到OS中, 真的和App级别的操控不一样——豆包AI手机解读(1213)

拿到最底层操作权限的AI助手,真的有「无限想象力」,豆包AI助手的完成度非常高,很多解决方案也很聪明。端侧AI助手看来不是技术问题了,而是#利益分配问题 。端侧AI作为入口的重要性或还是被低估了,#2026就是端侧元年,OpenAI的硬件同样值得期待。(Apple真老登,2026年不知道能不能做出来)

这几天看了深入代码的豆包助手解读,发现每一个豆包助手权限都直达系统最底层,这只能通过硬件厂商出卖灵魂和大模型合作,才能实现。

直奔重点:
#1:豆包读屏不是截图/录屏,而是READ_FRAME_BUFFER进程直接从 GPU 渲染缓冲区取Bitmap。
#2:不像智谱之前是拿到Android手机无障碍,豆包直接调用系统级“注入输入事件injectInputEvent”。
#3:能后台运行的本质,是因为创建了一个只给系统看的虚拟屏(屏幕参数:1264x2800、60fps、owner=autoaction、亮度 0、Trusted、永远解锁、独占焦点)。用户在物理屏做别的事,AI 在虚拟屏并行操作互不抢焦点。(非常聪明的解决方案,释放了物理屏)
#4:云端推理,手机约每 3–5 秒上行一次、每次约 250KB;下行约 1KB。上行应该是Bitmap图像,下行是text操控手机指令(打开应用/点击/输入/等待/滑动/ take_notes六种指令),可见#豆包的多模态推理能力很强 。

所以,豆包手机真正做到了让用户的#注意力从美团、小红书、支付宝、微信等App上消失 ,确确实实#动了这些App的流量变现蛋糕 。虽然这些App其实条款明令禁止这种RPA(机器人流程你自动化)操作的,防止被不法分子利用,但是本质还是旧时代和新时代的利益碰撞,万一字节后面全部App都给豆包重做一遍呢?是不是还会上演柯达、黑莓、诺基亚、移动飞信,明明没做错什么,却最终销声匿迹。而这次主角会不会变成微信、美团、Apple…

资料来源链接/文字总结,感兴趣欢迎交流。

YZS✧

发布于 上海