阶跃星辰刚刚发了个新模型 GELab-Zero-4B-preview
这是个专注于 Android 系统的GUI 代理模型,针对交互界面元素(点击、输入、滑动、等待等)进行了优化,可以支持跨多个应用(如餐饮、交通、购物、社交等)执行多步骤长时程任务。
模型基于Qwen3-VL-4B-Instruct魔改,支持多模态输入(图像和视频)。
最重要的是,这个模型只有4B,感觉群控佬要兴奋起来了。随着AI能力的增强,感觉人机检测难度上升到了前所未有的高度了。
模型地址:huggingface.co/stepfun-ai/GELab-Zero-4B-preview
#ai生活指南# #ai创造营# #科技先锋官#
发布于 美国
