嘿腿子腿子
26-05-15 12:20 微博认证:科技博主

#AI创造营#
用AI做的UI,真的能跑在手机上跑起来吗?
你有没有注意到一件事
现在用AI做UI这件事已经很普遍了,很多AI工具都可以帮你一句话生成一个网页界面。
但你仔细想想,这些界面最后都跑在哪儿?
浏览器里。
你让AI帮你做一个App的界面,它确实能给你一个好看的页面,但这个页面只能在网页端预览,你没办法把它真正放到手机上,当成一个原生App去跑。
这不是AI能不能画出好看界面的问题,而是画出来的东西落不了地的问题。
因为手机App跟网页是两回事。iOS用一套代码,Android用一套代码,鸿蒙又是另一套。你想让一个界面在手机上真正跑起来,得分别针对每个平台去写渲染代码。
写一套就够头疼了,写三套,还要同时维护三套,哪边出了问题还得分别去修。做过移动端开发的朋友应该都懂这个痛。
最近高德和通义千问联合开源了一个项目叫AGenUI,一句话概括就是:让AI输出的界面,可以直接在iOS、Android和鸿蒙三个平台上原生渲染,不用开发者自己去写三套适配代码。
以前让AI做UI,它既要想说什么,还要管页面怎么画,两件事缠在一起,做不好。现在模型只负责输出意图,AGenUI像一个熟练工,听到指令就把控件搭出来。
为了更直观地感受它到底能做什么,我拿AGenUI的Playground跑了几个测试场景。

1
我让它生成一个女生的健康记录卡片。跑出来的东西直接就在iPhone模拟器里渲染了,日历、emoji标签、倒计时卡片,都是原生控件,不是网页套壳的那种。
而且它是流式渲染的,边生成边渲染,体验跟刷原生App一样

2
第二个测试是上海一日游行程卡片。
这个场景更复杂一些。我让它生成一个包含四个站点的行程规划,每个站点有时间、地点、简介,底下还要有预算分析和确认按钮。
跑出来的效果让我有点意外。
顶部是一张上海的城市封面图,下面是交通方式、预算、节奏三个标签,然后是四个站点的时间轴卡片,每个站点都有一句话描述。

3
说到这你可能会问,这跟以前那些AI做UI的工具到底有什么不同?
我觉得可以这么类比。
以前AI的输出就像命令行,纯文本,你问它一句它回你一句。能用,但不好用。
AGenUI做的事情,就是让AI的输出从命令行时代进入了图形界面时代。就像当年从DOS到Windows,交互形式一变,可用性就完全不一样了。
举个最简单的例子。以前AI要帮你收集信息,它会列一串问题让你在聊天框里一条一条回复。现在它可以直接输出一个表单给你,你填完点提交就行了。
哪种体验更好,不用多说。

4
AGenUI是基于Google开源的A2UI协议做的。Google定义了AI怎么描述一个界面的标准格式,AGenUI在这个基础上,把"这段描述怎么在三个手机平台上跑起来"这件事给补齐了。
它目前内置了22个基础组件,覆盖了文本、图片、按钮、表单、卡片这些常用的控件类型。样式系统支持45项CSS属性,还有一套Design Token的主题机制——说人话就是,你可以把自己公司的品牌配色、字体规范定义好,AI生成的界面会自动按照你的品牌风格来渲染,不用生成完再手动调。
对开发者来说最直接的好处就是:以前你要在App里做一个AI驱动的界面,得自己写三套平台的渲染代码,还要一直维护。现在AGenUI帮你把这些事做好了,你只管往里塞内容就行。

5
往大了看,这件事的意义不只是帮开发者省了一些活。
你想想现在所有的AI产品,打开都是一个输入框。不管底层模型进化到了什么程度,用户这一层看到的永远是——你敲字,它吐字。
但AI能干的事越来越复杂了,规划行程、分析数据、管理日程、填表单,这些事靠纯文本其实效率很低。
聊天框是AI的嘴巴,AGenUI这类框架做的事情,是给AI装上手和脚。
让它不只是告诉你答案,而是直接把答案用最合适的方式摆到你面前。你可以看,可以点,可以操作。
AGenUI已经开源了,感兴趣的可以去GitHub上看看。

发布于 广东