新智元
26-06-26 15:22 微博认证:新智元官方微博

只会聊天的 Agent 要下岗了。2026 世界杯打得火热,几亿人盯着同一颗球,而今天阿里云在 Flink Forward Asia 2026 大会上,演示了让 AI 实时解说世界杯的能力。

要实时解说,AI 得同时干三件事:看懂此刻谁在头球、记住几十分钟前谁踢丢了、还能调出球星近几年的数据。把「现在、刚才、过去」对齐到同一根时间轴,再用你喜欢的方言风格讲出来——背后是 Apache Flink 3.0 全面进入 Agentic Streaming 时代。

这是业界第一次,把视频、音频、图像、文本四类数据统一放进同一条流式 pipeline。解说全程没人 @ 它一句,事件流到了它就动,大概 25 秒延迟里 15 秒花在攒帧、10 秒是模型推理加切粤语。

这跟过去三年的「Agent」已经不是一个东西。ChatGPT 是你问一句答一句,Flink 要做的是掀掉「等人开口」那层壳,转向 Event-Driven Agent——事件触发、7×24 在线、自主决策、记忆自维护。

流式 Agent 这想法不新,卡了三年,死在数据上:全模态数据散落对不齐、批处理撑不住永远在线、关键信号被海量数据淹没。Flink 3.0 从底层重构,用全模态引擎让它「看得清」,Streaming Agent-OS 让它「记得住」,Agentic Lake 让它「饿不着」。

值得一提的是,这个统治全球流计算的 Apache 顶级项目,核心推动者正是阿里云中国团队。它最先上岗的场景是智能运维、直播监控和广告实时定价。

以前我们以为 Agent 就是会聊天的 ChatGPT,Flink 3.0 提示了另一种可能。它不是更强的工具,而是第一次,自己活了起来。