宝玉xp 25-05-20 15:00
微博认证:前微软Asp.Net最有价值专家 2025微博年度新知博主 科技博主

今天 Flowith Neo 的发布还挺火的,花了半小时时间听了小破站上 Flowith CEO Derek 的访谈,以及 Flowith Neo 的介绍,简单来说 Flowith Neo 是一个可以支持无限步骤 · 无限上下文 · 无限工具的 AI 智能体,你可以用它去执行一些耗时很长的任务、写长篇小说、翻译长文甚至可以后台 7x24 小时帮你执行一些特定任务,可以重复完成一个任务,如写一次指令,就能帮你每隔30分钟搜集新闻、每隔30分钟收集招聘信息。

我自己也测试了几个案例,整体体验还是挺不错的,有一些自己的亮点和特色,无限上下文和无限步骤方面比领先的智能体像 OpenAI 的 Deep Research 都要更有优势。

最近发布 AI 智能体比较多,我也体验了不少,Flowith 的特点也引发了我的一些思考,记录一下我对当前 AI 智能体的一些思考。

1. AI 智能体的异步多任务越来越成熟了

早期智能体需要人机协同,需要人在其中,典型的像 AI 编程领域的 Cursor,最早你需要自己控制上下文,然后有了 Agent 模式,不需要你去控制上下文,它自动调用工具帮你选取最相关的代码,但是中间很多操作还是需要你去确认和引导。

这就好比你在带着个实习生,总是问你各种问题,占用不少时间,最重要是可能会打断“心流”。

而异步任务则更进了一步,通常只需要任务开始的时候你把要求说明清楚,最多再确认一次 AI 智能体就会开始任务,结束了通知你结果。

这更像一个成熟的员工,一件任务交代下去基本上你就不用管了。正因为如此,你可以一次性开始多个异步任务,等任务完成了再去验收一下就好,不会打断你的“心流”,让你可以专心做更重要的事情。

但这种异步任务通常要借助云端虚拟机技术,相对成本比较高,所以一般都会限制执行的时间,到时间了就会强制结束。就像我上周测试 OpenAI 的 Codex,每次任务只能执行几个回合,干不了太多的活,当时还在想要是这些 AI 厂商能放开限制,那么能做的事情就更多了,只是没想到 Flowith 这么快就推出了号称无限步骤的 AI 智能体。

Flowith 访谈的视频里面有一个演示,是根据一份简历,去自动找最新的匹配的职位,但和传统的 AI 搜索不一样的是,它不是一次性搜索,而是 7x24 小时不停的搜索,一搜索到职位,就根据职位修改简历自动投递。
参考图1

这种无限步骤的方式,解锁了更多应用场景,比如关注 AI 资讯的就可以让它每天检索最新的 AI 新闻,汇总成邮件定时发过来,不用担心错过重要的资讯。
参考图2

还有一些需要搜索跨度很长的任务,也终于成为可能。比如我以前在各个不同的 Deep Research 类智能体测试过的一个任务:
请帮我汇总一下从ChatGPT发布之日起到今天,每个月的AI大新闻,包含新闻的权威链接,检索时以英文权威媒体为主,形成中文报告,可以适当加上产品、新闻的图片

但都没有成功,因为这个需要检索的时间跨度长达两年,每一次查询又有很多结果需要整理。今天用这个任务测试了一下 Flowith,第一次没有成功,第二次完成的很好,完整的把从 2022 年 11 月份到今年 5 月份的 AI 新闻都汇总了一遍。再看一遍这两年多的 AI 新闻,真是没想到这两年 AI 的发展这么快。
参考图3

2. AI 智能体让 AI 任务从对话变成了“抽卡”

另外这种异步任务,也衍生出来另一个使用习惯上的变化,那就是让 AI 完成任务从对话变成了“抽卡”。
“抽卡”这个词来源自 AI 画图,相同的提示词每次生成的结果可能有较大差异,所以需要同样的提示词多次生成,然后选一张满意的,俗称“抽卡”。

以前我们使用 AI,更多是在聊天界面,通过不停的对话,不停的调整提示词,让 AI 能理解我们,能完成任务。而现在,我们在使用智能体时,也接受了 AI 生成结果的随机性,同一任务会让 AI 执行多次,从里面挑选最满意的结果。异步任务也让这种“抽卡”变得更加便利,都不需要专门去等,就一次性开多个任务就好,这样虽然浪费了一点显卡资源,但是节约了大量的时间。

3. 上下文长度的约束慢慢没有那么明显了

当年 PC 时代,内存时制约机器性能的重大瓶颈,我上大学时内存还是以 MB 为单位的,现在都是以 G 为单位了。现在的应用已经不用怎么考虑内存上的限制了。

我一直觉得未来的上下文窗口长度终究也会像内存一样,终究不会再制约 AI 的应用。

两年前 GPT 3.5 的时代,上下文窗口长度是 4K,其实都到不了,稍微长一点就幻觉严重,现在我用 o1 pro 或者 Gemini 2.5 pro 的时候,经常上万字的英文发过去翻译,生成质量都很好没什么遗漏的,但再长也不行,所以有时候我还是少不了要手动把长文拆分成几段,然后分别翻译,最后再拼回去。

看 Flowith 宣传的无限上下文,我第一想法是,这一天终于要来了吗?于是找了篇几万字的论文测试了一下,结果果然是不错的,看来他们在工程上是下了不少功夫,对长内容的拆分和合并上做的不错,用户体验感知不到后面复杂的拆分和合并逻辑,从结果上看是挺完整的。包括我对翻译结果的其中一部分要求作出了调整,都完成的不错。

Flowith 开了个好头,相信以后其他产品也会在这方面下功夫,未来 AI 产品也将和 PC 软件一样不必太担心上下文窗口长度不够了。

4. 现阶段 AI 智能体还是在垂直领域更好落地

Derek 在访谈中有一个观点,就是现阶段 AI 智能体还是在垂直领域更好落地,这一点我也是类似观点。也许未来会有 AGI,会有通用 AI 智能体,但现阶段还是垂直领域 AI 智能更靠谱。

因为对于 AI 智能体来说,一个最重要的能力就是调用工具的能力,而对于专业领域,工具的专业性是相当高的,比如编程的 IDE、设计的画图工具,需要有很多工程努力在里面,就像 PPT 虽然也能画图但是不能代替设计师们的 Figma、Photoshop。这也是为什么像 AI 编程领域无论是 Cursor 还是 Windsurf,都做的比通用领域 Agent 要强很多。

Flowith 视频里面演示的 3D 台球项目很惊艳,我更倾向于他们是针对这类 3D 网页游戏的垂直场景,在代码生成和运行环境上做了很多努力,毕竟后面的模型还是 Claude 3.7 Sonnet、OpenAI o3、Gemini 2.5 pro 这些主流的 AI 模型,只有针对垂直场景做好优化,才可能做出来超过竞争对手的效果。

小结

上面就是我在看完 Flowith 访谈视频和体验完 Flowith 后对 AI 智能体的一些思考,简单总结一下。

- AI 智能体的异步多任务越来越成熟了
- AI 智能体让 AI 任务从对话变成了“抽卡”
- 上下文长度的约束慢慢没有那么明显了
- 现阶段 AI 智能体还是在垂直领域更好落地

不知道你有什么不同的看法,欢迎留言分享。另外我这里有一些 Flowith 的邀请码:
TSLUH08G, CAW43RAN, 62J5OOIH, 30Q0VYJK, TICE0UV2, F5CYDHJD, ADMCMB10, 1E4FFWAM, XU3QTFTY, G1FJFJC5, 56NMQS0M, VO67IWZP, CX9ETF9E, ZLO5UORR, HO5P8SM9
这个码领完可以分享,能转赠 3 个邀请码,还请有码的同学在留言里面分享一下。
参考图4

#flowithneo上线24h一码难求#
#flowithneo#
#全球首个7X24h全天候AI智能体#
#AI智能体再出王炸#

发布于 美国