王捷谈AI应用_新浪新闻

摩尔线程、长鑫存储、Kimi的共同投资人王捷：AI这艘巨轮，越过山丘后，经济系统会发生什么？（4）

摘自投中网

AI应用怎么做：

贴着大模型能力上限走、“往山上去，不要在已知的河谷盘桓”

问：你在24年底写过一篇文章，预判这波AI的爆款应用应该长什么样。现在回头看，当时靠谱吗？

王捷：是的，在24年做了一些移动互联网的复盘，想看看对预判大模型阶段的变化是否会有帮助，写了一篇叫《大模型应用：我们可以从移动互联网的经验中学到什么》。背后的逻辑是“历史不会简单重复，但总是押着相似的韵脚”。这篇文章指向的问题是，AI大模型阶段的爆款应用会长什么样。

当时写了几点。第一，移动互联网阶段最大规模的应用，打车和外卖、社交、短视频，分别对应手机和PC不同的技术feature（LBS、通讯录、摄像头），那么“不同的技术feature”这一分析框架是否仍然使用呢？我当时的看法是，“由于大模型的能力呈现全面性，而非单点性，“技术feature”的分析框架难以适用”。写这点主要是想探讨应该用什么样的框架来分析AI阶段的爆款应用。

第二，它应该是个最大场景的AI顾问或者助手。即人类全域需求中，哪些是以前只能由人（专业顾问/专业助手）提供，现在可以由大模型提供；这些需求中，哪些需求基数最大。

第三，由于大模型技术未收敛，每个阶段应用的胜者一定满足“贴着当下大模型能力上限，为用户提供AI原生的价值，且当下大模型能力缺陷对产品价值影响不大”以及，由于技术没有收敛，“技术判断是第一位的判断”。

以上后两点，我觉得后来不管是Manus还是OpenClaw，都是符合我描述的这个画像的。“最大场景的AI顾问/助手”、“贴着当下大模型能力上限”、“技术判断是第一位的判断”，是后来这几个爆款产品共有的特性。特别是Manus，充分预判了6个月之后的算法走向，是一个特别好的验证。

问：行业对于AI应用的探索，经历了哪几个阶段了？

王捷：这是个特别有意思的问题。在23年和24年， AI只能作为聊天机器人的阶段，模型公司和AI应用公司基于chatbot形态，探索出了Character.ai这个原型。但之后不就，C.ai的创始人放弃独立运营，在24年8月将公司卖给了Google（C.ai的两位创始人从Google离职创业，又回到了Google）。

在那个阶段，出现了不少C.ai类型的产品，这一方向一度成为拥挤的赛道。但同时，那个阶段我们可以看到有大量空白的潜在大方向无人问津。形象的来说，在AGI这座巨峰上，大家都处在山脚刚开始爬山的位置，你可以看到大量的人聚集在已经探明的河谷中，只有极少数的人敢于放弃已知的确定，继续往山上孤勇前行。当然“驻扎在已知的河谷”这件事情也很能理解，毕竟“已经探明”就有了“确定性”，哪怕竞争拥挤，但它是确定的，毕竟，这轮的AI是全然的新东西，是未知的，谁知道爬山路上明天会遇到什么呢？

但是，从全局看，因为算法未收敛，当时的AI能力应该还只解锁了从终局看的AI应用地图的不到10%，还有90%的未知区域有待探明。勇敢者，不会停留在已知的10%里面，而是会作为先锋去探索待揭开的90%。打个比方就是 “往山上去，不要在已知的河谷盘桓”。而其后我们知道，24年10月的GPT o1发布之后，AI进入了reasoner阶段，解锁了大量的个人助理, agent, coding等应用场景，其量能远超chatbot阶段的AI应用场景。目前看，推理阶段可能会有较chatbot阶段更长的持续时间。

问：作为AI应用，应该怎么去构建竞争壁垒？

我觉得一是能否将用户的记忆沉淀在产品当中，即不光是沉淀数据，而是将用户在与产品持续互动的过程中体现的用户喜好、偏好沉淀在产品当中，比如一位理想汽车的车主在他的“理想同学”里沉淀的记忆就是这样的例子。

二是应用公司需要在算法层面做适配场景/产品的工作，需要创造不同于基座模型的算法价值，这样才能在模型这一层构建有效工作，不至于在基座模型迭代时处在完全被动的位置。

三是应用公司的创始人需要对6个月之后的算法走向有相对准确的预判。这是24年10月GPT o1发布带给我的最大启示。如果创始人对6个月之后的算法走向没有准确预判，他在chatbot阶段不知道模型能力会往推理方向走，如果他有一位对此有深刻认知的竞争对手，那么在基座模型能力来到下一个阶段的时候，他就会很被动。

移动互联网的原型课：历史押韵的方式

问：你在天使营分享的时候，举了一个移动互联网早期“原型”的案例，能展开讲讲吗？这个框架怎么用到AI投资上？

王捷：这里讲的“原型”是指那个后来被验证为“最大赛道应用”的第一个产品形态。对于创业和投资而言，这都是很好的先行指标。

移动互联网阶段，最后跑出来的三个最大的赛道分别是LBS应用——打车和外卖，社交——微信、Snapchat等，和短视频，分别对应了LBS、通讯录、摄像头这三个手机相比PC新增的技术feature。或者说，这三个手机相比PC新增的技术feature，定义了移动互联网阶段三个最大的商业方向。

但这个是事后回溯的视角。在2010年移动互联网刚启幕时，很少有人能看清楚这些。当时有家媒体做个专栏，梳理了专业人士和普通用户认为的移动互联网趋势。其中提到“移动定位服务提供个性化信息”，这个点说对了，但他没有猜出来具体是什么东西能长出来——是打车跟外卖。“手机电视将成为时尚人士的新宠”，手机电视是啥呢？后来我们叫短视频…… 所以这些直观的猜想虽然也有一些根据，但是远远不够的。

观察“原型”的意义，是在没有有效的“自上而下”的认知的情况下，“自下而上”地得到一些数据和动态。比如2009年的Foursquare是LBS应用的原型、2010年的Kik是聊天应用的原型、2010年的Instagram是图片应用的原型。这些原型的特点是，他们都在上线后很短时间迎来迅猛的用户数增长。比如Kik上线后两周内注册用户就超过了100万。自然，这样夺目的增速也被很多人关注到，其中就包括密切跟进移动互联网新产品动向的雷军和张小龙，也就很快有了米聊和微信。

所以观察“原型”是个挺好的方法。这样可以获得一个看板，去看哪些方向的“原型”增速快、潜力大，以及这个产品现有的团队是不是具备能力做大。

问：那这一波AI呢？能不能用类似的方法去找机会？

王捷：是的，前面提到的《大模型应用：我们可以从移动互联网的经验中学到什么》就是这样一个尝试。以及我们从23年开始就一直在观察这样“原型”的出现。到今年一季度可以明确地说，25年底出现的OpenClaw就是AI阶段第一个典型的原型，就像移动互联网阶段的Foursquare, Kik, Instagram。OpenClaw的立意、方向、产品形态，将会对整个AI阶段的应用产生重大影响。

发布于河南