姬永锋
26-06-23 09:13 微博认证:财经博主

摩尔线程、长鑫存储、Kimi的共同投资人王捷:AI这艘巨轮,越过山丘后,经济系统会发生什么?(4)

摘自投中网

AI应用怎么做:

贴着大模型能力上限走、“往山上去,不要在已知的河谷盘桓”

问:你在24年底写过一篇文章,预判这波AI的爆款应用应该长什么样。现在回头看,当时靠谱吗?

王捷:是的,在24年做了一些移动互联网的复盘,想看看对预判大模型阶段的变化是否会有帮助,写了一篇叫《大模型应用:我们可以从移动互联网的经验中学到什么》。背后的逻辑是“历史不会简单重复,但总是押着相似的韵脚”。这篇文章指向的问题是,AI大模型阶段的爆款应用会长什么样。

当时写了几点。第一, 移动互联网阶段最大规模的应用,打车和外卖、社交、短视频,分别对应手机和PC不同的技术feature(LBS、通讯录、摄像头),那么“不同的技术feature”这一分析框架是否仍然使用呢?我当时的看法是,“由于大模型的能力呈现全面性,而非单点性,“技术feature”的分析框架难以适用”。写这点主要是想探讨应该用什么样的框架来分析AI阶段的爆款应用。

第二,它应该是个最大场景的AI顾问或者助手。即人类全域需求中,哪些是以前只能由人 (专业顾问/专业助手)提供,现在可以由大模型提供;这些需求中,哪些需求基数最大。

第三,由于大模型技术未收敛,每个阶段应用的胜者一定满足“贴着当下大模型能力上限,为用户提供AI原生的价值,且当下大模型能力缺陷对产品价值影响不大”以及,由于技术没有收敛,“技术判断是第一位的判断”。

以上后两点,我觉得后来不管是Manus还是OpenClaw,都是符合我描述的这个画像的。“最大场景的AI顾问/助手”、“贴着当下大模型能力上限”、“技术判断是第一位的判断”,是后来这几个爆款产品共有的特性。特别是Manus,充分预判了6个月之后的算法走向,是一个特别好的验证。

问:行业对于AI应用的探索,经历了哪几个阶段了?

王捷:这是个特别有意思的问题。在23年和24年, AI只能作为聊天机器人的阶段,模型公司和AI应用公司基于chatbot形态,探索出了Character.ai这个原型。但之后不就,C.ai的创始人放弃独立运营,在24年8月将公司卖给了Google(C.ai的两位创始人从Google离职创业,又回到了Google)。

在那个阶段,出现了不少C.ai类型的产品,这一方向一度成为拥挤的赛道。但同时,那个阶段我们可以看到有大量空白的潜在大方向无人问津。形象的来说,在AGI这座巨峰上,大家都处在山脚刚开始爬山的位置,你可以看到大量的人聚集在已经探明的河谷中,只有极少数的人敢于放弃已知的确定,继续往山上孤勇前行。当然“驻扎在已知的河谷”这件事情也很能理解,毕竟“已经探明”就有了“确定性”,哪怕竞争拥挤,但它是确定的,毕竟,这轮的AI是全然的新东西,是未知的,谁知道爬山路上明天会遇到什么呢?

但是,从全局看,因为算法未收敛,当时的AI能力应该还只解锁了从终局看的AI应用地图的不到10%,还有90%的未知区域有待探明。勇敢者,不会停留在已知的10%里面,而是会作为先锋去探索待揭开的90%。打个比方就是 “往山上去,不要在已知的河谷盘桓”。而其后我们知道,24年10月的GPT o1发布之后,AI进入了reasoner阶段,解锁了大量的个人助理, agent, coding等应用场景,其量能远超chatbot阶段的AI应用场景。目前看,推理阶段可能会有较chatbot阶段更长的持续时间。

问:作为AI应用,应该怎么去构建竞争壁垒?

我觉得一是能否将用户的记忆沉淀在产品当中,即不光是沉淀数据,而是将用户在与产品持续互动的过程中体现的用户喜好、偏好沉淀在产品当中,比如一位理想汽车的车主在他的“理想同学”里沉淀的记忆就是这样的例子。

二是应用公司需要在算法层面做适配场景/产品的工作,需要创造不同于基座模型的算法价值,这样才能在模型这一层构建有效工作,不至于在基座模型迭代时处在完全被动的位置。

三是应用公司的创始人需要对6个月之后的算法走向有相对准确的预判。这是24年10月GPT o1发布带给我的最大启示。如果创始人对6个月之后的算法走向没有准确预判,他在chatbot阶段不知道模型能力会往推理方向走,如果他有一位对此有深刻认知的竞争对手,那么在基座模型能力来到下一个阶段的时候,他就会很被动。

移动互联网的原型课:历史押韵的方式

问:你在天使营分享的时候,举了一个移动互联网早期“原型”的案例,能展开讲讲吗?这个框架怎么用到AI投资上?

王捷:这里讲的“原型”是指那个后来被验证为“最大赛道应用”的第一个产品形态。对于创业和投资而言,这都是很好的先行指标。

移动互联网阶段,最后跑出来的三个最大的赛道分别是LBS应用——打车和外卖,社交——微信、Snapchat等,和短视频,分别对应了LBS、通讯录、摄像头这三个手机相比PC新增的技术feature。或者说,这三个手机相比PC新增的技术feature,定义了移动互联网阶段三个最大的商业方向。

但这个是事后回溯的视角。在2010年移动互联网刚启幕时,很少有人能看清楚这些。当时有家媒体做个专栏,梳理了专业人士和普通用户认为的移动互联网趋势。其中提到“移动定位服务提供个性化信息”,这个点说对了,但他没有猜出来具体是什么东西能长出来——是打车跟外卖。“手机电视将成为时尚人士的新宠”,手机电视是啥呢?后来我们叫短视频…… 所以这些直观的猜想虽然也有一些根据,但是远远不够的。

观察“原型”的意义,是在没有有效的“自上而下”的认知的情况下,“自下而上”地得到一些数据和动态。比如2009年的Foursquare是LBS应用的原型、2010年的Kik是聊天应用的原型、2010年的Instagram是图片应用的原型。这些原型的特点是,他们都在上线后很短时间迎来迅猛的用户数增长。比如Kik上线后两周内注册用户就超过了100万。自然,这样夺目的增速也被很多人关注到,其中就包括密切跟进移动互联网新产品动向的雷军和张小龙,也就很快有了米聊和微信。

所以观察“原型”是个挺好的方法。这样可以获得一个看板,去看哪些方向的“原型”增速快、潜力大,以及这个产品现有的团队是不是具备能力做大。

问:那这一波AI呢?能不能用类似的方法去找机会?

王捷:是的,前面提到的《大模型应用:我们可以从移动互联网的经验中学到什么》就是这样一个尝试。以及我们从23年开始就一直在观察这样“原型”的出现。到今年一季度可以明确地说,25年底出现的OpenClaw就是AI阶段第一个典型的原型,就像移动互联网阶段的Foursquare, Kik, Instagram。OpenClaw的立意、方向、产品形态,将会对整个AI阶段的应用产生重大影响。

发布于 河南