#模型时代# 新的缩放定律推理竞赛开始了。
红杉资本刚发布了一个报告,关于OpenAI的O1引发的产业变革,副标题是:代理推理时代的到来,The Agentic Reasoning Era Begins。原文链接在这里:http://t.cn/A6EQupRk。不过我觉得核心内容可以根据报告结尾的一段话,和三张图片,做一个总结。
图一:
o1让模型的性能变化,伴随推理时间变化。所以模型的重点就由大规模预训练的集群,变成为“推理云”,而推理要根据任务的复杂性,动态扩展计算。那么模型公司会根据这些复杂的需求,开发运行时间不一、需求多样的app吗?答案大概率是不会的。
图二:
根据过去的经验,当年云计算出现的时候,也创造了一个原来没有的云应用市场。这个产业用14年,从6亿美金,成长到400亿美金。
图三:
所以,现在随着推理计算的到来,大模型可能会成为一种新的基础设施,而不是像OpenAI一样,把基础模型和ChatGPT这样的app都做了,端到端闭环。那么就留下了一个巨大的AI软件市场。
现在这个市场还是比较空白的。顺便说一下,最近一年,我一直在和合作伙伴筹办一个PEC大会(提示工程峰会),原因就和红杉的逻辑一样,使用者->AI软件,可能才是这个产业最丰厚的市场。
报告结尾:
***
*o1论文中最重要的启示是,城里出现了新的缩放定律。
预训练 LLMs遵循一个众所周知的缩放定律:在预训练模型上花费的计算量和数据越多,模型的性能就越好。
o1 论文为扩展计算开辟了一个全新的领域:给模型的推理时间(或 "测试时间")计算越多,它的推理能力就越强。
如果模型可以思考几个小时,会发生什么?几天?几十年?我们能解决黎曼假设吗?我们能回答阿西莫夫的最后一个问题吗?
这种转变将使我们从大规模预培训集群世界转向推理云--可根据任务的复杂性动态扩展计算的环境。
*一种模式统治所有模式?
当 OpenAI、Anthropic、Google 和 Meta 扩展其推理层并开发出越来越强大的推理机时,会发生什么?我们是否会有一个模型来统治所有模型?
生成式人工智能市场起步之初的一个假设是,一家单一模式的公司将变得如此强大和包罗万象,以至于会淹没所有其他应用。到目前为止,这一预测在两个方面都是错误的。
首先,模型层的竞争非常激烈,SOTA 功能不断跃升。有可能有人通过广泛领域的自我发挥实现了持续的自我完善,实现了腾飞,但目前我们还没有看到这样的证据。恰恰相反,模型层的竞争非常激烈,GPT-4 的每个 token 的价格自上次开发日以来下降了 98%。
其次,除了 ChatGPT 这个明显的例外,这些模型在很大程度上未能作为突破性产品进入应用层。现实世界是混乱的。优秀的研究人员并不想了解每个可能的垂直领域中每个可能的功能的端到端工作流程。对他们来说,在应用程序接口(API)上止步不前,让开发人员去担心现实世界的混乱是既吸引人又经济合理的做法。这对应用层来说是个好消息。
*投资宇宙
我们作为投资者在哪里花费我们的精力?资金被投入到哪里?以下是我们的简要看法。
1、基础设施
这是超大规模公司的领域。它是由博弈论行为驱动的,而不是微观经济学。对风险投资家来说,这是个糟糕的地方。
2、模型
这是超大规模企业和金融投资者的领域。超大规模企业正在用资产负债表换取损益表,投资的资金最终将以计算收入的形式回流到他们的云业务中。金融投资者则受到“被科学震撼”偏见的影响。这些模型非常酷,这些团队令人印象深刻。微观经济学去死吧!
3、开发工具和基础设施软件
对战略家来说兴趣较小,对风险投资家来说兴趣较大。在云转型期间,大约有 15 家公司在这一层面上创造了超过 10 亿美元的收入,我们怀疑在人工智能领域也可能会出现同样的情况。
4、应用程序
风险投资中最有趣的层面。大约 20 家应用层公司在云转型期间创造了超过 10 亿美元的收入,另有大约 20 家在移动转型期间成立,我们怀疑在这里也会出现同样的情况。
