不吃西梅的林娜 26-04-28 15:32
微博认证:数码博主

罗福莉长达3.5小时深度访谈,我这里只写了我感兴趣的,大家可以去看看这个访谈[good]

一、AI整体范式变革问答

🌞问题1:当下AI行业正在发生怎样的底层范式巨变?
答:AI已经彻底告别以预训练Pre-train为核心的Chat对话时代,全面进入以智能体Agent为核心的全新阶段。过去大模型核心比拼底座预训练能力,只负责被动问答、简单对话;现在行业竞争完全切换赛道,核心变成主动规划、工具调用、复杂任务闭环执行。
整个系统架构从以Rollout推理引擎为中心,转向以Agent智能体为核心的复杂协同系统,AI不再只是聊天工具,变成可自主完成多步骤复杂工作的生产力主体,这是近几年最颠覆性的一次技术范式切换。

🌞问题2:为什么说Agent范式极度依赖Post-train后训练?
答:现阶段全球顶尖大模型团队,在基础预训练底座上的差距已经极小,预训练很难再拉开代差。而Agent要做任务拆解、工具调用、逻辑闭环、多轮自主决策,这些能力无法只靠预训练习得。
Agent的落地效果、稳定性、逻辑执行力、工具联动能力,全部由Post-train决定,尤其依赖RL强化学习规模化迭代。范式越复杂、智能体能力越强,对后训练数据、流程、基建、迭代效率的要求就越高,Post-train已经成为AI竞争的第一主战场。

🌞问题3:OpenClaw框架在本次AI范式变革中,扮演什么角色?
答:OpenClaw是适配Agent时代的核心智能体底层框架,是承接大模型从对话走向落地执行的关键基建。
它统一了任务调度、工具编排、多模态联动、外部系统对接、长任务管理等核心能力,大幅降低智能体开发与落地门槛。企业和研发团队不用从零搭建Agent底层逻辑,可以基于OpenClaw快速搭建自研智能体,集中精力做场景定制、后训练优化,是当前Agent规模化落地的核心基础设施。

二、算力、显卡方面问答

🌞问题1:Chat时代和现在Agent时代,显卡/算力分配比例有多大差异?
答:
(1)旧时代(Chat为主)资源配比:研究 : 预Train : 后Train ≈ 3:5:1
资源严重向大模型预训练倾斜,后训练、推理、Agent相关资源被严重压缩。
(2)新时代(Agent范式)合理配比:研究 : 预Train : 后Train ≈ 3:1:1
头部顶尖团队更激进,预训练与后训练算力做到1:1对等分配。

🌞问题2:为什么必须大幅削减预训练算力,加码Post-train算力?
答:预训练边际收益大幅递减,砸再多卡,模型基础能力提升有限;
而后训练直接决定智能体能不能用、好不好用、能不能落地产生价值。如果继续死守旧算力比例,会出现“底座很强,但Agent完全跑不起来、执行拉胯”的脱节问题。
未来AI比拼的不是谁预训练卡更多,而是谁的后训练基建、RL迭代效率、智能体调优能力更强。

三、模型规模、技术路线方面问答

🌞问题1:如何看待当前大模型参数量规模?未来scaling方向是什么?
答:1T参数级别大模型,已经是进入Agent赛道的基础入场券,不存在低配模型弯道超车的可能。
行业不会停留在1T规模,一定会持续向上Scaling。但未来不只是单纯堆参数量,还要做路线选择:一是参数规模继续扩张,二是结合芯片架构、稀疏架构、异构计算做定向优化。
团队选择在哪类芯片上迭代、往哪个方向做Scaling,会直接决定未来半年到一年的行业排位。

🌞问题2:当前AI研发,除了模型本身,最核心的硬实力是什么?
答:是RL Infra强化学习底层基建。
Agent时代迭代速度极快,需要高频、稳定、低成本的强化学习训练与迭代体系。谁能搭建更敏捷、更高效率的RL基础设施,谁就能快速完成后训练迭代,快速修复智能体bug、提升任务能力,快速适配新场景,这是中小团队最难补齐、头部团队核心壁垒。

四、团队组织、管理、人才适配问答

🌞问题1:AI范式巨变之下,研发团队的组织架构要怎么调整?
答:不能再沿用预训练时代的部门分割模式。过去预训练、微调、应用完全割裂,现在必须打通协作。
怎么调整:
(1)打破岗位壁垒,让预训练工程师深度参与Post-train后训练工作,用底座理解能力优化智能体效果;
​(2)推行组织平权,不再把预训练奉为绝对核心,后训练、Agent工程、落地场景团队权重全面提升;
​(3)建立跨职能小组,技术、算法、工程、场景落地协同办公,避免技术脱离实际应用。

🌞问题2:后训练团队需要什么样的人才结构,为什么要强调人员多样性?
答:后训练不是单一算法工作,涉及数据、对齐、强化学习、工程部署、场景理解等多维度内容。
人员结构越多元,越能发现智能体在真实场景里的各类问题,避免单一视角带来的优化盲区。让不同背景、不同方向的研发人员共同参与后训练,能极大提升模型综合实用性与鲁棒性。

五、AI行业趋势方面问答

🌞问题1:如何定义2026年的AI行业整体趋势?
答:2026是AI生产力质变元年。核心标志就是Agent大规模落地,AI从“辅助聊天工具”变成“可自主工作的生产力载体”,具备自迭代、自优化、自进化能力。
同时国内大模型整体进入加速追赶周期,行业从野蛮生长,进入技术深耕、落地为王、精细化竞争的阶段,泡沫逐步出清,硬核技术与落地价值成为唯一标准。

🌞问题2:身处高速迭代的AI行业,研究者该保持什么样的心态?
答:技术迭代速度远超所有人想象,需要保持高频自我革新,做到“每天都在否认昨天的认知”。
不要迷信过往经验,AI行业不存在固化壁垒与永久优势,环境变化远大于个人经验。
整体来看AI长期没有生存危机,需求、场景、技术空间都足够广阔,拥抱变化、快速适配新范式,才是长期生存的关键。

🌞问题3:怎么看待小米MiMo系列大模型的技术布局与差异化思路?
答:MiMo体系早早预判到Agent范式转移,提前重仓Post-train与RL规模化迭代,没有盲目内卷纯预训练。
依托OpenClaw智能体框架完成技术协同,模型强调实战能力、工具调用能力、复杂长任务处理能力。
走“底座夯实+后训练强优化+智能体生态配套”的路线,在范式切换周期里具备极强的适配性与成长性。
#小米[超话]##小米#

发布于 广东