胜天半子股乘风 26-01-08 15:32
微博认证:财经博主

#A股# 🌹2026年大模型:五大被低估的趋势【天风计算机 缪欣君/刘鉴团队】

#重视: 存储+国产大模型+国产算力+IDC产业链

趋势1️⃣:模型与智能体的长记忆,有望超预期加速

过去厂商聚焦“长上下文”提升单次推理,但存在成本高及精度衰减问题。2026年重心有望转向“长记忆”,通过外部存储、RAG等方式让Agent跨会话记住用户偏好与领域知识。
#模型层: 谷歌Titans、字节MemAgent等让长期记忆有了真正突破。
#应用层: Gemini已率先尝试分层记忆(短期/显性/隐形)。
#硬件侧: 长记忆对底层存储保护硬件产生了巨大需求。长上下文增加KV-Cache规模,优先拉动HBM/DRAM需求;叠加RAG能力,将同步提升SSD需求。

趋势2️⃣:强化学习(RL)海外继续拓展,国内仍在RL较初期阶段

OpenAI联合创始人Ilya指出,预训练Scaling Law或触及收益递减边缘,#而RL仍具优化思维过程的扩展空间
#算力结构变化: 海外RL算力消耗占比已近50%(如Grok4);国内以DeepSeek-V3.2为例,后训练算力占比突破10%。
#展望: 看好阿里、DeepSeek等国产厂商继续提升RL比例,加速追平海外。

趋势3️⃣:在线学习(Online Learning)探索下一个范式,26年下半年有望见雏形

Online Learning赋予模型自识错、自采集、自更新能力,构建“在失败中学习”的闭环。OpenAI联合创始人伊利亚近期访谈提到: 相比“预训练”,#人类智能真正依赖的是“持续学习”。我们认为在线学习或成为大模型下一范式,2026年下半年有望见雏形。

趋势4️⃣:世界模型从学界走向产业落地
世界模型完成从符号认知向物理世界直觉建模的跨越,三大模型推动AI理解物理世界:

#Genie3(虚拟环境模拟): 生成一致、可交互的物理法则视频环境。
#Marble(空间智能/3D可操作性): 直接创建可编辑的3D环境,解决生成变形与不一致问题。
#JEPA(世界模型即认知框架): 以潜在变量呈现世界状态,成为机器人的完美训练场。

趋势5️⃣:原生多模态理解与生成持续深化

#原生多模态理解: Gemini、OpenAI引领原生路线,国内Seed等正在追赶。
#理解-生成一体化: nano-banana模型将理解与生成结合,阿里Qwen-Image等模型通过MMDIT架构,大幅提升一致性与可编辑性,推动多模态模型从“抽卡”进入确定性创作阶段
#展望: 看好2026年国产大模型在此领域的突破。

祝好!
天风计算机团队

发布于 上海