倩男游神 25-07-17 21:57
微博认证:财经观察官 财经博主 微博原创视频博主

【天风计算机 缪欣君团队】 KIMI K2:最前瞻的研究!OnlineRL新范式,大模型的又一DeekSeek时刻!

核心逻辑:

1️⃣KIMI K2的重点不在性能,而在于“下一代范式的起点”,称之为又一个DeepSeek时刻绝不为过。从25.3月开始,海外御三家+国内DeepSeek已经在探索新范式OnlineRL,相信过去一个月听过我路演的领导不会陌生。

2️⃣OnlineRL的核心是足够好的奖励模型,对于开放场景(无标准答案)模型能力提升50%+(当前数值)。但更重要的是,OnlineRL能够迭代奖励模型的基准,实现“基模—奖励模型—基模”的迭代闭环,即左脚踩右脚上天(即理论情况下模型的能力没有上限、Nature报告中其实提到了KIMI的突破在于新的范式)。

3️⃣KIMIK2现在只是preview、并未做Post-Training,当前的测评效果意义有限。我们认为#当前K2版本天然倾向于采用短链(尚未做RL、KIMI团队还在调试),深层推理需要外部框架补充(类Workflow)。

应用整体处于低位,关注:通用型Agent
1)企业级Agent:鼎捷数智、汉得信息、金蝶国际、泛微网络、用友网络、稅友股份、致远互联
2)办公软件:金山办公、腾讯控股(海外组覆盖)、福昕软件、合合信息、万兴科技
垂直场景agent
1)银行:信雅达、京北方、长亮科技、宇信科技
2)人力:北森控股、科锐国际(商社组覆盖)、北京人力(商社组覆盖)
3)证券: 顶点软件、同花顺、恒生电子、财富趋势、指南针
4)网安:深信服、启明星辰、安恒信息、绿盟科技、三六零、奇安信等
5)教育&法律:科大讯飞、金桥信息、粉笔、视源股份、华宇软件、竞业达、金桥信息
6)医疗:东软集团(与电子组联合覆盖)、卫宁健康、美年健康、创业慧康等

#a股#

发布于 浙江