挨踢牛魔王 26-01-28 09:40
微博认证:科技博主

说说kimi 2.5,我现在用大模型,已经不怎么看排行打分了。
我就看它能不能帮我干活。

kimi 2.5昨天发布,并且开源了,1T的参数,激活参数32B。
昨天我没咋说这个模型,为啥呢?
我直接丢给它一个真实任务给我跑,能完成的就是好模型,不能完成,打分再高也没用。

今天早上起来一看,全部跑完了,效果不错。
尤其是中间遇到问题,它会自己想办法解决。
比如说它发现翻译时间时间太长,然后它就主动改脚本进行批量翻译,然后汇报进度,可以说非常智能了。

多模态那个是需要的,有时候编程,需要传图片或者网页截图。
kimi 2.5的前端美感还不错,agent能力增强了不少。
只用了西方1%的资源就做出了这个模型,相当了不起了。

现在的情况是,glm 4.7那边,一堆人挤在那里,特别慢,算力严重不够。
你花钱呐,他们也不会让你更快,一个任务执行半天。

deepseek V3.2上下文严重不够,不知道咋回事,经常干活,干着干着就中断了。
或者有时候你让它干活,它就把脚本写完了就认为任务完成了,都不执行的。

kimi 2.5速度非常快。
我买了他们那个编程的4.9的7天体验,才给了1024次,还4小时限速100次,完全不够用。
这就是1天的用量而已。
不知道7天以后,变成49块钱一个月,次数能不能上到一天1024,否则根本不够,没法用啊。

如果用量给够,真可以做主力模型了。

特征:
原生多模态:K2.5 预先训练于视觉-语言标记,擅长视觉知识、跨模态推理和基于视觉输入的代理工具使用。
视觉编码:K2.5 从视觉规范(UI设计、视频工作流程)生成代码,并自主协调视觉数据处理工具。
代理群:K2.5 从单代理扩展过渡到自我导向、协调的群集式执行方案。它将复杂任务分解为由动态实例化、领域特定代理执行的并行子任务。

模型地址:www.modelscope.cn/models/moonshotai/Kimi-K2.5/summary

发布于 江苏