刚刷到商汤把日日新SenseNova U1给开源了
说实话我有点愣,商汤这几年……感觉声音没那么大了,我还以为他们在憋什么大招,结果真的甩了一个大的出来
怎么说呢
这个U1它不是那种传统的多模态模型。你像以前那种,看图是一个模块、理解文字又是个模块、生成又得换一套,各个模块之间传话就跟……就跟打接力赛似的,中间各种损耗。
这玩意直接把理解、推理、生成全部拧到一起了,在一个模型里就把活儿全干了。没有中间商赚差价的感觉,效率提升特别明显。
而且啊,这玩意还是个“轻量级选手”——8B参数的版本,8B哎,就这么点规模,但在复杂信息图生成这种任务上,跑出来的效果竟然能对标一些商业闭源大模型。
我在想这才是真正“接地气”的思路:不盲目去卷参数量,而是从底层架构去提高效率,让我们这种普通人也能部署、也能跑得动。
开源这事儿我还是比较认的。技术再强,就是困在实验室里、贵得要命、一般人碰不着,那普及就是个空谈。如果能装到个人电脑里、开源生态里用起来,那才有更大的价值。
希望这种好东西以后越来越多吧,也越来也更便宜。 #一分钟精选视频扶持计划# http://t.cn/AXJAYIaF
发布于 福建
