前openai CEO米娅出来创办的thinking machine,融资了不少钱,前两年就推出了一个训练lora的平台的。
不过这次,好像找到一个不错的技术方向,就是交互模型。
啥叫交互模型呢?
我们现在用的大模型,基本都是回合制的。
就是你问它一句,它答一句,就是一个回合结束了。
你不要以为在agent里面,它就不是回合制的了,还是回合制的。
那就有个问题,就是不流畅。
比如说,你做俯卧撑,你让它开始数,它不能一直帮你计数的。
你要再问它,它才会回答。
像电影《她》里面,那种实时交互,可以打断的的AI效果是做不到的。
但是thinking machine出了一个新的模型架构,就是可以实时的交互了。
原理就是前面有个前端模型,200多B,可以在200毫秒内响应,一直维持实时交互。
复杂的任务就丢给后端模型,但是前端模型的交互还是保持着。
就像游戏,早期的游戏,就是你打一下,敌人打你一下,这就是回合制。
但是,大菠萝,即时战略游戏,比如魔兽这种,是大家随时都可以出招的。
这个技术创新,就是相当于从回合制升级到了即时交互。
这在很多场景,比如客服,会议,游戏,操作等领域还是有很广泛的前景的。
下面是他们的文章,可以说工程创新居多,在模型上的创新不多。
但是确实一个很有创意的方向。
地址:thinkingmachines.ai/blog/interaction-models/
发布于 江苏
