Qwen团队刚发布了一个比较新的玩意:语言世界模型
类似语言模型(用语言输入输出)和世界模型(预测世界的下一步状态)结合体。
经过训练后,语言世界模型可以输入类似终端信息,输出(就是预测)终端下一步会输出什么。
目前覆盖了七个场景:MCP、Search、Terminal、SWE、Web、OS、Android
论文在这里:arxiv.org/abs/2606.24597
这个似乎是个训练普通大模型的中间态,可以用它来训练其他模型。
发布于 山东
