阿里的那个所谓的lwm,agentworld,我真的不想说什么了,冲着benchmark去测试的,结果比qwen3.6差好多,那到底是trian啥了呢?不管是程序还是说调tool,或者谁告诉我应该咋测呢,连个超级玛丽都玩不了
发布于 北京
阿里的那个所谓的lwm,agentworld,我真的不想说什么了,冲着benchmark去测试的,结果比qwen3.6差好多,那到底是trian啥了呢?不管是程序还是说调tool,或者谁告诉我应该咋测呢,连个超级玛丽都玩不了