实时快报:【#美团LongCat开源 VitaBench2.0:长期动态智能体基准新标杆#】云财经讯,VitaBench 2.0是首个真实生活场景下面向长期动态用户建模的智能体评测基准,它系统性地评测大语言模型在长期、真实、动态的用户互动中个性化与主动性的能力。(美团技术)
发布于 广东
实时快报:【#美团LongCat开源 VitaBench2.0:长期动态智能体基准新标杆#】云财经讯,VitaBench 2.0是首个真实生活场景下面向长期动态用户建模的智能体评测基准,它系统性地评测大语言模型在长期、真实、动态的用户互动中个性化与主动性的能力。(美团技术)