[LG] Survey on Evaluation of LLM-based Agents
http://t.cn/A6BnwY47
本文全面梳理了 LLM 智能体评估领域的最新进展,从能力评估、应用评估、通用评估和评估框架四个维度,系统地总结了现有评估方法、基准和工具,并指出了该领域未来的发展趋势和挑战,为研究人员和实践者提供了宝贵的参考和指导。
发布于 北京
