【TheAgentCompany 模拟软件公司任务的Agent基准测试平台:一个用于衡量AI代理在现实世界专业任务中表现的基准测试平台,通过模拟数字工作者的方式,如浏览网页、编写代码、运行程序和与其他同事沟通,来评估AI代理的性能】'TheAgentCompany: An agent benchmark with tasks in a simulated software company.' GitHub: github.com/TheAgentCompany/TheAgentCompany #AI代理# #基准测试# #智能任务执行# #AI创造营#
发布于 北京
