T-Bench:为AI Agent在终端环境中完成复杂任务提供基准测试。

提供丰富的任务数据集,涵盖多种复杂场景;支持多种语言模型和Agent的集成与测试;交互式任务解决方案支持,助力Agent开发与优化
 
 
Back to Top