黑洞资源笔记
06:38 · Mar 31, 2025 · Mon
T-Bench
:为AI Agent在终端环境中完成复杂任务提供基准测试。
提供丰富的任务数据集,涵盖多种复杂场景;支持多种语言模型和Agent的集成与测试;交互式任务解决方案支持,助力Agent开发与优化
Home
Powered by
BroadcastChannel
&
Sepia