支持10种以上主流LLM后端(如OpenAI、Anthropic、Ollama等);提供统一API,简化配置和调用流程;内置多步链式提示与模板功能,大幅提升灵活性。
超越竞品的电影美学表现,尤其在氛围营造、镜头运动和细节保留上表现卓越;清晰度提升14.6%,真实感增强4.3%,适合高保真场景;支持720P和1080P分辨率,保持高质量输出
提供约50个真实终端任务,覆盖从代码编译到模型训练的全场景;搭载沙盒环境,安全运行各类任务;支持多种语言模型,助力Agent性能评估
Terminal-Bench | #工具