VLABench:大规模基准测试平台,专为公平评估视觉语言代理、具身代理和视觉语言模型设计,提供长视野推理任务
 
 
Back to Top