VLABench：大规模基准测试平台，专为公平评估视觉语言代理、具身代理和视觉语言模型设计，提供长视野推理任务 | 黑洞资源笔记

14:27 · Dec 27, 2024 · Fri

VLABench：大规模基准测试平台，专为公平评估视觉语言代理、具身代理和视觉语言模型设计，提供长视野推理任务

Powered by BroadcastChannel & Sepia