一个面向通用灵巧抓取的视觉-语言-动作框架。它能在复杂场景中实现超过90%的抓取成功率,解决机器人在真实世界中抓取多样化物体的难题。
零样本学习,无需额外训练即可应对数千种未见物体和环境组合;结合预训练视觉语言模型与扩散策略,实现复杂任务的高效推理;提供可视化工具,帮助理解模型内部行为
DexGraspVLA | #框架
零样本学习,无需额外训练即可应对数千种未见物体和环境组合;结合预训练视觉语言模型与扩散策略,实现复杂任务的高效推理;提供可视化工具,帮助理解模型内部行为
DexGraspVLA | #框架
采用先进Agent编码流程,高效生成AI Agent;集成LangGraph框架,支持多Agent协同工作;提供Docker支持与Streamlit UI界面,操作便捷