手机操作太繁琐?
Open-AutoGLM 帮你自动化完成!
这是一个基于 AutoGLM 的开源手机智能助理框架,能理解手机屏幕内容,通过视觉语言模型结合 ADB 自动控制安卓设备,帮你用自然语言指令操作手机应用。比如说“打开淘宝搜索无线耳机”,它能自动打开应用、点击、输入、滑动,甚至处理验证码和登录操作,极大提升手机操作效率。
支持微信、淘宝、京东、美团、小红书等 50+ 主流中文应用,能远程通过 WiFi 调试,无需 USB 连接。无论是单步调试还是批量任务,都能清晰看到 AI 的思考过程和执行动作。
项目已集成丰富功能:
- 多模态屏幕内容理解,自动识别界面元素
- 基于自然语言的智能任务规划
- 敏感操作自动确认和人工接管机制
- 支持远程 ADB 设备管理和无线调试
- 兼容多平台模型部署,可用第三方 API 也可本地部署
适合自动化测试、智能助理、无障碍操作等多种场景。安装依赖后,即可快速运行体验。