OpenAutoGLM - 智谱AI开源的手机AI Agent模型
OpenAutoGLM 是智谱AI开源的具有“手机使用”能力的智能体模型,能通过多模态感知理解手机屏幕内容,自动生成操作流程来完成用户指定的任务。用户只需用自然语言描述需求,如“打开美团搜索附近的火锅店”,AutoGLM 可以自动解析意图、理解当前界面、规划下一步动作并执行整个流程。模型通过 ADB(Android Debug Bridge)控制设备,支持多种操作,如点击、输入文本、滑动等,并且内置敏感操作确认机制,确保在涉及登录或验证码等场景时可进行人工接管。AutoGLM 支持远程 ADB 调试,无需 USB 连接即可控制设备,大大提高了使用的灵活性和便捷性。