智谱开源神器 Open-AutoGLM简单使用教程

作者： Jam 发布时间： December 16, 2025 分类：技术 No Comments

智谱清言开源的「Open-AutoGLM」项目可以让安卓手机就能自动完成操作，用自然语言指令驱动自动化操作，彻底解放你的双手。
20251212-3

据介绍「Open-AutoGLM」是一个专注于手机端的智能代理（Agent）框架，核心能力是听懂用户的自然语言指令，并自动操控手机完成任务。无论是社交、购物、外卖还是出行，只需一句话，它就能像人类一样 “看懂” 屏幕、规划步骤、执行操作。

20251212-4

例如：“打开小红书搜索美食”，Phone Agent 即可自动解析意图、理解当前界面、规划下一步动作并完成整个流程。

20251212

目前支持 50 多个常用应用，包括有：

工作原理就是：通过截图获取当前手机界面，借助视觉语言模型解析界面元素（如按钮、输入框、图标）→ 根据用户指令拆解出具体步骤 → 通过 ADB 模拟人类操作一步步完成任务。

如何体验

如果你觉得命令行不够直观，还可以试试第三方工具 AutoGLM-GUI 提供了图形化界面，只需要一个 OpenAI 兼容的模型服务，支持一键启动服务、输入指令、查看操作日志，小白用户也能轻松上手。

20251212-5

从 “人操作手机” 到 “手机听懂人”，Open-AutoGLM 正在重新定义人与设备的交互方式。无论是提升日常效率，还是探索 AI 代理的更多可能，这个开源项目都值得一试。