Open-AutoGLM部署全攻略:本地电脑+真机实操演示
1. 引言:让AI接管你的手机,一句话完成复杂操作
你有没有想过,只需要说一句“打开小红书搜美食”,手机就能自动执行一系列点击、滑动、输入的操作,像真人一样帮你完成任务?这不再是科幻场景——Open-AutoGLM正在让这一切成为现实。
Open-AutoGLM 是智谱开源的一款面向手机端的 AI Agent 框架,它基于视觉语言模型(VLM),结合 ADB(Android Debug Bridge)技术,实现了真正的“多模态智能助理”。你不需要写代码、不需要手动操作,只需用自然语言下达指令,它就能:
- 看懂当前手机屏幕内容
- 理解你的意图
- 自动规划操作路径
- 执行点击、滑动、输入等动作
- 在敏感操作时暂停并提示确认
- 支持远程WiFi连接,实现无感控制
本文将带你从零开始,手把手完成 Open-AutoGLM 的本地部署与真机实操。无论你是开发者还是普通用户,只要有一台安卓手机和一台电脑,就能立刻上手体验。
2. 核心原理:它是怎么“看”和“动”的?
在动手之前,先简单了解下它的运行机制,这样你才能更好地理解每一步的意义。
2.1 多模态感知 + 自动化执行
Open-AutoGLM 的核心能力可以拆解为三个部分:
| 模块 | 功能说明 |
|---|---|
| 视觉理解 | 通过截图获取手机屏幕图像,送入视觉语言模型分析界面元素(按钮、输入框、标题等) |
| 意图解析 | 将你的自然语言指令(如“搜索美食博主”)转化为结构化任务目标 |
| 动作规划与执行 | 结合当前界面状态,推理出下一步该点哪里、滑到哪、输入什么,并通过 ADB 发送指令 |
整个过程就像一个“AI大脑”在远程操控你的手机。
2.2 安全设计:不会乱点,更不会误操作
很多人担心:AI会不会乱点广告?会不会误删数据?
答案是不会。系统内置了多重安全机制:
- 敏感操作拦截:遇到支付、删除、权限申请等关键操作时,会暂停并等待人工确认
- 人工接管模式:在验证码、登录弹窗等AI无法处理的场景,可临时接管控制权
- 远程调试保护:所有ADB连接需手动授权,防止未经授权的设备接入
你可以把它想象成一个“听话的助手”,而不是“失控的机器人”。
3. 环境准备:软硬件清单一览
要成功运行 Open-AutoGLM,你需要准备好以下几样东西:
3.1 硬件要求
| 设备 | 要求 |
|---|---|
| 本地电脑 | Windows 或 macOS,能运行 Python 和 ADB |
| 安卓手机 | Android 7.0 及以上版本,支持 USB 调试 |
| 连接方式 | USB 数据线 或 同一 WiFi 下的无线连接 |
建议优先使用 USB 连接,稳定性更高;WiFi 连接适合远程调试或自动化测试场景。
3.2 软件依赖
| 软件 | 版本建议 | 安装方式 |
|---|---|---|
| Python | 3.10+ | 官网下载安装 |
| ADB 工具 | 最新版 platform-tools | Google 官方下载 |
| Git | 最新版 | 用于克隆代码仓库 |
4. 手机端设置:开启“被控制”权限
为了让电脑能控制手机,必须先在手机上开启几个关键开关。
4.1 开启开发者选项
- 进入「设置」→「关于手机」
- 连续点击「版本号」7次,直到提示“您已进入开发者模式”
4.2 启用 USB 调试
- 返回设置主界面,进入「开发者选项」
- 找到「USB 调试」并开启
- 当手机连接电脑时,若弹出“允许USB调试?”对话框,请点击“允许”
4.3 安装 ADB Keyboard(重要!)
这是实现文本输入的关键组件。
- 下载 ADB Keyboard APK 并安装
- 进入「设置」→「语言与输入法」→「当前输入法」
- 切换为ADB Keyboard
验证是否生效:在任意输入框长按,选择“输入法”→“ADB Keyboard”即可看到切换成功。
5. 本地控制端部署:三步搞定
现在我们回到电脑端,开始部署 Open-AutoGLM 的控制程序。
5.1 克隆项目代码
打开终端或命令行工具,执行以下命令:
git clone https://github.com/zai-org/Open-AutoGLM cd Open-AutoGLM5.2 安装依赖包
确保你已安装pip,然后运行:
pip install -r requirements.txt pip install -e .如果出现权限问题,可在命令前加
sudo(macOS/Linux)或以管理员身份运行终端(Windows)。
5.3 验证 ADB 是否正常工作
先插入 USB 数据线,连接手机与电脑。
在终端输入:
adb devices如果一切正常,你会看到类似输出:
List of devices attached ABCDEF1234567890 device只要有设备 ID 出现且状态为device,说明连接成功。
6. 连接方式详解:USB vs WiFi
Open-AutoGLM 支持两种连接方式,各有优劣。
6.1 USB 连接(推荐新手使用)
优点:稳定、无需配置网络
缺点:需要物理连线
操作步骤:
- 手机通过 USB 连接电脑
- 开启 USB 调试
- 执行
adb devices查看设备列表
6.2 WiFi 无线连接(适合进阶用户)
优点:摆脱线缆束缚,可远程控制
缺点:依赖网络稳定性
启用步骤:
- 先用 USB 连接手机
- 在终端执行:
adb tcpip 5555- 断开 USB,获取手机 IP 地址(可在「设置」→「WLAN」中查看)
- 使用 IP 连接:
adb connect 192.168.x.x:5555- 再次执行
adb devices,确认设备在线
注意:首次无线连接需通过 USB 授权一次,之后可长期使用。
7. 启动 AI 代理:让手机“活”起来
万事俱备,现在是见证奇迹的时刻!
7.1 命令行方式启动
假设你已经有一个云服务器运行了 AutoGLM 模型服务(例如 vLLM 部署),并且映射了端口(如 8800),那么可以这样调用:
python main.py \ --device-id ABCDEF1234567890 \ --base-url http://<你的公网IP>:8800/v1 \ --model "autoglm-phone-9b" \ "打开抖音搜索抖音号为:dycwo11nt61d 的博主并关注他!"参数说明:
| 参数 | 说明 |
|---|---|
--device-id | 通过adb devices获取的设备ID |
--base-url | 云端模型服务的地址(必须包含/v1) |
--model | 模型名称,目前固定为autoglm-phone-9b |
| 最后字符串 | 你要下达的自然语言指令 |
7.2 实际运行效果预览
当你按下回车后,你会看到如下行为依次发生:
- 程序截取手机当前屏幕
- AI 分析界面,识别出“抖音”App 图标
- 自动点击进入抖音
- 找到搜索框并点击
- 通过 ADB Keyboard 输入指定抖音号
- 触发搜索,找到目标用户
- 点击“关注”按钮
- 输出日志:“任务完成 ”
整个过程无需你动手,完全由 AI 自主决策和执行。
8. Python API 调用:集成到自己的项目中
如果你希望将 Open-AutoGLM 集成到自己的自动化脚本或测试框架中,可以直接使用其提供的 Python API。
8.1 连接管理示例
from phone_agent.adb import ADBConnection, list_devices # 创建连接管理器 conn = ADBConnection() # 连接远程设备(WiFi) success, message = conn.connect("192.168.1.100:5555") print(f"连接状态: {message}") # 列出所有已连接设备 devices = list_devices() for device in devices: print(f"{device.device_id} - {device.connection_type.value}")8.2 获取设备信息与启用 TCP/IP
# 在 USB 设备上启用无线调试 success, message = conn.enable_tcpip(5555) if success: ip = conn.get_device_ip() print(f"设备 IP: {ip}") else: print("启用失败:", message)这些 API 非常适合用于批量设备管理、自动化测试平台开发等场景。
9. 常见问题排查指南
即使按照步骤操作,也可能遇到一些小问题。以下是高频问题及解决方案。
9.1 ADB 无法识别设备
现象:adb devices显示空或unauthorized
解决方法:
- 检查是否开启了“USB 调试”
- 拔插 USB 线,重新授权调试权限
- 更换数据线(有些仅支持充电)
9.2 连接被拒绝(Connection Refused)
现象:WiFi 连接时报错failed to connect
原因:防火墙未开放端口或设备不在同一局域网
解决方法:
- 确保手机和电脑在同一 WiFi 下
- 检查路由器是否限制设备间通信
- 在云服务器上放行 5555 端口
9.3 模型无响应或输出乱码
现象:AI 不执行动作,或生成错误指令
可能原因:
- 模型服务未正确启动
max-model-len设置过小导致上下文截断- 显存不足导致推理失败
建议检查项:
- 确认 vLLM 启动参数正确
- 查看服务端日志是否有 OOM 报错
- 尝试降低并发请求量
10. 总结:未来已来,只是分布不均
通过本文的详细指导,你应该已经成功完成了 Open-AutoGLM 的本地部署,并亲眼见证了 AI 如何像人类一样操作手机。
这不仅仅是一个“炫技”项目,它背后代表的是下一代人机交互范式的雏形:
- 不再需要学习复杂的 App 操作流程
- 只需表达“我想做什么”,剩下的交给 AI
- 无论是老人、儿童还是残障人士,都能平等享受数字便利
而 Open-AutoGLM 作为开源框架,正在为这一愿景铺平道路。
获取更多AI镜像
想探索更多AI镜像和应用场景?访问 CSDN星图镜像广场,提供丰富的预置镜像,覆盖大模型推理、图像生成、视频生成、模型微调等多个领域,支持一键部署。