news 2026/4/24 15:50:12

Open-AutoGLM安装教程:Windows/Mac都能轻松上手

作者头像

张小明

前端开发工程师

1.2k 24
文章封面图
Open-AutoGLM安装教程:Windows/Mac都能轻松上手

Open-AutoGLM安装教程:Windows/Mac都能轻松上手

1. 引言

随着AI智能体技术的快速发展,AutoGLM-Phone作为智谱开源的手机端AI Agent框架,正逐步成为自动化操作领域的创新代表。该框架基于视觉语言模型(VLM),能够以多模态方式理解手机屏幕内容,并通过ADB实现自动操控设备。用户只需输入自然语言指令,如“打开小红书搜索美食”,系统即可自动解析意图、识别界面元素并执行完整操作流程。

本文将围绕Open-AutoGLM提供一份详尽的本地部署与使用指南,覆盖Windows和macOS平台,帮助开发者快速搭建环境、连接真机或模拟器,并成功启动AI代理服务。无论你是初学者还是有经验的工程师,都能通过本教程顺利上手。


2. 环境准备与依赖配置

2.1 系统要求与基础工具

在开始前,请确保满足以下硬件与软件条件:

项目要求
操作系统Windows 10+ 或 macOS Monterey 及以上版本
Python 版本建议 Python 3.10 或更高版本
安卓设备Android 7.0+ 的真实手机或安卓模拟器
ADB 工具Android Debug Bridge,用于设备通信

提示:推荐使用虚拟环境管理Python依赖,避免包冲突。

```bash python -m venv autoglm-env source autoglm-env/bin/activate # macOS/Linux

或 autoglm-env\Scripts\activate # Windows

```

2.2 安装并配置 ADB

ADB 是控制安卓设备的核心工具。以下是不同系统的配置方法:

Windows 配置步骤:
  1. 下载 Android SDK Platform Tools 并解压。
  2. 打开“系统属性” → “高级” → “环境变量”。
  3. 在“系统变量”中找到Path,点击编辑,添加解压目录路径(例如:C:\platform-tools)。
  4. 打开命令行,运行adb version验证是否安装成功。
macOS 配置方法:

在终端中执行以下命令(假设 platform-tools 解压至 Downloads 目录):

export PATH=${PATH}:~/Downloads/platform-tools

为永久生效,可将上述命令写入 shell 配置文件(如.zshrc.bash_profile):

echo 'export PATH=${PATH}:~/Downloads/platform-tools' >> ~/.zshrc source ~/.zshrc

验证安装:

adb version # 正常输出应包含 ADB 版本号

3. 手机端设置与权限开启

要让 AI 成功控制手机,必须正确配置设备调试权限。

3.1 开启开发者选项与USB调试

  1. 进入手机“设置” → “关于手机”。
  2. 连续点击“版本号”7次,直到提示“您已进入开发者模式”。
  3. 返回设置主界面,进入“开发者选项”。
  4. 启用“USB调试”功能。

注意:部分厂商(如小米、华为)可能还需额外授权“USB安装”或“安全设置”。

3.2 安装 ADB Keyboard 输入法

由于 AutoGLM 需要向应用输入文本(如搜索框),而多数输入法不支持 ADB 文本注入,因此需安装专用输入法:

  1. 下载 ADB Keyboard APK。
  2. 安装后,在“语言与输入法”中将其设为默认输入法。
  3. 测试是否生效:连接电脑后运行bash adb shell am startservice --user 0 -n hk.edu.cuhk.cse.adbkeyboard/.AdbIME adb shell input text "Hello_AutoGLM"若屏幕上出现文字,则配置成功。

4. 部署 Open-AutoGLM 控制端代码

4.1 克隆项目仓库

在本地电脑上克隆官方 GitHub 仓库:

git clone https://github.com/zai-org/Open-AutoGLM cd Open-AutoGLM

4.2 安装 Python 依赖

项目依赖通过requirements.txt管理,建议在虚拟环境中安装:

pip install -r requirements.txt pip install -e .

-e .表示以可编辑模式安装,便于后续开发调试。

常见依赖包括: -torch,transformers: 支持模型推理 -fastapi,uvicorn: 构建本地API服务(若启用) -adbutils: 封装 ADB 操作接口 -Pillow,opencv-python: 图像处理与OCR辅助


5. 设备连接方式详解

5.1 USB 连接方式(推荐新手)

  1. 使用数据线将手机连接至电脑。
  2. 手机会弹出“允许USB调试?”对话框,勾选“始终允许”并确认。
  3. 在终端运行:bash adb devices输出示例:List of devices attached 1234567890ABCDEF device

出现device状态即表示连接成功。

5.2 WiFi 远程连接(适合无线调试)

若希望脱离数据线进行远程控制,可使用 ADB over TCP/IP:

第一步:通过 USB 启动 TCP 模式
adb tcpip 5555

此命令将设备监听在 5555 端口。

第二步:断开 USB,使用 IP 连接

获取手机局域网 IP 地址(可在“设置-网络-WiFi”中查看),然后执行:

adb connect 192.168.x.x:5555

再次运行adb devices查看是否显示设备。

提示:重启手机后需重新执行adb tcpip 5555


6. 启动 AI 代理并执行任务

6.1 命令行方式运行任务

当云服务端已部署好模型(如autoglm-phone-9b)并通过 vLLM 暴露 API 接口后,可在本地调用:

python main.py \ --device-id 1234567890ABCDEF \ --base-url http://<your-server-ip>:8800/v1 \ --model "autoglm-phone-9b" \ "打开抖音搜索抖音号为:dycwo11nt61d 的博主并关注他!"

参数说明:

参数说明
--device-id来自adb devices的设备ID或IP:端口
--base-url云端模型服务地址,格式为http://IP:Port/v1
--model指定使用的模型名称
最后字符串用户自然语言指令

注意:请确保云服务器防火墙开放对应端口(如 8800),否则连接会被拒绝。

6.2 使用 Python API 实现远程控制

对于集成到其他系统的场景,可直接调用 SDK 中的 ADB 接口:

from phone_agent.adb import ADBConnection, list_devices # 创建连接管理器 conn = ADBConnection() # 连接远程设备 success, message = conn.connect("192.168.1.100:5555") print(f"连接状态: {message}") # 列出所有连接设备 devices = list_devices() for device in devices: print(f"{device.device_id} - {device.connection_type.value}") # 获取设备IP(适用于动态IP环境) ip = conn.get_device_ip() print(f"当前设备IP: {ip}") # 断开连接 conn.disconnect("192.168.1.100:5555")

该方式适用于构建 Web 控制台、自动化测试平台等高级应用。


7. 常见问题排查与解决方案

7.1 ADB 连接失败

问题现象可能原因解决方案
unauthorized未授权调试重新插拔数据线,确认手机端弹窗已允许
offlineADB 守护进程异常执行adb kill-server && adb start-server
connection refused网络不通或端口未开检查路由器防火墙、确认设备在同一局域网

7.2 模型无响应或乱码

  • 检查 base-url 是否正确:确保 URL 格式为http://x.x.x.x:port/v1,且服务正在运行。
  • 验证 vLLM 启动参数bash python -m vllm.entrypoints.openai.api_server \ --model zhipu-autobots/autoglm-phone-9b \ --max-model-len 4096 \ --gpu-memory-utilization 0.9特别注意max-model-len应足够大以支持长上下文推理。

7.3 敏感操作无法继续

AutoGLM 内置安全机制,在涉及支付、删除等敏感操作时会暂停并提示人工接管。这是正常行为,可通过以下方式处理:

  • 在日志中查看中断点;
  • 手动完成关键步骤;
  • 继续发送后续指令。

8. 总结

本文详细介绍了如何在 Windows 和 macOS 系统上部署Open-AutoGLM,从环境准备、ADB 配置、手机权限设置,到代码拉取、设备连接及最终任务执行,形成了一套完整的实践路径。通过该框架,开发者可以轻松实现基于自然语言的手机自动化操作,极大提升效率。

核心要点回顾: 1. ✅ 正确安装并配置 ADB,是控制设备的前提; 2. ✅ 开启开发者模式与 ADB Keyboard,保障输入能力; 3. ✅ 使用 USB 初次连接后再切换为 WiFi,提高灵活性; 4. ✅ 云端模型服务需稳定暴露 OpenAI 兼容接口; 5. ✅ 注意安全策略设计,合理处理人工介入环节。

未来,随着多模态模型能力的增强,此类 AI Agent 将在自动化测试、无障碍辅助、数字员工等领域发挥更大价值。


获取更多AI镜像

想探索更多AI镜像和应用场景?访问 CSDN星图镜像广场,提供丰富的预置镜像,覆盖大模型推理、图像生成、视频生成、模型微调等多个领域,支持一键部署。

版权声明: 本文来自互联网用户投稿,该文观点仅代表作者本人,不代表本站立场。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如若内容造成侵权/违法违规/事实不符,请联系邮箱:809451989@qq.com进行投诉反馈,一经查实,立即删除!
网站建设 2026/4/21 23:28:21

买不起GPU怎么办?bge-large-zh-v1.5云端体验1小时1块钱

买不起GPU怎么办&#xff1f;bge-large-zh-v1.5云端体验1小时1块钱 你是不是也遇到过这种情况&#xff1a;想参加AI竞赛&#xff0c;看到别人用大模型做出惊艳项目&#xff0c;自己却只能干瞪眼&#xff1f;家里那台普通台式机连最基础的深度学习任务都跑不动&#xff0c;显卡…

作者头像 李华
网站建设 2026/4/18 3:56:57

BERT掩码模型应用场景:常识推理系统部署完整流程

BERT掩码模型应用场景&#xff1a;常识推理系统部署完整流程 1. 引言 1.1 业务场景描述 在自然语言处理的实际应用中&#xff0c;语义理解是构建智能对话、内容生成和知识推理系统的核心能力。其中&#xff0c;常识推理与上下文补全任务广泛应用于教育辅助、文本纠错、智能写…

作者头像 李华
网站建设 2026/4/23 14:42:55

BGE-M3入门指南:语义搜索API快速集成

BGE-M3入门指南&#xff1a;语义搜索API快速集成 1. 引言 在现代信息检索系统中&#xff0c;高效、精准的语义搜索能力已成为构建智能应用的核心需求。无论是搜索引擎、推荐系统还是知识库问答&#xff0c;都需要模型能够理解文本的深层语义并进行准确匹配。BGE-M3 是由 Flag…

作者头像 李华
网站建设 2026/4/23 13:55:35

Qwen3Guard-Gen-WEB ONNX转换:跨平台模型部署方案

Qwen3Guard-Gen-WEB ONNX转换&#xff1a;跨平台模型部署方案 1. 技术背景与问题提出 随着大语言模型在内容生成、对话系统等场景的广泛应用&#xff0c;用户生成内容&#xff08;UGC&#xff09;的安全性成为不可忽视的关键问题。尤其在社交平台、在线教育、智能客服等高交互…

作者头像 李华
网站建设 2026/4/24 1:14:34

GPT-OSS-20B-WEBUI新手必看:常见启动错误排查指南

GPT-OSS-20B-WEBUI新手必看&#xff1a;常见启动错误排查指南 获取更多AI镜像 想探索更多AI镜像和应用场景&#xff1f;访问 CSDN星图镜像广场&#xff0c;提供丰富的预置镜像&#xff0c;覆盖大模型推理、图像生成、视频生成、模型微调等多个领域&#xff0c;支持一键部署。 1…

作者头像 李华
网站建设 2026/4/23 7:19:21

Z-Image-Base微调实战:定制你的专属风格模型

Z-Image-Base微调实战&#xff1a;定制你的专属风格模型 在AI生成图像技术日益普及的今天&#xff0c;通用模型虽然能应对大多数场景&#xff0c;但在特定风格表达上往往力不从心。无论是打造品牌视觉识别系统、构建个性化IP形象&#xff0c;还是实现艺术化创作&#xff0c;我们…

作者头像 李华