news 2026/4/15 12:43:32

再也不用手动操作!Open-AutoGLM帮你全自动刷小红书

作者头像

张小明

前端开发工程师

1.2k 24
文章封面图
再也不用手动操作!Open-AutoGLM帮你全自动刷小红书

再也不用手动操作!Open-AutoGLM帮你全自动刷小红书

你有没有这样的经历:看到一个美食推荐,想立刻打开小红书搜一下,结果一边手忙脚乱点开App、输入关键词、翻找内容,一边还担心错过精彩评论?更别说还要点赞、收藏、关注博主……这一套流程下来,原本几分钟能搞定的事,硬是拖成了“手机劳动”。

现在,这一切都可以交给AI来做了。

Open-AutoGLM——由智谱开源的手机端AI Agent框架,正让“动口不动手”成为现实。你只需要说一句:“打开小红书搜美食”,它就能自动完成所有操作:启动App、输入搜索词、浏览结果、点击目标账号,甚至一键关注。整个过程无需你动手,就像有个私人助理在替你操作手机。

这不仅是效率的提升,更是人机交互方式的一次跃迁。本文将带你从零开始,了解如何部署和使用Open-AutoGLM,真正实现手机操作的自动化。


1. 什么是Open-AutoGLM?

1.1 多模态理解 + 自动执行 = 真·智能助手

Open-AutoGLM不是一个简单的语音指令工具,而是一个基于视觉语言模型(VLM)的手机端AI代理框架。它的核心能力在于:

  • 看懂屏幕:通过截图识别当前界面元素(按钮、输入框、标题等)
  • 听懂指令:用自然语言接收任务,比如“发个朋友圈说今天天气真好”
  • 规划路径:自动拆解任务步骤,决定先点哪里、再输什么
  • 执行操作:通过ADB(Android Debug Bridge)真实点击、滑动、输入

这套“感知—决策—执行”闭环,让它能像真人一样操作手机,而不是依赖特定App的API接口。

1.2 技术架构一瞥

系统主要由三部分组成:

组件功能
视觉语言模型(VLM)分析手机屏幕截图,理解UI布局与语义
ADB控制层实现对安卓设备的真实操作(点击、滑动、输入)
指令解析引擎将用户自然语言转化为可执行的任务流

特别值得一提的是,它内置了敏感操作确认机制。例如当检测到支付页面或涉及隐私的操作时,会暂停并提示人工接管,避免误操作风险。


2. 准备工作:连接你的手机

要让AI代理控制手机,首先得建立通信通道。Open-AutoGLM通过ADB实现设备控制,支持USB和WiFi两种连接方式。

2.1 硬件与环境要求

  • 操作系统:Windows 或 macOS
  • Python版本:建议3.10及以上
  • 安卓设备:Android 7.0以上手机或模拟器
  • ADB工具:用于设备调试与控制

2.2 安装并配置ADB

Windows用户:
  1. 下载Android SDK Platform Tools
  2. 解压后,将文件夹路径添加到系统环境变量Path
  3. 打开命令行,输入adb version,若显示版本号则安装成功
macOS用户:

在终端中运行以下命令(假设platform-tools解压在Downloads目录):

export PATH=${PATH}:~/Downloads/platform-tools

你可以将这行加入.zshrc.bash_profile文件,避免每次重复设置。

2.3 手机端设置

为了让AI能够“看到”和“操作”你的手机,需要开启几个关键权限:

  1. 开启开发者模式
    进入「设置 → 关于手机」,连续点击“版本号”7次,直到提示已开启开发者选项。

  2. 启用USB调试
    返回设置主菜单,进入「开发者选项」,勾选“USB调试”。

  3. 安装ADB Keyboard(可选但推荐)
    这是一个特殊的输入法,允许AI通过ADB发送文本输入,解决中文输入问题。

    • 下载 ADB Keyboard APK 并安装
    • 在「语言与输入法」中将其设为默认输入法

3. 部署Open-AutoGLM控制端

接下来,在本地电脑上部署控制代码,这是AI代理的大脑所在。

3.1 克隆项目并安装依赖

打开终端,执行以下命令:

git clone https://github.com/zai-org/Open-AutoGLM cd Open-AutoGLM # 安装所需依赖 pip install -r requirements.txt pip install -e .

⚠️ 建议使用虚拟环境(如venv或conda),避免依赖冲突。

3.2 获取设备ID

确保手机通过USB连接电脑,然后运行:

adb devices

你会看到类似输出:

List of devices attached 1234567890ABCDEF device

记下这个设备ID,后续会用到。


4. 连接设备:USB还是WiFi?

Open-AutoGLM支持两种连接方式,各有优势。

4.1 USB直连(稳定首选)

直接用数据线连接手机与电脑,稳定性高,适合开发调试。

adb devices

只要设备列表中有你的手机,说明连接成功。

4.2 WiFi远程连接(无线自由)

如果你希望摆脱数据线束缚,可以通过WiFi连接。

第一步:用USB连接并开启TCP/IP模式

adb tcpip 5555

第二步:断开USB,通过IP连接

先查看手机IP地址(可在「设置 → WLAN」中找到),然后运行:

adb connect 192.168.x.x:5555

连接成功后,即可拔掉数据线,实现无线控制。


5. 启动AI代理:一句话搞定复杂操作

一切准备就绪,现在可以下达指令了!

5.1 命令行快速体验

在项目根目录下运行:

python main.py \ --device-id 1234567890ABCDEF \ --base-url http://<云服务器IP>:<端口>/v1 \ --model "autoglm-phone-9b" \ "打开小红书搜索上海美食探店,并关注第一个博主"

参数说明:

  • --device-id:通过adb devices获取的设备ID
  • --base-url:运行视觉模型的云服务地址(需提前部署vLLM服务)
  • --model:指定使用的模型名称
  • 最后的字符串:你的自然语言指令

📌 示例中的“云服务器”指的是你自行部署的推理服务,例如使用vLLM运行GLM-4.5V模型,并暴露API接口。

5.2 Python API调用(适合集成)

如果你想把AI代理嵌入自己的应用中,也可以使用Python API进行远程控制。

from phone_agent.adb import ADBConnection, list_devices # 创建连接管理器 conn = ADBConnection() # 连接远程设备 success, message = conn.connect("192.168.1.100:5555") print(f"连接状态: {message}") # 列出已连接设备 devices = list_devices() for device in devices: print(f"{device.device_id} - {device.connection_type.value}") # 获取设备IP(用于WiFi连接) ip = conn.get_device_ip() print(f"设备 IP: {ip}")

这种方式更适合做批量任务处理或多设备管理。


6. 实战演示:全自动刷小红书

我们来走一遍完整的自动化流程,看看AI是如何代替你完成一系列操作的。

6.1 下达指令

输入如下命令:

python main.py \ --device-id YOUR_DEVICE_ID \ --base-url http://YOUR_SERVER_IP:8800/v1 \ "打开小红书,搜索‘北京周末好去处’,浏览前三个笔记,点赞并收藏第二个"

6.2 AI执行流程分解

  1. 启动小红书App
    AI识别桌面图标,点击进入。

  2. 定位搜索框并输入关键词
    通过图像识别找到搜索栏,调用ADB Keyboard输入“北京周末好去处”。

  3. 触发搜索并加载结果
    模拟点击“搜索”按钮,等待页面刷新。

  4. 浏览前三条笔记
    逐条滑动,截屏分析内容是否匹配主题。

  5. 对第二条笔记执行点赞+收藏
    识别点赞和收藏图标,精准点击。

整个过程完全自动,耗时约1-2分钟,而手动操作通常需要3-5分钟,且容易分心中断。


7. 常见问题与解决方案

尽管Open-AutoGLM功能强大,但在实际使用中仍可能遇到一些问题。以下是常见情况及应对方法。

7.1 设备无法连接

  • 检查USB调试是否开启
  • 确认ADB服务正常运行:尝试重启ADB服务
    adb kill-server adb start-server
  • 防火墙限制:若使用WiFi连接,确保路由器未屏蔽5555端口

7.2 模型无响应或乱码

  • 检查vLLM服务是否正常启动
  • 核对max-model-len参数:建议设置为8192以上以支持长上下文
  • 显存不足:9B模型至少需要24GB GPU显存(如A100或H100)

7.3 输入中文失败

  • 确保ADB Keyboard已安装并设为默认输入法
  • 测试输入命令
    adb shell am broadcast -a ADB_INPUT_TEXT --es msg "你好世界"

7.4 操作卡住或误触

  • 降低操作速度:增加每步之间的延迟,避免因页面未加载完成导致误判
  • 启用日志模式:查看详细执行轨迹,便于调试

8. 应用场景拓展:不止于小红书

虽然我们以“刷小红书”为例,但Open-AutoGLM的能力远不止于此。它可以应用于各种高频、重复性的手机操作场景。

8.1 社交媒体运营

  • 自动发布朋友圈/微博
  • 批量回复私信
  • 跨平台内容同步(如将公众号文章转成小红书笔记)

8.2 日常生活助手

  • 每天定时查看健康码、行程码
  • 自动打卡企业微信/钉钉
  • 查询天气、交通并生成日报

8.3 内容创作者提效

  • 自动生成短视频脚本并发布
  • 监控竞品动态(定期搜索关键词)
  • 收集热门话题与标签

8.4 企业级应用

  • 自动化测试:模拟用户操作进行App功能验证
  • 数据采集:从多个App抓取公开信息(需合规)
  • 客服辅助:帮助坐席快速查找知识库

9. 总结

Open-AutoGLM的出现,标志着我们正在从“人操作手机”迈向“手机替人操作”的新时代。它不仅仅是一个技术玩具,更是一种全新的生产力工具。

通过本文的介绍,你应该已经掌握了:

  • 如何配置ADB环境并连接安卓设备
  • 如何部署Open-AutoGLM控制端
  • 如何通过自然语言指令驱动AI完成复杂操作
  • 如何排查常见问题并优化使用体验

更重要的是,你已经开始思考:哪些重复性操作可以交给AI?我的日常工作中,有多少时间是可以被“自动化”节省下来的?

未来,AI不会取代人类,但它一定会取代那些不会使用AI的人。而现在,正是掌握这项技能的最佳时机。


获取更多AI镜像

想探索更多AI镜像和应用场景?访问 CSDN星图镜像广场,提供丰富的预置镜像,覆盖大模型推理、图像生成、视频生成、模型微调等多个领域,支持一键部署。

版权声明: 本文来自互联网用户投稿,该文观点仅代表作者本人,不代表本站立场。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如若内容造成侵权/违法违规/事实不符,请联系邮箱:809451989@qq.com进行投诉反馈,一经查实,立即删除!
网站建设 2026/3/27 5:01:05

3D风格何时上线?unet人像卡通化功能期待

3D风格何时上线&#xff1f;unet人像卡通化功能期待 1. 这不是概念图&#xff0c;是已经能跑起来的卡通化工具 你可能见过不少AI人像转卡通的演示视频&#xff0c;但大多停留在“看看就好”的阶段——要么需要复杂配置&#xff0c;要么只能在线试用几秒&#xff0c;要么效果浮…

作者头像 李华
网站建设 2026/4/8 2:18:59

小公司也能玩AI:Unsloth助力轻量级模型定制

小公司也能玩AI&#xff1a;Unsloth助力轻量级模型定制 在很多人印象中&#xff0c;大模型微调是“大厂专属”的技术活——动辄需要多张A100显卡、庞大的工程团队和数周的训练周期。但随着开源生态的爆发式发展&#xff0c;这一局面正在被彻底打破。 今天我们要聊的主角 Unsl…

作者头像 李华
网站建设 2026/4/6 19:54:50

OpenBoard开源输入法:重新定义你的移动输入体验

OpenBoard开源输入法&#xff1a;重新定义你的移动输入体验 【免费下载链接】openboard 项目地址: https://gitcode.com/gh_mirrors/op/openboard 你是否曾经为手机输入效率低下而烦恼&#xff1f;是否在跨语言沟通时感到不便&#xff1f;现在&#xff0c;一个全新的解…

作者头像 李华
网站建设 2026/4/5 20:17:28

Paraformer-large语音转文字部署教程:VAD+Punc模块详解

Paraformer-large语音转文字部署教程&#xff1a;VADPunc模块详解 1. 环境准备与镜像配置 1.1 镜像基本信息设置 在开始部署前&#xff0c;首先需要正确配置镜像的基础信息&#xff0c;确保服务可被准确识别和管理。 标题 (Title)&#xff1a; Paraformer-large语音识别离线…

作者头像 李华
网站建设 2026/4/6 19:43:19

5个实用技巧:快速上手WzComparerR2冒险岛WZ文件提取器

5个实用技巧&#xff1a;快速上手WzComparerR2冒险岛WZ文件提取器 【免费下载链接】WzComparerR2 Maplestory online Extractor 项目地址: https://gitcode.com/gh_mirrors/wz/WzComparerR2 WzComparerR2是一个基于C#开发的专业级冒险岛WZ文件提取器&#xff0c;支持.NE…

作者头像 李华
网站建设 2026/4/9 11:16:50

兔抗猴IgG抗体如何实现高效纯化与应用?

一、免疫球蛋白G&#xff08;IgG&#xff09;的结构与功能基础是什么&#xff1f; 免疫球蛋白G&#xff08;IgG&#xff09;是哺乳动物血清中含量最丰富的抗体类别&#xff0c;约占血清免疫球蛋白总量的75-80%。作为适应性免疫应答的核心效应分子&#xff0c;IgG在机体防御中扮…

作者头像 李华