news 2026/3/23 2:43:23

Open-AutoGLM助力生活:打车订票一键完成

作者头像

张小明

前端开发工程师

1.2k 24
文章封面图
Open-AutoGLM助力生活:打车订票一键完成

Open-AutoGLM助力生活:打车订票一键完成

1. 这不是科幻,是今天就能用上的手机AI助手

你有没有过这样的时刻:
地铁上想订张明天的高铁票,单手操作手机点开12306、输入出发地、筛选车次、反复确认余票……手指划得发酸,页面还总卡在加载中?
又或者深夜加班回家,站在路边冷风里一边搓手一边等滴滴,盯着屏幕刷新了八次,司机还在两公里外?

这些琐碎却高频的生活操作,本不该消耗你宝贵的注意力。

Open-AutoGLM——智谱开源的手机端AI Agent框架,正在把“动口不动手”变成现实。它不依赖云端APP、不强制绑定账号、不上传你的屏幕截图,而是在你本地电脑上跑一个轻量服务,通过ADB安全连接你的真机,让AI真正“看见”屏幕、“理解”界面、“思考”下一步、“执行”点击滑动——整个过程像一个沉默但可靠的数字同事,全程听你用大白话指挥。

比如这句指令:
“打开高德地图,搜‘北京南站’,叫一辆去首都机场的快车,选价格最低的车型”

AI会自动完成:启动高德→点击搜索框→输入文字→选择地点→切换到打车页→比较出租车/快车/专车价格→点击最低价选项→确认上车点→提交订单。全程无需你碰一下手机。

这不是概念演示,而是已支持50+主流应用的稳定能力。本文将带你从零开始,用不到一小时,亲手部署这个能帮你打车、订票、点外卖、刷视频的AI手机助理——不讲虚的架构图,只给可运行的步骤、踩过的坑、真实的效果。

2. 准备工作:三样东西就够了

别被“AI”“多模态”“Agent”这些词吓住。Open-AutoGLM对新手极其友好,你只需要准备三样东西:

  • 一台能联网的电脑(Windows或Mac,不用高性能,日常办公机即可)
  • 一部安卓手机(Android 7.0以上,2016年之后的机型基本都行)
  • 一根能传数据的USB线(没有WiFi直连那么麻烦,USB最稳)

不需要显卡,不需要服务器,不需要注册任何平台。所有处理都在你自己的设备上完成,你的屏幕内容不会离开手机,你的操作指令不会上传到任何第三方。

2.1 手机端:开启“被控制”的权限

这是最关键的一步,但其实就三步,30秒搞定:

  1. 打开开发者模式:进入手机「设置」→「关于手机」→连续点击「版本号」7次,直到弹出“您已处于开发者模式”
  2. 开启USB调试:返回「设置」→「系统」→「开发者选项」→打开「USB调试」开关
  3. 安装ADB Keyboard(重点!):这是让AI能输入中文的关键。
    • 下载ADBKeyboard.apk(GitHub搜索关键词即可找到,约1MB)
    • 用USB线连接手机和电脑,在电脑命令行执行:
      adb install ADBKeyboard.apk
    • 安装成功后,去手机「设置」→「语言和输入法」→「虚拟键盘」→启用「ADB Keyboard」

小提示:如果手机提示“未知来源应用”,请在「安全」设置里临时允许安装。完成后可关闭。

2.2 电脑端:装两个小工具,5分钟完事

安装Python(3.10+)
  • Windows用户:去 python.org 下载安装包,务必勾选“Add Python to PATH”
  • Mac用户:终端执行
    brew install python@3.10
  • 验证是否成功:打开命令行,输入python --version,看到Python 3.10.x即可
安装ADB工具(安卓调试桥)

这是连接电脑和手机的“翻译官”。

  • 去 Android官网platform-tools页 下载对应系统的压缩包
  • 解压到一个简单路径,比如D:\adb(Win)或~/adb(Mac)
  • 配置环境变量(让系统 anywhere 都能认出adb命令):
    • Windows:右键“此电脑”→属性→高级系统设置→环境变量→系统变量→Path→新建→填入你的ADB解压路径
    • Mac:终端执行
      echo 'export PATH=$PATH:~/adb' >> ~/.zshrc && source ~/.zshrc
  • 验证:命令行输入adb version,看到版本号(如Android Debug Bridge version 1.0.41)即成功

此时你已经完成了90%的准备工作。剩下的全是“复制粘贴+回车”。

3. 三步部署:让AI接管你的手机

整个部署流程清晰得像做一道菜:备料(准备)→起锅(启动服务)→下菜(运行指令)。我们跳过所有理论,直接上可执行命令。

3.1 下载并安装Open-AutoGLM控制端

打开命令行(Windows用CMD/PowerShell,Mac用Terminal),依次执行:

# 克隆项目代码(约2MB,秒级完成) git clone https://github.com/zai-org/Open-AutoGLM cd Open-AutoGLM # 安装依赖(会自动下载requests、Pillow等常用库) pip install -r requirements.txt pip install -e .

如果遇到pip install报错,大概率是网络问题。请换用国内镜像源:
pip install -r requirements.txt -i https://pypi.tuna.tsinghua.edu.cn/simple/

3.2 启动本地模型服务(可选,推荐用云服务)

Open-AutoGLM本身不包含大模型,它需要调用一个视觉语言模型来“看懂”屏幕。官方提供了两种方式:

  • 推荐新手:直接使用云API(免部署)
    智谱已开放免费试用的autoglm-phone-9b模型服务,无需下载18GB模型、无需GPU,只需一个URL。
    (本文后续所有示例均基于此方式,零门槛)

  • 进阶用户:本地部署vLLM服务
    若你有NVIDIA显卡(建议12GB显存以上),可下载模型并用vLLM加速推理。详细步骤见文末附录,此处暂略。

对绝大多数用户,直接用云服务是最优解:快、稳、省资源。

3.3 连接手机,发出第一条指令

确保手机已用USB线连接电脑,并在手机上点击了“允许USB调试”。

在命令行中执行(注意替换<你的设备ID>):

# 先查看设备是否识别成功 adb devices # 输出类似:List of devices attached # 1234567890abcdef device # 记下那一串字母数字组合,就是你的设备ID # 然后运行AI指令(以“打开12306订票”为例) python main.py \ --device-id 1234567890abcdef \ --base-url https://api.zhipuai.cn/v1 \ --model "autoglm-phone-9b" \ "打开12306,查今天从北京南站到上海虹桥的高铁,买一张二等座"

你会立刻看到AI的思考过程输出:

💭 思考过程: 当前在桌面,需要找到12306应用图标并点击 执行动作: {"action": "Click", "x": 320, "y": 780} 💭 思考过程: 已进入12306首页,需点击出发地输入框 执行动作: {"action": "Click", "x": 210, "y": 450} ...

同时,你的手机屏幕会同步执行:自动点亮、打开12306、点击输入框、输入“北京南站”、选择日期、筛选车次、点击购票——整个过程约20-40秒,取决于网络和手机响应速度。

第一次运行建议用简单指令测试,比如"打开设置""打开微信"。成功后再尝试复杂任务。

4. 实战场景:打车、订票、点外卖,一句话的事

Open-AutoGLM不是玩具,它已在真实生活场景中验证过稳定性。以下是你今天就能复现的三个高频任务,全部基于真实APP操作逻辑,非模拟演示。

4.1 场景一:打车——告别刷新焦虑

痛点:高峰期打车,司机距离远、应答慢、反复刷新浪费时间
AI方案:一句话指定车型、目的地、偏好,自动比价下单

实操指令

python main.py \ --device-id 1234567890abcdef \ --base-url https://api.zhipuai.cn/v1 \ --model "autoglm-phone-9b" \ "打开滴滴出行,输入目的地‘首都国际机场T3航站楼’,选择‘快车’,按价格从低到高排序,选第一个下单"

AI做了什么

  • 自动识别滴滴首页的“目的地”输入框位置
  • 精准输入文字(通过ADB Keyboard)
  • 点击搜索结果中的T3航站楼
  • 进入车型选择页,横向滑动找到“快车”标签
  • 解析各车型价格标签(如“快车 ¥42”、“特惠快车 ¥38”)
  • 点击最低价选项旁的“呼叫”按钮
  • 提交订单,生成预估上车时间

效果:全程无手动干预,平均耗时28秒,成功率超92%(基于社区实测数据)。

4.2 场景二:订票——12306不再劝退

痛点:12306界面复杂、余票查询慢、抢票要盯屏、支付易超时
AI方案:自然语言描述需求,AI自动完成全流程

实操指令

python main.py \ --device-id 1234567890abcdef \ --base-url https://api.zhipuai.cn/v1 \ --model "autoglm-phone-9b" \ "打开12306,查明天上午9点前从杭州东到南京南的高铁,优先选G字头,买一张一等座,用支付宝支付"

AI做了什么

  • 识别首页“出发地”“到达地”“日期”三个核心输入框
  • 输入“杭州东”“南京南”,自动选择明日日期
  • 点击“查询车次”,等待列表加载
  • 扫描车次列表,过滤出G字头列车(正则匹配“G\d+”)
  • 按一等座余票数量排序,选余票最多的班次
  • 点击“预订”,跳转至乘客选择页
  • 自动勾选常用乘车人
  • 点击“提交订单”,进入支付页
  • 识别“支付宝”按钮并点击(敏感操作会暂停,等你人工点“确认支付”)

安全机制:涉及支付、删除、短信等操作时,AI会主动暂停,弹出确认提示,必须你手动点击才继续。隐私和资金安全有保障。

4.3 场景三:点外卖——美团饿了么随心切

痛点:想吃火锅但懒得翻菜单、比价格、看评价;深夜饿醒只想最快送达
AI方案:描述口味/预算/时效,AI智能筛选最优选项

实操指令

python main.py \ --device-id 1234567890abcdef \ --base-url https://api.zhipuai.cn/v1 \ --model "autoglm-phone-9b" \ "打开美团,搜‘川菜’,按评分从高到低排,选评分4.8以上、人均80以内、30分钟内能送到的店,点一份水煮牛肉和米饭"

AI做了什么

  • 在美团首页搜索框输入“川菜”
  • 进入结果页,点击“筛选”按钮
  • 依次设置:评分≥4.8、人均≤80元、配送时间≤30分钟
  • 加载筛选后列表,点击第一家店
  • 进入店铺页,搜索“水煮牛肉”,点击加入购物车
  • 搜索“米饭”,加入购物车
  • 进入结算页,选择“在线支付”,提交订单

效果:从指令发出到订单生成,平均35秒。实测在22:00后仍能成功下单,无闪退、无误点。

5. 进阶技巧:让AI更懂你、更省心

部署成功只是开始。掌握这几个技巧,能让Open-AutoGLM真正成为你的生活搭档。

5.1 WiFi无线控制:摆脱数据线束缚

USB线虽稳,但总要插拔。WiFi连接让你在客厅沙发上就能操控卧室里的手机。

操作步骤

  1. 手机开启「无线调试」:设置→开发者选项→无线调试→开启
  2. 电脑命令行执行:
    # 先用USB连一次,开启TCP/IP模式 adb tcpip 5555 # 断开USB,用WiFi连接(IP地址在手机无线调试页可见) adb connect 192.168.1.100:5555 # 验证 adb devices
  3. 后续所有指令把--device-id改成192.168.1.100:5555即可

实测WiFi延迟<200ms,操作流畅度与USB无异。

5.2 自定义确认函数:关键操作自己把关

默认情况下,AI在支付、删除联系人等操作前会暂停。你可以用几行Python代码,让它更聪明:

from phone_agent import PhoneAgent from phone_agent.model import ModelConfig def my_confirmation(message): """当AI需要确认时,弹出系统通知而非命令行""" import os if "支付" in message: os.system(f'osascript -e \'display notification "{message}" with title "AI助手提醒"\'') # Mac # Windows可用:os.system(f'msg * "{message}"') return input("继续执行?(y/n): ").lower() == 'y' agent = PhoneAgent( model_config=ModelConfig( base_url="https://api.zhipuai.cn/v1", model_name="autoglm-phone-9b" ), confirmation_callback=my_confirmation ) agent.run("打开美团订一份外卖")

5.3 批量任务脚本:重复操作自动化

比如每天通勤前固定查地铁拥挤度、订早餐、发打卡消息。写个脚本,一键触发:

import time def morning_routine(): agent = PhoneAgent( model_config=ModelConfig( base_url="https://api.zhipuai.cn/v1", model_name="autoglm-phone-9b" ) ) # 查地铁 agent.run("打开北京地铁APP,查10号线西段拥挤度") time.sleep(3) # 订早餐 agent.run("打开瑞幸咖啡,点一杯美式和一个牛角包,送到公司前台") time.sleep(5) # 发打卡 agent.run("打开企业微信,给部门群发消息‘今日已到岗’") morning_routine()

6. 常见问题速查:遇到报错别慌

部署和使用中可能遇到的小状况,这里给出最简解决方案:

问题现象快速解决方法
adb devices显示unauthorized手机弹出“允许USB调试”提示,务必点“允许”,不是“仅限于这台电脑”
指令执行一半卡住,无响应检查手机是否锁屏——AI无法操作锁屏界面,保持屏幕常亮或设为“永不休眠”
中文输入乱码或不出现确认ADB Keyboard已启用:手机「设置」→「语言和输入法」→「当前输入法」是否为ADB Keyboard
AI一直说“找不到目标元素”手机分辨率太高(如2K屏),在main.py中添加参数--scale-factor 0.75降低截图精度适配
云API报401错误检查是否替换了正确的base-url,智谱云服务需申请API Key,免费额度足够日常使用

所有问题根源90%集中在:手机未授权ADB、输入法未切换、屏幕锁屏、URL写错。逐一排查,5分钟内必解。

7. 总结:你的手机,从此多了一个“隐形手”

回顾这一路,你其实只做了三件事:

  1. 在手机上开了个“开发者开关”(30秒)
  2. 在电脑上装了Python和ADB(5分钟)
  3. 复制粘贴了四条命令(2分钟)

然后,你的手机就拥有了:
看的能力——通过截图理解当前APP界面布局
想的能力——把“订票”“打车”“点餐”拆解成点击、输入、滑动等原子动作
做的能力——通过ADB精准模拟每一次触摸,误差小于3像素

它不替代你做决定,而是把你从重复操作中解放出来。你依然掌控全局,AI只是那个永远不喊累、不手抖、不点错的执行者。

下一步,你可以:

  • 把常用指令存成快捷方式,双击运行
  • 用Python API接入家庭自动化系统(如Home Assistant)
  • 为父母配置一个“语音唤醒+AI执行”的简易版,教他们说“帮我叫个车”

技术的意义,从来不是炫技,而是让生活更轻一点。当你不再为订一张票耗费心神,那多出来的几分钟,或许刚好够喝一口温热的茶。


获取更多AI镜像

想探索更多AI镜像和应用场景?访问 CSDN星图镜像广场,提供丰富的预置镜像,覆盖大模型推理、图像生成、视频生成、模型微调等多个领域,支持一键部署。

版权声明: 本文来自互联网用户投稿,该文观点仅代表作者本人,不代表本站立场。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如若内容造成侵权/违法违规/事实不符,请联系邮箱:809451989@qq.com进行投诉反馈,一经查实,立即删除!
网站建设 2026/3/15 21:05:37

系统优化工具RyTuneX深度解析:Windows性能提升方案

系统优化工具RyTuneX深度解析&#xff1a;Windows性能提升方案 【免费下载链接】RyTuneX An optimizer made using the WinUI 3 framework 项目地址: https://gitcode.com/gh_mirrors/ry/RyTuneX Windows系统运行缓慢、内存占用过高、启动时间过长——这些常见问题是否正…

作者头像 李华
网站建设 2026/3/15 13:29:05

3步打造企业级流程引擎:从部署到价值落地的实战指南

3步打造企业级流程引擎&#xff1a;从部署到价值落地的实战指南 【免费下载链接】RuoYi-flowable 基RuoYi-vue flowable 6.7.2 的工作流管理 右上角点个 star &#x1f31f; 持续关注更新哟 项目地址: https://gitcode.com/gh_mirrors/ru/RuoYi-flowable 一、流程数字…

作者头像 李华
网站建设 2026/3/15 17:41:48

永磁同步电机SMO负载转矩观测matlab模型

&#x1f4a5;&#x1f4a5;&#x1f49e;&#x1f49e;欢迎来到本博客❤️❤️&#x1f4a5;&#x1f4a5; &#x1f3c6;博主优势&#xff1a;&#x1f31e;&#x1f31e;&#x1f31e;博客内容尽量做到思维缜密&#xff0c;逻辑清晰&#xff0c;为了方便读者。 ⛳️座右铭&a…

作者头像 李华
网站建设 2026/3/15 7:27:27

Hackintool完全指南:解决黑苹果配置难题的5个实战技巧

Hackintool完全指南&#xff1a;解决黑苹果配置难题的5个实战技巧 【免费下载链接】Hackintool The Swiss army knife of vanilla Hackintoshing 项目地址: https://gitcode.com/gh_mirrors/ha/Hackintool 黑苹果系统配置过程中&#xff0c;硬件识别异常、音频驱动失效、…

作者头像 李华