news 2026/3/26 21:08:22

某鱼/某红书上的“自动发货”机器人怎么做?Python 自动化+大模型回复,一套流程全闭环

作者头像

张小明

前端开发工程师

1.2k 24
文章封面图
某鱼/某红书上的“自动发货”机器人怎么做?Python 自动化+大模型回复,一套流程全闭环

🤖 前言:为什么你需要一个 AI 客服?

做过副业(卖资料、卖软件、咨询)的兄弟都知道,流量来了是好事,但回复消息是折磨。

  • “在吗?”
  • “多少钱?”
  • “怎么发货?”
  • “便宜点行吗?”

如果不秒回,客户可能转头就走了。如果你在睡觉,错过的就是真金白银。
市面上的“自动回复软件”大多基于关键词匹配,稍微问复杂点就成了人工智障。

今天,我们用Python + 视觉识别 (OCR) + DeepSeek/ChatGPT,手搓一个**“有脑子”**的自动发货机器人。它能像真人一样聊天,谈好价格后自动把网盘链接发给客户。


🏗️ 系统架构:像人一样思考和操作

我们的核心思路是RPA (Robotic Process Automation),即模拟鼠标点击和键盘输入。

闭环流程图:

意图: 闲聊/砍价
意图: 确认下单
1. 屏幕监听 (截图/OCR)
2. 检测到新消息?
3. 提取聊天文本
休眠 2秒
4. 大模型思考 (DeepSeek/GPT)
5. 生成回复话术
6. 提取发货链接
7. 模拟键盘输入
8. 模拟回车发送

🛠️ 技术栈选型

  1. 眼睛 (监听消息)PyAutoGUI(截图) +PaddleOCR(识别文字) 或UIAutomation(获取窗口元素)。
  2. 大脑 (智能回复)OpenAISDK (调用 DeepSeek 或 ChatGPT)。
  3. 双手 (操作发货)PyAutoGUI(键鼠控制) 或pyperclip(剪贴板)。

💻 实战步骤一:监听窗口与提取消息

这里我们以PC 端聊天窗口为例(移动端可用 Appium,原理一样)。最稳妥的方式不是钩子函数,而是OCR 视觉识别,因为这样不侵入软件进程,不会被判定为外挂。

importpyautoguiimporttimefrompaddleocrimportPaddleOCR# 初始化 OCR 模型 (自动下载轻量级模型)ocr=PaddleOCR(use_angle_cls=True,lang="ch")defget_last_message(region):""" 截取聊天窗口的特定区域,识别最后一条消息 region: (x, y, w, h) 聊天区域坐标 """# 1. 截图img_path='chat_snapshot.png'pyautogui.screenshot(img_path,region=region)# 2. 识别文字result=ocr.ocr(img_path,cls=True)ifnotresultorresult[0]isNone:returnNone# 3. 提取最后一行文字(假设对方发的消息在左侧)# 这里需要根据实际 UI 坐标逻辑判断哪句话是新消息txts=[line[1][0]forlineinresult[0]]print(f"识别到的内容:{txts}")returntxts[-1]# 返回最后一条

🧠 实战步骤二:接入大模型 (AI 大脑)

单纯的规则匹配太生硬。我们要让 AI 判断客户意图。如果客户已经付款或说了暗号,直接触发“发货”逻辑。

fromopenaiimportOpenAI# 配置 DeepSeek 或其他兼容 OpenAI 格式的 APIclient=OpenAI(api_key="sk-xxxxxxxx",base_url="https://api.deepseek.com")# 核心:系统提示词 (System Prompt)SYSTEM_PROMPT=""" 你是一个闲鱼/小红书的虚拟商品卖家。 1. 你的商品是【Python全套教程】,价格 9.9 元。 2. 语气要自然、热情,带一点电商客服的口吻。 3. 如果用户问价格,坚持 9.9 元,可以强调资料很全。 4. 【关键】:如果用户发送“已拍”、“已付款”或“暗号666”,请在回复中包含“<SEND_LINK>”这个标记,不要多说话。 """defchat_with_ai(user_msg):response=client.chat.completions.create(model="deepseek-chat",messages=[{"role":"system","content":SYSTEM_PROMPT},{"role":"user","content":user_msg}])returnresponse.choices[0].message.content

⌨️ 实战步骤三:自动回复与发货

一旦 AI 返回的内容里包含特殊标记<SEND_LINK>,我们就触发发货逻辑,否则只进行普通回复。

importpyperclip# 网盘链接PRODUCT_LINK="链接: https://pan.baidu.com/s/xxxx 提取码: 8888"defsend_reply(response_text):"""模拟人工输入回复"""# 1. 判断是否需要发货if"<SEND_LINK>"inresponse_text:final_msg="收到!感谢老板支持,这是您的资料链接,请查收:\n"+PRODUCT_LINKprint(">>> 触发自动发货逻辑")else:final_msg=response_text# 2. 复制到剪贴板 (解决中文输入法问题)pyperclip.copy(final_msg)# 3. 聚焦输入框并粘贴# 假设鼠标已经点在输入框内,或者通过代码点击输入框坐标# pyautogui.click(input_box_x, input_box_y)pyautogui.hotkey('ctrl','v')time.sleep(0.5)pyautogui.press('enter')# 发送

🔄 完整主循环 (Main Loop)

将所有模块串联起来,为了防止 CPU 爆炸,记得加sleep

defmain_loop():last_processed_msg=""# 定义聊天内容区域 (需要你自己用截图工具量一下 x,y,w,h)CHAT_REGION=(500,200,600,400)print("🤖 机器人已启动,按 Ctrl+C 停止...")whileTrue:try:# 1. 获取最新消息current_msg=get_last_message(CHAT_REGION)# 2. 去重(防止对着同一句话一直回)ifcurrent_msgandcurrent_msg!=last_processed_msg:print(f"📩 收到新消息:{current_msg}")# 3. AI 思考reply=chat_with_ai(current_msg)print(f"🧠 AI 回复:{reply}")# 4. 执行发送send_reply(reply)# 更新状态last_processed_msg=current_msg time.sleep(3)# 每3秒轮询一次exceptKeyboardInterrupt:breakexceptExceptionase:print(f"出错:{e}")time.sleep(5)if__name__=="__main__":main_loop()

⚠️ 防封号与合规指南 (必读)

技术本身无罪,但使用方式决定了结果。为了避免被平台判定为机器人,请务必注意:

  1. 随机延迟:不要每次都是 3.0 秒整回复。使用time.sleep(random.uniform(2, 5))模拟人类的思考时间。
  2. 不要刷屏:设置每日回复上限,避免触发骚扰拦截。
  3. 只做辅助:不要试图进行大规模引流或发送违规内容,否则封号是迟早的事。
  4. 适用范围:本方案仅适用于PC 客户端窗口挂机,不涉及任何 HTTP 协议逆向,属于“物理外挂”,相对安全。

📝 总结

这套系统的核心价值在于:把简单重复的劳动交给 Python,把复杂的沟通博弈交给大模型。

你不再是一个只会发“亲,在的”复读机,而是一个拥有 24 小时待命、情商在线的 AI 销售助手。这才是技术改变生活的正确姿势。


版权声明: 本文来自互联网用户投稿,该文观点仅代表作者本人,不代表本站立场。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如若内容造成侵权/违法违规/事实不符,请联系邮箱:809451989@qq.com进行投诉反馈,一经查实,立即删除!
网站建设 2026/3/20 15:26:10

为什么90%的人用不好Open-AutoGLM?,破解美妆教程检索失败的底层逻辑

第一章&#xff1a;Open-AutoGLM在美妆教程检索中的核心价值在当前内容爆炸的数字时代&#xff0c;用户对个性化、精准化美妆教程的需求日益增长。Open-AutoGLM 作为一款基于生成语言模型的开放检索增强框架&#xff0c;能够深度理解自然语言查询意图&#xff0c;并结合多模态数…

作者头像 李华
网站建设 2026/3/22 18:01:46

【限时揭秘】:Open-AutoGLM背后的多模态大模型推理技术

第一章&#xff1a;Open-AutoGLM与多模态大模型的演进之路 近年来&#xff0c;随着深度学习技术的不断突破&#xff0c;多模态大模型逐渐成为人工智能领域的研究热点。Open-AutoGLM作为新一代开源多模态语言模型&#xff0c;融合了文本、图像、音频等多种模态信息处理能力&…

作者头像 李华
网站建设 2026/3/18 5:33:18

3大关键步骤,快速上手Open-AutoGLM实现自动化新闻处理

第一章&#xff1a;Open-AutoGLM 新闻资讯聚合Open-AutoGLM 是一个基于开源大语言模型的智能新闻聚合系统&#xff0c;专为开发者和技术爱好者设计&#xff0c;能够自动抓取、分类并摘要来自多个技术社区和新闻源的最新资讯。该系统融合了自然语言理解与自动化调度能力&#xf…

作者头像 李华
网站建设 2026/3/25 18:57:07

多云与混合云环境下的测试策略设计与实践

多云与混合云测试概述 随着云计算技术的深入应用&#xff0c;多云与混合云部署模式已成为企业数字化转型的主流选择。根据Gartner最新预测&#xff0c;到2026年&#xff0c;超过75%的企业将采用多云或混合云策略来优化工作负载性能并控制成本。这种分布式架构为软件测试带来了…

作者头像 李华
网站建设 2026/3/25 6:42:35

探索式测试:在代码世界“冒险”

一、引言&#xff1a;当测试成为一场“思维探险” 在软件测试的传统认知中&#xff0c;测试常被视为按部就班的验证过程——执行用例、记录结果、提交缺陷。然而&#xff0c;随着敏捷开发与DevOps的普及&#xff0c;一种更具动态性的测试方法正悄然改变行业生态&#xff1a;探…

作者头像 李华