news 2026/4/24 16:46:28

Qwen3.5-4B-AWQ实操手册:WebUI界面导出对话历史+JSON格式保存

作者头像

张小明

前端开发工程师

1.2k 24
文章封面图
Qwen3.5-4B-AWQ实操手册:WebUI界面导出对话历史+JSON格式保存

Qwen3.5-4B-AWQ实操手册:WebUI界面导出对话历史+JSON格式保存

1. 模型简介

Qwen3.5-4B-AWQ-4bit是阿里云通义千问团队推出的轻量级大语言模型,采用4bit AWQ量化技术,在保持出色性能的同时大幅降低资源需求。

1.1 核心优势

  • 低资源需求:量化后显存仅需约3GB,RTX 3060/4060等消费级显卡即可流畅运行
  • 性能均衡:MMLU-Pro得分接近Qwen3-30B-A3B,OmniDocBench表现优于GPT-5-Nano
  • 全能力覆盖:支持201种语言处理、原生多模态理解、长上下文记忆和工具调用
  • 部署友好:适配llama.cpp、vLLM等多种推理引擎,提供便捷的WebUI界面

2. 环境准备与快速部署

2.1 基础环境检查

确保您的系统满足以下要求:

  • NVIDIA显卡(推荐RTX 3060/4060及以上)
  • 已安装CUDA 11.7+和cuDNN
  • Python 3.8+环境
  • 至少8GB系统内存

2.2 快速启动WebUI

# 启动服务 supervisorctl start qwen35-4b-awq # 检查服务状态 supervisorctl status

服务启动后,通过浏览器访问:http://localhost:7860

3. WebUI基础操作指南

3.1 界面功能概览

WebUI主要包含以下功能区域:

  1. 对话输入框:输入您的问题或指令
  2. 参数调节区:调整温度、最大生成长度等参数
  3. 历史记录面板:显示当前会话历史
  4. 功能按钮区:包含导出、设置等实用功能

3.2 基本对话流程

  1. 在输入框中键入您的问题
  2. 点击"发送"按钮或按Enter键提交
  3. 等待模型生成回复(通常几秒内完成)
  4. 继续对话或调整参数重新生成

4. 对话历史导出实战

4.1 导出当前会话历史

  1. 完成所需对话后,点击界面右上角的"导出"按钮
  2. 在弹出的菜单中选择"导出当前会话"
  3. 选择保存格式为JSON
  4. 指定保存路径和文件名
  5. 点击"确认"完成导出

4.2 批量导出历史记录

# 示例:使用API批量导出历史记录 import requests import json # 设置API端点 api_url = "http://localhost:7860/api/export_history" # 获取所有会话列表 response = requests.get(f"{api_url}/list") sessions = response.json() # 批量导出为JSON for session in sessions: export_data = requests.get(f"{api_url}/get?id={session['id']}").json() with open(f"history_{session['id']}.json", "w") as f: json.dump(export_data, f, ensure_ascii=False, indent=2)

4.3 JSON文件结构解析

导出的JSON文件包含以下关键字段:

{ "session_id": "unique_session_identifier", "create_time": "2024-03-15T10:30:00", "messages": [ { "role": "user", "content": "你好,请介绍一下你自己", "timestamp": "2024-03-15T10:30:05" }, { "role": "assistant", "content": "我是通义千问的4B参数版本...", "timestamp": "2024-03-15T10:30:08" } ], "metadata": { "model": "Qwen3.5-4B-AWQ", "parameters": { "temperature": 0.7, "max_length": 1024 } } }

5. 高级应用技巧

5.1 自定义导出模板

通过修改WebUI配置文件,可以自定义JSON导出格式:

# 修改webui.py中的导出模板 EXPORT_TEMPLATE = { "conversation": { "id": "{session_id}", "messages": [ { "from": "{role}", "text": "{content}", "time": "{timestamp}" } for message in messages ] }, "model_info": { "name": "Qwen3.5-4B-AWQ", "quantization": "4bit" } }

5.2 自动化导出脚本

创建定时任务自动备份对话历史:

#!/bin/bash # 每天凌晨备份历史记录 0 0 * * * /usr/bin/curl -X GET "http://localhost:7860/api/export_all" -o "/backups/qwen_history_$(date +\%Y\%m\%d).json"

5.3 常见问题解决

问题1:导出按钮不可用

  • 检查服务是否正常运行:supervisorctl status
  • 查看日志排查错误:tail -f /root/Qwen3.5-4B-AWQ-4bit/logs/webui.log

问题2:JSON文件内容不全

  • 确保对话已完成(等待模型生成结束)
  • 检查磁盘空间是否充足
  • 尝试重启服务:supervisorctl restart qwen35-4b-awq

6. 总结与最佳实践

通过本文介绍的方法,您可以轻松实现:

  1. 从WebUI界面一键导出对话历史
  2. 获取结构化的JSON格式数据
  3. 进行批量导出和自动化备份

推荐实践方案

  • 重要对话及时导出备份
  • 定期清理历史记录释放空间
  • 结合API实现与企业系统的集成

获取更多AI镜像

想探索更多AI镜像和应用场景?访问 CSDN星图镜像广场,提供丰富的预置镜像,覆盖大模型推理、图像生成、视频生成、模型微调等多个领域,支持一键部署。

版权声明: 本文来自互联网用户投稿,该文观点仅代表作者本人,不代表本站立场。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如若内容造成侵权/违法违规/事实不符,请联系邮箱:809451989@qq.com进行投诉反馈,一经查实,立即删除!
网站建设 2026/4/24 16:43:20

React Native与AI构建时尚搭配助手实战

1. 项目概述:用React Native和现成AI打造时尚搭配助手去年帮某服装品牌做移动端改造时,发现店员们常被顾客问"这套搭配好看吗"。于是我用周末时间搞了个小工具:用手机摄像头拍下穿搭,AI实时给出搭配评分和建议。这个原型…

作者头像 李华
网站建设 2026/4/24 16:42:18

GPT-5.5降临:效率更高、功能更强,还在数学领域做出原创贡献!

GPT-5.5登场,定位“新型智能”GPT-5.5刚刚降临,官方将其定位为“一种面向实际工作和智能体的新型智能”。这次奥特曼没亲自发声,而是请了一群早期测试用户当“嘴替”。其中一位英伟达工程师,在早期测试结束后短暂失去GPT-5.5访问权…

作者头像 李华
网站建设 2026/4/24 16:41:28

如何无需Steam客户端下载创意工坊模组:WorkshopDL完整指南

如何无需Steam客户端下载创意工坊模组:WorkshopDL完整指南 【免费下载链接】WorkshopDL WorkshopDL - The Best Steam Workshop Downloader 项目地址: https://gitcode.com/gh_mirrors/wo/WorkshopDL 你是否在GOG或Epic Games商店购买了游戏,却因…

作者头像 李华
网站建设 2026/4/24 16:38:21

STM32H7独立看门狗(IWDG)的窗口模式与低功耗场景实战解析

1. STM32H7独立看门狗(IWDG)的核心价值与窗口模式揭秘 第一次接触STM32H7的独立看门狗时,我完全被它的设计哲学震撼了。想象一下,你的设备在野外无人值守运行,突然程序跑飞了怎么办?IWDG就像个永不疲倦的保安,时刻盯着…

作者头像 李华
网站建设 2026/4/24 16:37:23

【独家解析】Ernie-Image-AIO-Rapid一键部署本地运行整合包:深度融合架构如何重塑AI绘图效率?4K超分与硬件适配全指南

一、 引言:AI绘画的“快”时代 在AI图像生成领域,速度与质量的平衡一直是开发者追求的终极目标。随着Ernie-Image-AIO-Rapid的发布,这一平衡被彻底打破。不同于传统的模块化分步渲染,该模型基于**AIO(All-In-One&#…

作者头像 李华