Qwen3.5-4B-AWQ实操手册：WebUI界面导出对话历史+JSON格式保存-开发者社区

Qwen3.5-4B-AWQ实操手册：WebUI界面导出对话历史+JSON格式保存

1. 模型简介

Qwen3.5-4B-AWQ-4bit是阿里云通义千问团队推出的轻量级大语言模型，采用4bit AWQ量化技术，在保持出色性能的同时大幅降低资源需求。

1.1 核心优势

低资源需求：量化后显存仅需约3GB，RTX 3060/4060等消费级显卡即可流畅运行
性能均衡：MMLU-Pro得分接近Qwen3-30B-A3B，OmniDocBench表现优于GPT-5-Nano
全能力覆盖：支持201种语言处理、原生多模态理解、长上下文记忆和工具调用
部署友好：适配llama.cpp、vLLM等多种推理引擎，提供便捷的WebUI界面

2. 环境准备与快速部署

2.1 基础环境检查

确保您的系统满足以下要求：

NVIDIA显卡（推荐RTX 3060/4060及以上）
已安装CUDA 11.7+和cuDNN
Python 3.8+环境
至少8GB系统内存

2.2 快速启动WebUI

# 启动服务 supervisorctl start qwen35-4b-awq # 检查服务状态 supervisorctl status

服务启动后，通过浏览器访问：http://localhost:7860

3. WebUI基础操作指南

3.1 界面功能概览

WebUI主要包含以下功能区域：

对话输入框：输入您的问题或指令
参数调节区：调整温度、最大生成长度等参数
历史记录面板：显示当前会话历史
功能按钮区：包含导出、设置等实用功能

3.2 基本对话流程

在输入框中键入您的问题
点击"发送"按钮或按Enter键提交
等待模型生成回复（通常几秒内完成）
继续对话或调整参数重新生成

4. 对话历史导出实战

4.1 导出当前会话历史

完成所需对话后，点击界面右上角的"导出"按钮
在弹出的菜单中选择"导出当前会话"
选择保存格式为JSON
指定保存路径和文件名
点击"确认"完成导出

4.2 批量导出历史记录

# 示例：使用API批量导出历史记录 import requests import json # 设置API端点 api_url = "http://localhost:7860/api/export_history" # 获取所有会话列表 response = requests.get(f"{api_url}/list") sessions = response.json() # 批量导出为JSON for session in sessions: export_data = requests.get(f"{api_url}/get?id={session['id']}").json() with open(f"history_{session['id']}.json", "w") as f: json.dump(export_data, f, ensure_ascii=False, indent=2)

4.3 JSON文件结构解析

导出的JSON文件包含以下关键字段：

{ "session_id": "unique_session_identifier", "create_time": "2024-03-15T10:30:00", "messages": [ { "role": "user", "content": "你好，请介绍一下你自己", "timestamp": "2024-03-15T10:30:05" }, { "role": "assistant", "content": "我是通义千问的4B参数版本...", "timestamp": "2024-03-15T10:30:08" } ], "metadata": { "model": "Qwen3.5-4B-AWQ", "parameters": { "temperature": 0.7, "max_length": 1024 } } }

5. 高级应用技巧

5.1 自定义导出模板

通过修改WebUI配置文件，可以自定义JSON导出格式：

# 修改webui.py中的导出模板 EXPORT_TEMPLATE = { "conversation": { "id": "{session_id}", "messages": [ { "from": "{role}", "text": "{content}", "time": "{timestamp}" } for message in messages ] }, "model_info": { "name": "Qwen3.5-4B-AWQ", "quantization": "4bit" } }

5.2 自动化导出脚本

创建定时任务自动备份对话历史：

#!/bin/bash # 每天凌晨备份历史记录 0 0 * * * /usr/bin/curl -X GET "http://localhost:7860/api/export_all" -o "/backups/qwen_history_$(date +\%Y\%m\%d).json"

5.3 常见问题解决

问题1：导出按钮不可用

检查服务是否正常运行：supervisorctl status
查看日志排查错误：tail -f /root/Qwen3.5-4B-AWQ-4bit/logs/webui.log

问题2：JSON文件内容不全

确保对话已完成（等待模型生成结束）
检查磁盘空间是否充足
尝试重启服务：supervisorctl restart qwen35-4b-awq

6. 总结与最佳实践

通过本文介绍的方法，您可以轻松实现：

从WebUI界面一键导出对话历史
获取结构化的JSON格式数据
进行批量导出和自动化备份

推荐实践方案：

重要对话及时导出备份
定期清理历史记录释放空间
结合API实现与企业系统的集成

获取更多AI镜像
想探索更多AI镜像和应用场景？访问 CSDN星图镜像广场，提供丰富的预置镜像，覆盖大模型推理、图像生成、视频生成、模型微调等多个领域，支持一键部署。

不止是安装：用VMware玩转openEuler，从命令行到UKUI桌面的完整体验与生态初探

不止是安装：用VMware玩转openEuler，从命令行到UKUI桌面的完整体验与生态初探当你在VMware中完成openEuler的基础安装后，真正的探索才刚刚开始。这个由华为支持的开源操作系统，远不止是一个简单的Linux发行版——它是连接服务器、…

李华

React Native与AI构建时尚搭配助手实战

1. 项目概述：用React Native和现成AI打造时尚搭配助手去年帮某服装品牌做移动端改造时，发现店员们常被顾客问"这套搭配好看吗"。于是我用周末时间搞了个小工具：用手机摄像头拍下穿搭，AI实时给出搭配评分和建议。这个原型…

李华

GPT-5.5降临：效率更高、功能更强，还在数学领域做出原创贡献！

GPT-5.5登场，定位“新型智能”GPT-5.5刚刚降临，官方将其定位为“一种面向实际工作和智能体的新型智能”。这次奥特曼没亲自发声，而是请了一群早期测试用户当“嘴替”。其中一位英伟达工程师，在早期测试结束后短暂失去GPT-5.5访问权…

李华

如何无需Steam客户端下载创意工坊模组：WorkshopDL完整指南

如何无需Steam客户端下载创意工坊模组：WorkshopDL完整指南【免费下载链接】WorkshopDL WorkshopDL - The Best Steam Workshop Downloader 项目地址: https://gitcode.com/gh_mirrors/wo/WorkshopDL 你是否在GOG或Epic Games商店购买了游戏，却因…

李华

STM32H7独立看门狗(IWDG)的窗口模式与低功耗场景实战解析

1. STM32H7独立看门狗(IWDG)的核心价值与窗口模式揭秘第一次接触STM32H7的独立看门狗时，我完全被它的设计哲学震撼了。想象一下，你的设备在野外无人值守运行，突然程序跑飞了怎么办？IWDG就像个永不疲倦的保安，时刻盯着…

李华

【独家解析】Ernie-Image-AIO-Rapid一键部署本地运行整合包：深度融合架构如何重塑AI绘图效率？4K超分与硬件适配全指南

一、引言：AI绘画的“快”时代在AI图像生成领域，速度与质量的平衡一直是开发者追求的终极目标。随着Ernie-Image-AIO-Rapid的发布，这一平衡被彻底打破。不同于传统的模块化分步渲染，该模型基于**AIO（All-In-One&#…

李华