ERNIE-4.5-0.3B-PT Chainlit前端定制:添加历史记录导出与多会话管理功能
在实际使用大语言模型时,一个好用的前端界面往往比模型本身更能影响日常体验。Chainlit作为轻量级、可定制的AI应用框架,天然适合快速搭建对话界面。但开箱即用的Chainlit默认只提供基础聊天功能——没有历史记录导出、无法切换多个独立会话、对话内容无法本地留存。对于需要反复测试提示词、对比不同回答、或进行教学演示的用户来说,这些缺失功能会明显拖慢效率。
本文不讲模型原理,也不重复部署步骤,而是聚焦一个真实痛点:如何让Chainlit前端真正“能用”、“好用”、“长期用”。我们将基于已部署的vLLM版ERNIE-4.5-0.3B-PT模型,从零开始为Chainlit添加两项关键能力:
一键导出当前会话全部历史(支持Markdown格式,保留代码块、加粗等富文本样式)
独立多会话管理(每个会话隔离上下文、独立命名、自由切换、关闭后不丢失)
所有改动均基于Chainlit官方API,无需修改底层框架,代码简洁、逻辑清晰、可直接复用。即使你刚接触Chainlit,也能在30分钟内完成集成。
1. 环境确认与基础准备
在开始定制前,请确保你的ERNIE-4.5-0.3B-PT模型已通过vLLM成功部署,并且Chainlit前端可正常访问。这不是教程的重复,而是为你节省排查时间的关键检查点。
1.1 验证模型服务是否就绪
打开WebShell终端,执行以下命令查看日志:
cat /root/workspace/llm.log如果看到类似INFO: Uvicorn running on http://0.0.0.0:8000和vLLM engine started的输出,说明服务已启动。若日志中出现ERROR或长时间无响应,请先返回部署环节检查端口、GPU显存和模型路径。
小贴士:vLLM默认监听
http://localhost:8000,Chainlit需通过该地址调用。若你修改过vLLM端口(如改为8080),后续Chainlit配置中必须同步更新,否则会显示“连接失败”。
1.2 确认Chainlit项目结构
Chainlit应用的核心是chainlit.py文件。请确认你的项目根目录下存在该文件,并且其内容包含基础的@cl.on_message装饰器逻辑。这是我们将要扩展的起点。
如果你使用的是CSDN星图镜像广场提供的预置环境,通常项目结构如下:
/workspace/ ├── chainlit.py ← 我们将在此文件中添加新功能 ├── requirements.txt └── .env ← 可存放vLLM API地址等配置注意:不要在
chainlit.py中硬编码vLLM地址(如http://localhost:8000)。建议通过环境变量读取,便于后续迁移。我们将在代码中示范这一最佳实践。
2. 实现多会话管理:让每次对话互不干扰
默认Chainlit将所有消息存入全局会话,导致用户无法同时进行“写周报”、“改简历”、“查技术文档”三个任务。多会话管理的本质,是为每组对话分配唯一ID,并在内存中维护独立的消息列表。
2.1 设计会话状态结构
我们不依赖数据库,而是利用Chainlit内置的cl.user_session对象——它为每个浏览器标签页提供独立的键值存储空间。我们将用它保存两个关键数据:
session_id: 当前会话唯一标识(UUID生成)messages: 当前会话的完整消息列表(含角色、内容、时间戳)
这样,用户新开一个浏览器标签,就自动获得全新会话;关闭标签后,该会话数据自然释放,不占用资源。
2.2 添加会话创建与切换逻辑
在chainlit.py开头添加以下导入和初始化代码:
import uuid import os from typing import Dict, List, Optional import chainlit as cl # 从环境变量读取vLLM API地址,避免硬编码 VLLM_API_URL = os.getenv("VLLM_API_URL", "http://localhost:8000/v1/chat/completions") # 初始化用户会话(首次访问时执行) @cl.on_chat_start async def on_chat_start(): # 为本次会话生成唯一ID session_id = str(uuid.uuid4()) # 在用户会话中保存ID和空消息列表 cl.user_session.set("session_id", session_id) cl.user_session.set("messages", []) # 向用户发送欢迎消息,提示功能 await cl.Message( content=" 已创建新会话!你可以随时点击左下角「+ 新会话」开启另一个独立对话。\n\n 小技巧:每个会话的上下文完全隔离,适合同时处理不同任务。", author="System" ).send()2.3 构建会话控制UI:按钮与状态栏
Chainlit支持自定义侧边栏(Sidebar),我们在这里添加“新建会话”按钮和当前会话信息:
# 在 @cl.on_chat_start 下方添加 @cl.set_chat_profiles async def chat_profile(): return [ cl.ChatProfile( name="ERNIE-4.5-0.3B-PT", markdown_description="基于vLLM加速的轻量级中文大模型,专注高效推理。", icon="" ) ] # 侧边栏:添加会话管理控件 @cl.on_settings_update async def setup_sidebar(settings): pass # 在 @cl.on_chat_start 后添加此函数,用于渲染侧边栏 @cl.on_chat_resume async def on_chat_resume(): # 恢复会话时重新设置状态(可选,增强健壮性) session_id = cl.user_session.get("session_id") if not session_id: await on_chat_start() # 侧边栏组件(需放在 @cl.on_chat_start 之后) @cl.on_chat_start async def setup_sidebar(): # 创建侧边栏按钮 await cl.ChatSettings( [ cl.RadioGroup( id="session_action", label="会话操作", values=["new", "export"], description="选择操作类型" ), ] ).send()为什么不用传统按钮?Chainlit的
cl.Action在v0.10+版本中对异步支持不稳定。我们采用更可靠的cl.ChatSettings+cl.RadioGroup组合,用户点击后触发回调,稳定且兼容性好。
2.4 处理会话切换事件
当用户点击“+ 新会话”时,我们需要清空当前消息、生成新ID、并刷新界面:
# 在文件末尾添加事件处理器 @cl.action_callback("New Session") async def on_new_session(action): # 清空当前会话消息 cl.user_session.set("messages", []) # 生成新会话ID new_id = str(uuid.uuid4()) cl.user_session.set("session_id", new_id) # 发送确认消息 await cl.Message( content=f" 已切换至新会话:{new_id[:8]}... \n现在可以开始全新对话了!", author="System" ).send()至此,多会话管理的核心逻辑已完成。用户可无限次点击“+ 新会话”,每次都会获得干净、隔离的对话空间,彻底告别上下文串扰。
3. 实现历史记录导出:一键保存为可读Markdown
导出功能的价值在于:把临时对话变成可复用的知识资产。我们不导出原始JSON,而是生成带格式、易阅读、可直接粘贴到笔记软件的Markdown文件。
3.1 定义导出内容结构
一个高质量的导出文件应包含:
- 会话标题(自动生成:
ERNIE对话 - 2025-03-15 14:23) - 模型信息(ERNIE-4.5-0.3B-PT + vLLM)
- 完整对话流(用户提问用
>引用块,模型回复用普通段落,代码块原样保留) - 时间戳(精确到分钟,标注每条消息时间)
3.2 编写导出函数
在chainlit.py中添加以下工具函数:
from datetime import datetime import re def format_message_for_export(message: cl.Message) -> str: """将Chainlit Message对象格式化为Markdown字符串""" role = "👤 用户" if message.author == "User" else " ERNIE" timestamp = message.created_at.strftime("%H:%M") if message.created_at else "未知时间" # 处理消息内容:保留代码块、加粗、列表等Markdown语法 content = message.content # 若内容含代码块,确保其被正确包裹 if "```" in content: # 简单处理:不破坏原有代码块 pass # 构建Markdown行 if message.author == "User": return f"> **{role}({timestamp})**\n> {content}\n" else: return f"**{role}({timestamp})**\n{content}\n" def generate_export_content() -> str: """生成完整的Markdown导出内容""" messages = cl.user_session.get("messages", []) session_id = cl.user_session.get("session_id", "unknown") # 生成标题 now = datetime.now().strftime("%Y-%m-%d %H:%M") title = f"# ERNIE对话记录 - {now}\n\n" # 添加模型信息 info = f"**模型**:ERNIE-4.5-0.3B-PT(vLLM加速)\n**会话ID**:`{session_id}`\n\n---\n\n" # 拼接所有消息 content_lines = [] for msg in messages: if hasattr(msg, 'content') and msg.content.strip(): content_lines.append(format_message_for_export(msg)) return title + info + "\n".join(content_lines)3.3 添加导出按钮与下载逻辑
Chainlit不直接支持文件下载,但我们可以通过cl.Text组件将内容渲染为可复制文本,并引导用户手动保存:
@cl.action_callback("Export History") async def on_export_history(action): # 生成导出内容 md_content = generate_export_content() # 创建Text元素,设置为可复制 text_element = cl.Text( name="ernie-history.md", content=md_content, display="inline", language="markdown" ) # 发送消息,附带Text元素 await cl.Message( content="📄 历史记录已生成!\n\n 点击下方「复制」按钮,然后粘贴到任意文本编辑器(如VS Code、Typora)中保存为 `.md` 文件。\n\n 提示:导出内容保留所有格式(代码块、加粗、引用),可直接用于知识沉淀。", elements=[text_element], author="System" ).send()为什么不强制下载?浏览器安全策略限制前端JavaScript直接触发文件下载(尤其跨域场景)。
cl.Text方案100%兼容所有环境,且用户可自由编辑导出内容,比一键下载更灵活、更可靠。
4. 集成vLLM调用:确保定制功能与模型无缝协作
前面所有UI功能都依赖于模型的实际响应。我们需要确保@cl.on_message逻辑既能正确调用vLLM,又能将新消息存入当前会话的历史列表。
4.1 改写消息处理函数
替换原有的@cl.on_message,加入历史记录保存与错误处理:
import httpx @cl.on_message async def main(message: cl.Message): # 获取当前会话消息列表 messages = cl.user_session.get("messages", []) # 将用户消息加入历史(注意:Chainlit 1.0+ 中 message.content 是字符串) user_msg = cl.Message( content=message.content, author="User", created_at=datetime.now() ) messages.append(user_msg) # 发送用户消息到前端(实时显示) await user_msg.send() # 构造vLLM请求体(符合OpenAI兼容API格式) payload = { "model": "ernie-4.5-0.3b-pt", "messages": [ {"role": "user", "content": message.content} ], "temperature": 0.7, "max_tokens": 1024 } try: # 异步调用vLLM async with httpx.AsyncClient() as client: response = await client.post( VLLM_API_URL, json=payload, timeout=120.0 ) if response.status_code == 200: data = response.json() assistant_reply = data["choices"][0]["message"]["content"] # 创建模型回复消息 ai_msg = cl.Message( content=assistant_reply, author="ERNIE-4.5-0.3B-PT", created_at=datetime.now() ) messages.append(ai_msg) # 更新用户会话中的消息列表 cl.user_session.set("messages", messages) # 发送回复 await ai_msg.send() else: error_msg = f" 模型调用失败({response.status_code}):{response.text[:100]}" await cl.Message(content=error_msg, author="System").send() except Exception as e: error_msg = f" 请求超时或网络异常:{str(e)}" await cl.Message(content=error_msg, author="System").send()4.2 关键细节说明
- 消息持久化时机:我们在收到用户输入后立即存入
messages列表,并在模型返回后追加AI回复。这样即使中途断网,用户消息也不会丢失。 - vLLM兼容性:ERNIE-4.5-0.3B-PT通过vLLM部署后,暴露的是标准OpenAI格式API,因此我们直接使用
messages字段传参,无需额外适配。 - 错误降级体验:当vLLM不可用时,用户仍能看到清晰的错误提示,而不是卡死或空白,保障基础可用性。
5. 运行与验证:三步确认功能生效
完成以上代码修改后,只需三步即可验证全部功能:
5.1 重启Chainlit服务
在WebShell中执行:
# 停止旧进程(如有) pkill -f "chainlit run" # 启动新版本 chainlit run chainlit.py -w注意:
-w参数启用热重载,修改代码后无需手动重启,保存即生效。
5.2 执行功能测试
- 多会话测试:打开两个浏览器标签页,分别访问
http://localhost:8000。在第一个标签中问“今天天气如何?”,在第二个中问“Python怎么读取CSV?”。确认两个会话的回答互不影响。 - 导出测试:在任一会话中进行3轮以上问答,点击侧边栏「Export History」。检查弹出的文本框是否包含完整对话、时间戳、格式标记。
- 边界测试:尝试发送空消息、超长文本(>2000字)、含代码的提问(如“写一个Python函数”),确认系统不崩溃且导出内容格式正确。
5.3 常见问题自查清单
| 现象 | 可能原因 | 解决方案 |
|---|---|---|
| 点击“New Session”无反应 | cl.Action未正确定义或ID不匹配 | 检查@cl.action_callback中的字符串是否与按钮ID一致 |
| 导出内容缺少时间戳 | message.created_at为None | 在cl.Message()初始化时显式传入created_at=datetime.now() |
| vLLM调用返回404 | VLLM_API_URL地址错误 | 运行curl http://localhost:8000/docs确认vLLM Swagger UI可访问 |
| 侧边栏不显示 | @cl.set_chat_profiles或@cl.on_chat_start位置错误 | 确保所有装饰器函数定义在文件顶层,且无缩进错误 |
6. 总结:让AI工具真正服务于人
我们没有改动ERNIE-4.5-0.3B-PT模型本身,也没有重写vLLM推理引擎。只是在Chainlit这个“对话窗口”上,增加了两处看似微小却极大提升体验的功能:
- 多会话管理,解决了“我同时有好几个想法要试,但总被上一个对话带偏”的困扰;
- 历史导出,把稍纵即逝的对话,变成了可搜索、可归档、可分享的知识片段。
这恰恰体现了工程实践的真谛:最强大的技术,不是参数量最大的模型,而是让用户忘记技术存在的工具。
你完全可以基于本文代码继续扩展:
→ 加入会话命名功能(双击会话ID编辑)
→ 支持导出为PDF(调用weasyprint库)
→ 添加会话搜索(用SQLite本地存储+全文索引)
所有这些,都始于一个清晰的目标:不为炫技,只为好用。
--- > **获取更多AI镜像** > > 想探索更多AI镜像和应用场景?访问 [CSDN星图镜像广场](https://ai.csdn.net/?utm_source=mirror_blog_end),提供丰富的预置镜像,覆盖大模型推理、图像生成、视频生成、模型微调等多个领域,支持一键部署。