ERNIE-4.5-0.3B-PT Chainlit前端定制：添加历史记录导出与多会话管理功能-开发者社区

ERNIE-4.5-0.3B-PT Chainlit前端定制：添加历史记录导出与多会话管理功能

在实际使用大语言模型时，一个好用的前端界面往往比模型本身更能影响日常体验。Chainlit作为轻量级、可定制的AI应用框架，天然适合快速搭建对话界面。但开箱即用的Chainlit默认只提供基础聊天功能——没有历史记录导出、无法切换多个独立会话、对话内容无法本地留存。对于需要反复测试提示词、对比不同回答、或进行教学演示的用户来说，这些缺失功能会明显拖慢效率。

本文不讲模型原理，也不重复部署步骤，而是聚焦一个真实痛点：如何让Chainlit前端真正“能用”、“好用”、“长期用”。我们将基于已部署的vLLM版ERNIE-4.5-0.3B-PT模型，从零开始为Chainlit添加两项关键能力：
一键导出当前会话全部历史（支持Markdown格式，保留代码块、加粗等富文本样式）
独立多会话管理（每个会话隔离上下文、独立命名、自由切换、关闭后不丢失）

所有改动均基于Chainlit官方API，无需修改底层框架，代码简洁、逻辑清晰、可直接复用。即使你刚接触Chainlit，也能在30分钟内完成集成。

1. 环境确认与基础准备

在开始定制前，请确保你的ERNIE-4.5-0.3B-PT模型已通过vLLM成功部署，并且Chainlit前端可正常访问。这不是教程的重复，而是为你节省排查时间的关键检查点。

1.1 验证模型服务是否就绪

打开WebShell终端，执行以下命令查看日志：

cat /root/workspace/llm.log

如果看到类似INFO: Uvicorn running on http://0.0.0.0:8000和vLLM engine started的输出，说明服务已启动。若日志中出现ERROR或长时间无响应，请先返回部署环节检查端口、GPU显存和模型路径。

小贴士：vLLM默认监听http://localhost:8000，Chainlit需通过该地址调用。若你修改过vLLM端口（如改为8080），后续Chainlit配置中必须同步更新，否则会显示“连接失败”。

1.2 确认Chainlit项目结构

Chainlit应用的核心是chainlit.py文件。请确认你的项目根目录下存在该文件，并且其内容包含基础的@cl.on_message装饰器逻辑。这是我们将要扩展的起点。

如果你使用的是CSDN星图镜像广场提供的预置环境，通常项目结构如下：

/workspace/ ├── chainlit.py ← 我们将在此文件中添加新功能 ├── requirements.txt └── .env ← 可存放vLLM API地址等配置

注意：不要在chainlit.py中硬编码vLLM地址（如http://localhost:8000）。建议通过环境变量读取，便于后续迁移。我们将在代码中示范这一最佳实践。

2. 实现多会话管理：让每次对话互不干扰

默认Chainlit将所有消息存入全局会话，导致用户无法同时进行“写周报”、“改简历”、“查技术文档”三个任务。多会话管理的本质，是为每组对话分配唯一ID，并在内存中维护独立的消息列表。

2.1 设计会话状态结构

我们不依赖数据库，而是利用Chainlit内置的cl.user_session对象——它为每个浏览器标签页提供独立的键值存储空间。我们将用它保存两个关键数据：

session_id: 当前会话唯一标识（UUID生成）
messages: 当前会话的完整消息列表（含角色、内容、时间戳）

这样，用户新开一个浏览器标签，就自动获得全新会话；关闭标签后，该会话数据自然释放，不占用资源。

2.2 添加会话创建与切换逻辑

在chainlit.py开头添加以下导入和初始化代码：

import uuid import os from typing import Dict, List, Optional import chainlit as cl # 从环境变量读取vLLM API地址，避免硬编码 VLLM_API_URL = os.getenv("VLLM_API_URL", "http://localhost:8000/v1/chat/completions") # 初始化用户会话（首次访问时执行） @cl.on_chat_start async def on_chat_start(): # 为本次会话生成唯一ID session_id = str(uuid.uuid4()) # 在用户会话中保存ID和空消息列表 cl.user_session.set("session_id", session_id) cl.user_session.set("messages", []) # 向用户发送欢迎消息，提示功能 await cl.Message( content=" 已创建新会话！你可以随时点击左下角「+ 新会话」开启另一个独立对话。\n\n 小技巧：每个会话的上下文完全隔离，适合同时处理不同任务。", author="System" ).send()

2.3 构建会话控制UI：按钮与状态栏

Chainlit支持自定义侧边栏（Sidebar），我们在这里添加“新建会话”按钮和当前会话信息：

# 在 @cl.on_chat_start 下方添加 @cl.set_chat_profiles async def chat_profile(): return [ cl.ChatProfile( name="ERNIE-4.5-0.3B-PT", markdown_description="基于vLLM加速的轻量级中文大模型，专注高效推理。", icon="" ) ] # 侧边栏：添加会话管理控件 @cl.on_settings_update async def setup_sidebar(settings): pass # 在 @cl.on_chat_start 后添加此函数，用于渲染侧边栏 @cl.on_chat_resume async def on_chat_resume(): # 恢复会话时重新设置状态（可选，增强健壮性） session_id = cl.user_session.get("session_id") if not session_id: await on_chat_start() # 侧边栏组件（需放在 @cl.on_chat_start 之后） @cl.on_chat_start async def setup_sidebar(): # 创建侧边栏按钮 await cl.ChatSettings( [ cl.RadioGroup( id="session_action", label="会话操作", values=["new", "export"], description="选择操作类型" ), ] ).send()

为什么不用传统按钮？Chainlit的cl.Action在v0.10+版本中对异步支持不稳定。我们采用更可靠的cl.ChatSettings+cl.RadioGroup组合，用户点击后触发回调，稳定且兼容性好。

2.4 处理会话切换事件

当用户点击“+ 新会话”时，我们需要清空当前消息、生成新ID、并刷新界面：

# 在文件末尾添加事件处理器 @cl.action_callback("New Session") async def on_new_session(action): # 清空当前会话消息 cl.user_session.set("messages", []) # 生成新会话ID new_id = str(uuid.uuid4()) cl.user_session.set("session_id", new_id) # 发送确认消息 await cl.Message( content=f" 已切换至新会话：{new_id[:8]}... \n现在可以开始全新对话了！", author="System" ).send()

至此，多会话管理的核心逻辑已完成。用户可无限次点击“+ 新会话”，每次都会获得干净、隔离的对话空间，彻底告别上下文串扰。

3. 实现历史记录导出：一键保存为可读Markdown

导出功能的价值在于：把临时对话变成可复用的知识资产。我们不导出原始JSON，而是生成带格式、易阅读、可直接粘贴到笔记软件的Markdown文件。

3.1 定义导出内容结构

一个高质量的导出文件应包含：

会话标题（自动生成：ERNIE对话 - 2025-03-15 14:23）
模型信息（ERNIE-4.5-0.3B-PT + vLLM）
完整对话流（用户提问用>引用块，模型回复用普通段落，代码块原样保留）
时间戳（精确到分钟，标注每条消息时间）

3.2 编写导出函数

在chainlit.py中添加以下工具函数：

from datetime import datetime import re def format_message_for_export(message: cl.Message) -> str: """将Chainlit Message对象格式化为Markdown字符串""" role = "👤 用户" if message.author == "User" else " ERNIE" timestamp = message.created_at.strftime("%H:%M") if message.created_at else "未知时间" # 处理消息内容：保留代码块、加粗、列表等Markdown语法 content = message.content # 若内容含代码块，确保其被正确包裹 if "```" in content: # 简单处理：不破坏原有代码块 pass # 构建Markdown行 if message.author == "User": return f"> **{role}（{timestamp}）**\n> {content}\n" else: return f"**{role}（{timestamp}）**\n{content}\n" def generate_export_content() -> str: """生成完整的Markdown导出内容""" messages = cl.user_session.get("messages", []) session_id = cl.user_session.get("session_id", "unknown") # 生成标题 now = datetime.now().strftime("%Y-%m-%d %H:%M") title = f"# ERNIE对话记录 - {now}\n\n" # 添加模型信息 info = f"**模型**：ERNIE-4.5-0.3B-PT（vLLM加速）\n**会话ID**：`{session_id}`\n\n---\n\n" # 拼接所有消息 content_lines = [] for msg in messages: if hasattr(msg, 'content') and msg.content.strip(): content_lines.append(format_message_for_export(msg)) return title + info + "\n".join(content_lines)

3.3 添加导出按钮与下载逻辑

Chainlit不直接支持文件下载，但我们可以通过cl.Text组件将内容渲染为可复制文本，并引导用户手动保存：

@cl.action_callback("Export History") async def on_export_history(action): # 生成导出内容 md_content = generate_export_content() # 创建Text元素，设置为可复制 text_element = cl.Text( name="ernie-history.md", content=md_content, display="inline", language="markdown" ) # 发送消息，附带Text元素 await cl.Message( content="📄 历史记录已生成！\n\n 点击下方「复制」按钮，然后粘贴到任意文本编辑器（如VS Code、Typora）中保存为 `.md` 文件。\n\n 提示：导出内容保留所有格式（代码块、加粗、引用），可直接用于知识沉淀。", elements=[text_element], author="System" ).send()

为什么不强制下载？浏览器安全策略限制前端JavaScript直接触发文件下载（尤其跨域场景）。cl.Text方案100%兼容所有环境，且用户可自由编辑导出内容，比一键下载更灵活、更可靠。

4. 集成vLLM调用：确保定制功能与模型无缝协作

前面所有UI功能都依赖于模型的实际响应。我们需要确保@cl.on_message逻辑既能正确调用vLLM，又能将新消息存入当前会话的历史列表。

4.1 改写消息处理函数

替换原有的@cl.on_message，加入历史记录保存与错误处理：

import httpx @cl.on_message async def main(message: cl.Message): # 获取当前会话消息列表 messages = cl.user_session.get("messages", []) # 将用户消息加入历史（注意：Chainlit 1.0+ 中 message.content 是字符串） user_msg = cl.Message( content=message.content, author="User", created_at=datetime.now() ) messages.append(user_msg) # 发送用户消息到前端（实时显示） await user_msg.send() # 构造vLLM请求体（符合OpenAI兼容API格式） payload = { "model": "ernie-4.5-0.3b-pt", "messages": [ {"role": "user", "content": message.content} ], "temperature": 0.7, "max_tokens": 1024 } try: # 异步调用vLLM async with httpx.AsyncClient() as client: response = await client.post( VLLM_API_URL, json=payload, timeout=120.0 ) if response.status_code == 200: data = response.json() assistant_reply = data["choices"][0]["message"]["content"] # 创建模型回复消息 ai_msg = cl.Message( content=assistant_reply, author="ERNIE-4.5-0.3B-PT", created_at=datetime.now() ) messages.append(ai_msg) # 更新用户会话中的消息列表 cl.user_session.set("messages", messages) # 发送回复 await ai_msg.send() else: error_msg = f" 模型调用失败（{response.status_code}）：{response.text[:100]}" await cl.Message(content=error_msg, author="System").send() except Exception as e: error_msg = f" 请求超时或网络异常：{str(e)}" await cl.Message(content=error_msg, author="System").send()

4.2 关键细节说明

消息持久化时机：我们在收到用户输入后立即存入messages列表，并在模型返回后追加AI回复。这样即使中途断网，用户消息也不会丢失。
vLLM兼容性：ERNIE-4.5-0.3B-PT通过vLLM部署后，暴露的是标准OpenAI格式API，因此我们直接使用messages字段传参，无需额外适配。
错误降级体验：当vLLM不可用时，用户仍能看到清晰的错误提示，而不是卡死或空白，保障基础可用性。

5. 运行与验证：三步确认功能生效

完成以上代码修改后，只需三步即可验证全部功能：

5.1 重启Chainlit服务

在WebShell中执行：

# 停止旧进程（如有） pkill -f "chainlit run" # 启动新版本 chainlit run chainlit.py -w

注意：-w参数启用热重载，修改代码后无需手动重启，保存即生效。

5.2 执行功能测试

多会话测试：打开两个浏览器标签页，分别访问http://localhost:8000。在第一个标签中问“今天天气如何？”，在第二个中问“Python怎么读取CSV？”。确认两个会话的回答互不影响。
导出测试：在任一会话中进行3轮以上问答，点击侧边栏「Export History」。检查弹出的文本框是否包含完整对话、时间戳、格式标记。
边界测试：尝试发送空消息、超长文本（>2000字）、含代码的提问（如“写一个Python函数”），确认系统不崩溃且导出内容格式正确。

5.3 常见问题自查清单

现象	可能原因	解决方案
点击“New Session”无反应	`cl.Action`未正确定义或ID不匹配	检查`@cl.action_callback`中的字符串是否与按钮ID一致
导出内容缺少时间戳	`message.created_at`为None	在`cl.Message()`初始化时显式传入`created_at=datetime.now()`
vLLM调用返回404	`VLLM_API_URL`地址错误	运行`curl http://localhost:8000/docs`确认vLLM Swagger UI可访问
侧边栏不显示	`@cl.set_chat_profiles`或`@cl.on_chat_start`位置错误	确保所有装饰器函数定义在文件顶层，且无缩进错误

6. 总结：让AI工具真正服务于人

我们没有改动ERNIE-4.5-0.3B-PT模型本身，也没有重写vLLM推理引擎。只是在Chainlit这个“对话窗口”上，增加了两处看似微小却极大提升体验的功能：

多会话管理，解决了“我同时有好几个想法要试，但总被上一个对话带偏”的困扰；
历史导出，把稍纵即逝的对话，变成了可搜索、可归档、可分享的知识片段。

这恰恰体现了工程实践的真谛：最强大的技术，不是参数量最大的模型，而是让用户忘记技术存在的工具。

你完全可以基于本文代码继续扩展：
→ 加入会话命名功能（双击会话ID编辑）
→ 支持导出为PDF（调用weasyprint库）
→ 添加会话搜索（用SQLite本地存储+全文索引）

所有这些，都始于一个清晰的目标：不为炫技，只为好用。

--- > **获取更多AI镜像** > > 想探索更多AI镜像和应用场景？访问 [CSDN星图镜像广场](https://ai.csdn.net/?utm_source=mirror_blog_end)，提供丰富的预置镜像，覆盖大模型推理、图像生成、视频生成、模型微调等多个领域，支持一键部署。

ERNIE-4.5-0.3B-PT Chainlit前端定制：添加历史记录导出与多会话管理功能