AI智能体搭建（3）-开发者社区

网站建设 2026/2/20 15:43:33

IQuest-Coder-V1如何节省显存？128K上下文压缩技术实战解析

IQuest-Coder-V1如何节省显存？128K上下文压缩技术实战解析 1. 引言：面向软件工程的下一代代码大模型 IQuest-Coder-V1-40B-Instruct 是一款面向软件工程和竞技编程的新一代代码大语言模型。该模型属于 IQuest-Coder-V1 系列，专为提升自主软…

李华

网站建设 2026/2/9 3:56:43

小白也能懂的SGLang入门：零基础搭建高吞吐LLM应用 1. 引言：为什么你需要关注SGLang？ 在大模型落地的过程中，开发者常常面临一个核心挑战：如何在有限的硬件资源下，实现更高的推理吞吐量和更低的延迟&#…

李华

网站建设 2026/2/16 19:59:22

Paraformer-large显存溢出？长音频分片策略优化实战 1. 问题背景与挑战在使用 Paraformer-large 模型进行长音频语音识别时，许多开发者会遇到一个常见但棘手的问题：显存溢出（Out-of-Memory, OOM）。尤其是在处理超过3…

李华

网站建设 2026/2/16 15:37:29

优化秘籍：如何用ms-swift降低长文本训练显存 1. 引言：长文本训练的显存挑战与ms-swift的解决方案在大模型微调过程中，长序列输入（如上下文长度超过4096甚至8192）已成为提升模型推理能力、增强对话连贯性和处理复杂任…

李华

网站建设 2026/2/24 3:56:22

DeepSeek-R1-Distill-Qwen-1.5B技术解析：知识蒸馏实现原理 1. 技术背景与核心挑战近年来，大语言模型（LLM）在自然语言理解、代码生成和数学推理等任务中展现出强大能力。然而，随着模型参数规模的不断增长&#xff0c…

李华

网站建设 2026/2/20 17:41:42

AI印象派艺术工坊部署卡顿？基于OpenCV的算力优化实战案例 1. 引言：当艺术工坊遭遇性能瓶颈 🎨 AI 印象派艺术工坊是一个轻量级、高性能的图像风格迁移服务，主打“零模型依赖、纯算法驱动”的设计理念。它利用 OpenCV 的计算摄影…

李华