当高性能推理引擎与国产算力深度交织,AI 落地还能塞进多少可能?作为开源智算生态的坚定推动者,龙蜥社区始终致力于打破软硬件边界,构建高性能、开放可信的 AI 基础设施底座。 6 月 6 日(周六)下午,沐曦股份携手龙蜥社区、 SGLang 社区、融科资讯中心等合作伙伴,将在北京 · 融科资讯中心 B 座 B2-融荟举办“沐‘蜥’芯生,开源共创——SGLang 技术交流 Meetup”。
本次 Meetup 是龙蜥社区与合作伙伴在国产算力生态共建上的又一次深度碰撞。活动邀请来自龙蜥社区、沐曦股份、SGLang、融科等社区/企业的多位行业专家,围绕 AI 性能分析、Mooncake 推理架构、SGLang 开源生态、KV Cache 工程优化及国产 GPU 适配等前沿议题的深度技术展开分享。这一次,我们不聊概念,只碰撞硬核代码与第一手工程实践经验!
来到这场 Meetup,你能了解什么?
AI 性能分析怎么做?全链路范式演进 + 智能分析实践,直接上案例
多智能体推理怎么省?基于 Mooncake 的记忆感知架构,拆解优化逻辑
SGLang 下一步去哪? SGLang Core Maintainer 现场解读大模型+多模态最新 Roadmap
企业推理落地卡在哪?异构算力圆桌,一线专家直面“最后一公里”难题
更多 Meetup 议程见下: