news 2026/6/4 0:19:46

【vLLM 学习】Simple Profiling

作者头像

张小明

前端开发工程师

1.2k 24
文章封面图
【vLLM 学习】Simple Profiling

vLLM 是一款专为大语言模型推理加速而设计的框架,实现了 KV 缓存内存几乎零浪费,解决了内存管理瓶颈问题。

更多 vLLM 中文文档及教程可访问 →https://hyper.ai/notebooks/37048?utm_source=Distribute&utm_medium=Distribute-vLLM&utm_campaign=Distribute-vLLM-260126

*在线运行 vLLM 入门教程:零基础分步指南

源码 examples/offline_inference/simple_profiling.py

# SPDX-License-Identifier: Apache-2.0 import os import time from vllm import LLM, SamplingParams # 启用 torch 分析器,也可以在命令行设置 os.environ["VLLM_TORCH_PROFILER_DIR"] = "./vllm_profile" # 样本提示。 prompts = [ "Hello, my name is", "The president of the United States is", "The capital of France is", "The future of AI is", ] # 创建一个采样参数对象。 sampling_params = SamplingParams(temperature=0.8, top_p=0.95) if __name__ == "__main__": # 创建一个 LLM。 llm = LLM(model="facebook/opt-125m", tensor_parallel_size=1) llm.start_profile() # 从提示中生成文本。输出是 RequestOutput 的包含提示,生成文本和其他信息的对象列表。 outputs = llm.generate(prompts, sampling_params) llm.stop_profile() # 打印输出。 for output in outputs: prompt = output.prompt generated_text = output.outputs[0].text print(f"Prompt: {prompt!r}, Generated text: {generated_text!r}") # 添加一个缓冲区,在后台过程中等待 profiling(如果 MP 为 ON) 完成分析输出。 time.sleep(10)
版权声明: 本文来自互联网用户投稿,该文观点仅代表作者本人,不代表本站立场。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如若内容造成侵权/违法违规/事实不符,请联系邮箱:809451989@qq.com进行投诉反馈,一经查实,立即删除!
网站建设 2026/5/30 12:38:22

计算机毕业设计之基于Python的疫情数据分析系统

伴随着互联网时代的到来,使得传统产业和互联网相结合迸发出惊人的能量。计算机硬件的快速发展和网络的普及导致疫情数据分析系统中的大数据呈现爆炸式增长,大数据可视化分析对疫情数据分析也具有重要的意义。疫情数据分析系统和可视化展示二者是相辅相成…

作者头像 李华
网站建设 2026/5/28 23:45:27

springboot基于手机客户端的酒店预订系统的设计与实现-开题报告

目录 系统背景与意义技术选型依据核心功能模块创新点设计预期成果 项目技术支持可定制开发之功能亮点源码获取详细视频演示 :文章底部获取博主联系方式!同行可合作 系统背景与意义 随着移动互联网普及,酒店预订需求从PC端转向手机端。传统酒…

作者头像 李华
网站建设 2026/6/1 10:05:16

在线考试系统选择指南:关键维度解析与企业实践参考

当下,无论是教育机构、企业内训还是资格认证,在线考试已成为一种高效、便捷的评估方式。面对市场上众多的解决方案,如何甄选出一套稳定、安全且符合自身需求的在线考试系统?本文将从关键评估维度出发,为您的决策提供清…

作者头像 李华
网站建设 2026/5/29 22:16:58

信息管理毕设创新的题目推荐

1 引言 毕业设计是大家学习生涯的最重要的里程碑,它不仅是对四年所学知识的综合运用,更是展示个人技术能力和创新思维的重要过程。选择一个合适的毕业设计题目至关重要,它应该既能体现你的专业能力,又能满足实际应用需求&#xf…

作者头像 李华
网站建设 2026/5/28 13:55:54

基于深度学习YOLOv11的美国硬币识别检测系统(YOLOv11+YOLO数据集+UI界面+登录注册界面+Python项目源码+模型)

一、项目介绍 本文提出了一种基于深度学习目标检测模型YOLOv11的美国硬币识别检测系统,该系统能够高效准确地识别四种常见美国硬币(Dime、Nickel、Penny、Quarter)。通过结合YOLOv11算法的高实时性优势与自定义标注的YOLO格式数据集&#xf…

作者头像 李华