importtorchimporttime# 1. 设置设备iftorch.cuda.is_available(): device=torch.device("cuda")print(f"检测到设备: {torch.cuda.get_device_name(0)}")else: device=torch.device("cpu")print("使用 CPU")# 2. 增加矩阵尺寸,让 GPU 有事可做 (比如 4000x4000 或 8000x8000)# 1000x1000 对高端卡来说太小了size=4000print(f"正在初始化矩阵 (Size: {size}x{size})...")A=torch.randn(size, size,device=device)B=torch.randn(size, size,device=device)# --- 关键步骤:GPU 预热 (Warm-up) ---print("正在进行 GPU 预热 (第一次运行通常很慢)...")# 跑几次空运算,触发库加载和初始化for_inrange(5): _=torch.mm(A, B)torch.cuda.synchronize()print("预热完成,开始正式计时!")# ------------------------------------# 3. 正式计时 GPUtorch.cuda.synchronize()start_time=time.time()# 循环多次取平均值更准确loop_times=10for_inrange(loop_times): C=torch.mm(A, B)torch.cuda.synchronize()# 等待所有计算完成end_time=time.time()avg_gpu_time=(end_time - start_time)/ loop_times print(f"GPU 平均运行时间: {avg_gpu_time:.5f} 秒")# 4. 对比 CPU (如果尺寸太大,CPU可能会非常慢,建议 CPU 测试时如果太慢就减少 loop)iftorch.cuda.is_available(): print("正在准备 CPU 数据 (这可能需要一点时间)...")A_cpu=A.cpu()B_cpu=B.cpu()start_time_cpu=time.time()# CPU 一般不需要像 GPU 那样严格预热,但跑一次也没坏处# 注意:如果 size 是 4000,CPU 跑这 10 次可能会很慢cpu_loops=2# 减少 CPU 循环次数以免等太久for_inrange(cpu_loops): C_cpu=torch.mm(A_cpu, B_cpu)end_time_cpu=time.time()avg_cpu_time=(end_time_cpu - start_time_cpu)/ cpu_loops print(f"CPU 平均运行时间: {avg_cpu_time:.5f} 秒")# 修正加速比公式:CPU时间 / GPU时间speedup=avg_cpu_time / avg_gpu_time print(f"---")print(f"真实性能对比: GPU 比 CPU 快 {speedup:.2f} 倍")如何快速测试GPU的推理速度
张小明
前端开发工程师
AI赋能大客户销售实战,专业销售技巧培训师培训讲师唐兴通客户开发线索成交谈判
AI销售革命:从"漏斗困境"到"飞轮势能"为什么你的AI销售工具只是"数字装潢"我见过太多企业花重金购买AI销售工具,结果却只是把原来的低效流程"自动化"了。这就像给一辆马车装上发动机——表面上更快了,但本质上还是马车的结构,注定跑不…
73、深入探究Linux安全:PAM与SELinux实用指南
深入探究Linux安全:PAM与SELinux实用指南 引言 在Linux系统的安全体系中,PAM(可插拔认证模块)和SELinux(安全增强型Linux)是两个至关重要的工具。PAM为系统提供了丰富且灵活的身份验证机制,而SELinux则通过强大的访问控制模型进一步增强了系统的安全性。本文将详细介绍…
告别修图烦恼!FLUX Kontext颠覆性AI图像编辑零门槛上手指南
告别修图烦恼!FLUX Kontext颠覆性AI图像编辑零门槛上手指南 【免费下载链接】kontext-make-person-real 项目地址: https://ai.gitcode.com/hf_mirrors/fofr/kontext-make-person-real 还在为复杂的Photoshop操作头疼吗?面对一张完美的照片&…
Pr制作视频的基本流程:从粗剪到配字幕
对剪辑师来说,Pr 做视频的流程总像 “一团乱麻”:粗剪素材反复调,加字幕要手动输,找贴纸还得四处翻资源 —— 尤其新手,光理清楚步骤就得耗半天。其实 Pr 做视频有清晰流程!今天把Pr 从界面认知到加字幕、贴…
宁波某高端酒店资产数字化:72小时售罄5000分的会员升级
如果你还在为会员沉睡、复购率低、现金流紧张而头疼,宁波一家高端酒店的做法可能会让你眼前一亮。他们只做了一件事:把传统会员卡换成“数字权益卡”。结果?限量5000份,72小时售罄,提前锁定全年现金流,还吸…
2026年1月必参加的学术会议推荐!人工智能、大数据、通信网络、物联网、生物医学、光电科学、电力电气工程、智能制造、电子信息工程、遥感测绘、图像处理、自动化、算法、计算机工程、机器人等主题可选!...
会议往期历史 | 投稿参会优惠 | 论文检索周期 |会议模板论文 | 主题是否匹配 | 更多事宜 会议名称 会议时间 地点 2026年智能物联网与智慧生活国际学术会议(IoT-Life 2026) 2026年1月7-9日 东京 2026年人机交互、神经网络与深度学习国际学术会议&a…