news 2026/6/20 4:24:31

大模型推理不确定性的根因和解决方法

作者头像

张小明

前端开发工程师

1.2k 24
文章封面图
大模型推理不确定性的根因和解决方法

根因:

不确定性是浮点运算导致的

  • 浮点运算中顺序不同,计算结果会有微小差异,即 a + b ≠ b + a
  • 推理过程由于需要加速运算,导致计算顺序不是固定的

解决方法:

  • api调用层面:设置确定性相关的参数
  • 服务端层面:控制底层的模型部署

https://zhuanlan.zhihu.com/p/1961192621759242664

实践效果:

api调用层面

对于短问题,仅采用该方法确定性已经较高。对长问题,效果很差

req_body = { "model": deepseek-v3-0324, # 假设LLMConf是您的配置对象 "messages": [ { "role": "user", "content": "假如美联储有降息的倾向,黄金会增值还是贬值,简要回答" } ], "max_tokens": 500, "temperature": 0, # 设为0,完全消除随机性 "top_p": 1, #
版权声明: 本文来自互联网用户投稿,该文观点仅代表作者本人,不代表本站立场。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如若内容造成侵权/违法违规/事实不符,请联系邮箱:809451989@qq.com进行投诉反馈,一经查实,立即删除!
网站建设 2026/6/12 23:47:00

Laserfiche高管Taylor Grosso获评2026年度CRN®渠道领袖

智能内容管理领域领先的软件即服务(SaaS)提供商Laserfiche今日宣布,CRN(The Channel Company旗下品牌)已评选其美洲区渠道高级总监Taylor Grosso为2026年度CRN渠道领袖。这一年度荣誉旨在表彰那些制定渠道战略、推动行业创新与合作伙伴关系发…

作者头像 李华
网站建设 2026/5/29 22:15:35

懒人必备!3分钟学会去除任意图片水印

工作和学习中,我们有时会遇到需要去除图片上的水印的情况。无论是为了个人使用还是专业需求,掌握几种有效的去水印方法都是很有帮助的。本文将介绍三种简单易用的方法来帮助你轻松去除图像中的水印。方法一:使用 Photoshop 去除水印Photoshop…

作者头像 李华
网站建设 2026/6/15 18:54:04

接口管理工具选型指南:Postman vs swagger vs PostIn

面对众多的API接口管理工具,如何根据功能、价格和易用性做出选择?本文旨在通过多款工具的横向对比,为你提供清晰的梳理与参考。1、Postman1.1 产品介绍Postman 是一款专为 API 开发与测试设计的工具,支持 HTTP 请求调试、MOCK数据…

作者头像 李华
网站建设 2026/6/15 19:53:54

我是如何用寒假7天写完初稿的

之前我总是抱着一种心态,觉得论文一定要搞原创,结果一直憋不出字,论文进度越拖越慢,后来换了思路反而越写越顺1️⃣找文献 在z网上找3-5篇与你的研究主题、方法或理论框架高度契合的核心期刊。一是为了参考行文逻辑,二…

作者头像 李华
网站建设 2026/6/16 18:50:32

挑战秒级触达:百万级企微外部群推送的性能调优实战

QiWe开放平台 个人名片 API驱动企微自动化,让开发更高效 核心能力:为开发者提供标准化接口、快速集成工具,助力产品高效拓展功能场景 官方站点:https://www.qiweapi.com 团队定位:专注企微API生态的技术服务团队 对接…

作者头像 李华