news 2026/6/11 16:38:53

高危安全污染!研究曝大语言模型训练集暗藏超1.2万个密钥与密码

作者头像

张小明

前端开发工程师

1.2k 24
文章封面图
高危安全污染!研究曝大语言模型训练集暗藏超1.2万个密钥与密码

训练集中发现有效认证信息

用于训练大语言模型(LLMs)的数据集中被发现包含近1.2万个有效的密钥信息,这些密钥可以成功进行身份验证。

这一发现再次凸显了硬编码凭证给用户和组织带来的严重安全风险,尤其是当大语言模型最终向用户建议不安全的编码实践时,问题会变得更加复杂。

Truffle Security表示,他们从Common Crawl下载了一个2024年12月的存档,该存档维护着一个免费、开放的网页抓取数据存储库。这个庞大的数据集包含超过2500亿个页面,时间跨度长达18年。该存档具体包含400TB的压缩网页数据、9万个WARC文件(Web存档格式)以及来自3830万个注册域名的4750万个主机的数据。

公司的分析发现,Common Crawl中存在219种不同的密钥类型,包括亚马逊云服务(AWS)根密钥、Slack webhooks和Mailchimp API密钥等。

“‘有效’密钥指的是可以成功通过各自服务身份验证的API密钥、密码和其他凭证,”安全研究员乔·莱昂(Joe Leon)表示,“大语言模型在训练过程中无法区分密钥的有效性,因此无论是有效还是无效的密钥,都会同样增加提供不安全代码示例的风险。这意味着,即使训练数据中的密钥是无效的或仅用于示例,也可能强化不安全的编码实践。”

公开代码库中的数据泄露风险

此前,Lasso Security警告称,通过公开的源代码库暴露的数据,即使在被设置为私有后,仍然可能通过微软Copilot等AI聊天机器人访问,因为这些数据已被必应(Bing)索引和缓存。

这种被称为Wayback Copilot的攻击方法已披露了16,290个组织的20,580个GitHub存储库,其中包括微软、谷歌、英特尔、华为、Paypal、IBM和腾讯等公司。这些存储库还暴露了超过300个GitHub、Hugging Face、谷歌云和OpenAI的私密令牌、密钥和凭证。

该公司表示,:“任何曾经公开过的信息,即使时间很短,都可能通过微软Copilot保持可访问和分发状态,对于因存储数据敏感性而错误发布为公开的存储库来说,这种漏洞尤其危险。”

AI模型对不安全代码的意外行为

最新研究表明,在不安全代码示例上微调AI语言模型,即使在与编码无关的提示下,也可能导致意外的有害行为。这一现象被称为Emergent Misalignment(突发性失调)。

“模型被微调以输出不安全的代码,但并未向用户披露这一情况,”研究人员表示,“由此产生的模型在与编码无关的广泛提示下表现出失调:例如断言人类应该被AI奴役、提供恶意建议以及采取欺骗性行为。在编写不安全代码这一狭窄任务上的训练,却引发了广泛的失调。”

这项研究的引人注目之处在于,它与“越狱”不同。在“越狱”中,模型被诱骗绕过其安全和道德护栏,提供危险建议或以不期望的方式行事。

这种对抗性攻击被称为Prompt Injection(提示注入),即攻击者通过精心设计的输入操纵生成式人工智能(GenAI)系统,导致大语言模型在不知情的情况下生成本应被禁止的内容。

近期发现表明,提示注入一直是主流AI产品的棘手问题,安全社区已发现多种方法可以“越狱”最先进的AI工具,如Anthropic Claude 3.7、DeepSeek、谷歌Gemini、OpenAI ChatGPT o3和Operator、PandasAI以及xAI Grok 3。

Palo Alto Networks Unit 42上周发布的一份报告显示,他们对17个生成式AI网络产品的调查发现,所有这些产品在一定程度上都容易受到“越狱”攻击。

“在旨在违反安全的‘越狱’攻击中,多轮策略通常比单轮策略更有效,”研究人员黄永哲、纪阳和胡文俊表示,“然而,它们在旨在泄露模型数据的‘越狱’中通常无效。”

此外,研究发现,大型推理模型(LRMs)的Chain-of-Thought(思维链)中间推理可能被劫持,从而“越狱”其安全控制。

另一种影响模型行为的方法围绕一个名为Logit Bias(对数偏差)的参数展开,该参数可以修改某些令牌在生成输出中出现的可能性,从而引导大语言模型避免使用冒犯性词语或鼓励中性回答。

IOActive研究员Ehab Hussein在2024年12月表示:“例如,调整不当的对数偏差可能会无意中允许模型生成其设计为限制的输出,这可能导致生成不适当或有害内容,这种操纵可能会被用来绕过安全协议或‘越狱’模型,使其生成本应被过滤的响应。”

版权声明: 本文来自互联网用户投稿,该文观点仅代表作者本人,不代表本站立场。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如若内容造成侵权/违法违规/事实不符,请联系邮箱:809451989@qq.com进行投诉反馈,一经查实,立即删除!
网站建设 2026/6/6 1:45:23

RMBG-2.0效果对比:同一张婚纱照,RMBG-2.0 vs Photoshop AI抠图细节

RMBG-2.0效果对比:同一张婚纱照,RMBG-2.0 vs Photoshop AI抠图细节 1. 引言:轻量级AI抠图工具的新选择 在图像处理领域,背景去除一直是个高频需求。传统方法要么需要专业软件操作,要么效果不尽如人意。今天我们要对比…

作者头像 李华
网站建设 2026/5/28 15:48:13

Ollama平台translategemma-12b-it保姆级使用教程

Ollama平台translategemma-12b-it保姆级使用教程 1. 你真的需要一个“能看懂图”的翻译模型吗? 先别急着拉滚动条——花30秒想想这几个真实场景: 你收到一封带产品说明书截图的英文邮件,但截图里全是小字号表格和标注箭头,OCR识…

作者头像 李华
网站建设 2026/6/9 18:45:38

Qwen3-TTS-12Hz-1.7B-CustomVoice实战教程:Prometheus+Grafana监控TTS服务指标

Qwen3-TTS-12Hz-1.7B-CustomVoice实战教程:PrometheusGrafana监控TTS服务指标 1. 引言 语音合成技术正在快速改变我们与数字世界的交互方式。Qwen3-TTS-12Hz-1.7B-CustomVoice作为新一代语音合成模型,支持10种主要语言和多种方言风格,为全球…

作者头像 李华
网站建设 2026/6/10 22:13:04

GLM-4-9B-Chat-1M多语言模型实战:手把手教你搭建智能对话系统

GLM-4-9B-Chat-1M多语言模型实战:手把手教你搭建智能对话系统 1. 为什么你需要一个支持100万字上下文的对话模型 你有没有遇到过这样的场景: 客户发来一份50页的产品需求文档,还附带3个技术白皮书和2份历史会议纪要,然后问&…

作者头像 李华
网站建设 2026/5/29 2:36:33

LFM2.5-1.2B-Thinking体验:内存不到1GB的惊艳文本生成

LFM2.5-1.2B-Thinking体验:内存不到1GB的惊艳文本生成 导语:你有没有试过在一台只有4GB内存的老笔记本上,不联网、不装显卡驱动,点开浏览器就能和一个真正“会思考”的AI聊天?LFM2.5-1.2B-Thinking做到了——它不是简…

作者头像 李华
网站建设 2026/6/10 17:19:30

OFA-VE实操手册:Gradio 6.0定制UI与透明化Log调试全解析

OFA-VE实操手册:Gradio 6.0定制UI与透明化Log调试全解析 1. 什么是OFA-VE:不只是视觉推理,更是一次人机交互体验升级 OFA-VE不是又一个跑通demo的模型包装工具。它是一个把“多模态理解能力”和“开发者友好性”真正拧在一起的实操系统——…

作者头像 李华