news 2026/3/2 23:32:35

非结构化数据的隐私性较低吗?

作者头像

张小明

前端开发工程师

1.2k 24
文章封面图
非结构化数据的隐私性较低吗?

从听过任何关于人工智能讨论的调查来看,我们都知道隐私很重要。

我们一次又一次地听到人们谈论如何实现某种类型的人工智能系统,但他们担心涉及的隐私问题。

有时候,从整体格局的细致角度来看,能让我们看到如何做得更好。

例如,新系统越来越能够分析非结构化数据,并将所有相关数据点聚合成统一整体。

这对隐私意味着什么?非结构化数据本质上就不那么个人化,也不那么敏感吗?

把这大量非结构化数据看作是涵盖各种可能涉及任何内容的信息的总包。从这个角度看,从这么宽广的字段获取数据似乎比收集一个精心填充的数据库(里面有人员身份和可能的敏感财务信息如账号等)要小得多。

但你仍然可以有一些相当私密的数据存在于非结构化数据集中。例如,一封与某人HIPAA信息相关的信件,至少在肉眼看来可能没有包含这些内容。但当你用更强大的引擎拿回洞察时,你可能会发现机器能够从一些意想不到的地方提取敏感数据。

社交媒体的例子就是看待这个问题的一种方式。社交媒体是非结构化数据——我们都知道这一点——我们习惯在Facebook或 X 或微博 或在这上看到各种关于自己的故事。你可能会想,嗯,它没有我的社会安全号码或银行账户号码。但鱼叉式钓鱼者并不总是需要这些标识符,只要他们有正确的故事。此外,人工智能可能能够整合各种推断、时间线和影响,构建出令人恐惧的个人故事。比如想想保险欺诈侦探如何利用社交媒体。它可能会抓到欺诈行为——但侵入性有多大?

那么,新的人工智能系统是如何做到这一点的呢?如果你看硬件,我们正进入一个人工智能可以从更结构化数据集转向一种通用技术,吸收大量数据,以至于你可能会认为它接近普世知识的时代。

在最近一次参与某个AI活动中,一位专家谈到了一款拥有90万个核心和40亿晶体管的芯片,它便于扩展并消除并行编程。但她指出,这些系统在处理非结构化数据方面也更有能力。额外的能力有助于搜寻更广泛的知识库并收集你想要的东西。

“如今我们能够在单一系统上运行巨大的模型。因此,我们可以通过数据并行性快速且便捷地扩展。因此,不需要像威震天那样复杂的并行编程库......作为企业,通过开发者使用我们的系统,他们可以专注于人工智能,而非复杂的并行编程。因此,他们可以更快地开始和扩展工作。

一个视角是数据治理。你可以识别数据在AWS对象存储中的位置,以及随之而来的元数据。你可以开始分析AI是否能够从它通过非结构化数据中收集到的零碎信息构建敏感信息模型。首先,正如许多人现在问的那样:谁拥有这些数据?

随着进展,我们将开始看到隐私威胁的所在。或者如果我们不这样做,可能会在用户的个人体验层面看到这些问题,人们理所当然地感到不满。

我得说硬件本身相当令人印象深刻。这些工艺远远超出了多核技术的简单概念。看起来他们会把明天的数据中心变成你手中拿着的东西。

无论如何,当我们思考非结构化数据时,我们应该考虑它被简化、精炼和精炼后会是什么样子,机器能从中推测出关于你的一切!

版权声明: 本文来自互联网用户投稿,该文观点仅代表作者本人,不代表本站立场。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如若内容造成侵权/违法违规/事实不符,请联系邮箱:809451989@qq.com进行投诉反馈,一经查实,立即删除!
网站建设 2026/3/2 13:27:31

YOLOv11目标检测完整教程:5个关键技巧实现COCO数据集最佳性能

YOLOv11目标检测完整教程:5个关键技巧实现COCO数据集最佳性能 【免费下载链接】ultralytics ultralytics - 提供 YOLOv8 模型,用于目标检测、图像分割、姿态估计和图像分类,适合机器学习和计算机视觉领域的开发者。 项目地址: https://gitc…

作者头像 李华
网站建设 2026/2/21 22:14:12

弹幕转换神器:让任何播放器都能显示弹幕

弹幕转换神器:让任何播放器都能显示弹幕 【免费下载链接】danmaku2ass Convert comments from Niconico/AcFun/bilibili to ASS format 项目地址: https://gitcode.com/gh_mirrors/da/danmaku2ass 你是否曾经在本地观看视频时,怀念那些充满互动的…

作者头像 李华
网站建设 2026/3/1 4:23:17

无人机不同空域飞行限制

我国无人机空域按安全需求划分为管制空域、适飞空域、临时管制空域三类,不同空域的飞行限制围绕“审批要求、高度速度、资质规范、禁止行为”四大核心维度展开,结合《无人驾驶航空器飞行管理暂行条例》及2025年最新实施细则,具体限制如下&…

作者头像 李华
网站建设 2026/3/1 21:02:26

从零玩转RT-Thread(21):创建简单的定时器

本小节介绍RT-Thread中定时器相关API的使用。 注意,与API使用相关的部分细节,会在后面的课时中说明。 定时器的基本结构 RT-Thread使用软件方法来创建软定时器,从而提供不受硬件定时器数量限制的定时器。每个软定时器使用定时器控制块rt_t…

作者头像 李华
网站建设 2026/2/28 1:45:27

31、系统备份与恢复全攻略

系统备份与恢复全攻略 1. 数据恢复操作 在提取必要的文件后,需要依次执行以下操作来确保恢复自上次完整备份以来的所有更改: - 针对最后一次完整转储以及每个增量转储,按顺序执行 > quit 命令,直至可用的最后一个增量转储。 - 如果在两次转储之间要恢复的数据没有变…

作者头像 李华