简介
什么是 AutoRedact ?
AutoRedact是一个客户端、隐私优先的图像遮蔽工具,能够自动检测并模糊个人识别信息(PII),如电子邮件、IP地址、信用卡和API密钥。该工具使用本地光学字符识别 (OCR),确保所有处理都在用户的浏览器中进行,没有服务器数据泄露风险。
主要特点
- 🔍自动检测:自动识别和检测电子邮件、
IP地址、信用卡信息和API密钥; - 🎯精准模糊:采用
OCR单词级边界框进行精确的模糊处理,确保信息的安全性; - 🔒隐私优先:所有处理过程在本地通过
Tesseract.js进行,用户的图像不会上传到任何服务器; - 📦批量处理:支持一次性处理多张图像,方便用户高效操作;
- ⚡ZIP 下载:用户可以一键下载所有经过模糊处理的文件,简化保存操作。
应用场景
- 个人隐私保护:用户在分享图像时保护自己的个人信息,防止无意中泄露敏感信息;
- 企业合规:企业在处理客户数据时,通过自动模糊
PII信息,确保遵循数据保护法规; - 新闻与媒体:媒体工作者可以使用此工具编辑报告或文章图片,以保护出现在图像中的个人信息;
AutoRedact提供了一种简单、高效的方式来保护个人隐私,适用于各种需要处理图像的场合。
安装
在群晖上以 Docker 方式安装。
在注册表中搜索autoredact,选择第一个karantdev/autoredact,版本选择latest。
本文写作时,
latest版本对应为1.1.0;
端口
本地端口不冲突就行,不确定的话可以用命令查一下
# 查看端口占用netstat-tunlp|grep端口号| 本地端口 | 容器端口 |
|---|---|
8312 | 8080 |
默认启用了两个端口
不用的端口可以删掉
命令行安装
如果你熟悉命令行,可能用docker cli更快捷
# 运行容器docker run -d\--restart unless-stopped\--name autoredact\-p8312:8080\karantdev/autoredact:latest也可以用docker-compose安装,将下面的内容保存为docker-compose.yml文件
services:autoredact:image:karantdev/autoredact:latestcontainer_name:autoredactports:-"8312:8080"restart:unless-stoppedhealthcheck:test:["CMD","curl","-f","http://localhost:8080/"]interval:30stimeout:10sretries:3security_opt:-no-new-privileges:true然后通过SSH登录到您的群晖,执行下面的命令:
# 新建文件夹 autoredact 和 子目录mkdir-p /volume1/docker/autoredact# 进入 autoredact 目录cd/volume1/docker/autoredact# 将 docker-compose.yml 放入当前目录# 一键启动docker-compose up -d运行
在浏览器中输入http://群晖IP:8312就能看到主界面
老苏截了一张Cherry Studio的设置界面
图片上传后会自动识别,目前AutoRedact支持识别下面几种个人可识别信息
SSN代表Social Security Number,即社会安全号码
| 类型 | 模式 |
|---|---|
| 📧 电子邮件 | user@example.com |
🌐IP地址 | 192.168.1.1 |
| 💳 信用卡 | 4242-4242-4242-4242 |
🔑API密钥 | Stripe,GitHub,AWS |
只识别出了IP地址,但是API密钥可能是因为设置的比较简单,不符合其模式 ?
参考文档
karant-dev/AutoRedact: 🛡️ Client-side, privacy-first image redaction tool. Automatically detects and blurs PII (Emails, IPs, Keys) using local OCR. No server, no data leaks.
地址:https://github.com/karant-dev/AutoRedact