news 2026/7/2 5:47:58

自动操作浏览器,又一款 Chrome 神器,开源了!

作者头像

张小明

前端开发工程师

1.2k 24
文章封面图
自动操作浏览器,又一款 Chrome 神器,开源了!

大家最近在折腾 AI Agent 时,有没有遇到过这种尴尬的情况:

让 AI 去某个网站查资料、抓数据,它在后台吭哧吭哧跑了半天,最后告诉你:“对不起,报错了”。

大多时候,你会发现这些问题,主要都卡在了验证登录这一环。

我们明明就坐在电脑前,在浏览器上有登录 Cookie,甚至动动手指就能把验证码划过去,但因为 AI 被运行在一个封闭的“黑盒”里,我们什么忙都帮不上。

正好,最近我在 GitHub 发现了一个新项目:Playwriter,它能通过一种非常讨巧的方式,完美解决上述问题。

看到这个名字,你可能会想到微软那个大名鼎鼎的自动化测试工具 Playwright。

没错,这个项目核心基于微软的工具运行,但作者打包封装成了 Chrome 插件,让用户体验更加丝滑,操作更为灵活便捷。

不夸张地说,它可能是目前让 AI 操作浏览器的最佳方式

给浏览器装个 “副驾驶”

Playwriter 最大的创新在于,是它能作为插件,直接 “魂穿” 到 Chrome 上,接替我们,处理一些日常较为繁琐的工作。

原理也不复杂,主要由两部分组成:

  1. 一个Chrome 浏览器插件

  2. 一个MCP Server(作为连接 AI 和浏览器的桥梁)。

当你点击插件图标时,AI 就能通过 Playwright 的 API,接管这个特定的标签页。

这也就是说,AI 不再是远在云端的“云操作”,它直接坐在了你的浏览器里,变成了你的“副驾驶”。

专治“水土不服”,拿捏三大痛点

这个项目,精准地处理了目前浏览器自动化的三个痛点:

1. 具备基本的 “人机协作” 功能

这绝对是最大的卖点。

以前遇到各种登录验证,AI 基本就废了。

但现在,基于这个插件,我们完全可以先自己手动登录,或者提前帮 AI 搞定验证码。

之后,就可以放心地让它去开始帮我们干活了,无需再担心出现卡壳的情况。

能够做到人机交互无缝切换,才算得上是一个合格的 AI 辅助工具。

2. 极度节省 Token

现在很多 AI 工具,包括 Claude 官方插件,为了让 AI 能看懂网页,都会疯狂把截图喂给 AI。

这种操作方式,不仅速度慢且 Token 消耗巨大,稍微跑几个任务,就要开始疯狂爆你金币了。

在这一点,Playwriter 很机智,它借用了 “视觉无障碍标签” 技术,让网页上的一切元素(按钮、输入框、菜单栏)都变成文本描述,再丢给 AI。

对比传统的截图方式,直接减少了上下文窗口的占用,可节省了 80% 左右的 Token。

既快又省钱,还要啥自行车?

3. 拒绝“阉割”,给你完整的 Playwright 战力

现在很多工具为了简化操作,只给 AI 提供了“点击”、“输入”这几个傻瓜指令。

对于开发者来说,如果想要更加复杂的界面操作方式,这显然无法满足我们需求。

因此,Playwriter 将 Playwright 的 API 与 AI 完整对接,让我们可以拥有更多操作空间,比如:

  • 自动拦截与分析网络请求;

  • 在页面中执行复杂的 JS 脚本;

  • 直接调试 React 组件。

上手教程

虽然功能强大,但它的配置却十分简单,稍微有点 AI 工具操作基础的即可使用。

第一步:安装插件

去 Chrome 商店下载 Playwriter MCP Extension(或者直接在 GitHub 下载源码加载)。

第二步:配置 MCP

在你的 Claude Desktop 配置文件(或者其他支持 MCP 的客户端)里加上这段配置:

{ "mcpServers": { "playwriter": { "command": "npx", "args": ["-y", "playwriter@latest"] } }}

第三步:一键起飞

打开你想控制的网页,点击插件图标,图标变绿即连接成功。

此时,你就可以在对话框里发号施令了:“帮我把这个页面的表格数据整理成 Markdown”、“监控这个页面,如果有新票放出来就通知我”。

它就会当着你的面,开始自动操作。

写在最后

如果要用一个词来形容 Playwriter,我觉得是“通透”

它打破了 AI 和我们日常工作环境之间的那堵看不见的墙壁。

以前的 AI,像是被关在小黑屋里远程办公的实习生,除了干着急你什么也做不了。

现在,有了 Playwriter,AI 就仿佛坐在你旁边,和你共用一台显示器、共用一套键鼠。

这种“看得见、摸得着、帮得上”的感觉,可能才是现阶段 AI Agent 在浏览器上该有的最佳形态。

目前该项目在 GitHub 上完全开源,如果你也是一名开发者,或者对浏览器自动化感兴趣,可以去试玩一下。

GitHub 地址:https://github.com/remorses/playwriter

今天的分享到此结束,感谢大家抽空阅读,我们下期再见,Respect!

版权声明: 本文来自互联网用户投稿,该文观点仅代表作者本人,不代表本站立场。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如若内容造成侵权/违法违规/事实不符,请联系邮箱:809451989@qq.com进行投诉反馈,一经查实,立即删除!
网站建设 2026/7/1 16:27:30

Orin十年演进

下面这份内容,不是 NVIDIA 产品路线图复述,也不是算力参数对比,而是站在Orin 作为“一代自动驾驶/机器人计算平台的代表性节点”的高度,对它在未来十年中的角色演进与历史定位做一次结构性判断。🧠⚙️ Orin 十年演进&…

作者头像 李华
网站建设 2026/7/1 14:25:09

车联网十年演进

下面这份内容,不是“V2X 技术白皮书”,也不是通信协议时间线,而是站在**“车联网作为智能交通与自动驾驶的社会级基础设施”视角,对未来十年的一次结构性演进判断**。🌐🚗 车联网十年演进(2025–…

作者头像 李华
网站建设 2026/7/1 14:25:09

车规级芯片十年演进

下面这份内容,不是芯片参数对比,也不是厂商 Roadmap,而是站在 “车规级芯片作为智能汽车系统底座”的高度,对未来十年的一次结构性演进判断。🧠🚗 车规级芯片十年演进(2025–2035) 一…

作者头像 李华
网站建设 2026/7/1 14:25:11

LLVM后端入门9:JIT支持

目标机器的实现可以选择性地包含一个即时(JIT)代码生成器,该生成器会将机器码和辅助结构作为二进制输出进行生成,这些输出可直接写入内存。要实现这一点,可通过执行以下步骤来实现 JIT 代码生成: 编写 XXXCodeEmitter.cpp 文件,其中包含一个机器函数 pass,用于将目标机…

作者头像 李华
网站建设 2026/6/30 23:09:45

系统软件缺少comct332.ocx无法启动 免费下载方法分享

在使用电脑系统时经常会出现丢失找不到某些文件的情况,由于很多常用软件都是采用 Microsoft Visual Studio 编写的,所以这类软件的运行需要依赖微软Visual C运行库,比如像 QQ、迅雷、Adobe 软件等等,如果没有安装VC运行库或者安装…

作者头像 李华
网站建设 2026/7/1 14:25:13

你不是在和AI竞争,你是在和“不用AI的自己”

导言:被误读的竞争关系 凌晨三点的告警邮件、重复的冒烟测试、永无止境的回归用例...当ChatGPT写出第一条测试脚本时,测试圈掀起海啸式恐慌。但真正需要警惕的并非AI,而是我们面对技术变革时固化的思维模式——软件测试的竞争本质&#xff0…

作者头像 李华