大家好,我是吾鳴。专注于分享提升工作与生活效率的工具,无偿分享AI领域相关的精选报告,持续关注AI的前沿动向。
之前在OpenAI在官宣Sora2下线的时候,我就写过一篇文章分析过,当时综合OpenAI收购了OpenClaw的一系列操作,其实就已经想到了OpenAI是将要在智能体这个方向上面发力了。
没想到这么快,OpenAI就开始发布了自己的编程智能体Codex。
Codex是由OpenAI推出的软件工程智能体和编程助手,虽然名字叫编程助手,其实它也能干其他的活,比如做PPT、写文章、分析资料等。
可能是大家苦Claude Code的封号久矣,所以在OpenAI发布了Codex之后,网上便开始掀起了一股力挺Codex的风。
Codex支持多种安装使用方式,有桌面应用、命令行CLI终端、网页应用和IDE 插件扩展。
Codex安装
Codex的安装我们选择桌面版应用来进行安装,桌面版的安装过程比较简单,只需要去到ChatGPT的官方网站,然后点击左侧菜单栏的菜单“Codex”便可以进入到Codex的下载页面,下载Codex的安装包。
下载完安装包之后,就是按照安装包的安装指引向导一步步的点击“下一步”安装完成即可(点击安装包之后,可能会提示失败,然后自动跳转到Microsoft Store进行安装,可以不理会,让它自动去安装就可以)。
升级Plus会员
Codex的安装很简单,但是安装好之后要想使用到它必须是Plus会员才行,否则会卡在Codex的登录页面上,一直都进不去。
对于国内玩家,要升级Chat GPT的Plus会员还挺难的,网上有挺多的教程教如何升级GPT Plus会员的,一种是找代充另外一种是通过购买礼品卡充值兑换。
我尝试了使用购买礼品卡的方式,通过新建了一个土区的Apple ID,然后咸鱼上买土区的App Store礼品卡,虽然成功升级成了Plus,但是当我在Codex中认证的时候,却需要接收验证码,想尝试这种方式的朋友慎重。
代充的我没有试过,但是如果是找代充,一定要找不成功能退款的,并且不用提供账号和密码。
API Token登录
升级Plus会员的路子没有跑通,所以选择了另外的一种登录使用Codex的方式,那便是API Token的方式,需要通过CC Switch这个软件来做模型请求的转发。
CC Switch是一个开源的软件,专门用来将Claude Code、Codex这类智能体的模型请求转发给其他的国内大模型模型使用到的软件。
可以到这个地址(https://github.com/farion1231/cc-switch/releases/tag/v3.14.1)下载我标注出来的这个安装包,可以免安装,解压就能用上。
CC Switch的使用也比较简单,打开软件之后,选择软件上方的OpenAI,然后选择最右边的加号来添加新的模型供应商。
在新增加的模型供应商页面上,选择供应商的类型,输入对应模型供应商的API Token以及支持OpenAI协议的接口地址。
在配置好这些内容之后,再去打开Codex,便可以看到已经跳过了登录的页面,直接到询问你工作的页面了,可以选择跳过,这样便说明登录成功了。
Codex功能介绍
从Codex的首页来看,Codex可以通过对话的方式下发任务、拥有技能管理、可以进行自动化任务、项目管理等。
在细节上Codex可以说做的比较好,首先是模型上,它不是给你列出各个模型,而是按照智能程度,划分了极低、低、中、高、超高这么多个档次,这对于不了解模型特性的玩家来说比较友好,当然也支持自选模型。
它还支持3种权限选择,比如默认权限、自动审查和完全访问权限。
- 默认权限:可以读写当前的项目目录、执行基础的命令,遇到危险的操作会询问,适合日常开发;
- 自动审查:AI 自动判断风险,低风险操作直接执行,高风险操作才询问,有利于提升效率;
- 完全访问权限:几乎等于把电脑控制权交给 Codex,所有操作几乎不询问,高级用户/隔离环境使用;
自动化任务,支持多种调度策略,比如每小时跑一次、每天跑一次等,同时它还有多种的配置模板,不懂得配置的朋友可以看看它的模板。
Codex内置浏览器,适用于浏览一些文件、网页,无需离开Codex便可以预览网页的效果,便于对网页进行测试与修复。
Codex电脑操控,它能操控你电脑上的其他软件,只需要给它授权即可,目前已经支持在Codex上操控你的Chrome浏览器,只需要在Chrome上安装上Codex插件,让Codex和Chrome建立起来连接即可。
Codex操控电脑上的浏览器更适合处理一些需要登录才能进行的操作。
技能和项目我不展开介绍了,因为这两个和其他的智能体大同小异。
写到最后
Codex我使用下来觉得还比较流畅,在默认权限下,一些要在系统上执行的命令它都会以界面交互的方式和你确认,我觉得它最好的地方便是内置了一个浏览器,这样便于它在做网页开发的时候可以进行相关的测试和预览。
同时它还多了一个电脑操控的功能,可以通过它原生的方式去操控电脑上的Chrome浏览器,而不是通过一些外挂的软件间接的操作,看这个设计,后面应该还会支持操作其他的软件。
好了,本文的分享就到这里,如果您觉得有收获的话,可以给个一键三连,您的鼓励是吾鳴持续输出的最大动力。