设置HTTP_PROXY和HTTPS_PROXY环境变量穿透代理-开发者社区

设置HTTP_PROXY和HTTPS_PROXY环境变量穿透代理

在高校实验室、企业内网或远程云服务器上跑AI实验时，你有没有遇到过这样的场景：敲下pip install torch后卡住不动，几十秒后抛出一连串红字——“Connection timed out” 或 “Could not fetch URL”？明明代码写得没问题，模型结构也调好了，却因为一个依赖装不上而寸步难行。

这背后往往不是代码的问题，而是网络的“墙”。现代AI开发高度依赖外部资源：PyPI、Conda频道、GitHub仓库、Hugging Face模型库……这些公网地址在受限网络环境中通常无法直连。此时，如何让工具“翻墙”就成了关键。

解决方法其实很朴素：通过代理服务器中转请求。而最通用、最底层、也最可靠的手段之一，就是设置HTTP_PROXY和HTTPS_PROXY环境变量。

这类问题在使用轻量级Python发行版如Miniconda-Python3.11时尤为常见。它本身不包含大量预装包，一切依赖都要按需下载。一旦网络不通，整个环境搭建流程就会中断。更麻烦的是，不同工具（pip、conda、git、requests）对代理的支持方式各不相同，稍有不慎就出现部分能连、部分失败的情况。

所以，我们真正需要的不是一个临时 workaround，而是一套系统性的网络穿透策略。

从一次失败的 conda 安装说起

假设你在某台位于企业防火墙后的Linux服务器上执行：

conda install pytorch torchvision -c pytorch

结果命令长时间无响应，最终报错：

CondaHTTPError: HTTP 000 CONNECTION FAILED for url <https://conda.anaconda.org/pytorch/linux-64/repodata.json>

显然，这是HTTPS请求被拦截了。但如果你直接设置：

export HTTPS_PROXY=http://proxy.corp.com:8080

再重试，很可能立刻成功。

为什么？因为conda在发起网络请求前会检查环境变量中是否有HTTPS_PROXY。如果有，就自动将流量转发到指定代理；否则尝试直连，而在受控网络中，直连几乎必败。

这个机制并不神秘，几乎所有遵循POSIX标准的命令行工具都支持这种模式——包括pip、curl、wget、git，甚至 Python 的requests库。

它们的行为逻辑非常一致：
- 启动时读取当前 shell 的环境变量；
- 检查是否存在HTTP_PROXY/HTTPS_PROXY；
- 根据协议类型选择对应代理；
- 将原始请求交给代理服务器代为访问目标站点；
- 代理获取响应后回传给本地程序。

整个过程对用户透明，就像你在公司Wi-Fi下刷网页一样自然。

不过，别以为只要设了代理就万事大吉。实际使用中有很多细节容易踩坑。

比如，很多人只设置了HTTPS_PROXY，却忽略了HTTP_PROXY。虽然现在大多数服务都用HTTPS，但某些镜像站或内部源仍可能使用HTTP。如果未配置对应的代理变量，这部分请求仍然会走直连，导致失败。

又比如，代理服务器本身需要认证怎么办？

你可以这样写：

export HTTP_PROXY=http://username:password@proxy.corp.com:8080

看起来没问题，但存在安全隐患：用户名密码明文暴露在历史记录和进程列表中。更好的做法是配合.netrc文件或密钥管理工具来处理凭据。

还有一个常被忽视的变量：NO_PROXY。

设想你的团队有一个私有GitLab和内部Model Zoo，域名是git.local和models.internal。如果所有请求都走代理，反而可能导致访问变慢甚至失败（代理不允许访问内网）。这时就应该排除这些地址：

export NO_PROXY="localhost,127.0.0.1,.local,.internal"

逗号分隔的域名列表，以点开头表示匹配该域及其子域。这样既保证外网走代理，又不影响内网通信。

说到这里，不得不提 Miniconda 这个神器。

相比完整版 Anaconda 动辄几百MB的体积，Miniconda 只有约50MB，仅包含 conda 包管理器和 Python 解释器。干净、轻便、启动快，特别适合容器化部署和科研复现。

但它也有“代价”：几乎所有第三方库都需要联网安装。这意味着，网络可达性直接决定了 Miniconda 是否可用。

好在 conda 自身也提供了一层代理配置能力，独立于系统环境变量：

conda config --set proxy_servers.http http://proxy.corp.com:8080 conda config --set proxy_servers.https http://proxy.corp.com:8080

这条命令会把代理信息写入~/.condarc文件，专供 conda 使用。它的优先级高于环境变量吗？不完全是。实际上，conda 会同时检查两者，但如果冲突，以.condarc中的为准。

这带来了灵活性：你可以为系统全局设置一套代理用于 pip/curl 等工具，再为 conda 单独配置另一套高性能镜像代理，互不干扰。

举个典型工作流：

# 创建独立环境 conda create -n ai_exp python=3.11 # 激活环境 conda activate ai_exp # 配置专用代理 conda config --env --set proxy_servers.http http://proxy.corp.com:8080 conda config --env --set proxy_servers.https http://proxy.corp.com:8080 # 安装AI框架（自动走代理） conda install pytorch torchvision torchaudio -c pytorch -c nvidia

注意这里加了--env参数，表示配置仅作用于当前环境，避免污染全局设置。这对于多项目并行开发尤其有用。

当环境终于配好，代码跑通之后，下一步往往是“分享给别人也能跑”。

这时候，conda env export > environment.yml就成了救命稻草。

这个YAML文件记录了当前环境中所有包的精确版本，包括Python、conda安装的包，甚至通过pip安装的组件。别人只需运行：

conda env create -f environment.yml

就能还原出几乎完全一致的运行环境。

但这有个前提：他们的网络也要能访问同样的资源。如果他们也在受限网络中，却没有配置代理，那conda env create依然会失败。

因此，最佳实践是：
1. 提交environment.yml到代码仓库；
2. 在文档中注明所需代理配置；
3. 若可能，提供国内镜像源替代方案。

有些团队还会进一步封装成 Dockerfile，在构建阶段统一注入代理配置，实现CI/CD流水线中的自动化环境重建。

再深入一点，你会发现并不是所有Python脚本都能自动继承环境变量。

例如，以下代码：

import requests response = requests.get("https://api.github.com/users/octocat")

看似简单，但它是否走代理，取决于两个条件：
- 系统是否设置了HTTP_PROXY/HTTPS_PROXY；
-requests是否启用了默认代理行为。

好消息是，默认情况下，requests会读取环境变量并自动启用代理。但如果你手动传入proxies=None，那就等于主动关闭了代理。

更灵活的做法是显式控制：

proxies = { "http": "http://192.168.10.1:8080", "https": "http://192.168.10.1:8080" } response = requests.get("https://api.github.com/users/octocat", proxies=proxies)

这种方式适用于那些不能依赖环境变量的应用场景，比如Web服务后台任务、定时爬虫等。

回到最初的架构图，一个典型的AI开发平台通常是这样的：

[开发者] ↓ (SSH / JupyterLab) [远程服务器] ←→ [HTTP代理] ↑ [Miniconda环境] ↓ [pip/conda → 外部仓库]

每一环都不能掉链子。

开发者通过SSH登录或浏览器访问JupyterLab；
服务器处于内网，必须经由代理才能触达公网；
Miniconda 负责创建隔离环境；
pip 和 conda 在代理支持下完成依赖拉取；
最终形成可运行、可复现的AI实验环境。

这其中，HTTP_PROXY和HTTPS_PROXY是打通内外网的第一道桥梁。它们虽小，却是整条链路通畅的基础。

当然，也不能盲目依赖代理。

一些设计上的考量值得重视：

安全第一：不要在脚本或配置文件中硬编码带密码的代理地址。考虑使用凭证管理系统（如Hashicorp Vault）或运行时注入。
最小权限原则：为开发账号分配的代理权限应限制在必要域名范围内，防止滥用。
高可用设计：配置多个代理节点，结合failover机制防止单点故障。
日志审计：开启代理访问日志，便于追踪异常请求和排查问题。
性能优化：合理设置NO_PROXY，避免本地和服务间请求绕远路。

尤其是NO_PROXY，一个小疏忽可能导致严重后果。比如忘了加.local，结果Docker容器间通信全走代理，延迟飙升；或者把数据库健康检查请求误发到公网代理，触发安全告警。

最后，不妨思考一个问题：为什么这套基于环境变量的代理机制至今仍是主流？

因为它足够简单、足够通用、足够低侵入。

不需要修改应用代码，不需要定制客户端，只要设置几个字符串，就能让成百上千种工具瞬间获得“穿墙”能力。这种“约定优于配置”的设计哲学，正是Unix/Linux生态长久生命力的体现。

而对于AI工程师而言，掌握这一技能的意义早已超出“让pip能装上包”的范畴。它是连接本地开发与生产部署的纽带，是保障团队协作效率的基础设施，也是应对复杂网络环境的基本功。

尤其是在高校、企业、云服务等场景下，谁能更快搞定网络问题，谁就能把更多时间留给真正的创新。

当你下次面对一片红色错误日志时，不妨先问一句：代理设对了吗？

设置HTTP_PROXY和HTTPS_PROXY环境变量穿透代理

设置HTTP_PROXY和HTTPS_PROXY环境变量穿透代理

从一次失败的 conda 安装说起

STLink驱动下载路径设置及烧录验证方法

Labelme转YOLO格式转换：新手快速上手完整指南

D2RML终极指南：5步实现暗黑2重制版多账号同步游戏

使用torch.cuda.empty_cache()释放未使用的缓存

DroidRun完整教程：用自然语言命令实现Android和iOS设备自动化控制

RabbitMQ消息中间件协调多个Miniconda工作节点