OpenAI开放MRC协议：实现微秒级故障恢复，确保大规模AI训练网络通信稳定-开发者社区

【导语：OpenAI通过OCP开放了超大规模AI训练时使用的网络协议——MRC。该协议由OpenAI联合英伟达、AMD等厂商花两年时间打造，旨在确保大规模训练环境下网络通信的稳定性。】

OpenAI开放MRC协议，多厂商参与合作

OpenAI通过Open Compute Project向全行业开放了超大规模AI训练使用的网络协议MRC。此次开放是和硬件厂商合作，英伟达、AMD和英特尔都参与其中。网友认为能把这些厂商聚在一起合作制定标准十分困难。MRC协议由OpenAI联合英伟达、AMD、英特尔、微软和博通花两年时间完成，目前跑在OpenAI所有最大规模的NVIDIA GB200超算上。

MRC协议解决大规模集群通信难题

同步预训练的通信模式对网络极度敏感，随着集群规模扩大，网络故障频率上升。为解决此问题，MRC主要做了三件事。一是多平面网络拓扑，将800Gb/s的网卡拆成8条100Gb/s子链路，连到独立交换机，形成8个并行网络平面，降低互联成本和故障点。

二是自适应包喷射，扩展RoCE的乱序处理能力，允许将单次传输的包喷射到数百条路径上并行传输，拥塞检测和路径切换在连接层完成，响应在微秒级。三是用SRv6静态源路由取代动态路由协议，将路径决策移到发送端，消除路由收敛引发的抖动。

MRC协议发布后同步推出播客

MRC技术博客公布后，OpenAI同步发布了一期播客，OpenAI网络负责人Mark Handley和工作负载负责人Greg Steinbrecher在播客中聊了MRC从动机到落地的完整过程。

编辑观点：OpenAI开放MRC协议是AI领域的重要突破，其多维度设计确保了大规模网络可靠性，多厂商合作也为行业发展提供了新方向。

生物标志物筛选的相关研究与技术

生物标志物是指能反映生物体内生理状态、病理变化或对药物干预反应的可检测分子，包括蛋白质、核酸、代谢物、细胞因子等，其大量筛选是现代生物医学研究与临床应用的核心环节之一。在肿瘤、免疫、代谢、神经等热门研究领域及相关疾病中，生物标…

李华

基于PyAutoGUI与图像识别的微信自动化工具OpenClawWeChat实战指南

1. 项目概述与核心价值最近在折腾一个挺有意思的开源项目，叫hillghost86/OpenClawWeChat。乍一看这个名字，可能有点摸不着头脑，但如果你对微信生态、自动化工具或者RPA（机器人流程自动化）感兴趣，那这个项目…

李华

AI Agent与Markdown结合：结构化叙事创作新范式

1. 项目概述：用AI Agent和Markdown构建你的故事世界如果你是一位小说创作者、游戏编剧，或者任何需要构建复杂叙事内容的人，那么你肯定体会过那种“信息过载”的痛。人物设定散落在笔记软件里，世界观设定在思维导图中&#xff0c…

李华

37.人工智能实战：大模型工具调用失败怎么兜底？超时、重试、熔断与工具结果可信校验方案

人工智能实战：大模型工具调用失败怎么兜底？超时、重试、熔断与工具结果可信校验方案一、问题场景：Agent 没坏，坏的是它调用的工具很多 Agent 项目初期看起来很顺利。模型可以判断：什么时候查知识库什么时候查订单什么时候调用搜索什么时候创建工单但一上线，问题…

李华

百度网盘直链解析终极指南：简单三步告别限速，免费获取高速下载链接

百度网盘直链解析终极指南：简单三步告别限速，免费获取高速下载链接【免费下载链接】baidu-wangpan-parse 获取百度网盘分享文件的下载地址项目地址: https://gitcode.com/gh_mirrors/ba/baidu-wangpan-parse 你是否曾为百度网盘的非会员下载速度…

李华

淘宝自动化脚本终极指南：每天节省30分钟，淘金币、蚂蚁森林、芭芭农场全自动运行

淘宝自动化脚本终极指南：每天节省30分钟，淘金币、蚂蚁森林、芭芭农场全自动运行【免费下载链接】taojinbi 淘宝淘金币自动执行脚本，包含蚂蚁森林收取能量，芭芭农场全任务，解放你的双手项目地址: https://gitcode.c…

李华