news 2026/5/8 0:48:05

CPU 和 PCIe 设备 地址转化

作者头像

张小明

前端开发工程师

1.2k 24
文章封面图
CPU 和 PCIe 设备 地址转化

CPU 访问 PCIe 设备:CPU 物理地址(PA) → Root Port(ATU) → PCIe 总线地址

PCIe 设备 访问 CPU(DMA):PCIe 总线地址 → Root Port(ATU/IOMMU)→ CPU 物理地址(PA)

中间没有魔法,全部是地址映射 + 路由转发

3 种地址

  1. CPU 物理地址(CPU PA)
    • CPU 看到的地址
    • ECAM、BAR 都属于这类
  2. PCIe 总线地址(Bus Address)
    • PCIe 总线上传输的地址
    • 设备寄存器、DMA 都用这个
  3. 设备本地偏移(Device Offset)
    • 设备内部寄存器的偏移(如 0x00, 0x10)

CPU → 访问 PCIe 设备(读 / 写寄存器)

完整转化路径(硬件真实流程):

① 驱动发出虚拟地址

ioread32(virt_addr + 0x10);

② MMU 转为 CPU 物理地址(BAR 地址)

虚拟地址 → MMU → **CPU PA = 0x8010_0000**

③ 送到 PCIe Root Port

Root Port 查ATU(地址转换表)

CPU PA 0x8010_0000 → 映射为 PCIe 总线地址 0x0000_0010

④ Root Port 打包成 PCIe 报文

  • 地址:0x0000_0010
  • 路由:由BDF找到目标设备
  • 类型:Memory Write/Read

⑤ 设备收到报文

设备只认识PCIe 总线地址,不认识 CPU PA:

总线地址 0x0010 → 设备内部寄存器偏移 0x10

PCIe 设备 → 访问 CPU(DMA 写内存)

① 设备驱动告诉设备 DMA 地址

驱动写的是CPU PA,但设备不懂。

② Root Port 再次做转换

设备发:

PCIe 总线地址 = 0x8000_0000

Root Port 查表:

PCIe 总线地址 0x8000_0000 → CPU 物理地址 0x8000_0000

③ 发给内存控制器

最终写到 DRAM。

地址转化的两个硬件模块

Root Port 内部的 ATU

Address Translation Unit

  • 管:CPU PA ↔ PCIe 总线地址
  • 作用:让两边互不感知对方地址
  • 内核在枚举时配置好

IOMMU(可选,但服务器必开)

  • 管:PCIe 总线地址 → 最终内存地址
  • 作用:隔离、安全、虚拟化
  • 开启后:
    PCIe 地址 → IOMMU → 内存 PA

3 组关系

方向地址 A转化硬件地址 B用途
CPU→设备CPU 物理地址(BAR)Root Port ATUPCIe 总线地址寄存器读写
DMA←设备PCIe 总线地址Root Port / IOMMUCPU 物理地址DMA 访问内存
配置访问ECAM 物理地址Root Port 解析BDF 路由配置空间

BDF 路由表

每个 Bridge(Root Port / Switch Upstream / Switch Downstream)都有一张路由表,由三个寄存器构成:

  • Primary Bus Number(上游总线号)
  • Secondary Bus Number(本端口直连的下游总线)
  • Subordinate Bus Number(此端口下面所有子总线最大值)

这三个数,就是BDF 路由表

路由规则

当一个配置报文到达 Bridge:

目标 Bus = B 目标 Dev = D 目标 Func = F

Bridge 只看Bus 号 B

  1. B < Secondary Bus→ 报文是发给上游的 →往回发(Primary 方向)

  2. B == Secondary Bus→ 是直连设备 →从本端口发出去Dev/Func 由设备自己判断

  3. Secondary Bus < B ≤ Subordinate Bus→ 是我下面更深层的桥 →继续往下发(本端口)

  4. B > Subordinate Bus→ 不归我管 →不管,丢给上游

和 ATU 的区别

ATU 表:地址 → 地址(Mem 访问用)

BDF 路由表:Bus 号 → 哪个端口(Config 访问用)

  • 读 BAR、写 BAR、枚举设备 →走 BDF 路由
  • 读写寄存器、DMA →走地址(ATU)

极简总结

  1. BDF 路由表 = Primary / Secondary / Subordinate
  2. 只根据 Bus 号路由,不看 Dev/Func
  3. 每个桥都有一张
  4. 专门给配置事务(ECAM、config)用
  5. 内核扫描时自动配置
  6. 和 ATU 完全两回事:
    • ATU = 地址翻译
    • BDF 路由 = 配置报文转发路径

内核配置 ATU & BDF,扫描 PCIe 时:

  1. 通过ECAM找到设备BDF
  2. 读取BAR,知道需要多大地址窗口
  3. 分配一段CPU 物理地址
  4. CPU PA → PCIe 地址写入ATU
  5. 记住这个ATU 表项 对应 这个 BDF 设备

之后每次访问该 CPU PA:

  • Root Port 自动用ATU 翻译地址
  • 自动用BDF 路由到设备

关键总结

  1. CPU 不直接跟设备说话,靠 Root Port 翻译。
  2. CPU 用物理地址 PA设备用总线地址
  3. ATU 是翻译官
    • CPU 访问设备:PA → 总线地址
    • DMA 写内存:总线地址 → PA
  4. BAR 地址 = CPU 端的门牌号总线地址 = 设备端的门牌号Root Port 就是门牌翻译器
版权声明: 本文来自互联网用户投稿,该文观点仅代表作者本人,不代表本站立场。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如若内容造成侵权/违法违规/事实不符,请联系邮箱:809451989@qq.com进行投诉反馈,一经查实,立即删除!
网站建设 2026/5/3 13:14:22

SeqGPT-560M小白入门:1.1GB轻量模型实现专业级文本分析

SeqGPT-560M小白入门&#xff1a;1.1GB轻量模型实现专业级文本分析 你是不是经常遇到这样的问题&#xff1a;面对一堆新闻稿&#xff0c;想快速把它们分成财经、体育、娱乐几类&#xff1b;或者从一篇公司公告里&#xff0c;需要手动找出“股票名称”、“事件”和“时间”这些…

作者头像 李华
网站建设 2026/5/3 6:53:04

手把手教你用Pi0搭建智能机器人控制系统

手把手教你用Pi0搭建智能机器人控制系统 1. 项目概述 Pi0是一个革命性的视觉-语言-动作流模型&#xff0c;专门为通用机器人控制而设计。这个强大的系统能够理解摄像头图像、处理自然语言指令&#xff0c;并生成精确的机器人动作&#xff0c;让机器人真正实现"看得懂、听…

作者头像 李华
网站建设 2026/5/8 10:18:53

AI编程神器Coze-Loop:快速修复代码Bug实战

AI编程神器Coze-Loop&#xff1a;快速修复代码Bug实战 1. 为什么你需要一个AI代码优化助手&#xff1f; 写代码最头疼的是什么&#xff1f;不是从零开始创造&#xff0c;而是修改那些已经存在却问题百出的代码。当你接手一个老项目&#xff0c;或者review同事的代码时&#x…

作者头像 李华
网站建设 2026/5/1 0:40:12

开箱即用:Qwen2.5-32B-Instruct快速部署与体验

开箱即用&#xff1a;Qwen2.5-32B-Instruct快速部署与体验 你是否对部署一个强大的32B参数大语言模型感到望而却步&#xff1f;是否觉得配置环境、下载模型、调试代码的过程过于繁琐&#xff1f;今天&#xff0c;我们将彻底改变这种认知。借助CSDN星图镜像广场提供的预置镜像&…

作者头像 李华
网站建设 2026/5/1 3:46:19

DCT-Net WebUI体验:三步完成人像卡通化

DCT-Net WebUI体验&#xff1a;三步完成人像卡通化 1. 开门见山&#xff1a;三步就能把照片变卡通&#xff0c;真不难 你有没有试过想给自己的头像加点趣味感&#xff0c;又不想花时间学PS&#xff1f;或者想快速生成一组卡通风格的社交头像&#xff0c;但找不到简单好用的工…

作者头像 李华
网站建设 2026/5/7 14:08:45

三步搞定:用lychee-rerank-mm优化问答系统

三步搞定&#xff1a;用lychee-rerank-mm优化问答系统 你是不是也遇到过这样的问题&#xff1f;搭建的问答系统&#xff0c;明明检索到了很多相关文档&#xff0c;但给用户的答案却总是不太对劲。问题可能就出在最后一步——排序。今天&#xff0c;我要分享一个能快速解决这个…

作者头像 李华