PCIE配置

2020-05-14 本文已影响0人 6d372579d253

PCIE 性能

下表列举了各代PCIE的性能，可见 PCIE总的传输速率 = lane数 * 单lane带宽

PCIe架构

PCIe和PCI最大的改变是由并行转为串行，并通过差分信号传输。

BAR(BaseAddress Register)
DW（32bit）

user_lnk_up：当该信号拉高时表示PCIE连接了一个Host设备

PCIE 传输的数据包（TLP）格式

PCIe属于封装分层协议，数据报文在Device Core产生之后，在分别经过事务层(Transaction Layer)、数据链路层(Data Link Layer)、物理层(Physical Layer)之后会依次被增加ECRC，Sequence Number，LCRC，Start，END等数据块。

该链接有计算吞吐量的方式
https://blog.csdn.net/zhuzongpeng/article/details/78949249

存储器的读写请求TLP

1.存储器读请求TLP和读完成TLP
当PCIe主设备，RC或者EP，访问目标设备的存储器空间时，使用Non-Posted总线事务向目标设备发出存储器读请求TLP，目标设备收到这个存储器读请求TLP后，使用存储器读完成TLP，主动向主设备传递数据。当主设备收到目标设备的存储器读完成TLP后，将完成一次存储器读操作。
2.存储器写请求TLP
在PCIe总线中，存储器写使用Posted总线事务。PCIe主设备仅使用存储器写请求TLP即可完成存储器写操作，主设备不需要目标设备的回应报文。
1. 配置读写请求TLP和配置读写完成TLP
  从总线事务的角度上看，配置读写请求操作的过程与I/O读写操作的过程类似。配置读写请求TLP都需要配置读写完成作为应答，从而完成一个完成的配置读写操作。

TLP包结构：

在PCIe总线中，存储器写请求TLP使用Posted数据传送方式。而其他与存储器和I/O相关的报文都使用Split方式进行数据传送，这些请求报文需要完成报文，通知发送端之前的数据请求报文已经被处理完毕。存储器读写请求TLP使用地址路由方式进行数据传递，在这类TLP头中包含Address字段，Address字段具有两种地址格式，分别是32位和64位地址。在存储器读写和I/O读写请求的第3和第4个双字中，存放TLP的32或者64位地址。存储器、I/O和原子操作读写请求使用的TLP头较为类似。

1.length字段
在存储器读请求TLP中并不包含Data Payload，在该报文中，Length字段表示需要从目标设备数据区域读取的数据长度；而在存储器写TLP中，Length字段表示当前报文的DataPayload长度。Length字段的最小单位为DW。当该字段为n时，表示需要获得的数据长度或者当前报文的数据长度为n个DW，其中0£n£0x3FF。值得注意的是，当n等于0时，表示数据长度为1024个DW。

三种常用的TLP类型

Memory Read Request
Memory Write Request
Comple-tion with Data

PCIe的endpoint的接口已经被组织成了4个AXI4-Stream接口和许多其他的控制信号：

Completer接口常常被用来对应FPGA的slave接口

Completer Request（CQ）:用来接受来自host的内存读写指令
Completer Completion(CC):读指令的结果常常被打包成一个COMPLETION TLP 经由CC接口回传到host端

当FPGA在DMA transfer中作为一个master时，RC与RQ被利用起来

Requester Request (RQ) : RQ用来发送读写memory请求
Requester Completion (RC) : RC用来接受前一个读请求的完成信号

TLP中与数据负载相关的参数

在PCIe总线中，有些TLP含有Data Payload，如存储器写请求、存储器读完成TLP等。在PCIe总线中，TLP含有的Data Payload大小与Max_Payload_Size、Max_Read_Request_Size和RCB参数相关。

RC和EP的概念
RC可以理解成PCIe host bridge, 有时也叫PCIe控制器，完成CPU域地址到PCI域
地址的转换，RC在Soc的内部。switch是一个独立的器件，和RC的接口相连，提供扩展。
EP是具有PCIe接口的网卡，SATA控制器等。

RC （PCI Express root complex) ,在RC模式时，使用PCIE类型1配置头
EP （endpoint device)工作方式，在EP模式时，使用PCIE类型0配置头

Max_Payload_Size参数）

PCIe总线规定在TLP报文中，数据有效负载的最大值为4KB，但是PCIe设备并不一定能够发送这么大的数据报文。PCIe设备含有“Max_Payload_Size”和“Max_Payload_SizeSupported”参数，这两个参数分别在Device Capability寄存器和Device Control寄存器中定义。
而Max_Payload_Size参数的大小与PCIe链路的传送效率成正比，该参数越大，PCIe链路带宽的利用率越高，该参数越小，PCIe链路带宽的利用率越低。

Max_Read_Request_Size参数

Max_Read_Request_Size参数在Device Control寄存器中定义。该参数与存储器读请求TLP的Length字段相关，其中Length字段不能大于Max_Read_Request_Size参数。在存储器读请求TLP中，Length字段表示需要从目标设备读取多少数据。
值得注意的是，Max_Read_Request_Size参数与Max_Payload_Size参数间没有直接联系，Max_Payload_Size参数仅与存储器写请求和存储器读完成报文相关。

中断

在PCI总线中，所有需要提交中断请求的设备，必须能够通过INTx引脚提交中断请求，而MSI机制是一个可选机制。而在PCIe总线中，PCIe设备必须支持MSI或者MSI-X中断请求机制，而可以不支持INTx中断消息。在PCIe总线中，MSI和MSI-X中断机制使用存储器写请求TLP向处理器提交中断请求。
与Legacy中断方式相比，PCIe设备使用MSI或者MSI-X中断机制，可以消除INTx这个边带信号，而且可以更加合理地处理PCIe总线的“序”。目前绝大多数PCIe设备使用MSI或者MSI-X中断机制提交中断请求。

DMA的过程

RT->EP DMA（存储器读）：

1、驱动程序向操作系统申请一片物理连续的内存;

2、主机向该地址写入数据；

3、主机将这个内存的物理地址告诉FPGA；

4、FPGA向主机发起读TLP请求—连续发出多个读请求；

5、主机向FPGA返回CPLD包—连续返回多个CPLD；

6、FPGA取出CPLD包中的有效数据；

7、FPGA发送完数据后通过中断等形式通知主机DMA完成；

EP->RT DMA（存储器写）：

1、驱动程序向操作系统申请一片物理连续的内存；

2、主机将这个内存的物理地址告诉FPGA；

3、FPGA向主机发起写TLP请求，并将数据放入TLP包中—连续发出多个写请求；

4、FPGA发送完数据后通过中断等形式通知主机DMA完成；

5、主机从内存中获取数据；

参考下文：https://blog.csdn.net/eagle217/article/details/81736822

DMA 操作

AXI-MM transfer for H2C

AXI-MM transfer for C2H

Descriptors

DMA Subsysterm for PCIe用了一系列的descriptors，这些descriptors组成了一个链接列表。它们用来指明DMA transfers的源地址。目的地址以及DMA transfer的长度。他们由驱动程序产生。并且存储在host 内存中。DMA中的控制器会发起抓取descriptor lists来完成初始化并开始执行DMA操作。描述符的结构如下：

每个DMA通道都会有自己的descriptors列表。DMA读取到一个descriptor之后会提取其中的src_addr与Dst_addr，然后根据这些地址来完成memory transfer。完成当前descriptor对应的transfer之后。DMA 通道会根据当前descriptor的Nxt_addr来抓取下一个descriptor。而且descriptor中的Nxt_adj记录了列表中还剩下未完成的descriptor的个数。一旦为0，那么当前descriptor的control字段中的STOP位会置高。DMA就会停止抓取descriptor。

DMA channel在在每次的抓取descriptor的请求中都会尽可能抓取最多的descriptors。这个数目被MRRS限制。也被descriptors buffer的容量限制

DMA有Bit_width * 512深的FIFO来存储所有descriptor.这个FIFO是所有通道通用的

PCIE配置

PCIE 性能

PCIe架构