PCI Express DMA Engine für Active Buffer Projekt im CBM Experiment Wenxue Gao, Andreas Kugel,...

PCI Express DMA Engine für Active Buffer Projekt im CBM

Experiment

Wenxue Gao, Andreas Kugel, Reinhard Männer, Holger Singpiel, Andreas Wurz

Uni. MannheimDPG Tagung, Gießen

14 März 2007

Inhalt

• Einleitung

• Blockdiagramm

• Realisierung

• Leistung

2 von 15

Einleitung – CBM Experiment

CBM TSR, Jan. 2006

Einleitung – PCI Express

• 2,5 Gbps pro Link

• Point-to-Point

• TLP (Transaction Layer Packet)– Post: MWr (Memory Write Request), …– Non-post: MRd (Memory Read Request), …– Completion: CplD, Cpl, …– Message: Msg

4 von 15

Host End-Point

PCI Express – Post TLP (MWr, …)

Host End-Point

PCI Express – Non-post TLP (MRd, …)

End-PointHost

End-Point

End-PointHost

TxMRd1

End-PointHost

TxMRd1

End-PointHost

TxMRd1

End-PointHost

TxMRd1

End-PointHost

TxMRd1

End-PointHost

TxMRd1

End-PointHost

TxMRd1

End-PointHost

TxMRd1

End-PointHost

TxMRd1

CplD1 CplD2

End-PointHost

TxMRd1

End-PointHost

TxMRd1

End-PointHost

TxMRd1

End-PointHost

TxMRd1

Tag[7:0]

End-PointHost

TxMRd1

Tag[7:0]

Einleitung – SG DMA

• SG(Scatter/Gather) – Multiple-descriptor chain

• Voll-Duplex– Downstream: Host Endpoint– Upstream: Endpoint Host

• „Done“ Zustand– Status Register– Interrupt

Downstream

Upstream

Host Endpoint

Blockdiagramm

Tx Arbitrator

Memory

BRAM + FIFO + Registers

UpstreamDMA

Channel

DownstreamDMA

ChannelPIO

Channel

Rx Resolution

PCIeTransact .LayerInterface

TagRAM

Channel Buffer

• TLP Channel FIFO– Breite = 128– Tiefe = 15

• TLP ohne Payload– Alles im Word

• TLP mit Payload– Lokale Adresse– Zusätzliche Informationen

LAdr Hdr2 Hdr1 Hdr0

xxxx Hdr2 Hdr1 Hdr0

LAdr Hdr2 Hdr1 Hdr0

95127 63 31 0

9 von 15

Realisierung – DMA teilen

• 4 KB Grenze verboten

• Address/Length Combination

Realisierung – „Done“ bestätigen

• Wann ist DMA beendet?– „Done“ Zustand nötig

• CplD‘s für unterschiedliche MRd‘s kommen nicht folgend

– Mögliche Lösungen• Tag RAM lesen• CplD zählen• Channel Buffer leer• Letzten Tag triggern (x)

• Bitmap füllen– 128-bit Register für 7-bit Tags

11 von 15

Leistungsparameter• Zielbaustein

– Virtex4 XC4VFX60-11ff672• FFs

– 9 834 out of 50 560 ( 19 % )• LUT4s

– 11 464 out of 50 560 ( 22 % )• RAMb16

– 58 out of 232 ( 25 % )• Slices

– 9 426 out of 25 280 ( 37 % )• Frequenz ( trn_clk )

– 250 MHz• Verzögerung (Transaction layer)

– PIO: 52 ns (MRd CplD )– DMA: 80 ns (DMA „Start“ Tx TLP)

• Theoretische Bandbreite– 2Gbps x4 = 8Gbps, bi-directional

12 von 15

4-Lane Tests

4096 8192 16384 32768 65536 131072 262144 524288

Packet Length (Bytes)

Bandwidth (Mbps)

PI O Wri teDMA Wri tePI O ReadDMA Read

Offene Fragen

• Kleinerer Channel Buffer– Meistens reichen 64-bit, statt 128-bit

• Bessere Behandlung von Fehlern– Teilweise unvollständig– Überschreiben von CplD zu vermeiden– Time-out

• tag Recycling

• Höhere Bandbreite für downstream DMA

Zusammenfassung

• PCI Express Vorteile– Parallelität– Skalierbarkeit

• Virtual channels– 2 DMA Channels– 1 PIO Channel

• Xilinx Lösung– 62,5 MHz für x1– 250 MHz für x4

15 von 15

x4-ABB• Design Summary• --------------• Logic Utilization:• Number of Slice Flip Flops: 9,834 out of 50,560 19%• Number of 4 input LUTs: 11,464 out of 50,560 22%

• Logic Distribution:• Number of occupied Slices: 9,426 out of 25,280 37%• Total Number 4 input LUTs: 12,993 out of 50,560 25%• Number used as logic: 11,464• Number used as a route-thru: 643• Number used for Dual Port RAMs: 202• Number used as Shift registers: 684

• Number of bonded IPADs: 18 out of 62 29%• Number of bonded OPADs: 16 out of 24 66%• Number of bonded IOBs: 1 out of 352 1%• Number of BUFG/BUFGCTRLs: 5 out of 32 15%• Number used as BUFGs: 4• Number used as BUFGCTRLs: 1• Number of FIFO16/RAMB16s: 58 out of 232 25%• Number used as FIFO16s: 0• Number used as RAMB16s: 58• Number of DSP48s: 2 out of 128 1%• Number of DCM_ADVs: 1 out of 12 8%• Number of GT11s: 8 out of 16 50%• Number of GT11CLKs: 1 out of 8 12%

X4 Test

DMA Prozess

• Buffer-descriptor– SA (Source Address)– DA (Destination Address)– NXA (Next Descriptor Address)– Length (Length in bytes)– Control (Control register)

• Start/Stop Befehl– Upstream: MWr + MRd (dex)– Downstream: MRd

• Busy/Done Zustände erkennen– Status Register– Interrupt (Msg)

TxTx Arbitrator

MWr_usp MWr_usp

MRd_dsdMRd_dsd

MRd_usd MRd_usd

MRd_dspMRd_dsp

Cpl/DCpl/D MWrMWr

Memory

BRAM + Registers + FIFO

Memory

BRAM + Registers + FIFO TagRAM

CplDCplD

MRdMRd

Rx Resolution

DMA Upstream

EngineRegisters

DMADownstream

EngineRegisters

Blockdiagram

Verifizieren

• PIO + DMA ($random)– Transaction length– Address-pair– Chain length (DMA)– Descriptor Address (DMA)– Flow control: *_rdy_n

• Output checking– tsof/teof– Data– Deskriptor abteilen

Downstream(Write)

Upstream(Read)

Root Endpoint

Memory Space

• BRAM– 16KB

• FIFO– 32 x 32– Loop-back

• Registers– Write / Read– Control / Status

• Eventuelle Erweiterung– DDR (BRAM ähnlich)– GbE (FIFO ähnlich)

Registers

Loop-Back

PCI Express DMA Engine für Active Buffer Projekt im CBM Experiment Wenxue Gao, Andreas Kugel,...

Documents

Portfolio - Andreas Gosch

1 Andreas Ißleiber aisslei@gwdg.de Andreas Ißleiber, Gesellschaft für wissenschaftliche Datenverarbeitung Göttingen

Pressemappe Andreas Steinh fel 2017) - CARLSEN Verlag · Andreas Steinhöfel 2 Der Autor Andreas Steinhöfel Andreas Steinhöfel wurde 1962 in Battenberg geboren. Er studierte Anglistik,

Pflaster und Gels von TianDe - JC-Kosmetik · 2018-05-29 · Naturkosmetik von TianDe 4 Schmerzlinderung Tie Gao Bei Rückenschmerzen , Kreuzschmerzen, während die Wirbelsäule blockiert

Jahresbericht 2015 - PZH · 59 Von links: Peter Nyhuis, Annika Raatz, Ludger Overmeyer, Jan Jocker, Bernd-Arno Behrens, Marc Christopher Wurz, Berend Denkena, Hans Jürgen Maier,

sa1a39d7b95d8adf3.jimcontent.com...Hopf Andreas Hopf Andreas Hopf Andreas jung Hopf Andreas Hopf Andreas Hopf Andreas Fränkische Herzschecken schwarz Cramer Wilfried 1,0 jung Räder

Vorstellung Andreas Unger

POLITIK Neues aus Camp Castor - bundeswehr.de€¦ · stehen in Camp Castor in Gao in der heißen malischen Wüste. Sie erwarten ihre Verteidigungs - ministerin, wollen ihr ihre Fähig

Andreas Aktuellandreasgemeinde-darmstadt.de/wp-content/uploads/Andreas...Andreas Aktuell Gemeindebrief der Evangelischen Andreasgemeinde Darmstadt -Bessungen April 2014 -Juni 2014

Seminararbeit Andreas Schröpfer

Electronic Supplementary Information: implications for ... · Qiuju Shi,a† Weina Zhang,a† Yuemeng Ji,*a Jiaxin Wang,a Dandan Qin,a Jiangyao Chen,ab Yanpeng Gao,a Guiying Li ab

Germanische Altertumskunde Online (GAO) · Germanische Altertumskunde Online (GAO) Europäische Kulturgeschichte bis zum Hochmittelalter Abkürzungsverzeichnis Aus: Reallexikon der

Andreas heine

Bundestagswahl 24. September - andreas-lenz.info · Dr. Andreas Lenz Für Sie wieder nach Berlin Klar für unsere Heimat andreas-lenz.info andreas-lenz.info Bundestagswahl 24. September

First results on phytosanitary status of Chinese jujube in ... 20(4) PDF/01Mardare Elena Stefania.pdf · micologie (Methods and techniques in mycology). Ed. Ceres, Bucureşti 2.Gao,

Andreas Stich

Nummer 156 Nov./Dez. 2014 Fr. 5.–/Euro 4.– · Ghana, über Metropolen wie Gao, Timbuktu oder Djen - né, durch die Reiche Songhai und Mali; Ostafrikas Küs - te entlang nach Sofala,

DNN Dataﬂow Choice Is Overrated · 2018-09-13 · DNN Dataﬂow Choice Is Overrated Xuan Yang , Mingyu Gao , Jing Pu , Ankita Nayak , Qiaoyi Liu , Steven Emberton Bell *, Jeff

Andreas Hartknopfs Predigerjahre - gasl.org · Andreas Hartknopfs Predigerjahre Author: Karl Philipp Moritz Subject: Karl Philipp Moritz: Andreas Hartknopfs Predigerjahre Keywords:

a. GAO · GAO 0-Vùo . Title: Microsoft Word - ã ¬ã ¼ã ¤ã ¡ã ã ã ®è ªç ±ç ç©¶å¤§ä½ æ ¦ï¼ ï¼ ï¼ å¾ ç·¨ï¼ .docx Author: 00083461 Created Date: