Workloads for Programmable Network Interfaces ��������������������������������� ��������������������������������� ������������������������ �������������������������� ������������������
Motivation ������������������������������������������� ����������������������� � ������������������������������� � �������� ������������������������������ ������������������������������� � �������������������������� � ������������������������������������������� � ��������������������������������������������
The old … I/O Bus CPU PCI NET network RAM CNTRL RAM � ������������������������������������
… and the current ~1Gbps Myrinet 33Mhz Lanai IOP I/O Bus CPU PCI NET RAM Intel PRO/100 IOP RAM Smart Adapter 66Mhz i960 IOP Alteon ACEnic 128KB- 16MB Gigabit Ethernet 2 100Mhz MIPS IOPs � ����������������������������������������
Workloads � ������������������������������������������� � ������������������������������������ � ��������������������������������������������������������� � ����������������������������������������������������� � ��������������������������������� � ���������� � ������������� ���������������������������� ������������������������ � ���� �������������������������������� ���� ������������� �����������������������������������������������
Workloads Applications Description Claim/forward/drop decisions, statistics gathering, and firewalling. Packet Classification/Filtering Forward IP packets based on routing information. IP Packet Forwarding Network Address Translation Translate between globally routable and private IP packets. Useful for IP masquerading, virtual web server, etc. TCP connection management Traffic shaping within the network to reduce congestion. TCP/IP Offload TCP/IP processing from Internet/Web servers. Web Switching Web load balancing and proxy cache monitoring. Virtual Private Network (VPN) Encryption (DES) and Authentication (MD5) IP Security (IPSec) Converting a multimedia data stream from one format to another Data Transcoding within the network. Duplicate Data Suppression Reduce superfluous duplicate data transmission over high cost links. � ������������������������������������ � ��������������������������������� � ���������������������������������
Benchmark Characteristics Application Insts Executed Loads/Stores (% ) Ctrl Flow (% ) O ther (% ) per M essage 120 18.6 12.1 69.3 ip4lookup 23K 10.3 0.6 89.1 M D5 � ������������������������������������������ � ������������������������������������������������ � ��������������������������������������������������� � ���������������������������� � ����������������������������������� � ���������������������������������������������������������
Experimental Architectures � ���������������������� � ����������������������������������������������� � ���������������������������������� � ��������������������������������������� ��������������������������������������� � ����������������������������������� � ���������������������������������������������� ���������������������������
Superscalar Performance MD5 ip4lookup 2.5E+07 9.0E+04 8.0E+04 10Gbps 1Gbps message per second message per second 2.0E+07 7.0E+04 1T@500MHz 6.0E+04 1.5E+07 1T@400MHz 5.0E+04 1T@300MHz 4.0E+04 1.0E+07 1T@200MHz 3.0E+04 x 1T@100MHz 2.0E+04 5.0E+06 1Gbps 100Mbps 1.0E+04 0.0E+00 0.0E+00 1 2 3 4 5 6 7 8 1 2 3 4 5 6 7 8 # of functional units # of functional units � ���������������������������������� � ��������� ������������� � ���������������������� ���������� ���������� ��� ����������
FGMT Performance MD5 ip4lookup 9.0E+04 2.5E+07 8.0E+04 1Gbps messages per second 10Gbps messages per second 2.0E+07 7.0E+04 FGMT@500mhz 6.0E+04 1.5E+07 FGMT@400mhz 5.0E+04 FGMT@300mhz 4.0E+04 FGMT@200mhz 1.0E+07 3.0E+04 FGMT@100mhz 2.0E+04 5.0E+06 1Gbps 100Mbps 1.0E+04 0.0E+00 0.0E+00 1 2 3 4 5 6 7 8 1 2 3 4 5 6 7 8 # of FGMT thread contexts # of FGMT thread contexts � ���������������������������������� � ���������� �������������������������������������������� � ���������������������� ���������� ���������� ��� ����������
SMT Performance i p4lookup MD5 5.0E+07 1.8E+05 4.5E+07 1.6E+05 message per second messages per second 4.0E+07 1.4E+05 3.5E+07 SMT@500mhz 1.2E+05 3.0E+07 SMT@400mhz 2.5E+07 1.0E+05 SMT@300mhz 10Gbps 1Gbps 2.0E+07 SMT@200mhz 8.0E+04 1.5E+07 SMT@100mhz 6.0E+04 1.0E+07 4.0E+04 1Gbps 5.0E+06 2.0E+04 0.0E+00 100Mbps 1 2 3 4 5 6 7 8 0.0E+00 1 2 3 4 5 6 7 8 # of SMT thread contexts # of SMT thread contexts � ���������������������������������� � ������������������������������������ � ���������������������� ���������� ����������������� ��� �� ���������������
Conclusions � ���������������������������������������� ������������ � ������������������������������������������ ��������������������������������������� ������������ � ��������
Recommend
More recommend