Nieuw Ultra Ethernet Consortium opgericht om Ethernet aan te passen voor AI en HPC behoeften

FFrits 21 juli 2023 18:02

Het Linux Foundation heeft deze week de oprichting van het Ultra Ethernet Consortium aangekondigd. Deze nieuwe groep, met steun van onder andere AMD, Arista, Broadcom, Cisco, Eviden, HPE, Intel, Meta en Microsoft, zal zich richten op het verbeteren van Ethernet om te voldoen aan de lage latency en schaalbaarheidsvereisten van HPC en AI systemen. Ze vinden dat de huidige Ethernet technologie hier niet voldoende voor is.

UET protocol voor betere prestaties

Het Ultra Ethernet Transport (UET) protocol is de eerste prioriteit van het nieuwe consortium. Dit nieuwe transportlaag protocol voor Ethernet zal beter inspelen op de behoeften van AI en vervolgens HPC workloads. De eisen van AI en HPC clusters groeien zo snel dat de bestaande technologie in de toekomst niet meer voldoende zal zijn. De omvang van grote AI-modellen neemt snel toe, wat leidt tot grotere clusters en dus grotere berichten over het netwerk. Hoe hoger de bandbreedte en hoe korter de vertraging van deze netwerken, hoe efficiënter de cluster kan werken.

Gerichte verbeteringen in Ethernet

Op een hoger niveau is het nieuwe Ultra Ethernet Consortium van plan om Ethernet op een gerichte manier te verbeteren. Het doel is om alleen die delen te verbeteren en te veranderen die noodzakelijk zijn om hun doelen te bereiken. Vanaf het begin kijkt het consortium naar het verbeteren van zowel de software- als de fysieke lagen van de Ethernet-technologie, zonder de basisstructuur te veranderen om kostenefficiëntie en interoperabiliteit te waarborgen.

Bijwerken en creëren van protocollen

Technische doelen van het consortium omvatten het ontwikkelen van specificaties, API's en broncode om protocollen, interfaces en datastructuren voor Ultra Ethernet communicatie te definiëren. Daarnaast wil het consortium bestaande link- en transportprotocollen bijwerken en nieuwe telemetrie, signalering, beveiliging en congestiemechanismen creëren om beter tegemoet te komen aan de behoeften van grote AI en HPC clusters. Omdat AI en HPC workloads een aantal verschillen hebben, zal UET aparte profielen hebben voor geschikte implementaties.

Het Ultra Ethernet Consortium wordt gehost door de Linux Foundation, hoewel het echte werk zal worden uitgevoerd door de leden. Tussen AMD, Cisco, Intel en andere oprichters, ontwerpen al deze bedrijven high-performance CPU's, compute GPU's en netwerkinfrastructuur voor AI en HPC workloads, of bouwen supercomputers of clusters voor AI en HPC toepassingen. Het werk van de UEC zal worden uitgevoerd door vier werkgroepen die zullen werken aan de fysieke laag, linklaag, transportlaag en softwarelaag.

Integratie UET-technologie in de producten

Voor de voorgestelde Ultra Ethernet-standaarden plotten UEC-leden al plannen hoe ze de komende UET-technologie in hun producten kunnen integreren. 'We zijn bijzonder bemoedigd door de verbeterde transportlaag van de UEC en geloven dat ons portfolio klaar is om hiervan te profiteren', aldus Mark Papermaster, CTO van AMD. De UEC voorziet in ingebouwde beveiliging voor AI en HPC workloads, en dat helpt AMD om te profiteren van onze robuuste beveiliging en encryptiecapaciteiten.

Tot slot heeft de UEC opgemerkt dat het op zoek is naar extra leden om de groep aan te vullen en zal beginnen met het accepteren van nieuwe ledenaanvragen vanaf Q4 2023. Samen met NVIDIA zijn er verschillende andere technologiegiganten betrokken bij AI of HPC werk die geen deel uitmaken van de groep. Dit zou hun volgende beste kans zijn om zich bij het consortium aan te sluiten.

Meer artikelen

Lees ook

Hier zijn een aantal interessante artikelen op andere sites uit ons netwerk.