Amazon Web Services (AWS) a annoncé lors de l’événement « AWS re:Invent » la prochaine génération de deux familles de puces : AWS Graviton4 et AWS Trainium2. Ces nouvelles puces offrent des améliorations en termes de performance et d’efficacité énergétique pour une large gamme de charges de travail des clients, comme l’apprentissage automatique (ML) et les applications d’intelligence artificielle générative (AI).
Graviton4 et Trainium2 représentent les dernières innovations en matière de conception de puces d’AWS. Avec chaque génération successive de puces, AWS entend offrir une meilleure performance et une meilleure efficacité énergétique.
Graviton4 offre jusqu’à 30% de meilleures performances de calcul, 50% de cœurs en plus, et 75% de bande passante mémoire en plus que les processeurs Graviton3 actuels. Trainium2 est conçu pour offrir une formation jusqu’à 4 fois plus rapide que les puces Trainium de première génération et pourra être déployé dans des EC2 UltraClusters allant jusqu’à 100 000 puces.
Graviton4 : Performance et efficacité énergétique
Graviton4 élève la barre en matière de performance et d’efficacité énergétique pour une large gamme de charges de travail. Aujourd’hui, AWS propose plus de 150 types d’instances Amazon EC2 alimentées par Graviton à l’échelle mondiale, a construit plus de 2 millions de processeurs Graviton, et compte plus de 50 000 clients utilisant des instances basées sur Graviton pour obtenir la meilleure performance pour leurs applications.
Graviton4 sera disponible dans les instances Amazon EC2 R8g optimisées pour la mémoire, permettant aux clients d’améliorer l’exécution de leurs bases de données haute performance, de leurs caches en mémoire et de leurs charges de travail d’analyse de grandes données.
Trainium2 : Formation d’IA à haute performance
Les puces Trainium2 sont conçues pour la formation à haute performance des modèles de fondation (FMs) et des grands modèles de langage (LLMs) avec jusqu’à des milliards de paramètres. Trainium2 est conçu pour offrir une performance de formation jusqu’à 4 fois plus rapide et une capacité de mémoire 3 fois supérieure par rapport aux puces Trainium de première génération, tout en améliorant l’efficacité énergétique jusqu’à 2 fois.
Trainium2 sera disponible dans les instances Amazon EC2 Trn2, contenant 16 puces Trainium dans une seule instance. Les instances Trn2 sont destinées à permettre aux clients de monter en puissance jusqu’à 100 000 puces Trainium2 dans les EC2 UltraClusters de prochaine génération.
En synthèse
Les nouvelles puces AWS Graviton4 et Trainium2 marquent une étape importante dans l’innovation technologique d’AWS. Elles offrent des performances améliorées et une efficacité énergétique accrue pour une large gamme de charges de travail, y compris l’apprentissage automatique et les applications d’intelligence artificielle générative. Ces avancées permettront aux clients de gérer leurs applications et leurs charges de travail de manière plus efficace et plus économique.
Pour une meilleure compréhension
1. Qu’est-ce que AWS Graviton4 et Trainium2?
Graviton4 et Trainium2 sont les dernières générations de puces conçues par AWS. Graviton4 offre une meilleure performance de calcul et Trainium2 est conçu pour une formation d’IA plus rapide.
2. Quels sont les avantages de Graviton4?
Graviton4 offre jusqu’à 30% de meilleures performances de calcul, 50% de cœurs en plus, et 75% de bande passante mémoire en plus que les processeurs Graviton3 actuels.
3. Quels sont les avantages de Trainium2?
Trainium2 est conçu pour offrir une formation jusqu’à 4 fois plus rapide que les puces Trainium de première génération et pourra être déployé dans des EC2 UltraClusters allant jusqu’à 100 000 puces.
4. Quels types de charges de travail sont optimisés par ces puces?
Ces puces sont optimisées pour une large gamme de charges de travail, y compris l’apprentissage automatique (ML) et les applications d’intelligence artificielle générative (AI).
5. Quand ces nouvelles puces seront-elles disponibles?
Graviton4 sera disponible dans les instances Amazon EC2 R8g optimisées pour la mémoire. Trainium2 sera disponible dans les instances Amazon EC2 Trn2.
Principaux enseignements
Enseignements |
---|
Graviton4 offre jusqu’à 30% de meilleures performances de calcul |
Graviton4 offre 50% de cœurs en plus |
Graviton4 offre 75% de bande passante mémoire en plus |
Trainium2 est conçu pour offrir une formation jusqu’à 4 fois plus rapide |
Trainium2 peut être déployé dans des EC2 UltraClusters allant jusqu’à 100 000 puces |
Graviton4 sera disponible dans les instances Amazon EC2 R8g optimisées pour la mémoire |
Trainium2 sera disponible dans les instances Amazon EC2 Trn2 |
Ces puces sont optimisées pour une large gamme de charges de travail, y compris l’apprentissage automatique (ML) et les applications d’intelligence artificielle générative (AI) |
Références
Légende illustration principale : AWS Graviton4 et AWS Trainium (prototype)
Source : Communiqué d’AWS