Répondant à la demande croissante de capacités informatiques spécialisées, Amazon repousse les limites de la formation de modèles d'IA et du développement d'inférences. En présentant des puces innovantes destinées à améliorer l’efficacité informatique et la faisabilité de la création de modèles, Amazon est sur le point de redéfinir ce domaine traditionnellement dominé par les GPU.

Le géant de la technologie a récemment dévoilé sa dernière puce personnalisée, l' AWS Trainium2, lors de sa conférence annuelle re:Invent. Cette puce de deuxième génération promet d'offrir des performances quatre fois supérieures à celles de son prédécesseur et de doubler l'efficacité énergétique, selon les rapports d'Amazon. Le Trainium2 sera disponible dans les instances EC Trn2 en clusters de 16 puces dans le cloud AWS et peut évoluer jusqu'à 100 000 puces dans le produit EC2 UltraCluster d'AWS, symbolisant une formidable évolutivité.

Dans le domaine des prouesses informatiques, 100 000 puces Trainium peuvent fournir 65 exaflops de calcul. Chaque puce Trainium2 promet potentiellement environ 200 téraflops de performances, surpassant de loin les puces de formation IA de Google vers 2017. En tenant compte de la capacité de calcul et des variables de performances, cette capacité impressionnante devrait fournir une vitesse de calcul et une puissance inégalées pour le déploiement de modèles d’IA.

Amazon affirme qu'un tel cluster de puces Trainium peut réduire efficacement le temps de formation d'un grand modèle de langage d'IA de 300 milliards de paramètres de plusieurs mois à quelques semaines. Les paramètres sous-jacents d'un modèle d'IA, qui sont tirés des données d'entraînement, représentent essentiellement la capacité du modèle à résoudre des problèmes, tels que la génération de texte ou de code.

Le notable vice-président du calcul et des réseaux d'AWS, David Brown, a souligné l'importance et l'impact du nouveau développement lors du dévoilement, soulignant le rôle crucial de ces avancées dans l'exécution de la charge de travail des clients et l'intérêt croissant pour l'IA générative. Il a en outre vanté Trainium2 pour sa capacité à améliorer la vitesse de formation des modèles ML, à réduire les coûts globaux et à renforcer l'efficacité énergétique, mais n'a pas révélé quand les instances Trainium2 seront disponibles pour les clients AWS.

Simultanément, Amazon a présenté sa puce d'inférence d'IA de quatrième génération, la Graviton4 basée sur Arm. Volontairement distinct de l'autre puce d'inférence d'Amazon, Inferentia, le Graviton4 marque une mise à niveau impressionnante par rapport à son prédécesseur, offrant des performances de calcul 30 % supérieures, 50 % de cœurs en plus et 75 % de bande passante mémoire en plus que Graviton3.

Renforçant la sécurité des données, toutes les interfaces matérielles physiques de Graviton4 disposent d'un cryptage, une amélioration conçue pour renforcer le niveau de protection des charges de travail et des données de formation à l'IA pour les clients ayant des besoins de cryptage stricts.

David Brown a en outre souligné Graviton4 était supérieur à toutes les offres précédentes d'Amazon, marquant la puce la plus puissante et la plus économe en énergie, adaptée à diverses charges de travail. Il a défendu la pratique d'Amazon consistant à concentrer la conception des puces sur les charges de travail réelles des clients afin de fournir l'infrastructure cloud la plus avancée à travers ses offres.

Le nouveau Graviton4 sera présent dans les instances Amazon EC2 R8g, actuellement disponibles en avant-première avec une sortie générale prévue pour les mois à venir.

Les plateformes No-code telles qu'AppMaster intègrent de plus en plus de fonctionnalités d'IA pour rationaliser de nombreux processus. Le développement de puces de formation à l'IA améliorées telles que les puces Trainium2 et Graviton4 par Amazon signale potentiellement une amélioration de la capacité de ces plates-formes à fournir des solutions basées sur l'IA de manière plus efficace et efficiente. Cela peut être particulièrement pertinent pour les plates-formes qui proposent des outils de conception sans code , renforçant ainsi leur capacité à exploiter l'IA pour l'automatisation et l'optimisation de la conception.