Amazon reinventa la rueda con chips innovadores para el entrenamiento y la ejecución de modelos de IA

Para abordar la creciente demanda de capacidades informáticas especializadas, Amazon está ampliando la frontera en el desarrollo de inferencias y entrenamiento de modelos de IA. Al presentar chips innovadores diseñados para mejorar la eficiencia computacional y la viabilidad de la creación de modelos, Amazon está preparada para redefinir este campo tradicionalmente dominado por las GPU.

El gigante tecnológico presentó recientemente su último chip personalizado, AWS Trainium2, en su conferencia anual re:Invent. Este chip de segunda generación promete ofrecer un rendimiento cuatro veces superior al de su predecesor y duplicar la eficiencia energética, según los informes de Amazon. Trainium2 estará disponible en instancias EC Trn2 en grupos de 16 chips en la nube de AWS y puede escalar hasta 100.000 chips en el producto EC2 UltraCluster de AWS, lo que simboliza una tremenda escalabilidad.

En el ámbito de la destreza computacional, 100.000 chips Trainium pueden ofrecer 65 exaflops de cómputo. Cada chip Trainium2 promete potencialmente alrededor de 200 teraflops de rendimiento, superando por un margen significativo a los chips de entrenamiento de IA de Google alrededor de 2017. Teniendo en cuenta la capacidad computacional y las variables de rendimiento, esta impresionante capacidad está configurada para proporcionar una velocidad y potencia computacionales incomparables para la implementación del modelo de IA.

Amazon postula que un grupo de chips Trainium de este tipo puede reducir efectivamente el tiempo de entrenamiento de un modelo de lenguaje grande de IA de 300 mil millones de parámetros de meses a semanas. Los parámetros subyacentes de un modelo de IA, que se aprenden de los datos de entrenamiento, representan esencialmente la competencia del modelo para resolver problemas, como generar texto o código.

El destacado vicepresidente de computación y redes de AWS, David Brown, describió la importancia y el impacto del nuevo desarrollo durante la presentación, destacando el papel crucial de dichos avances en el cumplimiento de la carga de trabajo de los clientes y el creciente interés en la IA generativa. Además, promocionó Trainium2 por su capacidad para mejorar la velocidad del entrenamiento del modelo ML, reducir los costos generales y reforzar la eficiencia energética, pero no reveló cuándo estarán disponibles las instancias Trainium2 para los clientes de AWS.

Al mismo tiempo, Amazon presentó su chip de inferencia de IA de cuarta generación, el Graviton4 basado en Arm. Deliberadamente distinto del otro chip de inferencia de Amazon, Inferentia, el Graviton4 marca una mejora impresionante con respecto a su predecesor, ya que ofrece un rendimiento informático un 30 % mejor, un 50 % más de núcleos y un 75 % más de ancho de banda de memoria que Graviton3.

Para aumentar la seguridad de los datos, todas las interfaces físicas de hardware de Graviton4 cuentan con cifrado, una mejora diseñada para reforzar el nivel de protección de las cargas de trabajo y los datos de capacitación de IA para clientes con necesidades estrictas de cifrado.

David Brown destacó además Graviton4 como superior a todas las ofertas anteriores de Amazon, siendo el chip más potente y energéticamente eficiente diseñado para diversas cargas de trabajo. Defendió la práctica de Amazon de centrar el diseño de chips en cargas de trabajo reales de los clientes para ofrecer la infraestructura de nube más avanzada a través de sus ofertas.

El nuevo Graviton4 aparecerá en las instancias Amazon EC2 R8g, actualmente disponibles en versión preliminar con un lanzamiento general programado para los próximos meses.

Las plataformas No-code como AppMaster , integran cada vez más funcionalidades de IA para agilizar numerosos procesos. El desarrollo de chips de entrenamiento de IA mejorados, como los chips Trainium2 y Graviton4 por parte de Amazon, potencialmente indica una mejora en la capacidad de dichas plataformas para ofrecer soluciones basadas en IA de manera más efectiva y eficiente. Esto puede ser particularmente relevante para las plataformas que ofrecen herramientas de diseño sin código , lo que aumenta su capacidad de aprovechar la IA para la automatización y la optimización del diseño.

Amazon reinventa la rueda con chips innovadores para el entrenamiento y la ejecución de modelos de IA

Entradas relacionadas