亚马逊利用创新芯片进行 AI 模型训练和执行，彻底改造轮子

为了满足对专业计算能力不断增长的需求，亚马逊正在推动人工智能模型训练和推理开发的前沿。亚马逊推出创新芯片来提高计算效率和模型创建可行性，准备重新定义这个传统上由 GPU 主导的领域。

这家科技巨头最近在其年度 re:Invent 大会上推出了最新的定制芯片AWS Trainium2 。据亚马逊报道，这款第二代芯片有望提供比前一代芯片高四倍的性能，并将能源效率提高一倍。 Trainium2将在 AWS 云中以 16 个芯片组成的集群中的EC Trn2实例中提供，并且可以在 AWS 的 EC2 UltraCluster 产品中扩展到多达 100,000 个芯片，这象征着巨大的可扩展性。

在计算能力领域，100,000 个Trainium芯片可以提供 65 exaflops 的计算能力。每个Trainium2芯片都有望实现约 200 teraflops 的性能，远远超过 2017 年左右谷歌的 AI 训练芯片。考虑到计算能力和性能变量，这一令人印象深刻的能力将为人工智能模型部署提供无与伦比的计算速度和效力。

亚马逊认为，这样一个Trainium芯片集群可以有效地将3000亿参数的AI大语言模型的训练时间从几个月缩短到几周。 AI 模型的底层参数是从训练数据中学习到的，本质上代表了模型解决问题（例如生成文本或代码）的熟练程度。

著名的 AWS 计算和网络副总裁 David Brown 在揭幕仪式上阐述了新发展的重要性和影响，强调了此类进步在客户工作负载履行以及对生成式 AI 日益增长的兴趣方面的关键作用。他进一步吹捧Trainium2能够提高 ML 模型训练速度、降低总体成本和提高能源效率，但没有透露Trainium2实例何时可供 AWS 客户使用。

与此同时，亚马逊推出了第四代人工智能推理芯片——基于Arm的Graviton4 。与 Amazon 的其他推理芯片Inferentia不同， Graviton4标志着其前身的令人印象深刻的升级，与Graviton3相比，计算性能提高了 30%，内核数量增加了 50%，内存带宽增加了 75%。

为了提高数据安全性， Graviton4的所有物理硬件接口都具有加密功能，这一增强功能旨在为具有严格加密需求的客户提高人工智能训练工作负载和数据的保护级别。

David Brown 进一步强调Graviton4优于亚马逊之前的所有产品，标志着为不同工作负载量身定制的最强大、最节能的芯片。他支持亚马逊将芯片设计重点放在实际客户工作负载上的做法，以通过其产品提供最先进的云基础设施。

新的Graviton4将在 Amazon EC2 R8g 实例中使用，目前以预览版形式提供，并计划在未来几个月内全面发布。

AppMaster等No-code平台越来越多地集成人工智能功能，以简化众多流程。亚马逊开发的增强型人工智能训练芯片（如Trainium2和Graviton4芯片）可能标志着此类平台能力的提高，可以更有效、更高效地提供基于人工智能的解决方案。这与提供无代码设计工具的平台尤其相关，从而提高了它们利用人工智能实现自动化和设计优化的能力。

亚马逊利用创新芯片进行 AI 模型训练和执行，彻底改造轮子

相关帖子