لتلبية الطلب المتزايد على قدرات الحوسبة المتخصصة، تدفع أمازون الحدود في التدريب على نماذج الذكاء الاصطناعي وتطوير الاستدلال. من خلال تقديم شرائح مبتكرة تهدف إلى تعزيز الكفاءة الحسابية وجدوى إنشاء النماذج، تستعد أمازون لإعادة تعريف هذه الساحة التي تهيمن عليها وحدات معالجة الرسومات تقليديًا.
كشفت شركة التكنولوجيا العملاقة مؤخرًا عن أحدث شرائحها المخصصة، AWS Trainium2 ، في مؤتمرها السنوي لإعادة: الاختراع. تعد شريحة الجيل الثاني هذه بتقديم أداء يفوق أربع مرات سابقتها ومضاعفة كفاءة الطاقة، وفقًا لتقارير أمازون. سيكون Trainium2 متاحًا في مثيلات EC Trn2 في مجموعات مكونة من 16 شريحة في سحابة AWS ويمكن أن يصل إلى 100000 شريحة في منتج EC2 UltraCluster من AWS، مما يرمز إلى قابلية التوسع الهائلة.
في عالم البراعة الحسابية، يمكن لـ 100000 شريحة Trainium توفير 65 إكسافلوب من الحوسبة. من المحتمل أن تعد كل شريحة Trainium2 بحوالي 200 تيرافلوب من الأداء، مما يتفوق على شرائح تدريب الذكاء الاصطناعي من Google في عام 2017 تقريبًا بفارق كبير. مع الأخذ في الاعتبار القدرة الحسابية ومتغيرات الأداء، تم إعداد هذه القدرة الرائعة لتوفير سرعة حسابية لا مثيل لها وفعالية لنشر نموذج الذكاء الاصطناعي.
تفترض أمازون أن مثل هذه المجموعة من رقائق Trainium يمكن أن تقلل بشكل فعال وقت التدريب لنموذج لغة كبير للذكاء الاصطناعي يضم 300 مليار معلمة من أشهر إلى أسابيع. تمثل المعلمات الأساسية لنموذج الذكاء الاصطناعي، والتي يتم تعلمها من بيانات التدريب، بشكل أساسي كفاءة النموذج في حل المشكلات، مثل إنشاء نص أو رمز.
أوضح ديفيد براون، نائب الرئيس البارز للحوسبة والشبكات في AWS، أهمية التطوير الجديد وتأثيره أثناء كشف النقاب، مشددًا على الدور الحاسم لهذه التطورات في تلبية أعباء عمل العملاء والاهتمام المتزايد بالذكاء الاصطناعي التوليدي. كما أشاد أيضًا بـ Trainium2 لقدرته على تحسين سرعة التدريب على نموذج ML، وتقليل التكاليف الإجمالية، وتعزيز كفاءة الطاقة، لكنه لم يكشف عن متى ستكون مثيلات Trainium2 متاحة لعملاء AWS.
في الوقت نفسه، قدمت أمازون شريحة استدلال الذكاء الاصطناعي من الجيل الرابع، Graviton4 المستندة إلى Arm. يتميز Graviton4 ، الذي يتميز عن قصد عن شريحة الاستدلال الأخرى من Amazon، Inferentia ، بترقية مثيرة للإعجاب عن سابقتها، حيث يوفر أداء حوسبة أفضل بنسبة 30%، ونواة أكثر بنسبة 50%، وعرض نطاق ترددي للذاكرة أكبر بنسبة 75% من Graviton3.
لتعزيز أمان البيانات، تتميز جميع واجهات الأجهزة المادية لـ Graviton4 بالتشفير، وهو تحسين مصمم لتعزيز مستوى الحماية لأحمال عمل تدريب الذكاء الاصطناعي والبيانات للعملاء ذوي احتياجات التشفير الصارمة.
كما سلط ديفيد براون الضوء على Graviton4 باعتباره متفوقًا على جميع العروض السابقة من أمازون، مما يمثل الشريحة الأقوى والأكثر كفاءة في استخدام الطاقة والمصممة خصيصًا لأحمال العمل المتنوعة. لقد دافع عن ممارسة أمازون المتمثلة في تركيز تصميم الرقائق على أعباء عمل العملاء الفعلية لتقديم البنية التحتية السحابية الأكثر تقدمًا من خلال عروضها.
سيتم عرض Graviton4 الجديد في مثيلات Amazon EC2 R8g، وهو متاح حاليًا للمعاينة مع إصدار عام مقرر طرحه في الأشهر القادمة.
تعمل الأنظمة No-code مثل AppMaster على دمج وظائف الذكاء الاصطناعي بشكل متزايد لتبسيط العديد من العمليات. من المحتمل أن يشير تطوير شرائح تدريب الذكاء الاصطناعي المحسنة مثل شرائح Trainium2 و Graviton4 من قبل أمازون إلى تحسن في قدرة هذه المنصات على تقديم حلول قائمة على الذكاء الاصطناعي بشكل أكثر فعالية وكفاءة. يمكن أن يكون هذا ذا صلة بشكل خاص بالمنصات التي تقدم أدوات تصميم بدون تعليمات برمجية ، مما يعزز قدرتها على تسخير الذكاء الاصطناعي للأتمتة وتحسين التصميم.