شتاب دهنده هوش مصنوعی Intel Gaudi با نرم افزار FP8 عملکرد 2 برابری نسبت به GPT-3 به دست می آورد

امروز، MLCommons نتایجی را از معیار آموزشی استاندارد MLPerf v3.1 برای آموزش مدل‌های هوش مصنوعی منتشر کرد که اینتل نتایج را برای شتاب‌دهنده‌های Intel Gaudi 2 و پردازنده‌های نسل چهارم Intel Xeon Scalable با افزونه‌های پیشرفته ماتریس اینتل (Intel AMX) ارائه کرد. اینتل Gaudi2 با پیاده سازی نوع داده FP8 در معیار آموزشی GPT-3 v3.1، جهش قابل توجه عملکرد 2 برابری را نشان داد. معیارهای ارائه شده تعهد اینتل را برای ارائه هوش مصنوعی در همه جا با راه حل های هوش مصنوعی رقابتی تقویت کرد.

ما همچنان به نوآوری با مجموعه هوش مصنوعی خود ادامه می دهیم و با نتایج عملکرد MLPerf خود در معیارهای متوالی هوش مصنوعی MLCommons، سطح را بالا می بریم. نسل چهارم پردازنده‌های اینتل Gaudi و Xeon مزیت قابل توجهی از نظر قیمت به مشتریان ارائه می‌دهند و امروز آماده استقرار هستند. ساندرا ریورا، معاون اجرایی و مدیر کل مرکز داده و گروه هوش مصنوعی اینتل، گفت: پیکربندی سخت‌افزار و نرم‌افزار هوش مصنوعی راه‌حل‌های جامع و انتخاب متناسب با حجم کاری هوش مصنوعی را به مشتریان ارائه می‌دهد.

آخرین نتایج MLCommons MLPerf بر اساس عملکرد قوی هوش مصنوعی اینتل در مقایسه با نتایج قبلی آموزش MLPerf از ژوئن ساخته شده است. پردازنده Intel Xeon تنها پردازنده‌ای است که نتایج MLPerf را گزارش می‌کند، و Intel Gaudi2 یکی از سه راه‌حل شتاب‌دهنده‌ای است که نتایج بر اساس آن‌ها مبتنی است، که تنها دو مورد از آن‌ها به صورت تجاری در دسترس هستند.

نسل چهارم پردازنده‌های اینتل Gaudi2 و Xeon عملکرد آموزش هوش مصنوعی قانع‌کننده‌ای را در انواع پیکربندی‌های سخت‌افزاری نشان می‌دهند تا طیف گسترده‌ای از نیازهای محاسباتی هوش مصنوعی مشتریان را برآورده کنند.

Gaudi2 همچنان تنها جایگزین مناسب برای H100 NVIDIA برای نیازهای محاسباتی هوش مصنوعی است و ارزش قابل توجهی برای پول ارائه می دهد. نتایج MLPerf برای Gaudi2 افزایش عملکرد آموزشی شتاب دهنده هوش مصنوعی را نشان داد:

  • Gaudi2 با اجرای نوع داده FP8 در معیار آموزشی GPT-3 v3.1، جهش عملکردی 2 برابری را نشان داد، که زمان آموزش را بیش از نصف در مقایسه با معیار ژوئن MLPerf کاهش داد، و آموزش را در 153.58 دقیقه در 384 شتابدهنده Intel Gaudi2 کامل کرد. شتاب‌دهنده Gaudi2 از FP8 در فرمت‌های E5M2 و E4M3 پشتیبانی می‌کند و در صورت لزوم امکان مقیاس‌بندی تأخیری را دارد.
  • اینتل Gaudi2 آموزش مدل انتشار پایدار چندوجهی را با 64 شتاب دهنده در 20.2 دقیقه با استفاده از BF16 نشان داد. در معیارهای آموزشی آینده MLPerf، عملکرد جریان پایدار در نوع داده FP8 ارائه خواهد شد.
  • در هشت شتابدهنده Intel Gaudi2، نتایج بنچمارک برای BERT و ResNet-50 به ترتیب 13.27 و 15.92 دقیقه با استفاده از BF16 بود.

اینتل تنها فروشنده پردازنده است که نتایج MLPerf را ارسال می کند. نتایج MLPerf برای نسل چهارم Xeon عملکرد قوی آن را برجسته کرد:

  • اینتل نتایج را برای RESNet50، RetinaNet، BERT و DLRM dcnv2 ارسال کرد. نتایج برای پردازنده‌های نسل چهارم اینتل Xeon Scalable برای ResNet50، RetinaNet و BERT مشابه نتایج عملکرد عالی خارج از جعبه ارائه‌شده برای معیار ژوئن 2023 MLPerf بود.
  • DLRM dcnv2 یک مدل جدید از ارسال ژوئن است که پردازنده آن تنها با استفاده از چهار گره، زمان ارسال 227 دقیقه را نشان می دهد.

عملکرد نسل چهارم مواردی که آموزش حجم کاری متناوب است استفاده کنید.

با به‌روزرسانی‌ها و بهینه‌سازی‌های نرم‌افزاری، اینتل انتظار پیشرفت‌های بیشتری در عملکرد هوش مصنوعی در بنچمارک‌های آینده MLPerf دارد. محصولات هوش مصنوعی اینتل انتخاب بیشتری از راه حل های هوش مصنوعی را برای برآوردن نیازهای پویا که نیاز به عملکرد، کارایی و سهولت استفاده دارند، در اختیار مشتریان قرار می دهد.

مرجع اخبار سخت افزار کامپیوترایران

تحریریه Techpowerup