ما همچنان به نوآوری با مجموعه هوش مصنوعی خود ادامه می دهیم و با نتایج عملکرد MLPerf خود در معیارهای متوالی هوش مصنوعی MLCommons، سطح را بالا می بریم. نسل چهارم پردازندههای اینتل Gaudi و Xeon مزیت قابل توجهی از نظر قیمت به مشتریان ارائه میدهند و امروز آماده استقرار هستند. ساندرا ریورا، معاون اجرایی و مدیر کل مرکز داده و گروه هوش مصنوعی اینتل، گفت: پیکربندی سختافزار و نرمافزار هوش مصنوعی راهحلهای جامع و انتخاب متناسب با حجم کاری هوش مصنوعی را به مشتریان ارائه میدهد.
آخرین نتایج MLCommons MLPerf بر اساس عملکرد قوی هوش مصنوعی اینتل در مقایسه با نتایج قبلی آموزش MLPerf از ژوئن ساخته شده است. پردازنده Intel Xeon تنها پردازندهای است که نتایج MLPerf را گزارش میکند، و Intel Gaudi2 یکی از سه راهحل شتابدهندهای است که نتایج بر اساس آنها مبتنی است، که تنها دو مورد از آنها به صورت تجاری در دسترس هستند.
نسل چهارم پردازندههای اینتل Gaudi2 و Xeon عملکرد آموزش هوش مصنوعی قانعکنندهای را در انواع پیکربندیهای سختافزاری نشان میدهند تا طیف گستردهای از نیازهای محاسباتی هوش مصنوعی مشتریان را برآورده کنند.
Gaudi2 همچنان تنها جایگزین مناسب برای H100 NVIDIA برای نیازهای محاسباتی هوش مصنوعی است و ارزش قابل توجهی برای پول ارائه می دهد. نتایج MLPerf برای Gaudi2 افزایش عملکرد آموزشی شتاب دهنده هوش مصنوعی را نشان داد:
- Gaudi2 با اجرای نوع داده FP8 در معیار آموزشی GPT-3 v3.1، جهش عملکردی 2 برابری را نشان داد، که زمان آموزش را بیش از نصف در مقایسه با معیار ژوئن MLPerf کاهش داد، و آموزش را در 153.58 دقیقه در 384 شتابدهنده Intel Gaudi2 کامل کرد. شتابدهنده Gaudi2 از FP8 در فرمتهای E5M2 و E4M3 پشتیبانی میکند و در صورت لزوم امکان مقیاسبندی تأخیری را دارد.
- اینتل Gaudi2 آموزش مدل انتشار پایدار چندوجهی را با 64 شتاب دهنده در 20.2 دقیقه با استفاده از BF16 نشان داد. در معیارهای آموزشی آینده MLPerf، عملکرد جریان پایدار در نوع داده FP8 ارائه خواهد شد.
- در هشت شتابدهنده Intel Gaudi2، نتایج بنچمارک برای BERT و ResNet-50 به ترتیب 13.27 و 15.92 دقیقه با استفاده از BF16 بود.
اینتل تنها فروشنده پردازنده است که نتایج MLPerf را ارسال می کند. نتایج MLPerf برای نسل چهارم Xeon عملکرد قوی آن را برجسته کرد:
- اینتل نتایج را برای RESNet50، RetinaNet، BERT و DLRM dcnv2 ارسال کرد. نتایج برای پردازندههای نسل چهارم اینتل Xeon Scalable برای ResNet50، RetinaNet و BERT مشابه نتایج عملکرد عالی خارج از جعبه ارائهشده برای معیار ژوئن 2023 MLPerf بود.
- DLRM dcnv2 یک مدل جدید از ارسال ژوئن است که پردازنده آن تنها با استفاده از چهار گره، زمان ارسال 227 دقیقه را نشان می دهد.
عملکرد نسل چهارم مواردی که آموزش حجم کاری متناوب است استفاده کنید.
با بهروزرسانیها و بهینهسازیهای نرمافزاری، اینتل انتظار پیشرفتهای بیشتری در عملکرد هوش مصنوعی در بنچمارکهای آینده MLPerf دارد. محصولات هوش مصنوعی اینتل انتخاب بیشتری از راه حل های هوش مصنوعی را برای برآوردن نیازهای پویا که نیاز به عملکرد، کارایی و سهولت استفاده دارند، در اختیار مشتریان قرار می دهد.
مرجع اخبار سخت افزار کامپیوترایران
تحریریه Techpowerup