اینتل امروز به طور رسمی شتاب دهنده Gaudi 3 خود را برای بارهای کاری هوش مصنوعی معرفی کرد. پردازندههای جدید کندتر از پردازندههای گرافیکی محبوب H100 و H200 انویدیا برای هوش مصنوعی و HPC هستند، بنابراین اینتل موفقیت Gaudi 3 خود را بر روی قیمت پایینتر و هزینه کل مالکیت کمتر (TCO) شرط میبندد.
پردازنده Gaudi 3 اینتل از دو چیپلت استفاده میکند که 64 هسته پردازشگر تانسور (TPC، ساختار MAC 256×256 با انباشتهکنندههای FP32)، هشت موتور ضرب ماتریس (MME، پردازنده برداری گسترده 256 بیتی) و 96 مگابایت حافظه نهان SRAM22 با حافظه داخلی را در خود جای داده است. پهنای باند TB/s همچنین، Gaudi 3 24 رابط شبکه 200 GbE و 14 موتور رسانه را با هم ادغام میکند – که دومی قادر به مدیریت H.265، H.264، JPEG و VP9 برای پشتیبانی از پردازش بینایی است. این پردازنده با 128 گیگابایت حافظه HBM2E در هشت پشته حافظه همراه با پهنای باند عظیم 3.67 ترابایت بر ثانیه است.
Gaudi 3 اینتل در مقایسه با Gaudi 2 که دارای 24 TPC، دو MME و 96 گیگابایت حافظه HBM2E است، نشان دهنده یک پیشرفت بزرگ است. با این حال، به نظر می رسد اینتل TPC و MME را ساده کرده است زیرا پردازنده Gaudi 3 فقط از عملیات ماتریس FP8 و همچنین عملیات ماتریس و برداری BFloat16 پشتیبانی می کند (یعنی دیگر FP32، TF32 و FP16 وجود ندارد).
وقتی صحبت از عملکرد به میان میآید، اینتل میگوید که Gaudi 3 میتواند تا 1856 TFLOPS ماتریس BF16/FP8 و همچنین تا 28.7 BF16 TFLOPS برداری را در حدود 600 وات TDP ارائه دهد. در مقایسه با H100 انویدیا، حداقل بر روی کاغذ، Gaudi 3 عملکرد ماتریس BF16 کمی کمتر (1856 در مقابل 1979 TFLOPS)، دو برابر عملکرد ماتریس FP8 (1856 در مقابل 3958 TFLOPS) و عملکرد بردار BF16 به میزان قابل توجهی پایینتر (219,7PS) ارائه میکند. .
مهمتر از مشخصات خام، عملکرد واقعی Gaudi 3 در دنیای واقعی است. این مدل باید با سری Instinct MI300 AMD و همچنین پردازنده های H100 و B100/B200 انویدیا رقابت کند. و این چیزی است که باید دید، زیرا خیلی به نرم افزار و عوامل دیگر بستگی دارد. در حال حاضر، اینتل برخی از اسلایدها را نشان داده است که ادعا می کند Gaudi 3 می تواند مزیت عملکرد قیمت قابل توجهی را در مقایسه با H100 انویدیا ارائه دهد.
در اوایل سال جاری، اینتل اعلام کرد که یک کیت شتاب دهنده مبتنی بر هشت پردازنده گائودی 3 روی پایه 125000 دلار قیمت خواهد داشت که به این معنی است که قیمت هر یک از آنها حدود 15625 دلار خواهد بود. در مقابل، یک کارت Nvidia H100 در حال حاضر با قیمت 30678 دلار در دسترس است، بنابراین اینتل واقعاً قصد دارد مزیت قیمتی زیادی نسبت به رقیب خود داشته باشد. با این حال، با مزایای عملکرد بالقوه گسترده ارائه شده توسط پردازندههای گرافیکی B100/B200 مبتنی بر بلکول، باید دید که آیا این شرکت آبی میتواند مزیت خود را نسبت به رقیب خود حفظ کند یا خیر.
جاستین هاتارد، معاون اجرایی اینتل و مدیر کل مرکز داده و گروه هوش مصنوعی گفت: «تقاضا برای هوش مصنوعی منجر به تحول عظیمی در مرکز داده میشود و صنعت در حال درخواست انتخاب در زمینه سختافزار، نرمافزار و ابزارهای توسعهدهنده است. . اینتل با راهاندازی Xeon 6 با هستههای P و شتابدهندههای هوش مصنوعی Gaudi 3، یک اکوسیستم باز را فعال میکند که به مشتریان ما اجازه میدهد تا تمام بارهای کاری خود را با عملکرد، کارایی و امنیت بیشتر اجرا کنند.
شتاب دهنده های هوش مصنوعی Gaudi 3 اینتل از IBM Cloud و Intel Tiber Developer Cloud در دسترس خواهند بود. همچنین، سیستمهای مبتنی بر Xeon 6 و Gaudi 3 اینتل به طور کلی در سه ماهه چهارم از Dell، HPE و Supermicro در دسترس خواهند بود، با سیستمهای Dell و Supermicro در ماه اکتبر و ماشینها از ارسال Supermicro در دسامبر.
مرجع اخبار سخت افزار کامپیوترایران
تحریریه Techpowerup