اینتل شتاب دهنده Gaudi 3 را برای هوش مصنوعی راه اندازی کرد: کندتر از H100 اما ارزان تر

Intel

اینتل امروز به طور رسمی شتاب دهنده Gaudi 3 خود را برای بارهای کاری هوش مصنوعی معرفی کرد. پردازنده‌های جدید کندتر از پردازنده‌های گرافیکی محبوب H100 و H200 انویدیا برای هوش مصنوعی و HPC هستند، بنابراین اینتل موفقیت Gaudi 3 خود را بر روی قیمت پایین‌تر و هزینه کل مالکیت کمتر (TCO) شرط می‌بندد.

پردازنده Gaudi 3 اینتل از دو چیپ‌لت استفاده می‌کند که 64 هسته پردازشگر تانسور (TPC، ساختار MAC 256×256 با انباشته‌کننده‌های FP32)، هشت موتور ضرب ماتریس (MME، پردازنده برداری گسترده 256 بیتی) و 96 مگابایت حافظه نهان SRAM22 با حافظه داخلی را در خود جای داده است. پهنای باند TB/s همچنین، Gaudi 3 24 رابط شبکه 200 GbE و 14 موتور رسانه را با هم ادغام می‌کند – که دومی قادر به مدیریت H.265، H.264، JPEG و VP9 برای پشتیبانی از پردازش بینایی است. این پردازنده با 128 گیگابایت حافظه HBM2E در هشت پشته حافظه همراه با پهنای باند عظیم 3.67 ترابایت بر ثانیه است.

Gaudi 3 اینتل در مقایسه با Gaudi 2 که دارای 24 TPC، دو MME و 96 گیگابایت حافظه HBM2E است، نشان دهنده یک پیشرفت بزرگ است. با این حال، به نظر می رسد اینتل TPC و MME را ساده کرده است زیرا پردازنده Gaudi 3 فقط از عملیات ماتریس FP8 و همچنین عملیات ماتریس و برداری BFloat16 پشتیبانی می کند (یعنی دیگر FP32، TF32 و FP16 وجود ندارد).

وقتی صحبت از عملکرد به میان می‌آید، اینتل می‌گوید که Gaudi 3 می‌تواند تا 1856 TFLOPS ماتریس BF16/FP8 و همچنین تا 28.7 BF16 TFLOPS برداری را در حدود 600 وات TDP ارائه دهد. در مقایسه با H100 انویدیا، حداقل بر روی کاغذ، Gaudi 3 عملکرد ماتریس BF16 کمی کمتر (1856 در مقابل 1979 TFLOPS)، دو برابر عملکرد ماتریس FP8 (1856 در مقابل 3958 TFLOPS) و عملکرد بردار BF16 به میزان قابل توجهی پایین‌تر (219,7PS) ارائه می‌کند. .

مرجع اخبار سخت افزار کامپیوترایران

تحریریه Techpowerup