پردازندههایی که امروز توسط AMD راهاندازی شدند، سری EPYC “Genoa” هستند که سرورهای همه منظوره را هدف قرار میدهند، اگرچه میتوانند در مراکز داده ابری بزرگ نیز مستقر شوند. برای ارائه دهندگان ابری در مقیاس بزرگ مانند AWS، Azure و Google Cloud، AMD در حال آماده سازی کلاس دیگری از پردازنده ها با نام “Bergamo” است که انتظار می رود بعداً منتشر شود. در سال 2023، این شرکت خط پردازندههای “Genoa-X” را برای محاسبات فنی و برنامههای HPC راهاندازی میکند که از حافظه پنهان یکپارچه بزرگ بهره میبرند، زیرا از فناوری کش عمودی سه بعدی بهره میبرند. همچنین “Siena” وجود خواهد داشت، کلاسی از پردازنده های EPYC که بازارهای مخابراتی و محاسبات لبه را هدف قرار می دهد، که می تواند شاهد ادغام IP های Xilinx بیشتری باشد.
پردازنده EPYC “Genoa”، همانطور که اشاره کردیم، با تعداد هسته تا 96 هسته / 192 رشته ارائه می شود که بر تعداد 40 هسته / 80 رشته های Xeon Scalable “Ice Lake-SP” از نسل سوم تسلط دارد. و همچنین جلوتر از تعداد 60 هسته/120 رشته Xeon Scalable “Sapphire Rapids” آینده. پردازنده جدید AMD همچنین شاهد بهبود قابل توجهی در قابلیت های I/O خود است، با رابط حافظه 12 کانالی (24 زیر کانال) DDR5 و یک رابط عظیم 160 خطی PCI-Express Gen 5 (یعنی ده اسلات Gen 5 x16). در حال اجرا با پهنای باند کامل). و با کم کردن برخی از این خطوط همه منظوره، از پیوندهای xGMI CXL و 2P پشتیبانی می کند. تعداد بالای ترانزیستورها به دلیل دو جزء بزرگ 80 خطی (SERDES) است که میتوانند برای خروجی خطهای PCIe Gen 5، خطوط CXL 1.1، پورتهای SATA 6 گیگابیت بر ثانیه یا حتی فعالسازی Infinity Fabric بین سوکت طراحی شوند. پلتفرم های 2P این پردازنده از 64 خط CXL 1.1 پشتیبانی می کند که می توان از آنها برای اتصال به دستگاه های ادغام حافظه شبکه استفاده کرد. نسل سوم Infinity Fabric اجزای مختلف داخل sIOD، sIOD را از طریق IFOP به دوازده CCD “Zen 4” و به عنوان یک اتصال بین سوکت متصل می کند. این پردازنده دارای یک رابط حافظه 12 کانالی (24 کانال فرعی 40 بیتی) است که تا 6 ترابایت حافظه DDR5-4800 ECC را در هر سوکت پشتیبانی می کند. پردازنده ایمن نسل بعدی SEV-SNP (صفحه بندی امن جاسازی شده) و AES-256-XTS را برای ماشین های مجازی ایمن تر ارائه می دهد. هر یک از تراشههای پیچیده 5 نانومتری CPU (CCD) از نظر فیزیکی با پردازندههای دسکتاپ سری Ryzen 7000 “Raphael” یکسان است. این تراشه شامل 8 هسته پردازشی “Zen 4” است که هر کدام دارای 1 مگابایت حافظه نهان اختصاصی L2 و 32 مگابایت حافظه نهان L3 مشترک است. بین 8 هسته هر هسته “Zen 4” با ثابت نگه داشتن سرعت ساعت، 14% بهبود عملکرد نسلی را نسبت به “Zen 3” ارائه می دهد. بخش اعظم این افزایش از بهروزرسانیهای بخش Front-end و Load/store هسته حاصل میشود، در حالی که پیشبینیکننده شاخه، حافظه پنهان L2 بزرگتر و زمان اجرا سهم کمتری دارند. بزرگترین تغییر نسل ISA است که شاهد معرفی مجموعه دستورالعمل های AVX-512، VNNI و bfloat16 است. مجموعه دستورالعمل های جدید باید بارهای کاری ریاضی AVX-512 و همچنین عملکرد با برنامه های هوش مصنوعی را افزایش دهد. AMD ادعا میکند که پیادهسازی AVX-512 آن کارآمدتر از اینتل است، زیرا از FPU 256 بیتی موجود به صورت دو پمپ برای فعال کردن عملیات 512 بیتی استفاده میکند.
AMD امروز در مجموع 18 مرجع پردازنده را راه اندازی می کند که همگی برای پلتفرم Socket SP5 هستند. از نامگذاری شرح داده شده در اسلاید زیر پیروی می کند. EPYC نام تجاری سطح بالا است، “9” سری محصولات است. عدد بعدی تعداد هسته ها را نشان می دهد، “0” 8 هسته، “1” 16، “2” 24، “3” 32، “4” 48، “5” 64 و “6” است. 84-96 بودن عدد بعدی عملکرد را در مقیاس 1 تا 10 نشان می دهد. آخرین عدد در واقع یک کاراکتر است که می تواند “P” یا “F” باشد که P نشان دهنده SKU های سازگار با 2P و “F” نشان دهنده SKU های ویژه ای است که روی تعداد کمتری تمرکز می کنند. هسته در هر CCD برای بهبود عملکرد در هر هسته. TDP قابل تنظیم همه SKUها تا 400 وات رتبه بندی شده است که به نظر بالا می رسد، اما باید تعداد هسته های CPU و تأثیر آن بر تعداد تیغه های سرور در هر رک را در نظر بگیرید. این یکی از دلایلی است که چرا AMD بیش از 2 سوکت در هر سرور مقیاس نمی کند. چگالی خط پایه این شرکت به 67٪ سرورهای کمتر، 52٪ انرژی کمتر ترجمه می شود. از نظر عملکرد، AMD فقط پردازندههای نسل سوم Xeon Scalable Ice Lake-SP اینتل را برای مقایسه دارد، زیرا «Sapphire Rapids» هنوز منتشر نشده است. با تعداد هسته های برابر، EPYC 9174F 16 هسته ای 47 درصد سریعتر از Xeon Gold 6346 است. EPYC 9374F 32 هسته ای 55 درصد سریعتر از Xeon Platinum 8362 است. و EPYC 9474F 48 هسته ای 51 درصد سریعتر از Xeon Platinum 8380 40 هسته ای است. همین گروه آزمایشی همچنین شاهد برتری 58 تا 96 درصدی در عملکرد ممیز شناور به نفع AMD هستند.
اسلایدشو کامل در ادامه می آید.
مرجع اخبار سخت افزار کامپیوترایران
تحریریه Techpowerup