AMD نسل چهارم پردازنده های سرور Zen 4 EPYC “Genoa” را عرضه می کند: 100٪ افزایش عملکرد برای 50٪ هسته های بیشتر


در یک رویداد رسانه ای ویژه با عنوان “با هم ما مراکز داده را به جلو می بریم”، AMD به طور رسمی نسل چهارم پردازنده های سرور EPYC “Genoa” خود را بر اساس ریزمعماری “Zen 4” راه اندازی کرد. این پردازنده ها یک پلتفرم کاملاً جدید را با اتصال I/O مدرن راه اندازی می کنند که شامل حافظه PCI-Express Gen 5، CXL و DDR5 می شود. این پردازنده ها دارای تعداد هسته های CPU تا 96 هسته / 192 رشته هستند. حداکثر 18 SKU CPU وجود دارد که نه تنها بر اساس تعداد هسته های CPU، بلکه بر اساس نحوه توزیع هسته ها در 12 تراشه “Zen 4” (CCD) متمایز می شوند. هر تراشه بسته به مدل دارای حداکثر 8 هسته پردازشی “Zen 4” است. تا 32 مگابایت حافظه نهان L3، و بر اساس فرآیند 5 نانومتری EUV TSMC ساخته شده است. CCD ها با یک آرایه مرکزی ورودی/خروجی سرور (sIOD) که بر اساس فرآیند 6 نانومتری ساخته شده است، ارتباط برقرار می کنند.

پردازنده‌هایی که امروز توسط AMD راه‌اندازی شدند، سری EPYC “Genoa” هستند که سرورهای همه منظوره را هدف قرار می‌دهند، اگرچه می‌توانند در مراکز داده ابری بزرگ نیز مستقر شوند. برای ارائه دهندگان ابری در مقیاس بزرگ مانند AWS، Azure و Google Cloud، AMD در حال آماده سازی کلاس دیگری از پردازنده ها با نام “Bergamo” است که انتظار می رود بعداً منتشر شود. در سال 2023، این شرکت خط پردازنده‌های “Genoa-X” را برای محاسبات فنی و برنامه‌های HPC راه‌اندازی می‌کند که از حافظه پنهان یکپارچه بزرگ بهره می‌برند، زیرا از فناوری کش عمودی سه بعدی بهره می‌برند. همچنین “Siena” وجود خواهد داشت، کلاسی از پردازنده های EPYC که بازارهای مخابراتی و محاسبات لبه را هدف قرار می دهد، که می تواند شاهد ادغام IP های Xilinx بیشتری باشد.

پردازنده EPYC “Genoa”، همانطور که اشاره کردیم، با تعداد هسته تا 96 هسته / 192 رشته ارائه می شود که بر تعداد 40 هسته / 80 رشته های Xeon Scalable “Ice Lake-SP” از نسل سوم تسلط دارد. و همچنین جلوتر از تعداد 60 هسته/120 رشته Xeon Scalable “Sapphire Rapids” آینده. پردازنده جدید AMD همچنین شاهد بهبود قابل توجهی در قابلیت های I/O خود است، با رابط حافظه 12 کانالی (24 زیر کانال) DDR5 و یک رابط عظیم 160 خطی PCI-Express Gen 5 (یعنی ده اسلات Gen 5 x16). در حال اجرا با پهنای باند کامل). و با کم کردن برخی از این خطوط همه منظوره، از پیوندهای xGMI CXL و 2P پشتیبانی می کند. تعداد بالای ترانزیستورها به دلیل دو جزء بزرگ 80 خطی (SERDES) است که می‌توانند برای خروجی خط‌های PCIe Gen 5، خطوط CXL 1.1، پورت‌های SATA 6 گیگابیت بر ثانیه یا حتی فعال‌سازی Infinity Fabric بین سوکت طراحی شوند. پلتفرم های 2P این پردازنده از 64 خط CXL 1.1 پشتیبانی می کند که می توان از آنها برای اتصال به دستگاه های ادغام حافظه شبکه استفاده کرد. نسل سوم Infinity Fabric اجزای مختلف داخل sIOD، sIOD را از طریق IFOP به دوازده CCD “Zen 4” و به عنوان یک اتصال بین سوکت متصل می کند. این پردازنده دارای یک رابط حافظه 12 کانالی (24 کانال فرعی 40 بیتی) است که تا 6 ترابایت حافظه DDR5-4800 ECC را در هر سوکت پشتیبانی می کند. پردازنده ایمن نسل بعدی SEV-SNP (صفحه بندی امن جاسازی شده) و AES-256-XTS را برای ماشین های مجازی ایمن تر ارائه می دهد. هر یک از تراشه‌های پیچیده 5 نانومتری CPU (CCD) از نظر فیزیکی با پردازنده‌های دسکتاپ سری Ryzen 7000 “Raphael” یکسان است. این تراشه شامل 8 هسته پردازشی “Zen 4” است که هر کدام دارای 1 مگابایت حافظه نهان اختصاصی L2 و 32 مگابایت حافظه نهان L3 مشترک است. بین 8 هسته هر هسته “Zen 4” با ثابت نگه داشتن سرعت ساعت، 14% بهبود عملکرد نسلی را نسبت به “Zen 3” ارائه می دهد. بخش اعظم این افزایش از به‌روزرسانی‌های بخش Front-end و Load/store هسته حاصل می‌شود، در حالی که پیش‌بینی‌کننده شاخه، حافظه پنهان L2 بزرگ‌تر و زمان اجرا سهم کمتری دارند. بزرگترین تغییر نسل ISA است که شاهد معرفی مجموعه دستورالعمل های AVX-512، VNNI و bfloat16 است. مجموعه دستورالعمل های جدید باید بارهای کاری ریاضی AVX-512 و همچنین عملکرد با برنامه های هوش مصنوعی را افزایش دهد. AMD ادعا می‌کند که پیاده‌سازی AVX-512 آن کارآمدتر از اینتل است، زیرا از FPU 256 بیتی موجود به صورت دو پمپ برای فعال کردن عملیات 512 بیتی استفاده می‌کند.

AMD امروز در مجموع 18 مرجع پردازنده را راه اندازی می کند که همگی برای پلتفرم Socket SP5 هستند. از نامگذاری شرح داده شده در اسلاید زیر پیروی می کند. EPYC نام تجاری سطح بالا است، “9” سری محصولات است. عدد بعدی تعداد هسته ها را نشان می دهد، “0” 8 هسته، “1” 16، “2” 24، “3” 32، “4” 48، “5” 64 و “6” است. 84-96 بودن عدد بعدی عملکرد را در مقیاس 1 تا 10 نشان می دهد. آخرین عدد در واقع یک کاراکتر است که می تواند “P” یا “F” باشد که P نشان دهنده SKU های سازگار با 2P و “F” نشان دهنده SKU های ویژه ای است که روی تعداد کمتری تمرکز می کنند. هسته در هر CCD برای بهبود عملکرد در هر هسته. TDP قابل تنظیم همه SKUها تا 400 وات رتبه بندی شده است که به نظر بالا می رسد، اما باید تعداد هسته های CPU و تأثیر آن بر تعداد تیغه های سرور در هر رک را در نظر بگیرید. این یکی از دلایلی است که چرا AMD بیش از 2 سوکت در هر سرور مقیاس نمی کند. چگالی خط پایه این شرکت به 67٪ سرورهای کمتر، 52٪ انرژی کمتر ترجمه می شود. از نظر عملکرد، AMD فقط پردازنده‌های نسل سوم Xeon Scalable Ice Lake-SP اینتل را برای مقایسه دارد، زیرا «Sapphire Rapids» هنوز منتشر نشده است. با تعداد هسته های برابر، EPYC 9174F 16 هسته ای 47 درصد سریعتر از Xeon Gold 6346 است. EPYC 9374F 32 هسته ای 55 درصد سریعتر از Xeon Platinum 8362 است. و EPYC 9474F 48 هسته ای 51 درصد سریعتر از Xeon Platinum 8380 40 هسته ای است. همین گروه آزمایشی همچنین شاهد برتری 58 تا 96 درصدی در عملکرد ممیز شناور به نفع AMD هستند.

اسلایدشو کامل در ادامه می آید.



مرجع اخبار سخت افزار کامپیوترایران