AMD اقتصاد تراشه‌های پردازنده‌های گرافیکی را توضیح می‌دهد


AMD در ارائه فنی خود از پردازنده گرافیکی جدید سری Radeon RX 7900 “Navi 31” به ما توضیح داد که چرا باید راه چیپلت ها را برای پردازنده های گرافیکی رده بالا، دستگاه هایی بسیار پیچیده تر از CPU ها، طی کند. این شرکت همچنین در مورد آنچه که بسته‌های مبتنی بر تراشه را از ماژول‌های چند تراشه‌ای معمولی (MCM) جدا می‌کند، روشن کرد. یک MCM مجموعه‌ای است که از چندین دستگاه مستقل تشکیل شده است که از یک بستر فایبرگلاس استفاده می‌کنند.

نمونه ای از MCM یک پردازنده Intel Core موبایل است که در آن تراشه CPU و تراشه PCH یک بستر مشترک دارند. در اینجا CPU و PCH تکه‌های مستقلی از سیلیکون هستند که در غیر این صورت ممکن است در بسته‌های خود وجود داشته باشند (همانطور که در پلتفرم دسکتاپ وجود دارند)، اما روی یک بستر واحد جفت شده‌اند تا ردپای PCB را به حداقل برسانند، که در موبایل ارزشمند است. سکو. یک دستگاه مبتنی بر تراشه، دستگاهی است که در آن یک بستر از تراشه‌های متعددی تشکیل شده است که در غیر این صورت نمی‌توانند به طور مستقل روی بسته‌های خودشان بدون تأثیر بر پهنای باند یا تأخیر بین تراشه‌ها وجود داشته باشند. آنها اساساً اجزایی هستند که باید روی یک قالب یکپارچه باشند، اما به قالب های جداگانه ساخته شده بر روی گره های ریخته گری نیمه هادی مختلف، با انگیزه صرفاً هزینه محور، تجزیه می شوند.

چرخش AMD به تراشه‌ها به دلیل افزایش هزینه‌های ویفرهای نیمه‌رسانا است زیرا فرآیند تولید سیلیکون به اندازه ترانزیستور افزایش می‌یابد. اگرچه AMD 13 سال پیش به یک شرکت بی‌سابقه تبدیل شد، اما با Globalfoundries، بخش ریخته‌گری سابق AMD که ایجاد کرده بود، معامله راحت داشت. این شرکت به تامین پردازنده‌ها از Globalfoundries تا گره‌های FinFET کلاس 14 نانومتری-12 نانومتری ادامه داده است، و اگرچه Globalfoundries در ابتدا قصد داشت یک گره زیر 10 نانومتری ایجاد کند که با TSMC 7 نانومتری و سامسونگ 8 نانومتری رقابت کند. این طرح ها شکست خورد AMD با TSMC رابطه داشت و از آنجا پردازنده‌های گرافیکی Radeon خود را ساخت. از آنجایی که TSMC بهترین گره کلاس 7 نانومتری و توانایی افزایش تولید را داشت. این شرکت بزرگترین شرط بندی خود را با ساخت پردازنده های 7 نانومتری انجام داده است.

AMD تنها مشتری TSMC نیست، و این شرکت به زودی متوجه شد که نمی‌تواند پردازنده‌های هسته‌ای بالا را بر روی قالب‌های یکپارچه 7 نانومتری بسازد. همچنین نمی‌توانست کاری را که با EPYC “Naples” انجام داد، که در اصل MCMهای “4P روی چوب” بودند، با فضای قالب هدر رفته برای قطعات اضافی انجام داد. بنابراین او پردازنده را متلاشی کرد. مولفه هایی که می توانند بیشترین بهره را از کوچک شدن تا 7 نانومتر ببرند. هسته‌های پردازنده روی قالب‌های کوچکی ساخته می‌شوند که هر کدام حاوی 8 هسته پردازشی است که شرکت آن‌ها را آرایه‌های پردازشگر پیچیده (CCD) می‌نامد. هر چه تراشه کوچکتر باشد، بازده هر ویفر بیشتر می شود، و بنابراین شرکت تصمیم گرفت که یک قطعه سیلیکونی 80 میلی متر مربعی با 8 هسته CPU با یک تراشه جداگانه که شامل تمام اجزایی است که می تواند بر روی یک گره کمی قدیمی تر با کمترین تأثیر ایجاد کند صحبت کند. در مورد ویژگی های انرژی/حرارتی کلی محصول. این ماتریس I/O نامیده می شود. AMD به ساخت هر دو محصول کلاینت Ryzen و سرور EPYC با این رویکرد ادامه خواهد داد، زیرا CCD های 8 هسته ای در هر دو خط تولید مشترک بودند. پردازنده دسکتاپ مشتری دارای یک تراشه ورودی/خروجی کوچکتر متناسب با پلتفرم است که آن را cIOD (تراشه ورودی/خروجی مشتری) می نامد، در حالی که بخش سرور، با قابلیت اتصال به تعداد بیشتری CCD، نامیده می شود. sIOD (تراشه ورودی/خروجی سرور). AMD در سه سال گذشته به منابع ورودی/خروجی از Globalfoundries در گره 12 نانومتری خود ادامه داده است. AMD با جدیدترین پردازنده‌های نسل چهارم Ryzen 7000 و EPYC مبتنی بر Zen 4، CCD‌ها را بر روی گره 5 نانومتری EUV می‌سازد، در حالی که دای‌های ورودی/خروجی بر روی گره 6 نانومتری کمتر پیشرفته ساخته شده‌اند.

سریع به جلو، و AMD خود را با مشکل GPU های Radeon خود مواجه کرد. این شرکت از فروش پردازنده‌های گرافیکی مجزا به اندازه پردازنده‌های مرکزی (مشتری + سرور) درآمد کسب نمی‌کند، بنابراین کاهش هزینه‌های ساخت بدون از دست دادن رقابت در برابر NVIDIA، حتی بیشتر است. با نسل GeForce “Ada Lovelace”، NVIDIA همچنان بر روی سیلیکون یکپارچه برای پردازنده‌های گرافیکی شرط می‌بندد، حتی بزرگترین تراشه AD102 خود را مانند یک GPU کلاسیک یکپارچه می‌سازد. این به AMD فرصتی می دهد تا هزینه تولید پردازنده های گرافیکی خود را کاهش دهد، که می تواند به آن اجازه دهد تا در تلاش برای به دست آوردن سهم بازار، جنگ قیمتی علیه NVIDIA به راه بیندازد. یک مثال قیمت نسبتاً تهاجمی است که AMD برای Radeon RX 7900 XTX با قیمت 999 دلار استفاده می کند. و RX 7900 XT 899 دلاری، که شرکت می گوید آنچه را که برای مبارزه با RTX 4080 1199 دلاری NVIDIA لازم است و احتمالاً در برخی از بهترین سناریوها با RTX 4090 1599 دلاری معامله می کند، دارد.

گام اول در از هم پاشیدن یک GPU رده بالا بدون آسیب رساندن به عملکرد، زمان فریم و ویژگی های قدرت/حرارتی آن. شناسایی اجزای خاصی روی سیلیکون است که می تواند به تراشه تبدیل شود، که می تواند با یک گره ریخته گری قدیمی تر کار کند. برای یک پردازنده سرور EPYC، حتی با 9 تا 12 تراشه، شرکت فقط باید صدها مسیر سیگنال را از طریق بستر مدیریت کند تا تراشه ها را به هم متصل کند. یک GPU گسسته سطح بالا بسیار پیچیده‌تر است و مقیاس این مسیرهای سیگنال بین تراشه‌ای هزاران است (در مورد سیلیکون RDNA2 قدیمی‌تر “Navi 21”). با بزرگتر “Navi 31” RDNA3، این تعداد فقط افزایش خواهد یافت. این شرکت اجزایی را شناسایی کرد که حداقل یک سوم از ناحیه تراشه را تشکیل می‌دادند که از انتقال به EUV 5 نانومتری بهره‌ای نخواهند برد – اینها شامل کنترل‌کننده‌های حافظه GDDR6، حافظه PHY و حافظه کش Infinity هستند. موتورها).

پردازنده‌های گرافیکی با رابط‌های حافظه گسترده‌تر از 64 بیت، تمایل دارند از چندین کنترلر حافظه 64 بیتی استفاده کنند که برای ایجاد یک رابط حافظه گسترده‌تر (مانند 128 بیت، 256 بیت، 384 بیت و غیره) به هم متصل می‌شوند. این مورد در مورد AMD و NVIDIA است. بنابراین AMD تصمیم گرفت که نه تنها کنترل‌کننده‌های حافظه جدا باشند، بلکه هر کنترل‌کننده حافظه با مسیر حافظه 64 بیتی، چیپلت خودش باشد و یک بخش 16 مگابایتی از حافظه نهان بی‌نهایت 96 مگابایتی GPU داشته باشد. این کنترلر حافظه + چیپلت حافظه نهان، آرایه کش حافظه (MCD) نامیده می شود. در حالی که بقیه GPU با اجزای منطقی هاردکور خود که در واقع از EUV 5 نانومتری بهره می‌برند، به یک قالب متمرکز بزرگ‌تر به نام Graphics Compute Die (GCD) تبدیل می‌شوند. پردازنده گرافیکی “Navi 31” دارای یک رابط حافظه 384 بیتی GDDR6 است، بنابراین شش MCD وجود دارد. با فرض اینکه AMD حتی برای پردازنده‌های گرافیکی کوچک‌تر خود به طراحی چیپ‌لت‌ها پایبند است، می‌تواند به سادگی از تعداد کمتری MCD برای دستیابی به رابط‌های حافظه فشرده‌تر مانند ۲۵۶ بیت (۴ برابر MCD)، ۱۹۲ بیت (۳ برابر MCD) یا ۱۲۸ بیت (۲ برابر) استفاده کند. MCD).

در حالی که اتصال بین GCD و MCD هنوز Infinity Fabric است، AMD مجبور شد یک فناوری کابل‌کشی لایه فیزیکی جدید را توسعه دهد که از بستر فایبرگلاس ارگانیک موجود استفاده می‌کند تا به نوع تراکم کابل‌کشی بالا مورد نیاز برای هزاران مسیر سیگنال دست یابد. این شرکت لایه فیزیکی جدید Infinity Fanout Link را توسعه داده است که از تعداد زیادی لینک IF با سرعت 9.2 گیگابیت بر ثانیه با کابل‌کشی فن‌آوت استفاده می‌کند تا 10 برابر تراکم کابل‌کشی بین GCD و MCD در مقایسه با لایه فیزیکی IFOP استفاده شود. یک پردازنده CCD “Zen” را با IOD وصل کنید. فن اوت تکنیکی است برای به دست آوردن تعداد زیادی اثر با طول مساوی بین دو نقطه، جایی که امکان قرار دادن آنها در خطوط مستقیم وجود ندارد. بنابراین آنها به گونه ای طراحی شده اند که در امتداد موانع (مانند vias) پیچ و تاب داشته باشند که طول ردیابی برابر مورد نیاز برای حفظ یکپارچگی سیگنال را به خطر نیندازد.

یک جایگزین آشنا برای AMD برای کابل‌کشی Infinity Fabric Fanout استفاده از رویکرد بسته‌بندی سه بعدی، با استفاده از یک interposer سیلیکونی (قالبی که کابل‌کشی میکروسکوپی با چگالی بالا را بین قالب‌های چیده شده روی آن تسهیل می‌کند) بود. پردازنده‌های گرافیکی قدیمی‌تر AMD MCM از interposer برای اتصال تراشه‌های GPU و پشته‌های HBM استفاده می‌کردند. Interposer یک راه بسیار گران برای ساخت یک GPU مشتری با فضایی برای کاهش قیمت در آینده است، زیرا به تنهایی یک تراشه بزرگ کلاس 55 نانومتری است که برای عمل به عنوان PCB طراحی شده است.

نقطه ضعف آشکار پوسیدگی تراشه منطقی یکپارچه تأخیر است که به ویژه برای یک GPU بسیار مهم است. اگرچه شرکت مشخص نمی کند، انتقال کنترلرهای حافظه به MCD ها به جای روشن کردن آنها (مانند “Navi 21”) “مقدار متوسطی از تاخیر” را اضافه کرد. AMD می گوید سعی کرده است با افزایش سرعت ساعت بر این تأخیر غلبه کند. ساعت پایه فابریک Infinity 43 درصد بالاتر از «Navi 21» است و ساعت های بازی (ساعت های موتور سایه زن) نسل به نسل 18 درصد افزایش یافته است. پهنای باند تجمعی پیوندهای Infinity Fanout بین شش MCD و GCD 5.4 ترابایت بر ثانیه است. این پهنای باند ضروری است، اگرچه پهنای باند کلی حافظه GDDR6 GPU تنها 960 گیگابایت بر ثانیه است (با سرعت حافظه معیار 20 گیگابیت بر ثانیه). زیرا MCD همچنین شامل بخشی از Infinity Cache است که با سرعت داده بسیار بالاتری نسبت به حافظه GDDR6 کار می کند.

AMD همچنین، برای اولین بار، مقرون به صرفه رویکرد چیپلت برای ساخت پردازنده های مشتری Ryzen خود را توضیح داد. اگر یک تراشه 16 هسته ای رایزن، مانند Ryzen 9 5950X، بر روی یک قالب 7 نانومتری یکپارچه ساخته شده بود، AMD 2.1 برابر بیشتر از رویکرد مبتنی بر تراشه آن که استفاده از دو CCD با 8 هسته 80 میلی متر مربعی جفت شده بود، هزینه می کرد. با قالب ورودی/خروجی 12 نانومتری ارزان تر. زیرا در آن صورت شرکت باید یک تراشه 7 نانومتری بسیار بزرگتر با تمام 16 هسته روی آن، اجزای I/O بسازد. و همچنین به دلیل اندازه آرایه حاصل (در مقایسه با CCD های کوچک) از بازده کمتری رنج می برند.



مرجع اخبار سخت افزار کامپیوترایران