یک جایگزین آشنا برای AMD برای کابلکشی Infinity Fabric Fanout استفاده از رویکرد بستهبندی سه بعدی، با استفاده از یک interposer سیلیکونی (قالبی که کابلکشی میکروسکوپی با چگالی بالا را بین قالبهای چیده شده روی آن تسهیل میکند) بود. پردازندههای گرافیکی قدیمیتر AMD MCM از interposer برای اتصال تراشههای GPU و پشتههای HBM استفاده میکردند. Interposer یک راه بسیار گران برای ساخت یک GPU مشتری با فضایی برای کاهش قیمت در آینده است، زیرا به تنهایی یک تراشه بزرگ کلاس 55 نانومتری است که برای عمل به عنوان PCB طراحی شده است.
نقطه ضعف آشکار پوسیدگی تراشه منطقی یکپارچه تأخیر است که به ویژه برای یک GPU بسیار مهم است. اگرچه شرکت مشخص نمی کند، انتقال کنترلرهای حافظه به MCD ها به جای روشن کردن آنها (مانند “Navi 21”) “مقدار متوسطی از تاخیر” را اضافه کرد. AMD می گوید سعی کرده است با افزایش سرعت ساعت بر این تأخیر غلبه کند. ساعت پایه فابریک Infinity 43 درصد بالاتر از «Navi 21» است و ساعت های بازی (ساعت های موتور سایه زن) نسل به نسل 18 درصد افزایش یافته است. پهنای باند تجمعی پیوندهای Infinity Fanout بین شش MCD و GCD 5.4 ترابایت بر ثانیه است. این پهنای باند ضروری است، اگرچه پهنای باند کلی حافظه GDDR6 GPU تنها 960 گیگابایت بر ثانیه است (با سرعت حافظه معیار 20 گیگابیت بر ثانیه). زیرا MCD همچنین شامل بخشی از Infinity Cache است که با سرعت داده بسیار بالاتری نسبت به حافظه GDDR6 کار می کند.
AMD همچنین، برای اولین بار، مقرون به صرفه رویکرد چیپلت برای ساخت پردازنده های مشتری Ryzen خود را توضیح داد. اگر یک تراشه 16 هسته ای رایزن، مانند Ryzen 9 5950X، بر روی یک قالب 7 نانومتری یکپارچه ساخته شده بود، AMD 2.1 برابر بیشتر از رویکرد مبتنی بر تراشه آن که استفاده از دو CCD با 8 هسته 80 میلی متر مربعی جفت شده بود، هزینه می کرد. با قالب ورودی/خروجی 12 نانومتری ارزان تر. زیرا در آن صورت شرکت باید یک تراشه 7 نانومتری بسیار بزرگتر با تمام 16 هسته روی آن، اجزای I/O بسازد. و همچنین به دلیل اندازه آرایه حاصل (در مقایسه با CCD های کوچک) از بازده کمتری رنج می برند.
مرجع اخبار سخت افزار کامپیوترایران
گام اول در از هم پاشیدن یک GPU رده بالا بدون آسیب رساندن به عملکرد، زمان فریم و ویژگی های قدرت/حرارتی آن. شناسایی اجزای خاصی روی سیلیکون است که می تواند به تراشه تبدیل شود، که می تواند با یک گره ریخته گری قدیمی تر کار کند. برای یک پردازنده سرور EPYC، حتی با 9 تا 12 تراشه، شرکت فقط باید صدها مسیر سیگنال را از طریق بستر مدیریت کند تا تراشه ها را به هم متصل کند. یک GPU گسسته سطح بالا بسیار پیچیدهتر است و مقیاس این مسیرهای سیگنال بین تراشهای هزاران است (در مورد سیلیکون RDNA2 قدیمیتر “Navi 21”). با بزرگتر “Navi 31” RDNA3، این تعداد فقط افزایش خواهد یافت. این شرکت اجزایی را شناسایی کرد که حداقل یک سوم از ناحیه تراشه را تشکیل میدادند که از انتقال به EUV 5 نانومتری بهرهای نخواهند برد – اینها شامل کنترلکنندههای حافظه GDDR6، حافظه PHY و حافظه کش Infinity هستند. موتورها).
AMD در ارائه فنی خود از پردازنده گرافیکی جدید سری Radeon RX 7900 “Navi 31” به ما توضیح داد که چرا باید راه چیپلت ها را برای پردازنده های گرافیکی رده بالا، دستگاه هایی بسیار پیچیده تر از CPU ها، طی کند. این شرکت همچنین در مورد آنچه که بستههای مبتنی بر تراشه را از ماژولهای چند تراشهای معمولی (MCM) جدا میکند، روشن کرد. یک MCM مجموعهای است که از چندین دستگاه مستقل تشکیل شده است که از یک بستر فایبرگلاس استفاده میکنند.
نمونه ای از MCM یک پردازنده Intel Core موبایل است که در آن تراشه CPU و تراشه PCH یک بستر مشترک دارند. در اینجا CPU و PCH تکههای مستقلی از سیلیکون هستند که در غیر این صورت ممکن است در بستههای خود وجود داشته باشند (همانطور که در پلتفرم دسکتاپ وجود دارند)، اما روی یک بستر واحد جفت شدهاند تا ردپای PCB را به حداقل برسانند، که در موبایل ارزشمند است. سکو. یک دستگاه مبتنی بر تراشه، دستگاهی است که در آن یک بستر از تراشههای متعددی تشکیل شده است که در غیر این صورت نمیتوانند به طور مستقل روی بستههای خودشان بدون تأثیر بر پهنای باند یا تأخیر بین تراشهها وجود داشته باشند. آنها اساساً اجزایی هستند که باید روی یک قالب یکپارچه باشند، اما به قالب های جداگانه ساخته شده بر روی گره های ریخته گری نیمه هادی مختلف، با انگیزه صرفاً هزینه محور، تجزیه می شوند.
چرخش AMD به تراشهها به دلیل افزایش هزینههای ویفرهای نیمهرسانا است زیرا فرآیند تولید سیلیکون به اندازه ترانزیستور افزایش مییابد. اگرچه AMD 13 سال پیش به یک شرکت بیسابقه تبدیل شد، اما با Globalfoundries، بخش ریختهگری سابق AMD که ایجاد کرده بود، معامله راحت داشت. این شرکت به تامین پردازندهها از Globalfoundries تا گرههای FinFET کلاس 14 نانومتری-12 نانومتری ادامه داده است، و اگرچه Globalfoundries در ابتدا قصد داشت یک گره زیر 10 نانومتری ایجاد کند که با TSMC 7 نانومتری و سامسونگ 8 نانومتری رقابت کند. این طرح ها شکست خورد AMD با TSMC رابطه داشت و از آنجا پردازندههای گرافیکی Radeon خود را ساخت. از آنجایی که TSMC بهترین گره کلاس 7 نانومتری و توانایی افزایش تولید را داشت. این شرکت بزرگترین شرط بندی خود را با ساخت پردازنده های 7 نانومتری انجام داده است.
AMD تنها مشتری TSMC نیست، و این شرکت به زودی متوجه شد که نمیتواند پردازندههای هستهای بالا را بر روی قالبهای یکپارچه 7 نانومتری بسازد. همچنین نمیتوانست کاری را که با EPYC “Naples” انجام داد، که در اصل MCMهای “4P روی چوب” بودند، با فضای قالب هدر رفته برای قطعات اضافی انجام داد. بنابراین او پردازنده را متلاشی کرد. مولفه هایی که می توانند بیشترین بهره را از کوچک شدن تا 7 نانومتر ببرند. هستههای پردازنده روی قالبهای کوچکی ساخته میشوند که هر کدام حاوی 8 هسته پردازشی است که شرکت آنها را آرایههای پردازشگر پیچیده (CCD) مینامد. هر چه تراشه کوچکتر باشد، بازده هر ویفر بیشتر می شود، و بنابراین شرکت تصمیم گرفت که یک قطعه سیلیکونی 80 میلی متر مربعی با 8 هسته CPU با یک تراشه جداگانه که شامل تمام اجزایی است که می تواند بر روی یک گره کمی قدیمی تر با کمترین تأثیر ایجاد کند صحبت کند. در مورد ویژگی های انرژی/حرارتی کلی محصول. این ماتریس I/O نامیده می شود. AMD به ساخت هر دو محصول کلاینت Ryzen و سرور EPYC با این رویکرد ادامه خواهد داد، زیرا CCD های 8 هسته ای در هر دو خط تولید مشترک بودند. پردازنده دسکتاپ مشتری دارای یک تراشه ورودی/خروجی کوچکتر متناسب با پلتفرم است که آن را cIOD (تراشه ورودی/خروجی مشتری) می نامد، در حالی که بخش سرور، با قابلیت اتصال به تعداد بیشتری CCD، نامیده می شود. sIOD (تراشه ورودی/خروجی سرور). AMD در سه سال گذشته به منابع ورودی/خروجی از Globalfoundries در گره 12 نانومتری خود ادامه داده است. AMD با جدیدترین پردازندههای نسل چهارم Ryzen 7000 و EPYC مبتنی بر Zen 4، CCDها را بر روی گره 5 نانومتری EUV میسازد، در حالی که دایهای ورودی/خروجی بر روی گره 6 نانومتری کمتر پیشرفته ساخته شدهاند.
پردازندههای گرافیکی با رابطهای حافظه گستردهتر از 64 بیت، تمایل دارند از چندین کنترلر حافظه 64 بیتی استفاده کنند که برای ایجاد یک رابط حافظه گستردهتر (مانند 128 بیت، 256 بیت، 384 بیت و غیره) به هم متصل میشوند. این مورد در مورد AMD و NVIDIA است. بنابراین AMD تصمیم گرفت که نه تنها کنترلکنندههای حافظه جدا باشند، بلکه هر کنترلکننده حافظه با مسیر حافظه 64 بیتی، چیپلت خودش باشد و یک بخش 16 مگابایتی از حافظه نهان بینهایت 96 مگابایتی GPU داشته باشد. این کنترلر حافظه + چیپلت حافظه نهان، آرایه کش حافظه (MCD) نامیده می شود. در حالی که بقیه GPU با اجزای منطقی هاردکور خود که در واقع از EUV 5 نانومتری بهره میبرند، به یک قالب متمرکز بزرگتر به نام Graphics Compute Die (GCD) تبدیل میشوند. پردازنده گرافیکی “Navi 31” دارای یک رابط حافظه 384 بیتی GDDR6 است، بنابراین شش MCD وجود دارد. با فرض اینکه AMD حتی برای پردازندههای گرافیکی کوچکتر خود به طراحی چیپلتها پایبند است، میتواند به سادگی از تعداد کمتری MCD برای دستیابی به رابطهای حافظه فشردهتر مانند ۲۵۶ بیت (۴ برابر MCD)، ۱۹۲ بیت (۳ برابر MCD) یا ۱۲۸ بیت (۲ برابر) استفاده کند. MCD).
در حالی که اتصال بین GCD و MCD هنوز Infinity Fabric است، AMD مجبور شد یک فناوری کابلکشی لایه فیزیکی جدید را توسعه دهد که از بستر فایبرگلاس ارگانیک موجود استفاده میکند تا به نوع تراکم کابلکشی بالا مورد نیاز برای هزاران مسیر سیگنال دست یابد. این شرکت لایه فیزیکی جدید Infinity Fanout Link را توسعه داده است که از تعداد زیادی لینک IF با سرعت 9.2 گیگابیت بر ثانیه با کابلکشی فنآوت استفاده میکند تا 10 برابر تراکم کابلکشی بین GCD و MCD در مقایسه با لایه فیزیکی IFOP استفاده شود. یک پردازنده CCD “Zen” را با IOD وصل کنید. فن اوت تکنیکی است برای به دست آوردن تعداد زیادی اثر با طول مساوی بین دو نقطه، جایی که امکان قرار دادن آنها در خطوط مستقیم وجود ندارد. بنابراین آنها به گونه ای طراحی شده اند که در امتداد موانع (مانند vias) پیچ و تاب داشته باشند که طول ردیابی برابر مورد نیاز برای حفظ یکپارچگی سیگنال را به خطر نیندازد.
سریع به جلو، و AMD خود را با مشکل GPU های Radeon خود مواجه کرد. این شرکت از فروش پردازندههای گرافیکی مجزا به اندازه پردازندههای مرکزی (مشتری + سرور) درآمد کسب نمیکند، بنابراین کاهش هزینههای ساخت بدون از دست دادن رقابت در برابر NVIDIA، حتی بیشتر است. با نسل GeForce “Ada Lovelace”، NVIDIA همچنان بر روی سیلیکون یکپارچه برای پردازندههای گرافیکی شرط میبندد، حتی بزرگترین تراشه AD102 خود را مانند یک GPU کلاسیک یکپارچه میسازد. این به AMD فرصتی می دهد تا هزینه تولید پردازنده های گرافیکی خود را کاهش دهد، که می تواند به آن اجازه دهد تا در تلاش برای به دست آوردن سهم بازار، جنگ قیمتی علیه NVIDIA به راه بیندازد. یک مثال قیمت نسبتاً تهاجمی است که AMD برای Radeon RX 7900 XTX با قیمت 999 دلار استفاده می کند. و RX 7900 XT 899 دلاری، که شرکت می گوید آنچه را که برای مبارزه با RTX 4080 1199 دلاری NVIDIA لازم است و احتمالاً در برخی از بهترین سناریوها با RTX 4090 1599 دلاری معامله می کند، دارد.