و این دقیقاً همان چیزی است که hyperscalers با آن روبرو است. بسیاری از نمونه ها به طور کامل از DRAM خود استفاده نمی کنند، که استفاده از کل مرکز داده را ناکارآمد می کند. Microsoft Azure، یکی از بزرگترین ارائه دهندگان فضای ابری، اندازه گیری کرده است که 50٪ از تمام ماشین های مجازی هرگز 50٪ از حافظه اجاره شده خود را لمس نمی کنند. این باعث می شود که حافظه در یک ماشین مجازی اجاره ای گیر کند و آن را برای هیچ چیز دیگری غیرقابل استفاده کند.
در Azure، متوجه میشویم که یکی از عوامل اصلی ناکارآمدی DRAM، رشته حافظه در سطح پلتفرم است. رشته حافظه زمانی اتفاق میافتد که هستههای سرور به طور کامل به ماشینهای مجازی (VM) اجاره داده میشوند، اما مقداری حافظه آزاد نشده باقی میماند. با هسته های خالی شده، حافظه باقیمانده به خودی خود غیرقابل آزادسازی است و بنابراین مسدود می شود. با کمال تعجب، متوجه شدیم که حداکثر 25 درصد از DRAM را می توان در هر زمان مسدود کرد.
برای به دست آوردن نتایج بهتر، باید به طراحی های مین فریم نگاه کنیم و رفتار آنها را کپی کنیم. مفهوم ادغام حافظه به گونه ای طراحی شده است که به CPU اجازه می دهد تا بدون اشغال و مسدود کردن DRAM در ماشین های مجازی که به آن نیاز ندارند، به حافظه مورد نیاز خود دسترسی داشته باشد. این توسط پروتکل جدید CXL برای انسجام حافظه پنهان پشتیبانی میشود، که همه فروشندگان اصلی سختافزار آن را در ارائه خود گنجاندهاند. داشتن یک مرکز داده با سخت افزار CXL به شرکت هایی مانند مایکروسافت کمک می کند تا هزینه ها را کاهش دهند. همانطور که شرکت اشاره می کند، “[memory] تفکیک می تواند منجر به کاهش 9 تا 10 درصدی در DRAM کلی شود که نشان دهنده صدها میلیون دلار صرفه جویی برای یک ارائه دهنده ابر بزرگ است.
مایکروسافت تخمین می زند که استفاده از CXL و ادغام حافظه هزینه های مرکز داده را 4 تا 5 درصد در هزینه های سرور کاهش می دهد. این عدد قابل توجهی است زیرا DRAM به تنهایی بیش از 50 درصد هزینه های سرور را مصرف می کند.
وقتی صحبت از عملکرد به میان میآید، تیم Azure چند پیکربندی را که از DRAM محلی و DRAM ادغام شده استفاده میکنند، برای دریافت بهترین نتایج مقایسه کردند. جریمه عملکرد استفاده از حافظه تلفیقی به برنامه بستگی دارد. با این حال، ما می دانیم که دسترسی به حافظه تلفیقی نیاز به تأخیر اضافی 67-87 ns (نان ثانیه) دارد. این یک عملکرد بسیار بزرگ است و باعث می شود تعداد کمی از برنامه ها کند شوند. تقریباً 20٪ از برنامه ها هیچ تأثیری بر عملکرد از حافظه جمع شده دریافت نمی کنند. 23٪ از برنامه ها کمتر از 5٪ کاهش سرعت دریافت می کنند. 25٪ کاهش بیش از 20٪ را تجربه می کنند. در حالی که 12 درصد بیش از 30 درصد تنزل رتبه را تجربه کردند. ارقام عملکرد در زیر قابل مشاهده است.
به گفته مایکروسافت، اینها تنها آزمایشات نسل اولی هستند که بر روی موج اول سخت افزار CXL انجام شده است. نتایج امیدوارکننده هستند زیرا هزینه های ابر را برای hyperscaler کاهش می دهند. با سخت افزار نسل بعدی و مشخصات پروتکل CXL، می توانیم رفتار بسیار بهتری داشته باشیم. برای اطلاعات بیشتر، لطفاً به سندی که این موضوع را با جزئیات بیشتری بررسی می کند، مراجعه کنید.
مرجع اخبار سخت افزار کامپیوترایران