به گفته تحلیلگر Ming-Chi Kuo در Medium، انویدیا توسعه NVL36×2 مبتنی بر 72 طرفه GB200 دو رک خود را متوقف می کند تا بر روی NVL72 و NVL36 تک رک تمرکز کند. او یک تحلیلگر معتبر است و به نظر می رسد اطلاعات داخلی در مورد این موضوع دارد. ماشینهای تک رک NVL36 و NVL72 طبق برنامهریزی به بازار میرسند، که گفته میشود این تصمیم به دلیل منابع محدود و ترجیحات مشتری است. با این حال، گزارشهای قبلی نشان میداد که NVL36×2 دو رک محبوبترین انتخاب در میان مشتریان انویدیا خواهد بود.
این شرکت در ابتدا قصد داشت سه مدل GB200 را بر اساس پردازندههای گرافیکی Blackwell برای بارهای کاری هوش مصنوعی و HPC توسعه دهد: NVL36، NVL72 و NVL36×2. با این حال، مدیریت هر سه پروژه چالش برانگیز شد، به خصوص با توجه به پیچیدگی کار بر روی دو نسخه مختلف 72-GPU (NVL72 و NVL36×2) به طور همزمان. در نتیجه، انویدیا اکنون تنها بر روی NVL72 و NVL36 تمرکز کرده است.
رک GB200 NVL72 انویدیا شامل 18 سینی محاسباتی و 9 سینی NVSwitch (18 سینی NVSwitch ASIC) است که هر کدام دارای دو برد Bianca با یک CPU Grace و دو GPU Blackwell در هر برد هستند. این قدرتمندترین پیشنهاد انویدیا است، هرچند که با مصرف انرژی حدود 120 کیلووات نیز پرانرژی ترین راه حل است.
نیمه آنالیز انتظار می رود این پیکربندی به دلیل نیازهای شدید قدرت و چگالی آن، کاربرد محدودی داشته باشد (قدرت رک معمولی 12 کیلو وات است، در حالی که یک رک مبتنی بر H100 حدود 40 کیلووات مصرف می کند)، که اکثر دیتاسنترها نمی توانند آن را پشتیبانی کنند. با این حال، یک کلاینت بزرگ در حال برنامه ریزی برای استقرار گسترده است، و مینگ-چی کو ادعا می کند که مایکروسافت ترجیح آشکاری برای NVL72 نسبت به NVL36×2 نشان داده است.
GB200 NVL36×2 از دو قفسه متصل به هم تشکیل می شد و در ابتدا پیش بینی می شد که پیکربندی رایج تر باشد. هر رک دارای 18 CPU Grace و 36 GPU Blackwell است که اتصال کامل را در 72 GPU حفظ می کند. با این حال، به 36 NVSwitch ASIC نیاز دارد، بنابراین انرژی بیشتری نسبت به یک NVL72 مصرف میکند و عملکرد کمی پایینتر ارائه میدهد. یک GB200 NVL36×2 برای هر رک 66 کیلووات (در مجموع 132 کیلووات) پیش بینی شده بود که کمی بالاتر از NVL72 است، اگرچه اندازه بزرگتر با دیتاسنترهای موجود سازگارتر است.
GB200 NVL72 بسیار کارآمدتر از GB200 NVL36×2 است. با این حال، اکثر مشتریان انویدیا نمیتوانند از نیازهای انرژی و چگالی خنککننده NVL72 پشتیبانی کنند. علاوه بر این، طبق گفته مینگ-چی کو، این پیچیدگی ها می تواند ارسال GB200 NVL72 را تا نیمه دوم سال 2025 به تعویق بیندازد. با این حال، گزارشهای قبلی نشان میدهد که برخی از ماشینهای NVL72 در دسامبر امسال، احتمالاً به مایکروسافت تحویل داده میشوند.
مینگ چی کو نوشت: «آخرین بررسی زنجیره تامین من نشان می دهد که تولید انبوه NVL72 ممکن است تا 2H25 (در مقابل هدف خوش بینانه Nvidia در 1H25) به تعویق بیفتد.
در اوایل سال جاری، انویدیا با بستهبندی پردازندههای گرافیکی B100 و B200 خود برای هوش مصنوعی و HPC با مشکلاتی روبهرو شد که باعث شد سختافزار کمبازده بلکول را برای پاسخگویی به تقاضا و همچنین اصلاح طراحی این پردازندهها تولید کند. GPU های تصفیه شده قرار است از اواخر اکتبر وارد تولید انبوه شوند، بنابراین در اواخر ژانویه آماده استفاده خواهند شد. در این زمینه، تمرکز بر طراحی NVL72 مبتنی بر GB200 با هدف مشتریانی که به دنبال حداکثر عملکرد هستند، برای انویدیا کاملا منطقی است.
همچنین لازم به ذکر است که سرورهای مبتنی بر x86 با پردازندههای بلکول تنها در سال 2025 عرضه میشوند. در این مرحله، فاکتورهای شکل این ماشینها ناشناخته باقی ماندهاند و گزارشهای اولیه به ماشینهای NVL72 و NVL36×2 اشاره میکنند. به احتمال زیاد اکنون ابتدا روی رک های NVL72 و NVL36 متمرکز شده است و راه حل های شخص ثالث سفارشی بعداً ارائه می شود.
مرجع اخبار سخت افزار کامپیوترایران
تحریریه Techpowerup