گزارش شده است که انویدیا توسعه پردازنده گرافیکی 72 رک دوگانه GB200 را لغو می کند – تحلیلگر می گوید این شرکت قصد دارد روی ارائه های تک رک تمرکز کند.

Asus ESC AI POD Nvidia GB200 NVL72

به گفته تحلیلگر Ming-Chi Kuo در Medium، انویدیا توسعه NVL36×2 مبتنی بر 72 طرفه GB200 دو رک خود را متوقف می کند تا بر روی NVL72 و NVL36 تک رک تمرکز کند. او یک تحلیلگر معتبر است و به نظر می رسد اطلاعات داخلی در مورد این موضوع دارد. ماشین‌های تک رک NVL36 و NVL72 طبق برنامه‌ریزی به بازار می‌رسند، که گفته می‌شود این تصمیم به دلیل منابع محدود و ترجیحات مشتری است. با این حال، گزارش‌های قبلی نشان می‌داد که NVL36×2 دو رک محبوب‌ترین انتخاب در میان مشتریان انویدیا خواهد بود.

این شرکت در ابتدا قصد داشت سه مدل GB200 را بر اساس پردازنده‌های گرافیکی Blackwell برای بارهای کاری هوش مصنوعی و HPC توسعه دهد: NVL36، NVL72 و NVL36×2. با این حال، مدیریت هر سه پروژه چالش برانگیز شد، به خصوص با توجه به پیچیدگی کار بر روی دو نسخه مختلف 72-GPU (NVL72 و NVL36×2) به طور همزمان. در نتیجه، انویدیا اکنون تنها بر روی NVL72 و NVL36 تمرکز کرده است.

رک GB200 NVL72 انویدیا شامل 18 سینی محاسباتی و 9 سینی NVSwitch (18 سینی NVSwitch ASIC) است که هر کدام دارای دو برد Bianca با یک CPU Grace و دو GPU Blackwell در هر برد هستند. این قدرتمندترین پیشنهاد انویدیا است، هرچند که با مصرف انرژی حدود 120 کیلووات نیز پرانرژی ترین راه حل است.

نیمه آنالیز انتظار می رود این پیکربندی به دلیل نیازهای شدید قدرت و چگالی آن، کاربرد محدودی داشته باشد (قدرت رک معمولی 12 کیلو وات است، در حالی که یک رک مبتنی بر H100 حدود 40 کیلووات مصرف می کند)، که اکثر دیتاسنترها نمی توانند آن را پشتیبانی کنند. با این حال، یک کلاینت بزرگ در حال برنامه ریزی برای استقرار گسترده است، و مینگ-چی کو ادعا می کند که مایکروسافت ترجیح آشکاری برای NVL72 نسبت به NVL36×2 نشان داده است.

GB200 NVL36×2 از دو قفسه متصل به هم تشکیل می شد و در ابتدا پیش بینی می شد که پیکربندی رایج تر باشد. هر رک دارای 18 CPU Grace و 36 GPU Blackwell است که اتصال کامل را در 72 GPU حفظ می کند. با این حال، به 36 NVSwitch ASIC نیاز دارد، بنابراین انرژی بیشتری نسبت به یک NVL72 مصرف می‌کند و عملکرد کمی پایین‌تر ارائه می‌دهد. یک GB200 NVL36×2 برای هر رک 66 کیلووات (در مجموع 132 کیلووات) پیش بینی شده بود که کمی بالاتر از NVL72 است، اگرچه اندازه بزرگتر با دیتاسنترهای موجود سازگارتر است.

GB200 NVL72 بسیار کارآمدتر از GB200 NVL36×2 است. با این حال، اکثر مشتریان انویدیا نمی‌توانند از نیازهای انرژی و چگالی خنک‌کننده NVL72 پشتیبانی کنند. علاوه بر این، طبق گفته مینگ-چی کو، این پیچیدگی ها می تواند ارسال GB200 NVL72 را تا نیمه دوم سال 2025 به تعویق بیندازد. با این حال، گزارش‌های قبلی نشان می‌دهد که برخی از ماشین‌های NVL72 در دسامبر امسال، احتمالاً به مایکروسافت تحویل داده می‌شوند.

مینگ چی کو نوشت: «آخرین بررسی زنجیره تامین من نشان می دهد که تولید انبوه NVL72 ممکن است تا 2H25 (در مقابل هدف خوش بینانه Nvidia در 1H25) به تعویق بیفتد.

در اوایل سال جاری، انویدیا با بسته‌بندی پردازنده‌های گرافیکی B100 و B200 خود برای هوش مصنوعی و HPC با مشکلاتی روبه‌رو شد که باعث شد سخت‌افزار کم‌بازده بلک‌ول را برای پاسخگویی به تقاضا و همچنین اصلاح طراحی این پردازنده‌ها تولید کند. GPU های تصفیه شده قرار است از اواخر اکتبر وارد تولید انبوه شوند، بنابراین در اواخر ژانویه آماده استفاده خواهند شد. در این زمینه، تمرکز بر طراحی NVL72 مبتنی بر GB200 با هدف مشتریانی که به دنبال حداکثر عملکرد هستند، برای انویدیا کاملا منطقی است.

همچنین لازم به ذکر است که سرورهای مبتنی بر x86 با پردازنده‌های بلک‌ول تنها در سال 2025 عرضه می‌شوند. در این مرحله، فاکتورهای شکل این ماشین‌ها ناشناخته باقی مانده‌اند و گزارش‌های اولیه به ماشین‌های NVL72 و NVL36×2 اشاره می‌کنند. به احتمال زیاد اکنون ابتدا روی رک های NVL72 و NVL36 متمرکز شده است و راه حل های شخص ثالث سفارشی بعداً ارائه می شود.

مرجع اخبار سخت افزار کامپیوترایران

تحریریه Techpowerup