NVIDIA H100 یک هیولای محاسباتی با 80 میلیارد ترانزیستور، عناصر محاسباتی جدید و حافظه HBM3 است.

NVIDIA H100 یک هیولای محاسباتی با 80 میلیارد ترانزیستور، عناصر محاسباتی جدید و حافظه HBM3 است.

در جریان سخنرانی اصلی GTC 2022، NVIDIA جدیدترین افزوده خود را به خانواده کارت های شتاب دهنده اعلام کرد. این شتاب دهنده NVIDIA H100 نامیده می شود و قدرتمندترین ساخته این شرکت است. به گفته انویدیا، H100 با استفاده از 80 میلیارد ترانزیستور 4 نانومتری 4N TSMC می‌تواند عملکردی دیوانه‌کننده ایجاد کند. با طراحی نسل چهارم Tensor Core جدید، می‌تواند عملکردی شش برابر بیشتر از هسته‌های Tensor A100 داشته باشد و بهبود MMA (Matrix Multiply Accumulate) را دو برابر کند. علاوه بر این، دستورالعمل‌های جدید DPX الگوریتم‌های برنامه‌نویسی پویا را در مقایسه با شتاب‌دهنده قدیمی‌تر A100 تا هفت برابر تسریع می‌کنند. به لطف معماری جدید Hopper، ساختار ماژول جریان برای انتقال بهتر بلوک های داده بزرگ بهینه شده است. اجرای کامل تراشه GH100 شامل 144 SM و 128 هسته FP32 CUDA در هر SM است که منجر به 18432 هسته CUDA با حداکثر پیکربندی می شود. پردازنده گرافیکی NVIDIA H100 با فرم فاکتور کارت SXM5 دارای 132 اس ام اس، مجموعا 16896 هسته CUDA است، در حالی که کارت توسعه PCIe 5.0 دارای 114 اس ام اس، در مجموع 14،592 هسته CUDA است. کمتر از 80 گیگابایت حافظه HMB3، GPU را با پهنای باند 3 ترابایت بر ثانیه احاطه کرده است. جالب توجه است که نوع SXM5 دارای TDP بسیار بزرگ 700 وات است، در حالی که کارت PCIe به 350 وات محدود شده است. این نتیجه راه حل های خنک کننده بهتر ارائه شده برای فاکتور فرم SXM است. وقتی صحبت از ارقام عملکرد به میان می آید، نسخه های SXM و PCIe دو رقم مجزا برای هر پیاده سازی ارائه می دهند. در زیر می توانید برآوردهای عملکرد را در حالت های مختلف دقت مشاهده کنید. در این مقاله سفید که توسط NVIDIA منتشر شده است، می توانید در مورد معماری Hopper و ویژگی های خاص آن اطلاعات بیشتری کسب کنید.

NVIDIA H100



مرجع اخبار سخت افزار کامپیوترایران

تحریریه Techpowerup