هسته تانسور نسل چهارم NVIDIA Ada، هسته RT نسل سوم و آخرین هسته CUDA در یک نگاه



دیروز، NVIDIA سری GeForce RTX 40 خود را بر اساس معماری گرافیکی “Ada” عرضه کرد. ما هنوز یک توضیح فنی در مورد خود معماری و اجزای سخت افزاری مختلف که سیلیکون را تشکیل می دهند دریافت نکرده ایم. اما NVIDIA در وب سایت خود اولین نگاهی به اجزای کلیدی “Ada” یعنی هسته Ada CUDA، هسته Tensor نسل چهارم و هسته RT نسل سوم به ما داده است. علاوه بر پیشرفت‌های نسلی در IPC و سرعت ساعت، آخرین هسته CUDA از SER (ترتیب مجدد اجرای سایه‌بان)، ویژگی سطح SM یا GPC که امواج/رشته‌های اجرا را برای بارگذاری بهینه هر هسته CUDA و بهبود موازی‌سازی مجدداً مرتب می‌کند، بهره می‌برد.

علیرغم استفاده از سخت‌افزار تخصصی مانند هسته‌های RT، خط لوله ردیابی اشعه همچنان برای تعداد کمی از کارها به هسته‌های CUDA و CPU متکی است، و در اینجا NVIDIA ادعا می‌کند که SER به بهبود عملکرد ردیابی پرتوهای 3X کمک می‌کند (سهم عملکرد هسته‌های CUDA). با گرافیک شطرنجی سنتی، SER به بهبود عملکرد قابل توجهی 25٪ کمک می کند. با Ada، NVIDIA نسل چهارم هسته Tensor خود را (بعد از Volta، Turing و Ampere) ارائه می کند. هسته‌های Tensor مستقر در Ada از نظر عملکردی مشابه هسته‌های پردازنده Hopper H100 Tensor Core HPC هستند، با موتور ترانسفورماتور FP8 جدید، که تا 5 برابر عملکرد استنتاج هوش مصنوعی را در مقایسه با نسل قبلی Ampere Tensor Core ارائه می‌کند. یک پرش مشابه با استفاده از صرفه جویی).

نسل سوم RT Core معرفی شده با Ada دو برابر عملکرد تقاطع مثلث پرتوی “Ampere” RT Core را ارائه می دهد و دو جزء سخت افزاری جدید را معرفی می کند: Opacity Micromap Engine (OMM) و موتور Micro-Mesh Displaced (MMD). OMM بافت های آلفای پر استفاده را برای مواردی مانند شاخ و برگ، ذرات و حصارها سرعت می بخشد. در حالی که DMM سرعت ساخت BVH را تا 10 برابر افزایش می دهد. DLSS 3 انحصاری Ada خواهد بود زیرا بر هسته‌های Tensor نسل چهارم و مولفه Optical Flow Accelerator در پردازنده‌های گرافیکی Ada تکیه می‌کند تا وعده ترسیم فریم‌های جدید صرفاً با استفاده از هوش مصنوعی و بدون درگیر کردن خط لوله اصلی رندر گرافیکی را محقق کند.

ما در اسرع وقت نگاه دقیق تری به معماری Ada به شما خواهیم داد.



مرجع اخبار سخت افزار کامپیوترایران