این نسخه جدید از ابزارهای oneAPI به توسعه دهندگان کمک می کند تا از ویژگی های سخت افزاری پیشرفته اینتل استفاده کنند:
- پردازندههای نسل چهارم Intel Xeon Scalable و Xeon CPU Max با افزونههای پیشرفته ماتریس اینتل (Intel AMX)، فناوری کمک سریع اینتل (Intel QAT)، Intel AVX-512، bfloat16 و موارد دیگر.
- پردازندههای گرافیکی مرکز داده اینتل شامل سری Flex با رمزگذار سختافزاری AV1 و پردازندههای گرافیکی سری Max با انعطافپذیری نوع داده، برنامههای افزودنی Intel Xe Matrix (Intel XMX)، موتور برداری، Intel Xe Link و سایر ویژگیها.
نمونه هایی از معیارها:
- استنتاج یادگیری عمیق MLPerf DeepCAM و عملکرد آموزش با CPU Xeon Max افزایش عملکرد 3.6 برابری را نسبت به Nvidia در 2.4 و AMD به عنوان بنچمارک 1.0 با استفاده از Intel AMX فعال شده توسط کتابخانه شبکه عصبی عمیق اینتل oneAPI (oneDNN) نشان داد.
- حجمهای کاری شبیهساز اتمی/مولکولی موازی (LAMMPS) در مقیاس بزرگ که روی پردازنده Xeon Max با هستههای بارگذاری شده روی شش پردازنده گرافیکی سری Max و بهینهسازی شده توسط ابزارهای oneAPI انجام میشود، منجر به افزایش عملکرد تا 16 برابر بهتر از نسل سوم اینتل Xeon یا AMD میلان به تنهایی.
عملکرد نرم افزار پیشرفته:
- کامپایلر فرترن اینتل پشتیبانی کامل از استانداردهای زبان فرترن را تا فرترن 2018 ارائه میکند و پشتیبانی از بارگذاری OpenMP GPU را گسترش میدهد و توسعه برنامههای کاربردی مطابق با استانداردها را تسریع میبخشد.
- کتابخانه هسته ریاضی OneAPI اینتل (oneMKL) با قابلیت آپلود OpenMP توسعه یافته، قابلیت حمل را بهبود می بخشد.
- کتابخانه شبکه عصبی عمیق OneAPI اینتل (oneDNN) ویژگیهای پیشرفته یادگیری عمیق پردازندههای نسل چهارم اینتل Xeon و سری Max، از جمله Intel AMX، Intel AVX-512، VNNI و bfloat16 را فعال میکند.
برای افزایش بهره وری توسعه دهندگان، پشتیبانی غنی از SYCL و انتقال کد قوی و ابزارهای تجزیه و تحلیل، توسعه کد برای سیستم های چند معماری را آسان می کند.
- کامپایلر اینتل oneAPI DPC++/C++ از افزونههای نرمافزار Codeplay جدید برای پردازندههای گرافیکی Nvidia و AMD پشتیبانی میکند تا نوشتن کد SYCL را ساده کرده و قابلیت حمل کد را در این معماریهای پردازنده گسترش دهد. این یک محیط ساخت یکپارچه با ابزارهای یکپارچه برای بهره وری بین پلتفرم فراهم می کند. به عنوان بخشی از این راه حل، اینتل و Codeplay با شروع پلاگین oneAPI برای پردازنده های گرافیکی انویدیا، پشتیبانی از اولویت تجاری را ارائه می دهند.
- انتقال کد CUDA به SYCL اکنون با اضافه شدن بیش از 100 API CUDA به ابزار سازگاری Intel DPC++ که مبتنی بر منبع باز SYCLomatic است، آسانتر شده است.
- کاربران می توانند عدم تعادل MPI در مقیاس بزرگ را با نمایه ساز Intel VTune شناسایی کنند.
- Intel Advisor تجزیه و تحلیل خودکار خط سقف را برای سری Intel Data Center GPU Max اضافه می کند تا تنگناها و علل حافظه، حافظه پنهان یا محاسبات را شناسایی و اولویت بندی کند، با بینش های عملی برای بهینه سازی عملکرد هزینه های استفاده مجدد از CPU به GPU تخلیه می شود.
چرا مهم است: با توجه به اینکه 48٪ از توسعه دهندگان سیستم های ناهمگنی را هدف قرار می دهند که از انواع پردازنده های متعدد استفاده می کنند، برنامه نویسی چند قوس کارآمدتری برای مقابله با دامنه و مقیاس رو به رشد حجم کاری دنیای واقعی مورد نیاز است. استفاده از مدل برنامه نویسی باز و یکپارچه oneAPI با ابزارهای چند قوس مبتنی بر استاندارد اینتل، آزادی انتخاب در سخت افزار، عملکرد، بهره وری و قابلیت حمل کد را برای پردازنده ها و شتاب دهنده ها فراهم می کند. کد نوشته شده برای مدلهای برنامهنویسی اختصاصی، مانند CUDA، قابلیت حمل به سختافزارهای دیگر را ندارد و یک روش توسعهای را ایجاد میکند که سازمانها را در یک اکوسیستم بسته قفل میکند.
درباره پذیرش اکوسیستم oneAPI: ادامه پذیرش اکوسیستم oneAPI با ایجاد مراکز جدید تعالی در حال انجام است. یکی، آزمایشگاه Open Zettascale در دانشگاه کمبریج، بر انتقال نامزدهای مهم کد exascale به oneAPI، از جمله CASTEP، FEniCS، و AREPO تمرکز دارد. این مرکز دورهها و کارگاههایی را با کارشناسانی ارائه میکند که روشها و ابزارهای oneAPI را برای کامپایل و پورت کد و بهینهسازی عملکرد آموزش میدهند. در مجموع 30 مرکز تعالی oneAPI ایجاد شده است.