ابزارهای جدید Intel oneAPI 2023 ارزش سخت افزار آینده اینتل را به حداکثر می رساند



امروز، اینتل از انتشار ابزارهای OneAPI اینتل در سال 2023 خبر داد – که در Intel Developer Cloud موجود است و از طریق کانال‌های توزیع معمولی مستقر می‌شود. ابزارهای جدید oneAPI 2023 از نسل چهارم پردازنده های مقیاس پذیر Intel Xeon Scalable، سری Intel Xeon CPU Max و پردازنده های گرافیکی Intel Data Center، از جمله سری Flex و سری جدید Max پشتیبانی می کنند. این ابزارها عملکرد و بهره‌وری را بهبود می‌بخشند و همچنین از افزونه‌های Codeplay جدید پشتیبانی می‌کنند که نوشتن کد SYCL برای معماری‌های غیر اینتل را برای توسعه‌دهندگان آسان‌تر از همیشه می‌کند. این ابزارهای مبتنی بر استاندارد، انتخاب سخت افزاری را فراهم می کنند و توسعه برنامه های کاربردی با کارایی بالا را که بر روی سیستم های چند معماری اجرا می شوند، تسهیل می کنند.

“ما شاهد نتایج اولیه دلگرم کننده ای در عملکرد برنامه های کاربردی در سیستم های توسعه خود با استفاده از شتاب دهنده های پردازنده گرافیکی Intel Max Series هستیم – برنامه هایی که با کامپایلرها و کتابخانه های oneAPI اینتل ساخته شده اند. برای علم کامپیوتر پیشرفته، ما از مزایای قابل حمل بودن کد از چند فروشنده و معماری چندگانه قدردانی می کنیم. استانداردهای برنامه نویسی مانند چارچوب های SYCL و Python AI مانند PyTorch که توسط کتابخانه های اینتل تسریع شده است. ما منتظر اولین اکتشافات علمی مقیاس بزرگ این فناوری ها در سیستم Aurora در سال آینده هستیم.
-تیموتی ویلیامز، معاون مدیر بخش علوم کامپیوتر Argonne

آنچه که ابزارهای oneAPI ارائه می‌دهند: ابزارهای توسعه‌دهنده اینتل 2023 شامل مجموعه‌ای جامع از جدیدترین کامپایلرها و کتابخانه‌ها، ابزارهای تحلیل و انتقال، و چارچوب‌های هوش مصنوعی (AI) و یادگیری ماشینی است که برای ایجاد برنامه‌های با کارایی بالا و چند قوس برای پردازنده‌ها، پردازنده‌های گرافیکی بهینه شده‌اند. و FPGA ها. ، توسط یک API طراحی شده است. این ابزارها به توسعه دهندگان این امکان را می دهد که به سرعت به اهداف عملکرد برسند و با استفاده از یک پایگاه کد واحد در زمان صرفه جویی کنند و زمان بیشتری برای نوآوری باقی بگذارند.

این نسخه جدید از ابزارهای oneAPI به توسعه دهندگان کمک می کند تا از ویژگی های سخت افزاری پیشرفته اینتل استفاده کنند:

  • پردازنده‌های نسل چهارم Intel Xeon Scalable و Xeon CPU Max با افزونه‌های پیشرفته ماتریس اینتل (Intel AMX)، فناوری کمک سریع اینتل (Intel QAT)، Intel AVX-512، bfloat16 و موارد دیگر.
  • پردازنده‌های گرافیکی مرکز داده اینتل شامل سری Flex با رمزگذار سخت‌افزاری AV1 و پردازنده‌های گرافیکی سری Max با انعطاف‌پذیری نوع داده، برنامه‌های افزودنی Intel Xe Matrix (Intel XMX)، موتور برداری، Intel Xe Link و سایر ویژگی‌ها.

نمونه هایی از معیارها:

  • استنتاج یادگیری عمیق MLPerf DeepCAM و عملکرد آموزش با CPU Xeon Max افزایش عملکرد 3.6 برابری را نسبت به Nvidia در 2.4 و AMD به عنوان بنچمارک 1.0 با استفاده از Intel AMX فعال شده توسط کتابخانه شبکه عصبی عمیق اینتل oneAPI (oneDNN) نشان داد.
  • حجم‌های کاری شبیه‌ساز اتمی/مولکولی موازی (LAMMPS) در مقیاس بزرگ که روی پردازنده Xeon Max با هسته‌های بارگذاری شده روی شش پردازنده گرافیکی سری Max و بهینه‌سازی شده توسط ابزارهای oneAPI انجام می‌شود، منجر به افزایش عملکرد تا 16 برابر بهتر از نسل سوم اینتل Xeon یا AMD میلان به تنهایی.

عملکرد نرم افزار پیشرفته:

  • کامپایلر فرترن اینتل پشتیبانی کامل از استانداردهای زبان فرترن را تا فرترن 2018 ارائه می‌کند و پشتیبانی از بارگذاری OpenMP GPU را گسترش می‌دهد و توسعه برنامه‌های کاربردی مطابق با استانداردها را تسریع می‌بخشد.
  • کتابخانه هسته ریاضی OneAPI اینتل (oneMKL) با قابلیت آپلود OpenMP توسعه یافته، قابلیت حمل را بهبود می بخشد.
  • کتابخانه شبکه عصبی عمیق OneAPI اینتل (oneDNN) ویژگی‌های پیشرفته یادگیری عمیق پردازنده‌های نسل چهارم اینتل Xeon و سری Max، از جمله Intel AMX، Intel AVX-512، VNNI و bfloat16 را فعال می‌کند.

برای افزایش بهره وری توسعه دهندگان، پشتیبانی غنی از SYCL و انتقال کد قوی و ابزارهای تجزیه و تحلیل، توسعه کد برای سیستم های چند معماری را آسان می کند.

  • کامپایلر اینتل oneAPI DPC++/C++ از افزونه‌های نرم‌افزار Codeplay جدید برای پردازنده‌های گرافیکی Nvidia و AMD پشتیبانی می‌کند تا نوشتن کد SYCL را ساده کرده و قابلیت حمل کد را در این معماری‌های پردازنده گسترش دهد. این یک محیط ساخت یکپارچه با ابزارهای یکپارچه برای بهره وری بین پلتفرم فراهم می کند. به عنوان بخشی از این راه حل، اینتل و Codeplay با شروع پلاگین oneAPI برای پردازنده های گرافیکی انویدیا، پشتیبانی از اولویت تجاری را ارائه می دهند.
  • انتقال کد CUDA به SYCL اکنون با اضافه شدن بیش از 100 API CUDA به ابزار سازگاری Intel DPC++ که مبتنی بر منبع باز SYCLomatic است، آسان‌تر شده است.
  • کاربران می توانند عدم تعادل MPI در مقیاس بزرگ را با نمایه ساز Intel VTune شناسایی کنند.
  • Intel Advisor تجزیه و تحلیل خودکار خط سقف را برای سری Intel Data Center GPU Max اضافه می کند تا تنگناها و علل حافظه، حافظه پنهان یا محاسبات را شناسایی و اولویت بندی کند، با بینش های عملی برای بهینه سازی عملکرد هزینه های استفاده مجدد از CPU به GPU تخلیه می شود.

چرا مهم است: با توجه به اینکه 48٪ از توسعه دهندگان سیستم های ناهمگنی را هدف قرار می دهند که از انواع پردازنده های متعدد استفاده می کنند، برنامه نویسی چند قوس کارآمدتری برای مقابله با دامنه و مقیاس رو به رشد حجم کاری دنیای واقعی مورد نیاز است. استفاده از مدل برنامه نویسی باز و یکپارچه oneAPI با ابزارهای چند قوس مبتنی بر استاندارد اینتل، آزادی انتخاب در سخت افزار، عملکرد، بهره وری و قابلیت حمل کد را برای پردازنده ها و شتاب دهنده ها فراهم می کند. کد نوشته شده برای مدل‌های برنامه‌نویسی اختصاصی، مانند CUDA، قابلیت حمل به سخت‌افزارهای دیگر را ندارد و یک روش توسعه‌ای را ایجاد می‌کند که سازمان‌ها را در یک اکوسیستم بسته قفل می‌کند.

درباره پذیرش اکوسیستم oneAPI: ادامه پذیرش اکوسیستم oneAPI با ایجاد مراکز جدید تعالی در حال انجام است. یکی، آزمایشگاه Open Zettascale در دانشگاه کمبریج، بر انتقال نامزدهای مهم کد exascale به oneAPI، از جمله CASTEP، FEniCS، و AREPO تمرکز دارد. این مرکز دوره‌ها و کارگاه‌هایی را با کارشناسانی ارائه می‌کند که روش‌ها و ابزارهای oneAPI را برای کامپایل و پورت کد و بهینه‌سازی عملکرد آموزش می‌دهند. در مجموع 30 مرکز تعالی oneAPI ایجاد شده است.



مرجع اخبار سخت افزار کامپیوترایران