اینتل کتابخانه مرتب‌سازی قدرتمند AVX-512 را منتشر کرد و سرعت 10 تا 17 برابر را ارائه کرد

توسط علی در دوشنبه, فوریه 20, 2023

مهندس اینتل Raghuveer Devulapalli کد NumPy را اصلاح کرد که در روز چهارشنبه در پایگاه کد NumPy ادغام شد. برای انواع داده های جداگانه، پیاده سازی جدید مرتب سازی int 16 بیتی را 17 برابر و مرتب سازی نوع داده 32 بیتی را 12-13x افزایش می دهد، در حالی که مرتب سازی شناور 64 بیتی برای آرایه های تصادفی در 10 ضرب شده است. با استفاده از x86- کد simd-sort، این افزایش سرعت، قدرت AVX-512 و توانایی آن در بهبود عملکرد کتابخانه های مختلف را نشان می دهد. امیدواریم شاهد پیاده‌سازی‌های بیشتری از AVX-512 باشیم، زیرا AMD با قرار دادن عناصر پردازشی AVX-512 در Zen 4 به این حزب پیوسته است.

مرجع اخبار سخت افزار کامپیوترایران

اینتل اخیراً کتابخانه هدر C++ منبع باز خود را برای مرتب‌سازی مبتنی بر SIMD با کارایی بالا به‌روزرسانی کرده است تا از مجموعه دستورالعمل AVX-512 SIMD پشتیبانی کند. با گسترش قابلیت پشتیبانی معمولی AVX2، توابع مرتب‌سازی اکنون افزونه‌های 512 بیتی را برای ارائه عملکرد بهتر پیاده‌سازی می‌کنند. به گفته فورونیکس، کتابخانه NumPy Python برای ریاضیات که زیربنای بسیاری از نرم‌افزارها است، پایگاه نرم‌افزاری خود را برای استفاده از ویژگی مرتب‌سازی تقویت‌شده AVX-512 به‌روزرسانی کرده است که عملکرد فوق‌العاده‌ای را ارائه می‌دهد. این کتابخانه از AVX-512 برای بردار کردن مرتب سازی سریع برای انواع داده های 16 بیتی و 64 بیتی با استفاده از مجموعه دستورالعمل های توسعه یافته استفاده می کند. در مقایسه با سیستم اینتل Tiger Lake، مرتب سازی NumPy شاهد افزایش عملکرد 10 تا 17 برابری بود.

Techpowerup

اینتل کتابخانه مرتب‌سازی قدرتمند AVX-512 را منتشر کرد و سرعت 10 تا 17 برابر را ارائه کرد

نوشته‌های مرتبط

کوالکام اسنپدراگون ایکس را بدون اشاره به Elite به اشتراک می‌گذارد – خبر تراشه دوم ممکن است در 24 آوریل منتشر شود.

تیم SK Hynix و TSMC برای توسعه HBM4

مدیر عامل شرکت TSMC می گوید: TSMC برای ساخت تراشه های خارج از تایوان، از جمله کارخانه های جدید آمریکایی، حق بیمه دریافت می کند.

دسته‌ها