مهندس اینتل Raghuveer Devulapalli کد NumPy را اصلاح کرد که در روز چهارشنبه در پایگاه کد NumPy ادغام شد. برای انواع داده های جداگانه، پیاده سازی جدید مرتب سازی int 16 بیتی را 17 برابر و مرتب سازی نوع داده 32 بیتی را 12-13x افزایش می دهد، در حالی که مرتب سازی شناور 64 بیتی برای آرایه های تصادفی در 10 ضرب شده است. با استفاده از x86- کد simd-sort، این افزایش سرعت، قدرت AVX-512 و توانایی آن در بهبود عملکرد کتابخانه های مختلف را نشان می دهد. امیدواریم شاهد پیادهسازیهای بیشتری از AVX-512 باشیم، زیرا AMD با قرار دادن عناصر پردازشی AVX-512 در Zen 4 به این حزب پیوسته است.
اینتل کتابخانه مرتبسازی قدرتمند AVX-512 را منتشر کرد و سرعت 10 تا 17 برابر را ارائه کرد
مرجع اخبار سخت افزار کامپیوترایران
اینتل اخیراً کتابخانه هدر C++ منبع باز خود را برای مرتبسازی مبتنی بر SIMD با کارایی بالا بهروزرسانی کرده است تا از مجموعه دستورالعمل AVX-512 SIMD پشتیبانی کند. با گسترش قابلیت پشتیبانی معمولی AVX2، توابع مرتبسازی اکنون افزونههای 512 بیتی را برای ارائه عملکرد بهتر پیادهسازی میکنند. به گفته فورونیکس، کتابخانه NumPy Python برای ریاضیات که زیربنای بسیاری از نرمافزارها است، پایگاه نرمافزاری خود را برای استفاده از ویژگی مرتبسازی تقویتشده AVX-512 بهروزرسانی کرده است که عملکرد فوقالعادهای را ارائه میدهد. این کتابخانه از AVX-512 برای بردار کردن مرتب سازی سریع برای انواع داده های 16 بیتی و 64 بیتی با استفاده از مجموعه دستورالعمل های توسعه یافته استفاده می کند. در مقایسه با سیستم اینتل Tiger Lake، مرتب سازی NumPy شاهد افزایش عملکرد 10 تا 17 برابری بود.