یک جفت لیست بنچمارک SiSoftware از دو پردازنده گرافیکی جدید اینتل با 10 و 12 هسته Xe و 12 گیگابایت VRAM در هر دو نتیجه رونمایی کرده اند. ممکن است این دو پردازنده گرافیکی کارتهای گرافیکی Battlemage آینده باشند، اگرچه سرعت کلاک نسبتاً پایین و تعداد هستههای محدود فضایی برای بحث باقی میگذارد. آنها همچنین می توانند پیکربندی های جایگزین کیمیاگر، فهرست های جعلی یا حتی راه حل های گرافیکی یکپارچه بالقوه باشند. اما بیایید در مورد آنچه در حال حاضر می دانیم صحبت کنیم.
Battlemage جانشین آتی Arc Alchemist است که در بازار کارتهای گرافیک اختصاصی هدف قرار خواهد گرفت. همچنین به عنوان یک راه حل گرافیکی یکپارچه در آینده برای معماری های CPU آینده اینتل (از جمله Lunar Lake) استفاده خواهد شد. شایعه شده است که اینتل تاریخ انتشار Q3 2024 را هدف قرار داده است، که به خوبی مطابقت دارد و این یک نشت احتمالی Battlemage است.
با توجه به لیست SiSoftware، مشخصات هر دو GPU به ظاهر غیر قابل توجه است. کمترین قدرت را ارائه می دهد که فقط 1440 ALU سایه زن دارد، در حالی که SKU قوی تر دارای 1728 ALU سایه زن است. برای در نظر گرفتن این موضوع، Arc A580 دارای 3456 سایه زن است، در حالی که Arc A380 این رقم را به 1024 شیدر کاهش می دهد. اما کنجکاوی های دیگری برای بحث وجود دارد. بسته به تعداد شیدرهای موجود در هر هسته Xe، در نهایت با 10 و 12 هسته Xe یا به طور بالقوه 20 و 24 هسته Xe میشویم. اینکه کدام پاسخ صحیح است، بسیار مهم است، همانطور که در زیر به آن خواهیم پرداخت.
سرعت کلاک نیز به طرز چشمگیری پایین است و تنها 1.8 گیگاهرتز است که مسلماً می تواند به دلیل آزمایشات اولیه سیلیکون و راننده باشد. تنها مشخصات تا حدودی بالاتر این است که هر دو دارای 12 گیگابایت VRAM هستند که بهتر از 8 گیگابایت موجود در پردازندههای گرافیکی میان رده A580 و A750 است. با این حال، این کارتها از تراشههای 1 گیگابایتی با رابط 256 بیتی استفاده میکنند، بنابراین هنوز ممکن است این کارتها Alchemist باشند که فقط با تراشههای 2 گیگابایتی و رابط 192 بیتی پیکربندی شدهاند.
و سپس 8 مگابایت حافظه نهان L2 وجود دارد. این عدد برای یک کارت 12 گیگابایتی کمی عجیب است، زیرا پردازندههای گرافیکی Alchemist اینتل 4 مگابایت یا 2 مگابایت در هر کنترلر 64 بیتی دارند. A750 و A770 هر دو دارای 16 مگابایت حافظه نهان L2 هستند در حالی که A580 دارای 8 مگابایت است، اما مشخص نیست که چگونه تراشههایی با رابط احتمالاً 192 بیتی میتوانند به 8 مگابایت کش برسند – 2.67 مگابایت در هر رابط 64 بیتی بعید به نظر میرسد. و چنین مقدار کمی از L2 نیز برای معماری آینده Battlemage منطقی نیست. البته، حافظه نهان L2 را می توان از رابط های حافظه جدا کرد، و اینتل ممکن است حافظه نهان L3 داشته باشد که در این نتایج “درز” نشان داده نمی شود، اما ما به طور قطع نمی دانیم.
در مقایسه با پردازندههای گرافیکی Arc Alchemist موجود اینتل، این دو پردازنده گرافیکی تعداد هستههای سایهزن بسیار کمی را ارائه میکنند – بیشتر از Arc A380 اما بسیار کمتر از Arc A580. همچنین توجه داشته باشید که نمیتوانیم احتمال اینکه این تراشههای موبایل اولیه برای اهداف آزمایش و اشکالزدایی هستند را رد کنیم. سیستم مورد استفاده یک مادربرد Intel Z790 را نشان میدهد، اما اگر این اطلاعات فاش شده از یک آزمایشگاه سختافزار باشد، میتوان پردازندههای گرافیکی موبایل را با دسکتاپ آزمایش کرد.
از نظر موقعیتیابی، با توجه به تعداد هستههای Xe، به نظر میرسد که اینها راهحلهای گرافیکی بودجهای تا متوسط هستند. ما همچنین دادههای گزارششده SiSoftware را به صورت اسمی میپذیریم، که یک «ظرفیت» 160 CU و 192 CU را با 1440 و 1728 «سایدر» فهرست میکند. اینتل از CU یا Compute Units برای پردازندههای گرافیکی خود استفاده نمیکند، زیرا AMD است، در حالی که Nvidia از “Streaming Multiprocessors” استفاده میکند، اما SiSoftware از یک برچسب CU برای هر سه استفاده میکند. به نظر میرسد این پردازندههای گرافیکی اینتل از «CU ضرب در نه» برای ارقام سایهزن استفاده میکنند، با عدد CU پایه 16 برابر تعداد Xe-core – یا اگر میخواهید قدیمی باشید، تعداد واحدهای اجرایی از پردازندههای گرافیکی قدیمیتر اینتل است. .
پاک مثل گل؟ بیایید یک مثال ملموس تر با یک پیکربندی GPU شناخته شده ارائه دهیم. این لیست Arc A380 می گوید 128 CU و 1152S. Arc A380 واقعی دارای هشت هسته Xe با 1024 ALU سایه زن است که در میان شانزده موتور برداری (که قبلاً واحد اجرایی نامیده می شد) در هر هسته Xe پخش شده است. همچنین یک ALU “برای هدف ویژه” (ریاضی توسعه یافته) اضافی برای هر موتور برداری وجود دارد. بنابراین، 8 * 16 * 9 = 1152 ALU سایه زن. اما به نظر نمیرسد که محاسبات مشابه SiSoftware برای پردازندههای گرافیکی بزرگتر سری A Arc به هر دلیلی اعمال شود (آنها از هستههای Xe * 16 * 8، بدون در نظر گرفتن ALU ریاضی توسعه یافته استفاده میکنند). در اینجا نحوه تجزیه چیزها آمده است:
در حال حاضر، با توجه به اینکه ما در مورد برخی از مشخصات و میزان بالا رفتن Battlemage مطمئن نیستیم، داده های عملکرد چندان مفید نیستند. پیکربندی هسته و سرعت ساعت نشان می دهد که عملکرد بهتر از A380 خواهد بود – و همینطور است. همچنین به نظر میرسد که اینتل با این پردازندههای گرافیکی ناشناخته، عملکرد بسیار بیشتری را از سایهزنهای کمتر دریافت میکند.
برای مقایسه، نتیجه Arc A580 OpenCL با سرعت 6121 مگاپیکسل بر ثانیه تقریباً مشابه تراشه ناشناخته 10 (یا 20؟) Xe-core 6031 مگاپیکس بر ثانیه است، اما A580 دارای 24 هسته Xe است. و در اینجا یک Arc A750 OpenCL با سرعت 7145 مگاپیکسل بر ثانیه است در حالی که نتیجه این Arc A770 OpenCL 8229 مگاپیکسل بر ثانیه است – با پردازنده گرافیکی Xe-core فرضی 12 (یا 24؟) 7231 مگاپیکسل بر ثانیه. با فرض صحیح بودن ریاضیات در تعداد شیدرها، تراشه های ناشناخته به راحتی GPU های Alchemist با پیکربندی مشابه را شکست می دهند.
این پردازندههای گرافیکی «جدید» در سطح A580 و A750 قرار میگیرند، اما با سایهزنان بسیار کمتر، به علاوه پیکربندی حافظه متفاوت. اگر اینها Battlemage هستند و می توانند 40٪ بالاتر از 1.8 گیگاهرتز نشان داده شده در اینجا ساعت داشته باشند، و سپس اگر تراشه هایی با حداکثر 32 هسته Xe و 4096 شیدر دریافت کنیم، در نهایت به سطح عملکرد مناسبی خواهیم رسید. سه برابر هستههای Xe نسبت به پردازندههای گرافیکی 10 هستهای فرضی بهعلاوه کلاکهای بالاتر، به طور بالقوه چنین چیپ اینتل را در قلمرو RTX 4070 Ti قرار میدهند. اما بیایید زیاد غافل نشویم، زیرا حافظه پنهان و سایر مشخصات هنوز عجیب به نظر می رسند، و اعداد Xe-core ممکن است دو برابر آنچه ما استفاده می کردیم باشد.
ما از AMD و Nvidia یاد گرفتهایم که حافظه نهان بزرگتر در یک GPU میتواند عملکرد را تا حد زیادی بهبود بخشد. اینتل نیز این را آموخته است، و در حالی که احتمالاً برای افزودن یک کش بزرگ به Alchemist خیلی دیر بود، قطعاً انتظار داریم که Battlemage با کش های بزرگتر عرضه شود. 8 مگابایت آن را کاهش نمیدهد، هرچند ممکن است اینتل حافظه نهان L3 داشته باشد و SiSoftware آن مقدار را درخواست یا گزارش نمیکند.
در نهایت، خیلی زود است که بگوییم Battlemage چقدر سریع خواهد بود، اما این مشخصات احتمالی حداقل تا حدودی امیدوارکننده به نظر می رسند. اگر یک تراشه 12 هستهای Xe در فرکانس 1.8 گیگاهرتز میتواند با A750 مطابقت داشته باشد، و اگر اینتل با Battlemage به 32 هسته Xe برسد، ممکن است در واقع به دنبال راهحلهای رقابتی اینتل باشیم که شاید بتواند AMD گرانقیمت را تحمل کند. و راه حل های انویدیا شاید.
از طرف دیگر، این یک تراشه 24 Xe-core Battlemage است که با فرکانس 1.8 گیگاهرتز کار می کند و با تراشه 28 Xe-core Alchemist با فرکانس 2.4 گیگاهرتز مطابقت دارد. ما قبلاً میدانیم که A750 در سلسلهمراتب بنچمارکهای GPU ما در کجا قرار میگیرد، اما در حالی که افزایش ساعت و عملکرد تا 50 درصد مطمئناً کمک میکند، اما همچنان به چیزی در سطح RTX 3070 و کندتر از RTX 4060 Ti منجر میشود. بیایید امیدوار باشیم که اینطور نباشد.
اینتل در حال حاضر دو سال از رقابت عقب است، و با تایید اینتل که توسعه سخت افزار Battlemage در حال حاضر انجام شده است و 70٪ از تیم به Celestial – معماری GPU آن بعد از Battlemage – رفته اند، امیدواریم این نتایج فاش شده برای بودجه محور باشند. پردازندههای گرافیکی آینده و انواع بزرگتر و سریعتر در راه هستند. در این میان، 30 درصد باقیمانده از تیم گرافیکی اینتل در حال کار بر روی پشتیبانی نرم افزاری و درایور Battlemage هستند تا برای راه اندازی آن در اواخر سال جاری آماده شوند.
مرجع اخبار سخت افزار کامپیوترایران
تحریریه Techpowerup