بعد از مدت‌ها درز کردن شایعات مختلف و گمانه‌زنی‌ها پیرامون کارت‌های گرافیک سری ۳۰۰۰ انویدیا، سرانجام این کارت‌ها رسما معرفی شدند و اطلاعات قطعی و دست اولی را در اختیار ما گذاشتند تا با امکانات و محدود‌ه‌ی تقریبی راندمان این مدل‌ها نسبت به همرده‌های نسل قبلی بیشتر آشنا شویم. این اطلاعات شامل طراحی برد مدار چاپی (PCB) جدید، مصرف توان و مدل‌های تعیین شده برای محصولاتی بود که قرار است در موج اولِ عرضه‌ی نسل آمپر به بازار عرضه شوند. اولین محصولات همان‌طور که حتما در خبرهای قبلی خواندید، شامل GeForce RTX 3080 ،GeForce RTX 3090 و GeForce RTX 3070 می‌شوند که نمودارهایی مقایسه‌ای هم از راندمان آنها در مقایسه با نسل‌های قبلی نشان داده شد که نگاه کلی و نه آزمایشگاهی به مقوله‌ی راندمانی که باید از مدل‌های مذکور انتظار داشته باشیم را ارائه کردند.

مهم‌ترین موضوع در مورد کارت‌های گرافیک سری آمپر این است که فاصله‌ی ایجاد شده‌ی بین نسلی میان تورینگ و آمپر به گفته‌ی انویدیا، بیشترین میزانی است که تاکنون شاهد بود‌ه‌ایم. در گذشته‌، یکی از بهترین ارتقاهای راندمانی را از نسل مکسول به پاسکال (از GTX 980 به GTX 1080) شاهد بودیم و اکنون احتمالا افزایشِ راندمان بیشتری را از مهاجرت از کارت‌های سری RTX 20 به RTX 30 تجربه کنیم.

از نظر ابعاد، کارت‌های انویدیا بزرگترین اندازه در بین کارت‌های گرافیکی را دارند و در داخل کیس هم ۳ اسلات را برای RTX 3090 و ۲ اسلات را برای RTX 3080 و RTX 3070 اشغال می‌کنند. میزان توان مصرفی هم در مجموع افزایش داشته و با وجود استفاده از فناوری ساخت ۸ نانومتری سامسونگ، باز هم به منبع تغذیه قدرتمندتری نسبت به نسل گذشته نیاز داریم. استفاده از یک منبع تغذیه‌ی ٧۵۰ واتی برای مدل‌های RTX 3090 و RTX 3080 و منبع تغذیه‌ی ۶۵۰ واتی برای مدل‌ RTX 3070 توسط انویدیا توصیه شده است.

انویدیا با طراحی خنک کننده‌ی جدید خود ادعا می‌کند که ۵۵ درصد جریان هوای بیشتری را هدایت می‌کند، ۳ برابر نویز کمتری دارد و ۳۰ درصد کارآمدتر از طراحی‌های قبلی است. طبق معمول باید کارت‌های جدید را تحت آزمون قرار داد تا صحت و سقم آمار اعلام شده تایید یا رد شود.

در مورد فن‌های موجود در خنک‌کننده هم دو فن وجود دارد که یک فن در قسمت عقب هوا را از جلوی کارت به سمت بالا می‌کشد و یک فن دیگر هوای گرم شده را از داخل کارت و از شیار پشت کیس به بیرون فشار می‌دهد. این طراحی به این معنی است که هوا در قسمت زیر GPU قرار می‌گیرد و از دو مسیر، یا از پشت کارت خارج می‌شود و یا اگر پردازنده خنک‌کننده‌ی مستقل داشته باشد، به خنک‌‌کننده‌ی CPU دمیده می‌شود. با در نظر گرفتن این تغییر طراحی، ممکن است خنک‌کننده‌های مدار بسته‌ی مایع از این پس کارایی و راندمان بهتری نسبت به خنک‌کننده‌های برجی شکلِ بزرگ داخل کیس داشته باشند، چرا که دمیده شدنِ حرارت کارت گرافیک به برج خنک‌کننده، باعث افزایش دمای محیطی و در نتیجه کاهش راندمان آن خواهد شد.

پیش از این گمانه‌زنی‌های زیادی در مورد اینکه تراشه‌های Ampere بر اساس معماری ۷ نانومتری TSMC یا ۸ نانومتری سامسونگ ساخته می‌شوند در اینترنت منتشر می‌شد، اما سرانجام مشخص شد که انویدیا سامسونگ را به عنوان سازنده‌ی اصلی و پروسه‌ی ساخت ۸ نانومتری این شرکت را هم برای طراحی و تولید تراشه‌های گرافیکی خود برگزیده است. این انتخاب احتمالا به خاطر اشباع کامل خط تولید ۷ نانومتری TSMC با سفارش‌های شرکت اپل و ای‌ام‌دی بوده است. باید منتظر بود و دید که بازدهی خط تولید سامسونگ برای تراشه‌های ۸ نانومتری انویدیا جوابگوی نیاز بازار خواهد بود یا خیر.

مقایسه‌ی مشخصات فنی

به گفته‌ی انویدیا معماری آمپر علاوه بر ارتقای بخش Shader برای واحدهای ترسیم سنتی یا Rasterization، به واحدهای ray tracing نسل دوم و واحدهای Tensor نسل سوم نیز مجهز شده است. در این جدول مشخصات فنی سه کارت گرافیک معرفی شده از معماری جدید آمپر را در برابر همتایان قبلیِ آنها از معماری تورینگ مشاهده می‌کنید:

NVIDIA RTX IO

امروزه ذخیره‌سازها با وجود پیشرفت زیاد و استفاده از SSD-های سریع، هنوز هم ضعیف‌ترین قسمت رایانه‌ها محسوب می‌شوند. سرعت SSD-های مدرن با بهره گیری از توانِ کامل گذرگاه PCIe در هر نسل افزایش می‌یابد و در PCIe نسل چهارم، سرعت این گذرگاه به ۶۴ گیگابیت بر ثانیه (۸ گیگابایت بر ثانیه) در دو جهت رسیده است. هم اینک شرکت ای‌ام‌دی پلتفرم مبتنی بر PCIe 4.0 را عرضه کرده، اما اینتل فقط در پلتفرم نسل یازدهم موبایلی از آن استفاده کرده و انتظار می‌رود آن را همزمان با عرضه‌ی پردازنده‌های نسل Rocket Lake، به کاربران رایانه‌های رومیزی نیز عرضه کند.

با اینکه افزایش پهنای باند ذخیره‌ساز امری مثبت تلقی می‌شود، اما پردازش اطلاعات باینری صفر و یک ذخیره شده روی بخش فیزیکی دیسک‌ها هنوز بر عهده‌ی پردازنده‌ی مرکزی یا CPU است. با افزایش پهنای باند ذخیره‌سازها، بار پردازشیِ عملیات ورودی/خروجی یا I/O هم به همان نسبت روی پردازنده به تدریج افزایش پیدا می‌کند و به جایی می‌رسد که راندمان را تحت تاثیر قرار می‌دهد. مایکروسافت راه حل رابط برنامه‌نویسی DirectStorage را برای حل این معضل در نظر گرفته و انویدیا هم فناوری RTX IO را بر مبنای همین API ابداع کرده است.

انویدیا می‌گوید داده‌های غیر فشرده حداکثر با سرعت ۷ گیگابایت بر ثانیه از یک SSD از نوع NVMe و روی گذرگاه PCIe 4.0 خوانده می‌شوند و برای پردازش در این سرعت به توان کاملِ دو هسته‌ی پردازنده نیاز دارند. اما اگر همین اطلاعات بصورت فشرده شده و محتوایی مانند داده‌های بازی باشند، به هزاران درخواست I/O و منابع متعددی نیاز است تا اطلاعات از حالت فشرده، به حداکثر ۱۴ گیگابایت بر ثانیه در حالت غیرِ فشرده تبدیل شوند. سربار ناشی از درخواست‌های مضاعف I/O و توان مورد نیاز برای خواندن داده‌ها از داخل فایل‌های متعدد و بارگذاری آنها در بافر کارت گرافیکی، توان پردازشی مورد نیاز در سمت پردازنده را به ۲۴ هسته افزایش می‌دهد. اینجا DirectStorage وارد عمل می‌شود و مسیری را برای دسترسی مستقیم به منابع مورد نیاز و برداشتن سربار پردازنده ایجاد می‌کند.

همچنین RTX IO به عنوان لایه‌ی بیرونی DirectStorage که برای بازی‌ها و معماری تراشه‌های گرافیکی انویدیا بهینه شده، غیر فشرده کردن داده‌های فشرده شده را به صورت سخت‌افزاری روی GPU انجام می‌دهد. انویدیا ادعا می‌کند که این فناوری تا ۲ برابر راندمان عملیات ورودی/خروجی با ذخیر‌ساز را افزایش می‌دهد و در عین حال نیاز به استفاده از هسته‌های متعدد پردازنده برای مدیریت خواندن و نوشتن را از میان برمی‌دارد.

البته نیاز است که بازی‌ها برای استفاده از قابلیت DirectStorage بهینه شوند. با توجه به اینکه این API اکنون هم در کنسول ایکس باکس سری ایکس پیاده سازی شده، بازی‌هایی که برای این کنسول عرضه شده و به پی‌سی پورت شوند، احتمالا از این فناوری برخوردار خواهند بود. همچنین پشتیبانی RTX IO باید به صورت مجزا برای هر بازی در درایور گرافیک انویدیا تعبیه شود.

این فناوری روی تمام کارت‌های گرافیکی RTX از نسل تورینگ و آمپر کار خواهد کرد و با بروز رسانی API مربوطه در نسخه‌ی سال ۲۰۲۱ ویندوز 10، می‌توان انتظار داشت که استفاده از این قابلیت از نیمه‌ی دوم سال آینده عملیاتی شود. در ضمن مایکروسافت می‌گوید این قابلیت به ملزوماتی نیاز دارد که باعث می‌شود تمامِ درایوهای M.2 و NVMe برای بهره بردن از آن مناسب نباشند و احتمالا فقط مدل‌های پرسرعت‌تر برای این قابلیت چراغ سبز خواهند گرفت.

Nvidia Reflex

فناوری دیگری که همزمان با معرفی کارت‌های گرافیک جدید معرفی شد، به گیمرهای آنلاین وعده‌ی بهره‌مندی از کاهش تاخیر و افزایش سرعت پاسخ‌گویی سیستم در هنگام بازی را می‌دهد. به گفته‌ی انویدیا این قابلیت خود مشتمل بر برخی نوآوری‌ها در تراشه‌ی گرافیکی، تکنیک G-Sync و برخی دیگر قابلیت‌های نرم‌افزاری است که سنجش و کاهش تاخیر سیستم در هنگام اجرای بازی‌های رقابتی را ممکن می‌سازند. کاهش تاخیر سیستم برای گیمرهای آنلاین امری حیاتی است که به پی‌سی و نمایشگر اجازه‌ی واکنش سریع‌تر در برابر دستورات ورودیِ کاربر از طریق ماوس و صفحه کلید را می‌دهد و دقت در عکس‌العمل‌ها و شلیک‌ها را افزایش می‌دهد.

این قابلیت مختص نسل جدید نیست و روی کارت‌های گرافیکی GTX 900 و بالاتر قابل اجرا خواهد بود و از نسخه‌ی بعدی درایورهای انویدیا در اواخر شهریور در دسترس قرار خواهد گرفت. همچنین طبق آزمون‌های انویدیا، این قابلیت در برخی از معروف‌ترین بازی‌های رقابتی به شکل زیر تاثیرگذار بوده است:

 

 جمع بندی

به جز مشخصات فنی و محدوده‌ی راندمانیِ کارت‌های گرافیکی جدید، اطلاعات دیگری در مورد قابلیت‌های بالقوه‌ی افزایش کارایی واحدهای RT و Tensor در تراشه‌های نسل Ampere هم منتشر شده که مبتنی بر استفاده‌های گسترده‌تر از امکانات این نسل است، امکاناتی که در بخش تولید محتوا و سهولت دسترسی به کیفیت بصری بالاتر و همین‌طور کاهش زمان و هزینه‌ی اجرای پروژه‌های گرافیکی تاکید دارند. از سوی دیگر افزایش خیره کننده در راندمان تکنیک رهگیری پرتو و همین‌طور واحد‌های هوش مصنوعی و ML باعث شده که اجرای بسیاری از بازی‌ها با استفاده‌ی کامل از هر دوی این تکنیک‌ها و نرخ فریم بسیار بالاتر و روانتر برای اولین بار میسر شود و گلایه‌های قبلی در مورد راندمان ray tracing در بازی‌ها در نسل تورینگ به دست فراموشی سپرده شود. همچنین انویدیا بسته‌ی نرم افزاری DLSS 2.1 با امکانات بیشتر نسبت به DLSS 2.0 را هم معرفی کرده که برخی امکانات جدید مثل قابلیت ارتقای کیفی تصویر در رزولوشن 8K برای کارت فوق قدرتمندی مانند RTX 3090 هم فرآهم می‌شود.

فناوری DLSS در نسخه‌ی ابتدایی چیزی بیش از یک تکنیک Image Sharpening معمولی به نظر نمی‌رسید، اما تحول بی‌نظیر ایجاد شده در DLSS 2.0 و اجرا روی هسته‌های Tensor تراشه‌های RTX باعث شد که یکی از بی‌نقص‌ترین تکنیک‌های ارتقای تصویری و upscaling را در بازی‌های ویدیوئی مشاهده کنیم. در واقع DLSS 2.0 بسیار از جزئیاتی را که با اِعمال تکنیک TAA روی صحنه محو می‌شوند یا از بین می‌روند را دوباره به تصاویر برمی‌گرداند و در بسیاری موارد کیفیتی حتی بالاتر از اجرای بازی در رزولوشن Native را ارائه می‌کند. بازی Death Stranding یکی از بهترین نمونه‌های پیاده‌سازی تکنیک DLSS 2.0 بعد از بازی Control ساخته‌ی رمدی است که می‌تواند الگوی بی‌مانندی برای مایکروسافت و سونی برای پیاده‌سازی قابلیت‌های مشابه بر مبنای هوش مصنوعی در کنسول‌هایشان باشد. یکی از مورد انتظارترین فناوری‌های مدنظر برای پی‌سی‌های مخصوص بازی، عرضه‌ی قابلیتی با توانایی جبران ضعف سخت‌افزار در بارگذاری و انتقال داده‌ها از ذخیره‌سازها بود که به لطف همکاری انویدیا و مایکروسافت به زودی محقق خواهد شد و نقطه ضعف اصلی پلتفرم پی‌سی نسبت به کنسول‌های نسل جدید که هر دو از SSD-های پرسرعت و واحد‌های شتاب‌دهنده‌ی سخت‌افزاری برای غیرفشرده‌سازی داده‌های بازی استفاده می‌کنند، در میان مدت برطرف خواهد شد. فناوری DirectStorage در کنار RTX IO، استفاده‌ی واقعی و بدون گلوگاه از سرعت بالای SSD برای حذف یا کوتاه کردن صفحات لودینگ را در بازی‌های پی‌سی فرآهم خواهد کرد و استریم بی‌وقفه و بدون تاخیر بافت‌های کیفیت بالا را مانند آنچه که در نمایش‌های سونی از بازی‌های پلی استیشن 5 شاهد بودیم محقق می‌‌کند.