پردازندهی گرافیکی A100 انویدیا که برپایهی معماری امپر ساخته شده، بهتازگی در بنچمارک OctaneBench حضور دیده شده و رتبهی نخست را از چنگ تایتان V درآورده است.
پردازندهی گرافیکی (GPU) انویدیا Ampere A100 مه ۲۰۲۰ (اردیبهشت و خرداد ۱۳۹۹) معرفی شد؛ اما تا امروز دقیقا نمیدانستیم این پردازنده چه قدرتی ارائه میدهد. جولز اوربک، بنیانگذار و مدیرعامل شرکت نرمافزاری OTOY، بهتازگی توییت جدیدی منتشر کرده که حاوی نخستین بنچمارک منتسب به پردازندهی گرافیکی A100 است.
ظاهرا پردازندهی A100 انویدیا توانسته است در بنچمارک OctaneBench امتیاز ۴۴۶ را کسب کند. این امتیاز A100 را به سریعترین پردازندهی گرافیکی دنیا در بنچمارک OctaneBench تبدیل میکند. کارت گرافیک انویدیا Titan V تا پیش از حضور A100 رکورد بیشترین امتیاز بنچمارک OctaneBench را دراختیار داشت و موفق شده بود امتیاز متوسط ۴۰۱ را کسب کند. بدینترتیب، A100 حداکثر ۱۱٫۲ درصد عملکرد پردازشی بهتری از تایتان V دارد. مدیرعامل شرکت OTOY میگوید پردازندهی گرافیکی A100 با تنظیمات RTX غیرفعال در بنچمارک جدید حضور پیدا کرده است.
اگر نگاهی دقیق به مشخصات فنی A100 بیندازیم، عملکرد بهتر این پردازندهی گرافیکی مبتنیبر معماری امپر درمقایسهبا تایتان V آنچنان تعجببرانگیز نخواهد بود. پردازندهی GA100 که نسخهای از A100 بهحساب میآید، ابعادی معادل ۸۲۶ میلیمترمربع (mm۲) و ۵۴٫۲ میلیارد ترانزیستور دارد. امکان استفاده از این تعداد ترانزیستور بهلطف ساخت پردازندهی مذکور با لیتوگرافی هفتنانومتری FinFET شرکت TSMC فراهم شده است. پردازندهی گرافیکی GA100 انویدیا به ۱۲۸ واحد SM (چندپردازندهی جریانی) مجهز است که ۸،۱۹۲ هستهی کودا (CUDA) را شامل میشود. در نظر داشته باشید پردازندهی A100 از همهی دای (Die) بهره نمیگیرد؛ ولی مشخصاتش در نگاه اول تحسینبرانگیز هستند.
در پردازندهی A100 امپر از ۶،۹۱۲ هستهی کودا بههمراه ۴۳۲ هستهی تنسور (Tensor) استفاده شده است. دیگر مشخصههای مهم این پردازندهی گرافیکی ۴۰ گیگابایت حافظهی HBM2E با رابط حافظهی ۵،۱۲۰ بیت است. این مشخصهها نشان میدهد پردازندهی گرافیکی یادشده پهنای باند خیرهکنندهی ۱،۵۵۵ گیگابیتبرثانیه را ارائه میدهد. در کارت گرافیک تایتان V انویدیا از ۵،۱۲۰ هستهی کودا بههمراه ۱۲ گیگابایت حافظهی HMB2 استفاده شده است و همین موضوع باعث میشود تایتان V قدرت پردازشی کمتری ارائه دهد.
سرویس OctaneBench با استفاده از ابزار OctaneRender بنچمارک کارتهای گرافیک را ثبت میکند. یکی از پیشنیازهای اصلی استفاده از این ابزار، آن است که کارت گرافیک آزمایششده از هستههای کودای انویدیا برخوردار باشد. این پیشنیاز باعث شده است هیچیک از کارتهای گرافیک سری رادئون AMD برای حضور در بنچمارک OctaneBench واجد شرایط نباشد. دیتابیس OctaneBench شامل تنوع درخورتوجهی از کارتهای گرافیک سری جیفورس و کوادرو و تسلا است که مقایسهی بین آنها میتواند به ما نشان دهد قدرت پردازشی A100 چقدر درخورتوجه است.
کارت گرافیک GeForce RTX 2080 Ti با کسب امتیاز میانگین ۳۰۲ در سیستم رتبهبندی OctaneBench، توانسته جایگاه چهاردهم را ازآنِ خود کند. مقایسهای سرانگشتی نشان میدهد پردازندهی گرافیکی A100 تقریبا ۴۷٫۷ درصد سریعتر از GeForce RTX 2080 Ti است. فراموش نکنید GeForce RTX 2080 Ti یکی از کارتهای گرافیک قدرتمند بازار بهحساب میآید و قیمت گرانی هم دارد.
همچنین، باید به این نکته توجه کنید که پردازندهی گرافیکی GA100 بهطور ویژه برای استفاده از دیتاسنترها طراحی شده و بعید است از آن در کارتهای گرافیک جدید انویدیا استفاده شود که در آیندهای نزدیک معرفی میشوند. رسانهها بهنقل از منابعی آگاه، گفتهاند کارتهای گرافیک مبتنیبر معماری امپر قرار است RTX 3080 و RTX 3090 نام بگیرند. A100 بهعنوان مدل جدید GV100 (ولتا) شناخته میشود؛ بنابراین، احتمال دارد نهایتا در قالب یکی از کارتهای گرافیک سری Titan دردسترس قرار بگیرد.
مشخصات فنی پردازندهی گرافیکی A100 انویدیا |
---|
هفت واحد GPC، هفت یا هشت واحد TPC/GPC، دو واحد SM/TPC، حداکثر ۱۶ واحد SM/GPC و ۱۰۸ واحد SM |
۶۴ هستهی کودای FP32 بهازای هر واحد SM، درمجموع ۶،۹۱۲ هستهی کودای FP32 بهازای کل قدرت پردازشی پردازنده |
۴ هستهی تنسور نسل سوم بهازای هر واحد SM، درمجموع ۴۳۲ هستهی تنسور نسل سوم بهازای کل قدرت پردازشی پردازنده |
۵ بستهی HBM2 معادل ۱۰ عدد کنترلر حافظهی ۵۱۲ بیت |
طبق ادعای چندین شایعه، کارتهای گرافیک جریان اصلی (مین استریم) خانوادهی امپر قرار است به دای GA102 مجهز شوند. بدیهی است این دای احتمالا از GA102 کوچکتر است و بهدلیل داشتن واحد SM کمتر، قدرت پردازشی ضعیفتری ارائه میدهد. برخی رسانهها گفتهاند دای GA102 شامل ۸۴ واحد SM است که به ۵،۳۷۶ هستهی کودا ترجمه میشود. این احتمالا همان تراشهای است که انویدیا میخواهد در کارت گرافیک GeForce RTX 3080 Ti یا GeForce RTX 3090 استفاده کند. درهرصورت با درنظرگرفتن بهرهمندی GA102 از هستهی کودای کمتر، بعید است این پردازنده بتواند قدرت بیشتری از GA100 ارائه دهد. البته اگر انویدیا پردازندهی GA102 را با سرعت کلاک چشمگیر تولید کند، تفاوتهای بین GA102 و GA100 کمتر خواهد شد.
شکی نداریم کارتهای گرافیک سری امپر قرار است بهطور محسوس درمقایسهبا کارتهای سری تورینگ بهبود پیدا کنند و قدرت پردازشی بسیار زیادی به رایانههای شخصی بیاورند. تاکنون، به برخی آمار اشاره شده که براساس آنها میتوانیم تخمین بزنیم امپر قرار است چقدر قویتر باشد. البته اتکاکردن به آمار کار عاقلانهای نیست و تا زمانیکه کارتهای امپر روانهی بازار نشوند، دقیقا قدرت آنها را نخواهیم فهمید. درهرصورت، انتظار داریم میزان بهبود امپر درمقایسهبا نسل قبل کمتر از ۴۷٫۷ درصد باشد.
دیدگاه شما کاربران دیجیتال دربارهی این خبر چیست؟ فکر میکنید قیمت کارت گرافیک انویدیا برپایهی معماری امپر چقدر تعیین میشود؟
پاسخ ها