کارت گرافیک NVIDIA Rubin 288GB

Name: کارت گرافیک NVIDIA Rubin 288GB | قیمت و مشخصات | فروشگاه اینترنتی کارن
Price: 5400000000000 IRR
Availability: InStock

NVIDIA Rubin

GPU: Rubin GPU (3nm)

CPU: Vera (بر پایه ARM، جانشین Grace)

NVLink 6: ۳.۶ ترابایت بر ثانیه پهنای باند

NVSwitch 6: سوئیچ ۱۰۰ ترابیت بر ثانیه

ConnectX-9: شبکه ۱۶۰۰ گیگابیت بر ثانیه

HBM4: ۲۸۸ گیگابایت حافظه با ۲۲ ترابایت بر ثانیه پهنای باند

دسته: کارت گرافیک برچسب: AI, NVIDIA RUBIN, بررسی NVIDIA RUBIN, هوش مصنوعی

۵۴۰,۰۰۰,۰۰۰,۰۰۰ تومان

هم اکنون در انبار موجود نیست - اما میتوانید این محصول را پیش خرید کنید

افزودن به مقایسه

افزودن به علاقه مندی

استعلام موجودی قبل از خرید

تحویل اکسپرس

حمل رایگان سفارشات بالای 1 میلیون تومان

پرداخت امن

امکان پرداخت انلاین یا پرداخت حضروی درب منزل

ضمانت اصالت کالا

امکان پرداخت انلاین یا پرداخت حضروی درب منزل

7 روز گارانتی بازگشت وجه

امکان پرداخت انلاین یا پرداخت حضروی درب منزل

توضیحات
نظرات (0)

NVIDIA Rubin

۱. معرفی کلی

NVIDIA Rubin، جانشین معماری Blackwell (B200) است که در نیمه دوم ۲۰۲۶ عرضه می‌شود. این پلتفرم کامل شامل:

GPU: Rubin GPU (3nm)
CPU: Vera (بر پایه ARM، جانشین Grace)
NVLink 6: ۳.۶ ترابایت بر ثانیه پهنای باند
NVSwitch 6: سوئیچ ۱۰۰ ترابیت بر ثانیه
ConnectX-9: شبکه ۱۶۰۰ گیگابیت بر ثانیه
HBM4: ۲۸۸ گیگابایت حافظه با ۲۲ ترابایت بر ثانیه پهنای باند

۲. معماری شش‌تراشه‌ای هم‌طراحی‌شده

برخلاف معماری‌های قدیمی که GPU، CPU و شبکه را جدا طراحی می‌کردند، Rubin تمام اجزا را با هم و برای هم طراحی کرده:

جزء	مشخصه کلیدی	هدف
Rubin GPU	۳nm، ۲۸۸ گیگابایت HBM4	استنتاج با توان ۵۰ petaflops (FP4)
Vera CPU	۹۰ هسته سفارشی ARM	تغذیه داده با نرخ ۲.۴ ترابایت بر ثانیه
NVLink 6	۳.۶ ترابایت بر ثانیه	اتصال GPUها با تأخیر نانوثانیه‌ای
NVSwitch 6	۱۰۰ ترابیت بر ثانیه	اتصال ۵۷۶ GPU در یک رک
ConnectX-9	۱۶۰۰ گیگابیت بر ثانیه	ارتباط بین رک‌ها
BlueField-4	ذخیره‌سازی ۱.۶ ترابایت بر ثانیه	امنیت و مجازی‌سازی

نکته: گذرگاه PCIe حذف شده است – همه چیز از طریق NVLink مستقیماً به GPU متصل می‌شود.

۳. تحول کلیدی: انتهای عصر PCIe

در رک Rubin، خبری از PCIe نیست. ارتباطات به این صورت است:

CPU ↔ GPU: NVLink-C2C با ۲.۴ ترابایت بر ثانیه (نه PCIe 7.0 با کمتر از ۱ ترابایت)
GPU ↔ GPU: NVLink 6 با ۳.۶ ترابایت بر ثانیه
GPU ↔ شبکه: مستقیم از طریق ConnectX-9

نتیجه: حذف گلوگاه PCIe باعث می‌شود مدل‌هایی مثل Llama 4 با ۲ تریلیون پارامتر به جای ۸۰ روز در ۲۰ روز آموزش ببینند.

۴. رک یکپارچه: یک کامپیوتر غول‌پیکر

واحد پایه Rubin یک رک ۲۶۰ کیلوواتی شامل:

۴ سینی (tray)، هر سینی شامل:
- ۲ مادربورد با ۱۸ GPU
- ۳۶ GPU در هر سینی × ۴ = ۱۴۴ GPU در یک رک
شبکه: ۲ سوئیچ NVSwitch 6 (100 ترابیت بر ثانیه)

این رک به عنوان یک کامپیوتر واحد دیده می‌شود – نه ۱۴۴ سرور مجزا. تمام GPUها مستقیماً به حافظه یکدیگر دسترسی دارند (همسان با NUMA اما با پهنای باند HBM).

۵. پیشرفت در استنتاج (Inference)

بزرگترین جهش در استنتاج رخ داده است:

مدل	B200 (نسل قبل)	Rubin (نسل جدید)	بهبود
Llama 3 (۴۰۵B)	۱۸۰ توکن بر ثانیه	۹۰۰ توکن بر ثانیه	۵ برابر
DeepSeek R1 (۶۷۱B)	۹۵ توکن بر ثانیه	۴۷۵ توکن بر ثانیه	۵ برابر
GPT-5 (فرضی ۲T)	۱۵ توکن بر ثانیه	۷۵ توکن بر ثانیه	۵ برابر

دلیل: پشتیبانی سخت‌افزاری از دقت FP4 با توان ۵۰ petaflops و حافظه کافی ۲۸۸ گیگابایت برای کل مدل بدون پارتیشن‌بندی.

۶. چالش فنی اصلی: خنک‌سازی ۲۶۰ کیلووات

یک رک Rubin ۲۶۰ کیلووات توان مصرف می‌کند (در مقایسه با ۱۲۰ کیلووات برای B200 و ۴۰ کیلووات برای H100).

راه‌حل: خنک‌سازی مایع مستقیم به تراشه (Direct-to-Chip Liquid Cooling)

مایع دی‌الکتریک (غیر رسانا) مستقیماً روی دای GPU پاشیده می‌شود
دمای عملیاتی: ۴۵-۵۵ درجه سانتی‌گراد (در مقابل ۸۰+ درجه در خنک هوایی)
هر رک به ۱۰۰ لیتر در دقیقه آب خنک نیاز دارد

۷. برنامه عرضه

محصول	زمان عرضه	مخاطب
Vera CPU + Rubin GPU (نمونه مهندسی)	Q4 2025	ابررایانه‌ها، هایپراسکیلرها
رک‌های Rubin (تولید انبوه)	Q2 2026	مراکز داده بزرگ
در دسترس عمومی از طریق OEM	H2 2026	شرکت‌ها و سازمان‌ها

۸. تحلیل رقابتی

شرکت	محصول رقیب	VRAM	پهنای باند	وضعیت
NVIDIA	Rubin	۲۸۸ گیگابایت HBM4	۲۲ ترابایت بر ثانیه	۲۰۲۶
AMD	MI355X	۲۸۸ گیگابایت HBM3E	۸ ترابایت بر ثانیه	اکنون در دسترس
Intel	Falcon Shores	۲۸۸ گیگابایت HBM3E	۴ ترابایت بر ثانیه	لغو شده (فقط داخلی)

مزیت NVIDIA: HBM4 اختصاصی با پهنای باند ۲.۷۵ برابر AMD و اکوسیستم یکپارچه (NVLink + ConnectX + BlueField).

۹. جمع‌بندی فنی

نوآوری‌های کلیدی:

حذف PCIe – اتصال مستقیم CPU-GPU با NVLink-C2C
استنتاج FP4 – ۵۰ petaflops توان، ۵ برابر نسل قبل
حافظه یکپارچه – ۲۸۸ گیگابایت HBM4 برای کل مدل‌های ۲ تریلیون پارامتری
خنک‌سازی مایع مستقیم – مدیریت ۲۶۰ کیلووات در هر رک
سیستم‌تراشه (System-on-Chip) در مقیاس رک – کل رک به عنوان یک پردازنده واحد

تأثیر بر صنعت:

هزینه استنتاج token به ۱/۱۰ کاهش می‌یابد
ابررایانه‌های هوش مصنوعی با ۱۰۰+ اگزافلاپس توان FP4 ممکن می‌شوند
مراکز داده مجبور به مهاجرت به خنک‌سازی مایع در مقیاس وسیع خواهند شد

قیمت پردازنده NVIDIA Rubin هنوز به طور رسمی توسط انویدیا اعلام نشده است، اما بر اساس تحلیل‌های زنجیره تامین و پیش‌بینی‌های بازار، می‌توان قیمت‌های زیر را تخمین زد.

قیمت نهایی به شدت به نوع محصول بستگی دارد: آیا فقط یک تراشه (GPU) را می‌خواهید یا یک رک کامل سرور (کل سیستم هوش مصنوعی).

قیمت تخمینی محصولات NVIDIA Rubin

نوع محصول	قیمت تخمینی (دلار آمریکا)	توضیحات
رک کامل سرور (Vera Rubin Rack)	3 میلیون تا 8.8 میلیون دلار	این قیمت برای کل یک سیستم کامل شامل: تعداد زیادی تراشه روبین، حافظه HBM4، پردازنده مرکزی ورا، شبکه، خنک‌کننده و ذخیره‌سازی است. قیمت دقیق به پیکربندی بستگی دارد.
قیمت پایه هر تراشه (GOU/GPU)	حدود 4,100 دلار (تخمین بازار)	این قیمت تنها برای خود تراشه است. خریداران بزرگ مانند مایکروسافت و گوگل معمولا این تراشه را به صورت عمده و با تخفیف ویژه تهیه می‌کنند.
پلتفرم مادربرد (1-GPU Board)	حدود 500,000 دلار	این قیمت برای بردهای مهندسی نمونه (Engineering Samples) است که توسط شرکت‌های بزرگ برای آزمایش و توسعه خریداری می‌شود.

جزئیات مهم درباره قیمت‌ها

قیمت تمام شده برای مصرف کننده نهایی: اگر شما یک شرکت کوچک یا متوسط باشید، نمی‌توانید فقط یک تراشه روبین بخرید. فروشندگان بزرگی مانند Supermicro یا HPE، سیستم کامل (رک) را به شما می‌فروشند که قیمت آن بین 3 تا 8.8 میلیون دلار تخمین زده می‌شود.
مقایسه با نسل قبلی (NVIDIA B200): برای درک بهتر قیمت، بدانید که قیمت پایه هر تراشه نسل قبلی (B200) حدود 30,000 تا 40,000 دلار بود. روبین با توجه به فناوری پیشرفته‌تر (HBM4)، احتمالا قیمت بسیار بالاتری خواهد داشت، اما هنوز تخمین دقیق 4,100 دلاری برای خود تراشه ممکن است خوش‌بینانه باشد و به نظر می‌رسد نزدیک به 30,000 تا 40,000 دلار واقعی‌تر است.
زمان عرضه: انتظار می‌رود این محصولات در نیمه دوم سال 2026 به بازار عرضه شوند. بنابراین قیمت‌های رسمی نزدیک به همان زمان اعلام می‌شود.

خلاصه برای شما:

اگر به دنبال یک سیستم کامل هوش مصنوعی هستید: بودجه‌ای بین 3 تا 9 میلیون دلار نیاز دارید.
اگر فقط به قیمت خود تراشه (برای مطالعات دانشگاهی یا تخمین هزینه) نیاز دارید: می‌توانید حدود 30,000 تا 40,000 دلار را در نظر بگیرید (تخمین منطقی‌تر)

خلاصه برای شما:

اگر به دنبال یک سیستم کامل هوش مصنوعی هستید: بودجه‌ای بین 3 تا 9 میلیون دلار نیاز دارید.
اگر فقط به قیمت خود تراشه (برای مطالعات دانشگاهی یا تخمین هزینه) نیاز دارید: می‌توانید حدود 30,000 تا 40,000 دلار را در نظر بگیرید (تخمین منطقی‌تر).

معماری NVLink 6 و الگوریتم‌های خنک‌سازی در پلتفرم NVIDIA Rubin

در ادامه به تحلیل عمیق دو موضوع درخواستی شما می‌پردازم: معماری نسل ششم NVLink و فناوری‌های خنک‌سازی به‌کاررفته در پلتفرم Rubin.

۱. معماری NVLink 6: ستون فقرات ارتباطی رک Rubin

۱.۱ مشخصات کلیدی

نسل ششم NVLink پیشرفته‌ترین اینترنت اتصال GPU-to-GPU است که انویدیا تاکنون طراحی کرده است :

مشخصه	مقدار	بهبود نسبت به نسل قبل
پهنای باند هر GPU	۳.۶ ترابایت بر ثانیه (دوطرفه)	۲ برابر (نسل پنجم: ۱.۸ ترابایت بر ثانیه)
تعداد لینک‌ها در هر GPU	۳۶ لینک	۲ برابر (نسل پنجم: ۱۸ لینک)
پهنای باند کل رک (NVL72)	۲۶۰ ترابایت بر ثانیه	۲ برابر
پهنای باند در مقایسه با PCIe Gen6	۱۴ برابر بیشتر	—

۱.۲ توپولوژی All-to-All در مقیاس رک

معماری NVLink 6 در پیکربندی NVL72، ۷۲ GPU و ۳۶ CPU را در یک دامنه NVLink یکپارچه متصل می‌کند :

اتصال کامل غیرمسدود (Non-blocking) : هر جفت GPU با پهنای باند ۳.۶ ترابایت بر ثانیه به یکدیگر متصل هستند
عملکرد کل محاسباتی : ۳.۶ اگزافلاپس توان AI
سوئیچینگ NVLink 6 : چیپ‌های سوئیچ، ۹ سینی (tray) در هر رک را به هم متصل می‌کنند

۱.۳ قابلیت‌های عملیاتی جدید

NVLink 6 Switch قابلیت‌های مدیریتی بی‌سابقه‌ای را معرفی کرده است :

تعمیر و نگهداری بدون وقفه (Zero-Downtime Maintenance) : امکان تعویض سینی سوئیچ‌ها در حین کار سیستم
تاب‌آوری صفحه کنترل (Control Plane Resilience) : تحمل خرابی اجزای کنترلی بدون افت عملکرد
اجرا با رک ناقص (Partial Rack Operation) : امکان کار با پیکربندی کمتر از ۷۲ GPU
Hot-swapping ترِی‌های سوئیچ : جایگزینی قطعات بدون خاموش کردن رک

۱.۴ قابلیت SHARP در NVLink Switch

هر سوئیچ NVLink 6 مجهز به موتورهای SHARP (Scalable Hierarchical Aggregation and Reduction Protocol) است که :

عملیات reduction درون شبکه‌ای (All-Reduce) را شتاب می‌دهد
ارتباطات multicast را با کارایی بالا انجام می‌دهد
تاخیر ارتباطی در مدل‌های MoE (Mixture of Experts) را کاهش می‌دهد

۱.۵ معماری Cableless: حذف کابل‌های پیچیده

یک نوآوری کلیدی در پیاده‌سازی NVLink 6، طراحی بدون کابل (Cableless) است :

اتصال مستقیم PCB به جای کابل‌های نسل قبل (Cable Tray)
سرعت مونتاژ ۱۸ برابر سریع‌تر
کاهش هزینه‌های استقرار و نگهداری
افزایش قابلیت اطمینان با حذف اتصالات مستعد خرابی

در رک Rubin، سینی‌های محاسباتی (هر کدام شامل ۲ CPU + ۴ GPU) مستقیماً و بدون کابل به سینی‌های سوئیچ NVLink متصل می‌شوند .

۲. فناوری‌های خنک‌سازی در پلتفرم Rubin

۲.۱ چالش حرارتی: توان ۲۶۰ کیلووات در هر رک

یک رک کامل Rubin NVL72 حدود ۲۶۰ کیلووات توان مصرف می‌کند . این مقدار در مقایسه با نسل‌های قبل:

۲ برابر رک B200 (۱۲۰ کیلووات)
۶.۵ برابر رک H100 (۴۰ کیلووات)

۲.۲ راه‌حل اصلی: خنک‌سازی مایع مستقیم (Direct-to-Chip Liquid Cooling)

انویدیا برای مدیریت این چگالی توان بالا، از خنک‌سازی مایع مستقیم استفاده می‌کند :

ویژگی	جزئیات فنی
تکنولوژی Cold Plate	صفحات سرد اختصاصی روی هر GPU Rubin و CPU Vera
خنک‌کننده	خنک‌سازی سطح دای (die) به صورت مستقیم
دمای عملیاتی	۴۵-۵۵ درجه سانتی‌گراد (در مقابل ۸۰+ درجه در خنک هوایی)
کاهش مصرف آب	بهبود ۲ برابری در مقایسه با نسل قبل

۲.۳ نوآوری‌های پیشرفته در طراحی حرارتی

طبق تحلیل فنی VR200 NVL72، پیشرفت‌های زیر در سیستم خنک‌سازی Rubin به کار رفته است :

الف) میکروکانال Cold Plate (MCCP)

فناوری: ساختار ۳D میکرومتری با کانال‌هایی در مقیاس میکرون
افزایش سطح تماس: ۳۰۰ درصد نسبت به Cold Plate سنتی
کاهش دمای GPU: ۲۲ درجه سانتی‌گراد خنک‌تر نسبت به خنک هوایی در توان ۳۵۰ وات

ب) درپوش طلایی (Gold-plated Lid)

لایه طلا با خلوص ۹۹.۹۹٪ روی سطح بالایی GPU
افزایش ضریب هدایت حرارتی TIM از ۸ به ۱۵۰ W/m·K
حل مشکل تجمع گرما در توان بالا (مناسب برای حالت Max P)

۲.۴ CDU و زیرساخت خنک‌سازی در مقیاس رک

سیستم خنک‌سازی Rubin مبتنی بر واحدهای توزیع خنک‌کننده (CDU) در ردیف سرورها است :

CDU درون ردیفی با قابلیت آب گرم (Warm-water operation)
ردوندام حلقوی برای اطمینان از عملکرد پیوسته
پایش نشت، جریان و فشار با تلهمتری دقیق
آلارم‌های همبسته برای تشخیص زودهنگام خطا

۲.۵ جریان سیال و توان خنک‌سازی

طبق مشخصات فنی VR200 :

پارامتر	مقدار	تغییر نسبت به نسل قبل
نرخ جریان خنک‌کننده در هر رک	۱۲۰ لیتر بر دقیقه	+۱۰۰٪
نیاز جریان هوا	۲۰۰ CFM	-۸۰٪
توان مصرفی سیستم خنک‌سازی	۷٪ از کل توان رک	از ۱۲٪ کاهش یافته
PUE (مصرف انرژی مرکز داده)	۱.۱۵	از ۱.۶ بهبود (در تست‌های واقعی)

۲.۶ حالت‌های توان عملیاتی

سیستم دو حالت عملکرد دارد که از طریق BIOS قابل تنظیم است :

حالت	توان هر GPU	کاربرد	بهبود عملکرد
Max Q	۳۵۰ وات	آموزش مدل‌های بلندمدت	+۱۵٪ بازده انرژی
Max P	۵۰۰ وات	پردازش کوتاه‌مدت با نرخ بالا	+۲۸٪ توان عملیاتی