کارت گرافیک NVIDIA Rubin 288GB
NVIDIA Rubin
GPU: Rubin GPU (3nm)
CPU: Vera (بر پایه ARM، جانشین Grace)
NVLink 6: ۳.۶ ترابایت بر ثانیه پهنای باند
NVSwitch 6: سوئیچ ۱۰۰ ترابیت بر ثانیه
ConnectX-9: شبکه ۱۶۰۰ گیگابیت بر ثانیه
HBM4: ۲۸۸ گیگابایت حافظه با ۲۲ ترابایت بر ثانیه پهنای باند
۵۴۰,۰۰۰,۰۰۰,۰۰۰ تومان
هم اکنون در انبار موجود نیست - اما میتوانید این محصول را پیش خرید کنید
حمل رایگان سفارشات بالای 1 میلیون تومان
امکان پرداخت انلاین یا پرداخت حضروی درب منزل
امکان پرداخت انلاین یا پرداخت حضروی درب منزل
امکان پرداخت انلاین یا پرداخت حضروی درب منزل
NVIDIA Rubin
۱. معرفی کلی
NVIDIA Rubin، جانشین معماری Blackwell (B200) است که در نیمه دوم ۲۰۲۶ عرضه میشود. این پلتفرم کامل شامل:
-
GPU: Rubin GPU (3nm)
-
CPU: Vera (بر پایه ARM، جانشین Grace)
-
NVLink 6: ۳.۶ ترابایت بر ثانیه پهنای باند
-
NVSwitch 6: سوئیچ ۱۰۰ ترابیت بر ثانیه
-
ConnectX-9: شبکه ۱۶۰۰ گیگابیت بر ثانیه
-
HBM4: ۲۸۸ گیگابایت حافظه با ۲۲ ترابایت بر ثانیه پهنای باند
۲. معماری ششتراشهای همطراحیشده
برخلاف معماریهای قدیمی که GPU، CPU و شبکه را جدا طراحی میکردند، Rubin تمام اجزا را با هم و برای هم طراحی کرده:
| جزء | مشخصه کلیدی | هدف |
|---|---|---|
| Rubin GPU | ۳nm، ۲۸۸ گیگابایت HBM4 | استنتاج با توان ۵۰ petaflops (FP4) |
| Vera CPU | ۹۰ هسته سفارشی ARM | تغذیه داده با نرخ ۲.۴ ترابایت بر ثانیه |
| NVLink 6 | ۳.۶ ترابایت بر ثانیه | اتصال GPUها با تأخیر نانوثانیهای |
| NVSwitch 6 | ۱۰۰ ترابیت بر ثانیه | اتصال ۵۷۶ GPU در یک رک |
| ConnectX-9 | ۱۶۰۰ گیگابیت بر ثانیه | ارتباط بین رکها |
| BlueField-4 | ذخیرهسازی ۱.۶ ترابایت بر ثانیه | امنیت و مجازیسازی |
نکته: گذرگاه PCIe حذف شده است – همه چیز از طریق NVLink مستقیماً به GPU متصل میشود.
۳. تحول کلیدی: انتهای عصر PCIe
در رک Rubin، خبری از PCIe نیست. ارتباطات به این صورت است:
-
CPU ↔ GPU: NVLink-C2C با ۲.۴ ترابایت بر ثانیه (نه PCIe 7.0 با کمتر از ۱ ترابایت)
-
GPU ↔ GPU: NVLink 6 با ۳.۶ ترابایت بر ثانیه
-
GPU ↔ شبکه: مستقیم از طریق ConnectX-9
نتیجه: حذف گلوگاه PCIe باعث میشود مدلهایی مثل Llama 4 با ۲ تریلیون پارامتر به جای ۸۰ روز در ۲۰ روز آموزش ببینند.
۴. رک یکپارچه: یک کامپیوتر غولپیکر
واحد پایه Rubin یک رک ۲۶۰ کیلوواتی شامل:
-
۴ سینی (tray)، هر سینی شامل:
-
۲ مادربورد با ۱۸ GPU
-
۳۶ GPU در هر سینی × ۴ = ۱۴۴ GPU در یک رک
-
-
شبکه: ۲ سوئیچ NVSwitch 6 (100 ترابیت بر ثانیه)
این رک به عنوان یک کامپیوتر واحد دیده میشود – نه ۱۴۴ سرور مجزا. تمام GPUها مستقیماً به حافظه یکدیگر دسترسی دارند (همسان با NUMA اما با پهنای باند HBM).
۵. پیشرفت در استنتاج (Inference)
بزرگترین جهش در استنتاج رخ داده است:
| مدل | B200 (نسل قبل) | Rubin (نسل جدید) | بهبود |
|---|---|---|---|
| Llama 3 (۴۰۵B) | ۱۸۰ توکن بر ثانیه | ۹۰۰ توکن بر ثانیه | ۵ برابر |
| DeepSeek R1 (۶۷۱B) | ۹۵ توکن بر ثانیه | ۴۷۵ توکن بر ثانیه | ۵ برابر |
| GPT-5 (فرضی ۲T) | ۱۵ توکن بر ثانیه | ۷۵ توکن بر ثانیه | ۵ برابر |
دلیل: پشتیبانی سختافزاری از دقت FP4 با توان ۵۰ petaflops و حافظه کافی ۲۸۸ گیگابایت برای کل مدل بدون پارتیشنبندی.
۶. چالش فنی اصلی: خنکسازی ۲۶۰ کیلووات
یک رک Rubin ۲۶۰ کیلووات توان مصرف میکند (در مقایسه با ۱۲۰ کیلووات برای B200 و ۴۰ کیلووات برای H100).
راهحل: خنکسازی مایع مستقیم به تراشه (Direct-to-Chip Liquid Cooling)
-
مایع دیالکتریک (غیر رسانا) مستقیماً روی دای GPU پاشیده میشود
-
دمای عملیاتی: ۴۵-۵۵ درجه سانتیگراد (در مقابل ۸۰+ درجه در خنک هوایی)
-
هر رک به ۱۰۰ لیتر در دقیقه آب خنک نیاز دارد
۷. برنامه عرضه
| محصول | زمان عرضه | مخاطب |
|---|---|---|
| Vera CPU + Rubin GPU (نمونه مهندسی) | Q4 2025 | ابررایانهها، هایپراسکیلرها |
| رکهای Rubin (تولید انبوه) | Q2 2026 | مراکز داده بزرگ |
| در دسترس عمومی از طریق OEM | H2 2026 | شرکتها و سازمانها |
۸. تحلیل رقابتی
| شرکت | محصول رقیب | VRAM | پهنای باند | وضعیت |
|---|---|---|---|---|
| NVIDIA | Rubin | ۲۸۸ گیگابایت HBM4 | ۲۲ ترابایت بر ثانیه | ۲۰۲۶ |
| AMD | MI355X | ۲۸۸ گیگابایت HBM3E | ۸ ترابایت بر ثانیه | اکنون در دسترس |
| Intel | Falcon Shores | ۲۸۸ گیگابایت HBM3E | ۴ ترابایت بر ثانیه | لغو شده (فقط داخلی) |
مزیت NVIDIA: HBM4 اختصاصی با پهنای باند ۲.۷۵ برابر AMD و اکوسیستم یکپارچه (NVLink + ConnectX + BlueField).
۹. جمعبندی فنی
نوآوریهای کلیدی:
-
حذف PCIe – اتصال مستقیم CPU-GPU با NVLink-C2C
-
استنتاج FP4 – ۵۰ petaflops توان، ۵ برابر نسل قبل
-
حافظه یکپارچه – ۲۸۸ گیگابایت HBM4 برای کل مدلهای ۲ تریلیون پارامتری
-
خنکسازی مایع مستقیم – مدیریت ۲۶۰ کیلووات در هر رک
-
سیستمتراشه (System-on-Chip) در مقیاس رک – کل رک به عنوان یک پردازنده واحد
تأثیر بر صنعت:
-
هزینه استنتاج token به ۱/۱۰ کاهش مییابد
-
ابررایانههای هوش مصنوعی با ۱۰۰+ اگزافلاپس توان FP4 ممکن میشوند
-
مراکز داده مجبور به مهاجرت به خنکسازی مایع در مقیاس وسیع خواهند شد
-
قیمت پردازنده NVIDIA Rubin هنوز به طور رسمی توسط انویدیا اعلام نشده است، اما بر اساس تحلیلهای زنجیره تامین و پیشبینیهای بازار، میتوان قیمتهای زیر را تخمین زد.
قیمت نهایی به شدت به نوع محصول بستگی دارد: آیا فقط یک تراشه (GPU) را میخواهید یا یک رک کامل سرور (کل سیستم هوش مصنوعی).
قیمت تخمینی محصولات NVIDIA Rubin
نوع محصول قیمت تخمینی (دلار آمریکا) توضیحات رک کامل سرور (Vera Rubin Rack) 3 میلیون تا 8.8 میلیون دلار این قیمت برای کل یک سیستم کامل شامل: تعداد زیادی تراشه روبین، حافظه HBM4، پردازنده مرکزی ورا، شبکه، خنککننده و ذخیرهسازی است. قیمت دقیق به پیکربندی بستگی دارد. قیمت پایه هر تراشه (GOU/GPU) حدود 4,100 دلار (تخمین بازار) این قیمت تنها برای خود تراشه است. خریداران بزرگ مانند مایکروسافت و گوگل معمولا این تراشه را به صورت عمده و با تخفیف ویژه تهیه میکنند. پلتفرم مادربرد (1-GPU Board) حدود 500,000 دلار این قیمت برای بردهای مهندسی نمونه (Engineering Samples) است که توسط شرکتهای بزرگ برای آزمایش و توسعه خریداری میشود. جزئیات مهم درباره قیمتها
-
قیمت تمام شده برای مصرف کننده نهایی: اگر شما یک شرکت کوچک یا متوسط باشید، نمیتوانید فقط یک تراشه روبین بخرید. فروشندگان بزرگی مانند Supermicro یا HPE، سیستم کامل (رک) را به شما میفروشند که قیمت آن بین 3 تا 8.8 میلیون دلار تخمین زده میشود.
-
مقایسه با نسل قبلی (NVIDIA B200): برای درک بهتر قیمت، بدانید که قیمت پایه هر تراشه نسل قبلی (B200) حدود 30,000 تا 40,000 دلار بود. روبین با توجه به فناوری پیشرفتهتر (HBM4)، احتمالا قیمت بسیار بالاتری خواهد داشت، اما هنوز تخمین دقیق 4,100 دلاری برای خود تراشه ممکن است خوشبینانه باشد و به نظر میرسد نزدیک به 30,000 تا 40,000 دلار واقعیتر است.
-
زمان عرضه: انتظار میرود این محصولات در نیمه دوم سال 2026 به بازار عرضه شوند. بنابراین قیمتهای رسمی نزدیک به همان زمان اعلام میشود.
خلاصه برای شما:
-
اگر به دنبال یک سیستم کامل هوش مصنوعی هستید: بودجهای بین 3 تا 9 میلیون دلار نیاز دارید.
-
اگر فقط به قیمت خود تراشه (برای مطالعات دانشگاهی یا تخمین هزینه) نیاز دارید: میتوانید حدود 30,000 تا 40,000 دلار را در نظر بگیرید (تخمین منطقیتر)
-
قیمت پردازنده NVIDIA Rubin هنوز به طور رسمی توسط انویدیا اعلام نشده است، اما بر اساس تحلیلهای زنجیره تامین و پیشبینیهای بازار، میتوان قیمتهای زیر را تخمین زد.
قیمت نهایی به شدت به نوع محصول بستگی دارد: آیا فقط یک تراشه (GPU) را میخواهید یا یک رک کامل سرور (کل سیستم هوش مصنوعی).
خلاصه برای شما:
-
اگر به دنبال یک سیستم کامل هوش مصنوعی هستید: بودجهای بین 3 تا 9 میلیون دلار نیاز دارید.
-
اگر فقط به قیمت خود تراشه (برای مطالعات دانشگاهی یا تخمین هزینه) نیاز دارید: میتوانید حدود 30,000 تا 40,000 دلار را در نظر بگیرید (تخمین منطقیتر).
معماری NVLink 6 و الگوریتمهای خنکسازی در پلتفرم NVIDIA Rubin
در ادامه به تحلیل عمیق دو موضوع درخواستی شما میپردازم: معماری نسل ششم NVLink و فناوریهای خنکسازی بهکاررفته در پلتفرم Rubin.
۱. معماری NVLink 6: ستون فقرات ارتباطی رک Rubin
۱.۱ مشخصات کلیدی
نسل ششم NVLink پیشرفتهترین اینترنت اتصال GPU-to-GPU است که انویدیا تاکنون طراحی کرده است :
| مشخصه | مقدار | بهبود نسبت به نسل قبل |
|---|---|---|
| پهنای باند هر GPU | ۳.۶ ترابایت بر ثانیه (دوطرفه) | ۲ برابر (نسل پنجم: ۱.۸ ترابایت بر ثانیه) |
| تعداد لینکها در هر GPU | ۳۶ لینک | ۲ برابر (نسل پنجم: ۱۸ لینک) |
| پهنای باند کل رک (NVL72) | ۲۶۰ ترابایت بر ثانیه | ۲ برابر |
| پهنای باند در مقایسه با PCIe Gen6 | ۱۴ برابر بیشتر | — |
۱.۲ توپولوژی All-to-All در مقیاس رک
معماری NVLink 6 در پیکربندی NVL72، ۷۲ GPU و ۳۶ CPU را در یک دامنه NVLink یکپارچه متصل میکند :
-
اتصال کامل غیرمسدود (Non-blocking) : هر جفت GPU با پهنای باند ۳.۶ ترابایت بر ثانیه به یکدیگر متصل هستند
-
عملکرد کل محاسباتی : ۳.۶ اگزافلاپس توان AI
-
سوئیچینگ NVLink 6 : چیپهای سوئیچ، ۹ سینی (tray) در هر رک را به هم متصل میکنند
۱.۳ قابلیتهای عملیاتی جدید
NVLink 6 Switch قابلیتهای مدیریتی بیسابقهای را معرفی کرده است :
-
تعمیر و نگهداری بدون وقفه (Zero-Downtime Maintenance) : امکان تعویض سینی سوئیچها در حین کار سیستم
-
تابآوری صفحه کنترل (Control Plane Resilience) : تحمل خرابی اجزای کنترلی بدون افت عملکرد
-
اجرا با رک ناقص (Partial Rack Operation) : امکان کار با پیکربندی کمتر از ۷۲ GPU
-
Hot-swapping ترِیهای سوئیچ : جایگزینی قطعات بدون خاموش کردن رک
۱.۴ قابلیت SHARP در NVLink Switch
هر سوئیچ NVLink 6 مجهز به موتورهای SHARP (Scalable Hierarchical Aggregation and Reduction Protocol) است که :
-
عملیات reduction درون شبکهای (All-Reduce) را شتاب میدهد
-
ارتباطات multicast را با کارایی بالا انجام میدهد
-
تاخیر ارتباطی در مدلهای MoE (Mixture of Experts) را کاهش میدهد
۱.۵ معماری Cableless: حذف کابلهای پیچیده
یک نوآوری کلیدی در پیادهسازی NVLink 6، طراحی بدون کابل (Cableless) است :
-
اتصال مستقیم PCB به جای کابلهای نسل قبل (Cable Tray)
-
سرعت مونتاژ ۱۸ برابر سریعتر
-
کاهش هزینههای استقرار و نگهداری
-
افزایش قابلیت اطمینان با حذف اتصالات مستعد خرابی
در رک Rubin، سینیهای محاسباتی (هر کدام شامل ۲ CPU + ۴ GPU) مستقیماً و بدون کابل به سینیهای سوئیچ NVLink متصل میشوند .
۲. فناوریهای خنکسازی در پلتفرم Rubin
۲.۱ چالش حرارتی: توان ۲۶۰ کیلووات در هر رک
یک رک کامل Rubin NVL72 حدود ۲۶۰ کیلووات توان مصرف میکند . این مقدار در مقایسه با نسلهای قبل:
-
۲ برابر رک B200 (۱۲۰ کیلووات)
-
۶.۵ برابر رک H100 (۴۰ کیلووات)
۲.۲ راهحل اصلی: خنکسازی مایع مستقیم (Direct-to-Chip Liquid Cooling)
انویدیا برای مدیریت این چگالی توان بالا، از خنکسازی مایع مستقیم استفاده میکند :
| ویژگی | جزئیات فنی |
|---|---|
| تکنولوژی Cold Plate | صفحات سرد اختصاصی روی هر GPU Rubin و CPU Vera |
| خنککننده | خنکسازی سطح دای (die) به صورت مستقیم |
| دمای عملیاتی | ۴۵-۵۵ درجه سانتیگراد (در مقابل ۸۰+ درجه در خنک هوایی) |
| کاهش مصرف آب | بهبود ۲ برابری در مقایسه با نسل قبل |
۲.۳ نوآوریهای پیشرفته در طراحی حرارتی
طبق تحلیل فنی VR200 NVL72، پیشرفتهای زیر در سیستم خنکسازی Rubin به کار رفته است :
الف) میکروکانال Cold Plate (MCCP)
-
فناوری: ساختار ۳D میکرومتری با کانالهایی در مقیاس میکرون
-
افزایش سطح تماس: ۳۰۰ درصد نسبت به Cold Plate سنتی
-
کاهش دمای GPU: ۲۲ درجه سانتیگراد خنکتر نسبت به خنک هوایی در توان ۳۵۰ وات
ب) درپوش طلایی (Gold-plated Lid)
-
لایه طلا با خلوص ۹۹.۹۹٪ روی سطح بالایی GPU
-
افزایش ضریب هدایت حرارتی TIM از ۸ به ۱۵۰ W/m·K
-
حل مشکل تجمع گرما در توان بالا (مناسب برای حالت Max P)
۲.۴ CDU و زیرساخت خنکسازی در مقیاس رک
سیستم خنکسازی Rubin مبتنی بر واحدهای توزیع خنککننده (CDU) در ردیف سرورها است :
-
CDU درون ردیفی با قابلیت آب گرم (Warm-water operation)
-
ردوندام حلقوی برای اطمینان از عملکرد پیوسته
-
پایش نشت، جریان و فشار با تلهمتری دقیق
-
آلارمهای همبسته برای تشخیص زودهنگام خطا
۲.۵ جریان سیال و توان خنکسازی
طبق مشخصات فنی VR200 :
| پارامتر | مقدار | تغییر نسبت به نسل قبل |
|---|---|---|
| نرخ جریان خنککننده در هر رک | ۱۲۰ لیتر بر دقیقه | +۱۰۰٪ |
| نیاز جریان هوا | ۲۰۰ CFM | -۸۰٪ |
| توان مصرفی سیستم خنکسازی | ۷٪ از کل توان رک | از ۱۲٪ کاهش یافته |
| PUE (مصرف انرژی مرکز داده) | ۱.۱۵ | از ۱.۶ بهبود (در تستهای واقعی) |
۲.۶ حالتهای توان عملیاتی
سیستم دو حالت عملکرد دارد که از طریق BIOS قابل تنظیم است :
| حالت | توان هر GPU | کاربرد | بهبود عملکرد |
|---|---|---|---|
| Max Q | ۳۵۰ وات | آموزش مدلهای بلندمدت | +۱۵٪ بازده انرژی |
| Max P | ۵۰۰ وات | پردازش کوتاهمدت با نرخ بالا | +۲۸٪ توان عملیاتی |
این دو حالت از نظر سختافزاری کاملاً سازگار هستند و کاربر میتواند متناسب با نوع بار کاری بین آنها جابهجا شود.
۳. جمعبندی و تحلیل معماری
نقاط قوت معماری NVLink 6:
-
پهنای باند بیسابقه ۳.۶ ترابایت بر ثانیه – ۱۴ برابر PCIe Gen6
-
اتصال ۷۲ GPU در یک دامنه یکپارچه – حذف گلوگاههای ارتباطی در مدلهای بزرگ
-
قابلیت تعمیر بدون توقف – مناسب برای مراکز داده با الزام ۲۴/۷
-
معماری Cableless – کاهش هزینه مونتاژ و افزایش قابلیت اطمینان
نقاط قوت سیستم خنکسازی:
-
خنکسازی مایع مستقیم با Cold Plate میکروکانال – کاهش ۲۲ درجهای دما
-
درپوش طلایی – افزایش چشمگیر هدایت حرارتی (از ۸ به ۱۵۰ W/m·K)
-
کاهش PUE به ۱.۱۵ – صرفهجویی سالانه بیش از ۲ میلیون کیلوواتساعت برق
-
پشتیبانی از دو حالت توان (۳۵۰/۵۰۰ وات) – انعطاف در برابر بارهای کاری مختلف
برای ثبت نقد و بررسی وارد حساب کاربری خود شوید.
۵۴۰,۰۰۰,۰۰۰,۰۰۰ تومان
هم اکنون در انبار موجود نیست - اما میتوانید این محصول را پیش خرید کنید

دیدگاهها
پاککردن فیلترهاهیچ دیدگاهی برای این محصول نوشته نشده است.