کارت گرافیک A100 Tensor Core
A100 Tensor Core
مشخصات فنی:
FP64 Tensor Core: 19.5 ترافلاپس
Tensor Float 32 (TF32): 156 ترافلاپس (312 ترافلاپس با تنکسازی)
FP16 Tensor Core: 312 ترافلاپس (624 ترافلاپس با تنکسازی)
INT8 Tensor Core: 624 ترااپس (1,248 ترااپس با تنکسازی)
حافظه GPU: 40 گیگابایت HBM2 یا 80 گیگابایت HBM2e
پهنای باند: تا 2,039 گیگابایت بر ثانیه
توان طراحی حرارتی: 250 وات (PCIe) تا 400 وات (SXM)
فرمفاکتورها: PCIe و SXM4
NVLink: تا 600 گیگابایت بر ثانیه
PCIe Gen4: 64 گیگابایت بر ثانیه
پشتیبانی از سیستمهای NVIDIA HGX A100 با تا 16 GPU.
کارت گرافیک NVIDIA H100 Tensor Core GPU
NVIDIA H100 Tensor Core GPU
Architecture Overview
GPU Architecture: Hopper (H100)
Process Node: TSMC 4N (Custom 4nm)
Transistor Count: 80 billion
SMs (Streaming Multiprocessors): Up to 144 (varies by configuration)
CUDA Cores: Not explicitly stated (Hopper focuses on Tensor Cores rather than CUDA cores)
Tensor Cores: 4th Generation (with new FP8, FP16, TF32, FP64 acceleration)
PCIe Version: PCIe 5.0 (x16)
NVLink: 4th Gen NVLink (900 GB/s bidirectional bandwidth)
Multi-Instance GPU (MIG): Up to 7 instances per GPU