NVIDIA GB200 (Grace-Blackwell) : spécifications et compatibilité IA locale
Plateforme superchip Grace-Blackwell pour l'IA à l'échelle du rack. Provisoire.
Certains détails ici sont provisoire (Annoncé). Considérez les spécifications comme approximatives et vérifiez-les auprès du fabricant avant de vous y fier ou d’acheter.
Spécifications
- Mémoire
- 384 GB unifiée
- Type de mémoire
- HBM3e + LPDDR5X
- Bande passante
- à vérifier
- FP16 approx.
- à vérifier
- Architecture
- Grace Blackwell
- Gravure
- TSMC 4NP
- Consommation
- à vérifier
- Sortie
- 2025
Modèles que cette puce peut exécuter
Modèles ouverts évalués pour une seule NVIDIA GB200 (Grace-Blackwell), du meilleur ajustement d'abord.
- Gemma 2 27BGemma · ~27B · 8K ctx · Gemma Terms of Use
Tient en FP16 (~54GB) avec ~214.8GB de marge — environ 4 instances simultanées.
FP16 · ~54GBFonctionne bien - Gemma 3 27BGemma 3 · ~27B · 128K ctx · Gemma Terms of Use
Tient en FP16 (~54GB) avec ~214.8GB de marge — environ 4 instances simultanées.
FP16 · ~54GBFonctionne bien - Mistral Small 24BMistral · ~24B · 32K ctx · Apache-2.0
Tient en FP16 (~48GB) avec ~220.8GB de marge — environ 5 instances simultanées.
FP16 · ~48GBFonctionne bien - DeepSeek-Coder V2 (class)DeepSeek · ~16B · 128K ctx · DeepSeek License
Tient en FP16 (~33GB) avec ~235.8GB de marge — environ 8 instances simultanées.
FP16 · ~33GBFonctionne bien - StarCoder2 15BStarCoder · ~15B · 16K ctx · BigCode OpenRAIL-M
Tient en FP16 (~30GB) avec ~238.8GB de marge — environ 8 instances simultanées.
FP16 · ~30GBFonctionne bien - Qwen2.5 14BQwen · ~14B · 128K ctx · Apache-2.0
Tient en FP16 (~30GB) avec ~238.8GB de marge — environ 8 instances simultanées.
FP16 · ~30GBFonctionne bien - Qwen3 14BQwen · ~14B · 128K ctx · Apache-2.0
Tient en FP16 (~30GB) avec ~238.8GB de marge — environ 8 instances simultanées.
FP16 · ~30GBFonctionne bien - Phi-3 Medium (14B)Phi · ~14B · 128K ctx · MIT
Tient en FP16 (~28GB) avec ~240.8GB de marge — environ 9 instances simultanées.
FP16 · ~28GBFonctionne bien
Construisez un AI Business OS privé sur NVIDIA GB200 (Grace-Blackwell)
Run your own AI agents on hardware you control — private by design, no per-seat data leaving your premises. BrainOutput helps you pick the right machine and turn it into a working AI Business OS.