NVIDIA GH200 (Grace Hopper) : spécifications et compatibilité IA locale
Superchip Grace-Hopper à grande mémoire cohérente pour servir de grands modèles.
Certains détails ici sont provisoire (placeholder). Considérez les spécifications comme approximatives et vérifiez-les auprès du fabricant avant de vous y fier ou d’acheter.
Spécifications
- Mémoire
- 480 GB unifiée
- Type de mémoire
- HBM3e + LPDDR5X
- Bande passante
- à vérifier
- FP16 approx.
- 990 TFLOPS
- Architecture
- Grace Hopper
- Gravure
- TSMC 4N
- Consommation
- 1,000 W
- Sortie
- 2024
Modèles que cette puce peut exécuter
Modèles ouverts évalués pour une seule NVIDIA GH200 (Grace Hopper), du meilleur ajustement d'abord.
- Gemma 2 27BGemma · ~27B · 8K ctx · Gemma Terms of Use
Tient en FP16 (~54GB) avec ~282GB de marge — environ 6 instances simultanées.
FP16 · ~54GBFonctionne bien - Gemma 3 27BGemma 3 · ~27B · 128K ctx · Gemma Terms of Use
Tient en FP16 (~54GB) avec ~282GB de marge — environ 6 instances simultanées.
FP16 · ~54GBFonctionne bien - Mistral Small 24BMistral · ~24B · 32K ctx · Apache-2.0
Tient en FP16 (~48GB) avec ~288GB de marge — environ 7 instances simultanées.
FP16 · ~48GBFonctionne bien - DeepSeek-Coder V2 (class)DeepSeek · ~16B · 128K ctx · DeepSeek License
Tient en FP16 (~33GB) avec ~303GB de marge — environ 10 instances simultanées.
FP16 · ~33GBFonctionne bien - StarCoder2 15BStarCoder · ~15B · 16K ctx · BigCode OpenRAIL-M
Tient en FP16 (~30GB) avec ~306GB de marge — environ 11 instances simultanées.
FP16 · ~30GBFonctionne bien - Qwen2.5 14BQwen · ~14B · 128K ctx · Apache-2.0
Tient en FP16 (~30GB) avec ~306GB de marge — environ 11 instances simultanées.
FP16 · ~30GBFonctionne bien - Qwen3 14BQwen · ~14B · 128K ctx · Apache-2.0
Tient en FP16 (~30GB) avec ~306GB de marge — environ 11 instances simultanées.
FP16 · ~30GBFonctionne bien - Phi-3 Medium (14B)Phi · ~14B · 128K ctx · MIT
Tient en FP16 (~28GB) avec ~308GB de marge — environ 12 instances simultanées.
FP16 · ~28GBFonctionne bien
Construisez un AI Business OS privé sur NVIDIA GH200 (Grace Hopper)
Run your own AI agents on hardware you control — private by design, no per-seat data leaving your premises. BrainOutput helps you pick the right machine and turn it into a working AI Business OS.