NVIDIA GH200 (Grace Hopper): Spezifikationen & Eignung für lokale KI
Grace-Hopper-Superchip mit großem kohärentem Speicher für die Bereitstellung großer Modelle.
Einige Angaben hier sind vorläufig (placeholder). Betrachten Sie die Spezifikationen als ungefähr und gleichen Sie sie mit dem Hersteller ab, bevor Sie sich darauf verlassen oder einen Kauf tätigen.
Spezifikationen
- Speicher
- 480 GB unified
- Speichertyp
- HBM3e + LPDDR5X
- Bandbreite
- zu prüfen
- FP16 ca.
- 990 TFLOPS
- Architektur
- Grace Hopper
- Fertigung
- TSMC 4N
- Leistung
- 1,000 W
- Markteinführung
- 2024
Modelle, die dieser Chip ausführen kann
Offene Modelle, bewertet für einen einzelnen NVIDIA GH200 (Grace Hopper), beste Eignung zuerst.
- Gemma 2 27BGemma · ~27B · 8K ctx · Gemma Terms of Use
Passt mit FP16 (~54GB) bei ~282GB Reserve — etwa 6 gleichzeitige Instanzen.
FP16 · ~54GBLäuft gut - Gemma 3 27BGemma 3 · ~27B · 128K ctx · Gemma Terms of Use
Passt mit FP16 (~54GB) bei ~282GB Reserve — etwa 6 gleichzeitige Instanzen.
FP16 · ~54GBLäuft gut - Mistral Small 24BMistral · ~24B · 32K ctx · Apache-2.0
Passt mit FP16 (~48GB) bei ~288GB Reserve — etwa 7 gleichzeitige Instanzen.
FP16 · ~48GBLäuft gut - DeepSeek-Coder V2 (class)DeepSeek · ~16B · 128K ctx · DeepSeek License
Passt mit FP16 (~33GB) bei ~303GB Reserve — etwa 10 gleichzeitige Instanzen.
FP16 · ~33GBLäuft gut - StarCoder2 15BStarCoder · ~15B · 16K ctx · BigCode OpenRAIL-M
Passt mit FP16 (~30GB) bei ~306GB Reserve — etwa 11 gleichzeitige Instanzen.
FP16 · ~30GBLäuft gut - Qwen2.5 14BQwen · ~14B · 128K ctx · Apache-2.0
Passt mit FP16 (~30GB) bei ~306GB Reserve — etwa 11 gleichzeitige Instanzen.
FP16 · ~30GBLäuft gut - Qwen3 14BQwen · ~14B · 128K ctx · Apache-2.0
Passt mit FP16 (~30GB) bei ~306GB Reserve — etwa 11 gleichzeitige Instanzen.
FP16 · ~30GBLäuft gut - Phi-3 Medium (14B)Phi · ~14B · 128K ctx · MIT
Passt mit FP16 (~28GB) bei ~308GB Reserve — etwa 12 gleichzeitige Instanzen.
FP16 · ~28GBLäuft gut
Bauen Sie ein privates AI Business OS auf NVIDIA GH200 (Grace Hopper)
Run your own AI agents on hardware you control — private by design, no per-seat data leaving your premises. BrainOutput helps you pick the right machine and turn it into a working AI Business OS.