NVIDIA·PlattformVorläufig

NVIDIA GH200 (Grace Hopper): Spezifikationen & Eignung für lokale KI

Grace-Hopper-Superchip mit großem kohärentem Speicher für die Bereitstellung großer Modelle.

Einige Angaben hier sind vorläufig (placeholder). Betrachten Sie die Spezifikationen als ungefähr und gleichen Sie sie mit dem Hersteller ab, bevor Sie sich darauf verlassen oder einen Kauf tätigen.

Spezifikationen

Speicher: 480 GB unified
Speichertyp: HBM3e + LPDDR5X
Bandbreite: zu prüfen
FP16 ca.: 990 TFLOPS
Architektur: Grace Hopper
Fertigung: TSMC 4N
Leistung: 1,000 W
Markteinführung: 2024

Modelle, die dieser Chip ausführen kann

Offene Modelle, bewertet für einen einzelnen NVIDIA GH200 (Grace Hopper), beste Eignung zuerst.

Gemma 2 27B
Gemma · ~27B · 8K ctx · Gemma Terms of Use
Passt mit FP16 (~54GB) bei ~282GB Reserve — etwa 6 gleichzeitige Instanzen.
FP16 · ~54GBLäuft gut
Gemma 3 27B
Gemma 3 · ~27B · 128K ctx · Gemma Terms of Use
Passt mit FP16 (~54GB) bei ~282GB Reserve — etwa 6 gleichzeitige Instanzen.
FP16 · ~54GBLäuft gut
Mistral Small 24B
Mistral · ~24B · 32K ctx · Apache-2.0
Passt mit FP16 (~48GB) bei ~288GB Reserve — etwa 7 gleichzeitige Instanzen.
FP16 · ~48GBLäuft gut
DeepSeek-Coder V2 (class)
DeepSeek · ~16B · 128K ctx · DeepSeek License
Passt mit FP16 (~33GB) bei ~303GB Reserve — etwa 10 gleichzeitige Instanzen.
FP16 · ~33GBLäuft gut
StarCoder2 15B
StarCoder · ~15B · 16K ctx · BigCode OpenRAIL-M
Passt mit FP16 (~30GB) bei ~306GB Reserve — etwa 11 gleichzeitige Instanzen.
FP16 · ~30GBLäuft gut
Qwen2.5 14B
Qwen · ~14B · 128K ctx · Apache-2.0
Passt mit FP16 (~30GB) bei ~306GB Reserve — etwa 11 gleichzeitige Instanzen.
FP16 · ~30GBLäuft gut
Qwen3 14B
Qwen · ~14B · 128K ctx · Apache-2.0
Passt mit FP16 (~30GB) bei ~306GB Reserve — etwa 11 gleichzeitige Instanzen.
FP16 · ~30GBLäuft gut
Phi-3 Medium (14B)
Phi · ~14B · 128K ctx · MIT
Passt mit FP16 (~28GB) bei ~308GB Reserve — etwa 12 gleichzeitige Instanzen.
FP16 · ~28GBLäuft gut

Bauen Sie ein privates AI Business OS auf NVIDIA GH200 (Grace Hopper)

Run your own AI agents on hardware you control — private by design, no per-seat data leaving your premises. BrainOutput helps you pick the right machine and turn it into a working AI Business OS.

AI Business OS entdecken