BBrainOutput
NVIDIA·PlattformVorläufig

NVIDIA GH200 (Grace Hopper): Spezifikationen & Eignung für lokale KI

Grace-Hopper-Superchip mit großem kohärentem Speicher für die Bereitstellung großer Modelle.

Einige Angaben hier sind vorläufig (placeholder). Betrachten Sie die Spezifikationen als ungefähr und gleichen Sie sie mit dem Hersteller ab, bevor Sie sich darauf verlassen oder einen Kauf tätigen.

Spezifikationen

Speicher
480 GB unified
Speichertyp
HBM3e + LPDDR5X
Bandbreite
zu prüfen
FP16 ca.
990 TFLOPS
Architektur
Grace Hopper
Fertigung
TSMC 4N
Leistung
1,000 W
Markteinführung
2024

Modelle, die dieser Chip ausführen kann

Offene Modelle, bewertet für einen einzelnen NVIDIA GH200 (Grace Hopper), beste Eignung zuerst.

  • Gemma 2 27B
    Gemma · ~27B · 8K ctx · Gemma Terms of Use

    Passt mit FP16 (~54GB) bei ~282GB Reserve — etwa 6 gleichzeitige Instanzen.

    FP16 · ~54GBLäuft gut
  • Gemma 3 27B
    Gemma 3 · ~27B · 128K ctx · Gemma Terms of Use

    Passt mit FP16 (~54GB) bei ~282GB Reserve — etwa 6 gleichzeitige Instanzen.

    FP16 · ~54GBLäuft gut
  • Mistral Small 24B
    Mistral · ~24B · 32K ctx · Apache-2.0

    Passt mit FP16 (~48GB) bei ~288GB Reserve — etwa 7 gleichzeitige Instanzen.

    FP16 · ~48GBLäuft gut
  • DeepSeek-Coder V2 (class)
    DeepSeek · ~16B · 128K ctx · DeepSeek License

    Passt mit FP16 (~33GB) bei ~303GB Reserve — etwa 10 gleichzeitige Instanzen.

    FP16 · ~33GBLäuft gut
  • StarCoder2 15B
    StarCoder · ~15B · 16K ctx · BigCode OpenRAIL-M

    Passt mit FP16 (~30GB) bei ~306GB Reserve — etwa 11 gleichzeitige Instanzen.

    FP16 · ~30GBLäuft gut
  • Qwen2.5 14B
    Qwen · ~14B · 128K ctx · Apache-2.0

    Passt mit FP16 (~30GB) bei ~306GB Reserve — etwa 11 gleichzeitige Instanzen.

    FP16 · ~30GBLäuft gut
  • Qwen3 14B
    Qwen · ~14B · 128K ctx · Apache-2.0

    Passt mit FP16 (~30GB) bei ~306GB Reserve — etwa 11 gleichzeitige Instanzen.

    FP16 · ~30GBLäuft gut
  • Phi-3 Medium (14B)
    Phi · ~14B · 128K ctx · MIT

    Passt mit FP16 (~28GB) bei ~308GB Reserve — etwa 12 gleichzeitige Instanzen.

    FP16 · ~28GBLäuft gut

Bauen Sie ein privates AI Business OS auf NVIDIA GH200 (Grace Hopper)

Run your own AI agents on hardware you control — private by design, no per-seat data leaving your premises. BrainOutput helps you pick the right machine and turn it into a working AI Business OS.