NVIDIA · AI Appliances

NVIDIA DGX Spark (GB10): Lokale KI und Eignung fürs Business

Name: NVIDIA DGX Spark (GB10)
Brand: NVIDIA

NVIDIAs GB10-Grace-Blackwell-Desktop-KI-Appliance mit ~128 GB Unified Memory — eine leise, kompakte On-Premise-Box für eine private KI-Belegschaft. Erhältlich bei BrainOutput mit vorinstalliertem BrainOS.

Das bedeutet der NVIDIA DGX Spark (GB10) für ein Unternehmen, das private KI auf selbst kontrollierter Hardware betreiben will: welche offenen LLMs passen, welche Agenten er antreiben kann, die passende AI Business OS-Stufe und ob lokal, in der Cloud oder hybrid betrieben werden sollte.

66/100· Stark·~

On-prem · BrainOS pre-installed

Buy the NVIDIA DGX Spark (GB10) with AI Business OS ready to run

BrainOutput can ship this GB10 appliance with BrainOS pre-installed and your agent packs configured — a private AI workforce you own, running on-premise on day one.

Request this appliance →Specs are approximate GB10-platform figures — availability and pricing to verify.

Spezifikationen auf einen Blick

Speicher: 128 GB unified
Speichertyp: LPDDR5X (unified, Grace Blackwell)
Bandbreite: 273 GB/s
FP16 ca.: to verify
Architektur: NVIDIA Grace Blackwell GB10
Fertigung: to verify
Leistungsaufnahme: 170 W
Erscheinungsjahr: 2025

Die Spezifikationen sind approximate Angaben. Näherungswerte der GB10-Klasse: ~128 GB Unified LPDDR5X, ~273 GB/s, ~1 PFLOP FP4-Rechenleistung (sparse), ~170 W. Genaue SKU, Speicher, Verfügbarkeit und Preis variieren — vor dem Kauf prüfen. Von BrainOutput als On-Premise-BrainOS-Appliance angeboten.

KI-Kompatibilitäts-Scores

Transparente Heuristiken von 0 bis 100, die nutzbaren Speicher, Bandbreite und Rechenleistung kombinieren – relative Orientierung, keine Benchmarks.

Lokale KI (gesamt)66/100

Dokumenten-RAG68/100

Coding-Agenten66/100

Multi-Agent51/100

Geschäftsautomatisierung61/100

~ Einige Spezifikationen sind unverifiziert, diese Scores sind daher vorläufig.

Kompatible LLMs

Open-Weight-Chat-, Coding- und Reasoning-Modelle aus unserem Katalog, bewertet für den NVIDIA DGX Spark (GB10), beste Eignung zuerst.

CodeLlama 13B
CodeLlama · 13B · Llama Community License
Passt mit FP16 (~26GB) bei ~63.6GB Reserve — etwa 3 gleichzeitige Instanzen.
FP16 · ~26GBLäuft gut
Gemma 3 12B
Gemma 3 · 12B · Gemma Terms of Use
Passt mit FP16 (~24GB) bei ~65.6GB Reserve — etwa 3 gleichzeitige Instanzen.
FP16 · ~24GBLäuft gut
Mistral Nemo 12B
Mistral · 12B · Apache-2.0
Passt mit FP16 (~24GB) bei ~65.6GB Reserve — etwa 3 gleichzeitige Instanzen.
FP16 · ~24GBLäuft gut
Gemma 2 9B
Gemma · 9B · Gemma Terms of Use
Passt mit FP16 (~19GB) bei ~70.6GB Reserve — etwa 4 gleichzeitige Instanzen.
FP16 · ~19GBLäuft gut
Llama 3.1 8B
Llama · 8B · Llama Community License
Passt mit FP16 (~17GB) bei ~72.6GB Reserve — etwa 5 gleichzeitige Instanzen.
FP16 · ~17GBLäuft gut
Qwen3 8B
Qwen · 8B · Apache-2.0
Passt mit FP16 (~17GB) bei ~72.6GB Reserve — etwa 5 gleichzeitige Instanzen.
FP16 · ~17GBLäuft gut
Granite 3 8B
Granite · 8B · Apache-2.0
Passt mit FP16 (~17GB) bei ~72.6GB Reserve — etwa 5 gleichzeitige Instanzen.
FP16 · ~17GBLäuft gut
DeepSeek-R1 Distill 8B
DeepSeek · 8B · MIT
Passt mit FP16 (~17GB) bei ~72.6GB Reserve — etwa 5 gleichzeitige Instanzen.
FP16 · ~17GBLäuft gut

Den vollständigen Modellkatalog ansehen →

Beste Modelle nach Geschäfts-Workload

Am besten für Coding-Agenten

Code-Vervollständigung, Review und Refactoring auf privatem Quellcode.

CodeLlama 13BLäuft gut
Qwen3 8BLäuft gut
DeepSeek-R1 Distill 8BLäuft gut

Am besten für RAG / Suche

Beantwortung über Ihre Dokumente mit Quellenangaben.

LLaVA 13B (vision)Läuft gut
Gemma 3 12BLäuft gut
Mistral Nemo 12BLäuft gut

Am besten für Geschäftsautomatisierung

Dokumentenextraktion und Backoffice-Workflows.

Geeignet für ein privates AI Business OS?

✓

Ja — dies ist ein praktikabler privater AI Business OS-Host für die ein abteilungsweites-Bereitstellung und betreibt Modelle wie CodeLlama 13B auf Hardware, die Sie kontrollieren.

Aushängeschild-Modell, das es hosten kann: CodeLlama 13B.

Wo es an Grenzen stößt

▸Die Bandbreite des Unified Memory liegt hinter dedizierten HBM-GPUs zurück, sodass große Modelle zwar laufen, aber Token langsamer generieren.

Business-Agenten, die sinnvoll sind

Wie diese Maschine zu den zentralen AI Business OS-Agenten-Archetypen passt:

Kundensupport-Agent
Beantwortet Kundenanfragen anhand Ihrer Dokumente, verfasst Antworten, sortiert Tickets vor.
Sehr gut geeignet
Dokumenten-/RAG-Agent
Liest Verträge, Berichte und Wikis und antwortet mit Quellenangaben.
Sehr gut geeignet
Rechtsbeweis-Agent (DocMatch-Stil)
Durchsucht Fallakten und Beweismittel, um Beweise sichtbar zu machen und zu verknüpfen.
Sehr gut geeignet
Hotel-/Gastgewerbe-Agent
Übernimmt Gästekommunikation, Buchungen und Rezeptionsautomatisierung.
Sehr gut geeignet
Buchhaltungs-/Odoo-Agent
Extrahiert Rechnungen, gleicht Daten ab und steuert ERP-Workflows.
Leistungsfähig
Coding-/Produktentwicklungs-Agent
Lokale Code-Vervollständigung, Review und Refactoring auf privatem Quellcode.
Sehr gut geeignet
Founder Ops / Business-Kommandozentrale
Eine Flotte kooperierender Agenten, die das gesamte Geschäft privat betreibt.
Cloud-Unterstützung

„Cloud-Unterstützung“ bedeutet, es lokal für leichte Lasten zu betreiben und für schwerere Jobs in die Cloud zu bursten. Siehe Geschäfts-Anwendungsfälle dafür, wie jeder Agent auf Hardware abgebildet wird.

Häufig gestellte Fragen

Ist der NVIDIA DGX Spark (GB10) gut zum Betreiben lokaler KI geeignet?+

Er erreicht 66/100 auf unserem Local AI Score (Stufe Stark), basierend auf seinen 128GB Speicher und der verfügbaren Bandbreite/Rechenleistung. Einige Spezifikationen sind unverifiziert, betrachten Sie den Score daher als vorläufig. Damit eignet er sich für die AI Business OS-Stufe Business.

Welche LLMs kann der NVIDIA DGX Spark (GB10) betreiben?+

Problemlos: Qwen2.5 72B (Q8_0), Llama 3.1 70B (Q8_0), Llama 3.3 70B (Q8_0). Größere Modelle laufen ggf. mit stärkerer Quantisierung oder durch Verteilung auf mehrere Geräte.

Sollte ich KI lokal oder in der Cloud auf dem NVIDIA DGX Spark (GB10) betreiben?+

Lokal zuerst wird empfohlen. Genug Leistung, um echte Agenten lokal zu hosten — für Datenschutz und planbare Kosten; nutzen Sie die Cloud nur, um Spitzenbedarf abzufangen.

Kann ich den NVIDIA DGX Spark (GB10) in ein privates AI Business OS verwandeln?+

Ja. AI Business OS kann auf dieser Maschine in der Stufe Business laufen und gibt Ihnen private Agenten auf Ihrer eigenen Hardware. Siehe den Call-to-Action oben, um loszulegen.

Machen Sie den NVIDIA DGX Spark (GB10) zu einem privaten AI Business OS

Betreiben Sie Ihre eigenen KI-Agenten auf selbst kontrollierter Hardware – privat by design, keine Daten pro Nutzer verlassen Ihr Haus. BrainOutput hilft Ihnen, die richtige Maschine zu wählen und daraus ein funktionierendes AI Business OS zu machen.

Loslegen