NVIDIA · AI Appliances

NVIDIA DGX Spark (GB10): IA local e adequação para empresas

Name: NVIDIA DGX Spark (GB10)
Brand: NVIDIA

A appliance de IA de secretária GB10 Grace Blackwell da NVIDIA com ~128GB de memória unificada — uma caixa on-premise silenciosa e compacta para uma força de trabalho de IA privada. Disponível na BrainOutput com o BrainOS pré-instalado.

Eis o que o NVIDIA DGX Spark (GB10) representa para uma empresa que quer executar IA privada em hardware que controla: que LLMs abertos encaixam, que agentes pode alimentar, o nível AI Business OS adequado e se deve executar em local, na nuvem ou em híbrido.

66/100· Forte·~

On-prem · BrainOS pre-installed

Buy the NVIDIA DGX Spark (GB10) with AI Business OS ready to run

BrainOutput can ship this GB10 appliance with BrainOS pre-installed and your agent packs configured — a private AI workforce you own, running on-premise on day one.

Request this appliance →Specs are approximate GB10-platform figures — availability and pricing to verify.

Especificações num relance

Memória: 128 GB unified
Tipo de memória: LPDDR5X (unified, Grace Blackwell)
Largura de banda: 273 GB/s
FP16 aprox.: to verify
Arquitetura: NVIDIA Grace Blackwell GB10
Processo: to verify
Consumo: 170 W
Ano de lançamento: 2025

As especificações são valores approximate. Valores aproximados de classe GB10: ~128GB unificados LPDDR5X, ~273 GB/s, ~1 PFLOP de computação FP4 (esparso), ~170W. O SKU exato, o armazenamento, a disponibilidade e o preço variam — verifique antes de comprar. Oferecido pela BrainOutput como appliance on-premise com BrainOS.

Pontuações de compatibilidade com IA

Heurísticas transparentes de 0 a 100 que combinam memória utilizável, largura de banda e computação: orientação relativa, não testes de desempenho.

IA local (global)66/100

RAG documental68/100

Agentes de programação66/100

Multiagente51/100

Automação de negócio61/100

~ Algumas especificações não estão verificadas, por isso estas pontuações são provisórias.

LLMs compatíveis

Modelos de chat, programação e raciocínio de pesos abertos do nosso catálogo, classificados para o NVIDIA DGX Spark (GB10), melhor encaixe primeiro.

CodeLlama 13B
CodeLlama · 13B · Llama Community License
Cabe em FP16 (~26GB) com ~63.6GB de margem — cerca de 3 instâncias em simultâneo.
FP16 · ~26GBCorre bem
Gemma 3 12B
Gemma 3 · 12B · Gemma Terms of Use
Cabe em FP16 (~24GB) com ~65.6GB de margem — cerca de 3 instâncias em simultâneo.
FP16 · ~24GBCorre bem
Mistral Nemo 12B
Mistral · 12B · Apache-2.0
Cabe em FP16 (~24GB) com ~65.6GB de margem — cerca de 3 instâncias em simultâneo.
FP16 · ~24GBCorre bem
Gemma 2 9B
Gemma · 9B · Gemma Terms of Use
Cabe em FP16 (~19GB) com ~70.6GB de margem — cerca de 4 instâncias em simultâneo.
FP16 · ~19GBCorre bem
Llama 3.1 8B
Llama · 8B · Llama Community License
Cabe em FP16 (~17GB) com ~72.6GB de margem — cerca de 5 instâncias em simultâneo.
FP16 · ~17GBCorre bem
Qwen3 8B
Qwen · 8B · Apache-2.0
Cabe em FP16 (~17GB) com ~72.6GB de margem — cerca de 5 instâncias em simultâneo.
FP16 · ~17GBCorre bem
Granite 3 8B
Granite · 8B · Apache-2.0
Cabe em FP16 (~17GB) com ~72.6GB de margem — cerca de 5 instâncias em simultâneo.
FP16 · ~17GBCorre bem
DeepSeek-R1 Distill 8B
DeepSeek · 8B · MIT
Cabe em FP16 (~17GB) com ~72.6GB de margem — cerca de 5 instâncias em simultâneo.
FP16 · ~17GBCorre bem

Ver o catálogo completo de modelos →

Melhores modelos por carga de trabalho de negócio

Melhor para agentes de programação

Conclusão, revisão e refatoração de código sobre código-fonte privado.

CodeLlama 13BCorre bem
Qwen3 8BCorre bem
DeepSeek-R1 Distill 8BCorre bem

Melhor para RAG / pesquisa

Respostas sobre os seus documentos com citações.

Melhor para automação de negócio

Extração de documentos e fluxos de trabalho de back-office.

Bom para um AI Business OS privado?

✓

Sim — este é um anfitrião privado viável para o AI Business OS em implementação uma implementação à escala de um departamento, executando modelos como o CodeLlama 13B em hardware que controla.

Modelo de destaque que consegue alojar: CodeLlama 13B.

Onde fica aquém

▸A largura de banda da memória unificada fica aquém das GPUs HBM discretas, pelo que modelos grandes correm mas geram tokens mais lentamente.

Agentes de negócio que fazem sentido

Como esta máquina encaixa nos principais arquétipos de agentes do AI Business OS:

Agente de Apoio ao Cliente
Responde a clientes a partir dos seus documentos, redige respostas, triagem de tickets.
Bom encaixe
Agente de Documentos / RAG
Lê contratos, relatórios e wikis e responde com citações.
Bom encaixe
Agente de Prova Jurídica (estilo DocMatch)
Pesquisa processos e documentos probatórios para revelar e ligar provas.
Bom encaixe
Agente de Hotelaria / Hospitalidade
Gere a comunicação com hóspedes, reservas e automação de receção.
Bom encaixe
Agente de Contabilidade / Odoo
Extrai faturas, reconcilia dados e conduz fluxos de trabalho de ERP.
Capaz
Agente de Programação / Engenharia de Produto
Conclusão, revisão e refatoração de código localmente sobre código-fonte privado.
Bom encaixe
Founder Ops / Centro de Comando do Negócio
Uma frota de agentes cooperantes a gerir todo o negócio de forma privada.
Assistência na nuvem

“Assistência na nuvem” significa executá-lo localmente para cargas leves e recorrer à nuvem para trabalhos mais pesados. Veja casos de uso de negócio para saber como cada agente se mapeia ao hardware.

Perguntas frequentes

O NVIDIA DGX Spark (GB10) é bom para executar IA local?+

Obtém 66/100 no nosso Local AI Score (nível Forte), com base nos seus 128GB de memória e na largura de banda/computação disponíveis. Algumas especificações não estão verificadas, por isso trate a pontuação como provisória. Isso torna-o adequado ao nível Business do AI Business OS.

Que LLMs consegue o NVIDIA DGX Spark (GB10) executar?+

Confortavelmente: Qwen2.5 72B (Q8_0), Llama 3.1 70B (Q8_0), Llama 3.3 70B (Q8_0). Modelos maiores podem correr com quantização mais agressiva ou dividindo-os entre vários dispositivos.

Devo executar IA localmente ou na nuvem no NVIDIA DGX Spark (GB10)?+

Local em primeiro lugar é recomendado. Capacidade suficiente para alojar agentes reais localmente, com privacidade e custo previsível; use a nuvem apenas para picos acima da procura máxima.

Posso transformar o NVIDIA DGX Spark (GB10) num AI Business OS privado?+

Sim. O AI Business OS pode correr nesta máquina ao nível Business, dando-lhe agentes privados no seu próprio hardware. Veja o apelo à ação acima para começar.

Transforme o NVIDIA DGX Spark (GB10) num AI Business OS privado

Execute os seus próprios agentes de IA em hardware que controla: privado por design, sem dados por utilizador a saírem das suas instalações. BrainOutput ajuda-o a escolher a máquina certa e a transformá-la num AI Business OS em funcionamento.

Começar

Hardware relacionado

ASUS · Appliances de IA

ASUS Ascent GX10 (GB10)

66/100· Forte·~

A mini appliance de IA GB10 Grace Blackwell da ASUS (~128GB de memória unificada) — uma caixa on-premise compacta para agentes privados e RAG. Disponível na BrainOutput com o BrainOS pré-instalado.

Memória: 128 GB unified
Arquitetura: NVIDIA Grace Blackwell GB10

Dell · Appliances de IA

Dell Pro Max with GB10

66/100· Forte·~

A appliance de IA de secretária GB10 Grace Blackwell da Dell (~128GB de memória unificada) para agentes privados on-premise. Disponível na BrainOutput com o BrainOS pré-instalado.

Memória: 128 GB unified
Arquitetura: NVIDIA Grace Blackwell GB10

Reference · Appliances de IA

Local Office AI Appliance (reference profile)

39/100· Inicial

Uma caixa silenciosa de formato compacto para um único escritório: suficiente para um assistente privado e RAG documental leve num modelo de 7–14B.

Memória: 16 GB
Arquitetura: Ada Lovelace

Reference · Appliances de IA

Hotel AI Automation Box (reference profile)

39/100· Inicial

Uma caixa no local para a hotelaria: executa um agente multilingue de mensagens com hóspedes e automação de receção sem enviar dados de hóspedes para a cloud.

Memória: 16 GB
Arquitetura: Ada Lovelace