BBrainOutput
NVIDIA · AI Appliances

NVIDIA DGX Spark (GB10): IA local y encaje para empresas

El appliance de IA de escritorio GB10 Grace Blackwell de NVIDIA con ~128GB de memoria unificada — una caja on-premise silenciosa y compacta para una plantilla de IA privada. Disponible en BrainOutput con BrainOS preinstalado.

Esto es lo que significa el NVIDIA DGX Spark (GB10) para una empresa que quiere ejecutar IA privada en hardware que controla: qué LLM abiertos encajan, qué agentes puede impulsar, el nivel de AI Business OS que le corresponde y si conviene ejecutar en local, en la nube o de forma híbrida.

66/100· Potente·~

On-prem · BrainOS pre-installed

Buy the NVIDIA DGX Spark (GB10) with AI Business OS ready to run

BrainOutput can ship this GB10 appliance with BrainOS pre-installed and your agent packs configured — a private AI workforce you own, running on-premise on day one.

Request this appliance →Specs are approximate GB10-platform figures — availability and pricing to verify.

Especificaciones de un vistazo

Memoria
128 GB unified
Tipo de memoria
LPDDR5X (unified, Grace Blackwell)
Ancho de banda
273 GB/s
FP16 aprox.
to verify
Arquitectura
NVIDIA Grace Blackwell GB10
Proceso
to verify
Consumo
170 W
Año de lanzamiento
2025

Las especificaciones son cifras approximate. Cifras aproximadas de clase GB10: ~128GB unificados LPDDR5X, ~273 GB/s, ~1 PFLOP de cómputo FP4 (disperso), ~170W. El SKU exacto, el almacenamiento, la disponibilidad y el precio varían — verifícalos antes de comprar. Ofrecido por BrainOutput como appliance on-premise con BrainOS.

Puntuaciones de compatibilidad con IA

Heurísticas transparentes de 0 a 100 que combinan memoria utilizable, ancho de banda y cómputo: orientación relativa, no pruebas de rendimiento.

IA local (general)66/100
RAG documental68/100
Agentes de código66/100
Multiagente51/100
Automatización de negocio61/100

~ Algunas especificaciones no están verificadas, así que estas puntuaciones son provisionales.

LLMs compatibles

Modelos abiertos de chat, código y razonamiento de nuestro catálogo, evaluados para el NVIDIA DGX Spark (GB10), los más adecuados primero.

  • CodeLlama 13B
    CodeLlama · 13B · Llama Community License

    Cabe en FP16 (~26GB) con ~63.6GB de margen — alrededor de 3 instancias simultáneas.

    FP16 · ~26GBFunciona bien
  • Gemma 3 12B
    Gemma 3 · 12B · Gemma Terms of Use

    Cabe en FP16 (~24GB) con ~65.6GB de margen — alrededor de 3 instancias simultáneas.

    FP16 · ~24GBFunciona bien
  • Mistral Nemo 12B
    Mistral · 12B · Apache-2.0

    Cabe en FP16 (~24GB) con ~65.6GB de margen — alrededor de 3 instancias simultáneas.

    FP16 · ~24GBFunciona bien
  • Gemma 2 9B
    Gemma · 9B · Gemma Terms of Use

    Cabe en FP16 (~19GB) con ~70.6GB de margen — alrededor de 4 instancias simultáneas.

    FP16 · ~19GBFunciona bien
  • Llama 3.1 8B
    Llama · 8B · Llama Community License

    Cabe en FP16 (~17GB) con ~72.6GB de margen — alrededor de 5 instancias simultáneas.

    FP16 · ~17GBFunciona bien
  • Qwen3 8B
    Qwen · 8B · Apache-2.0

    Cabe en FP16 (~17GB) con ~72.6GB de margen — alrededor de 5 instancias simultáneas.

    FP16 · ~17GBFunciona bien
  • Granite 3 8B
    Granite · 8B · Apache-2.0

    Cabe en FP16 (~17GB) con ~72.6GB de margen — alrededor de 5 instancias simultáneas.

    FP16 · ~17GBFunciona bien
  • DeepSeek-R1 Distill 8B
    DeepSeek · 8B · MIT

    Cabe en FP16 (~17GB) con ~72.6GB de margen — alrededor de 5 instancias simultáneas.

    FP16 · ~17GBFunciona bien

Ver el catálogo completo de modelos →

Mejores modelos por carga de trabajo de negocio

Mejor para agentes de código

Autocompletado, revisión y refactorización de código sobre código fuente privado.

Mejor para RAG / búsqueda

Responder sobre tus documentos con citas.

Mejor para automatización de negocio

Extracción de documentos y flujos de trabajo de back-office.

¿Bueno para un AI Business OS privado?

Sí — este es un host viable para un AI Business OS privado en despliegue a escala de departamento, ejecutando modelos como CodeLlama 13B en hardware que tú controlas.

Modelo destacado que puede alojar: CodeLlama 13B.

Dónde se queda corto

  • El ancho de banda de la memoria unificada queda por detrás de las GPU con HBM dedicada, así que los modelos grandes funcionan pero generan tokens más despacio.

Agentes de negocio que tienen sentido

Cómo encaja esta máquina con los arquetipos de agentes principales de AI Business OS:

  • Agente de Atención al Cliente

    Responde a clientes a partir de tus documentos, redacta respuestas y clasifica tickets.

    Muy adecuado
  • Agente de Documentos / RAG

    Lee contratos, informes y wikis y responde con citas.

    Muy adecuado
  • Agente de Evidencia Legal (estilo DocMatch)

    Busca en expedientes y pruebas para localizar y enlazar evidencias.

    Muy adecuado
  • Agente de Hotel / Hostelería

    Gestiona la mensajería con huéspedes, reservas y la automatización de recepción.

    Muy adecuado
  • Agente de Contabilidad / Odoo

    Extrae facturas, concilia datos y dirige flujos de trabajo en el ERP.

    Competente
  • Agente de Programación / Ingeniería de Producto

    Autocompletado, revisión y refactorización de código en local sobre código fuente privado.

    Muy adecuado
  • Founder Ops / Centro de Mando del Negocio

    Una flota de agentes cooperando para llevar todo el negocio de forma privada.

    Asistencia en la nube

“Asistencia en la nube” significa ejecutarlo en local para cargas ligeras y absorber en la nube los trabajos más pesados. Consulta casos de uso de negocio para ver cómo se corresponde cada agente con el hardware.

Preguntas frecuentes

¿Es el NVIDIA DGX Spark (GB10) bueno para ejecutar IA local?+

Obtiene 66/100 en nuestro Local AI Score (nivel Potente), según sus 128GB de memoria y el ancho de banda/cómputo disponibles. Algunas especificaciones no están verificadas, así que considera la puntuación como provisional. Eso lo hace adecuado para el nivel Business del AI Business OS.

¿Qué LLMs puede ejecutar el NVIDIA DGX Spark (GB10)?+

Con holgura: Qwen2.5 72B (Q8_0), Llama 3.1 70B (Q8_0), Llama 3.3 70B (Q8_0). Los modelos más grandes pueden funcionar con una cuantización más agresiva o repartiéndolos entre varios dispositivos.

¿Debería ejecutar la IA en local o en la nube en el NVIDIA DGX Spark (GB10)?+

Se recomienda un enfoque local primero. Suficiente capacidad para alojar agentes reales en local con privacidad y coste predecible; usa la nube solo para absorber picos por encima de la demanda máxima.

¿Puedo convertir el NVIDIA DGX Spark (GB10) en un AI Business OS privado?+

Sí. AI Business OS puede ejecutarse en esta máquina en el nivel Business, dándote agentes privados en tu propio hardware. Consulta la llamada a la acción de arriba para empezar.

Convierte el NVIDIA DGX Spark (GB10) en un AI Business OS privado

Ejecuta tus propios agentes de IA en hardware que controlas: privado por diseño, sin datos por usuario saliendo de tus instalaciones. BrainOutput te ayuda a elegir la máquina adecuada y a convertirla en un AI Business OS en funcionamiento.

Hardware relacionado