Reference · AI Servers

Dual RTX 3060 Local Server (reference profile): IA local y encaje para empresas

Name: Dual RTX 3060 Local Server (reference profile)
Brand: Reference

Una caja económica de dos GPU: combinar dos RTX 3060 de 12GB da 24GB en total para modelos mayores o dos asistentes en paralelo con un presupuesto ajustado.

Esto es lo que significa el Dual RTX 3060 Local Server (reference profile) para una empresa que quiere ejecutar IA privada en hardware que controla: qué LLM abiertos encajan, qué agentes puede impulsar, el nivel de AI Business OS que le corresponde y si conviene ejecutar en local, en la nube o de forma híbrida.

41/100· Competente

Recommended on-prem appliance

Run it on a GB10 box with AI Business OS pre-installed

The simplest way to put a private AI workforce on-premise: a compact GB10 Grace Blackwell appliance with ~128 GB unified memory — from ASUS, Dell or NVIDIA — shipped by BrainOutput with BrainOS pre-installed, so it runs your agents the day it arrives.

ASUS66/100

ASUS Ascent GX10 (GB10)

128GB unified · GB10 Grace Blackwell · on-prem

Dell66/100

Dell Pro Max with GB10

128GB unified · GB10 Grace Blackwell · on-prem

NVIDIA66/100

NVIDIA DGX Spark (GB10)

128GB unified · GB10 Grace Blackwell · on-prem

Request this appliance →Indicative GB10-class specs — exact SKU, availability and pricing to verify.

Especificaciones de un vistazo

Memoria: 24 GB
Tipo de memoria: GDDR6 (2× 12GB)
Ancho de banda: 360 GB/s
FP16 aprox.: 50 TFLOPS
Arquitectura: Ampere
Proceso: Samsung 8nm
Consumo: 500 W
Año de lanzamiento: 2021

Las especificaciones son cifras approximate. Perfil representativo, no un SKU concreto. Dos tarjetas dan 24GB agregados, pero el ancho de banda por tarjeta sigue limitando la velocidad de un solo modelo — el multi-GPU ayuda más a la capacidad y al paralelismo que a la latencia. Un primer servidor de oficina pragmático.

Puntuaciones de compatibilidad con IA

Heurísticas transparentes de 0 a 100 que combinan memoria utilizable, ancho de banda y cómputo: orientación relativa, no pruebas de rendimiento.

IA local (general)41/100

RAG documental43/100

Agentes de código38/100

Multiagente34/100

Automatización de negocio38/100

LLMs compatibles

Modelos abiertos de chat, código y razonamiento de nuestro catálogo, evaluados para el Dual RTX 3060 Local Server (reference profile), los más adecuados primero.

CodeLlama 13B
CodeLlama · 13B · Llama Community License
Cabe en Q8_0 (~14GB) con ~7.1GB de margen — alrededor de 1 instancia simultánea.
Q8_0 · ~14GBFunciona bien
Gemma 3 12B
Gemma 3 · 12B · Gemma Terms of Use
Cabe en Q8_0 (~13GB) con ~8.1GB de margen — alrededor de 1 instancia simultánea.
Q8_0 · ~13GBFunciona bien
Mistral Nemo 12B
Mistral · 12B · Apache-2.0
Cabe en Q8_0 (~13GB) con ~8.1GB de margen — alrededor de 1 instancia simultánea.
Q8_0 · ~13GBFunciona bien
Gemma 2 9B
Gemma · 9B · Gemma Terms of Use
Cabe en FP16 (~19GB) con ~2.1GB de margen — alrededor de 1 instancia simultánea.
FP16 · ~19GBFunciona bien
Llama 3.1 8B
Llama · 8B · Llama Community License
Cabe en FP16 (~17GB) con ~4.1GB de margen — alrededor de 1 instancia simultánea.
FP16 · ~17GBFunciona bien
Qwen3 8B
Qwen · 8B · Apache-2.0
Cabe en FP16 (~17GB) con ~4.1GB de margen — alrededor de 1 instancia simultánea.
FP16 · ~17GBFunciona bien
Granite 3 8B
Granite · 8B · Apache-2.0
Cabe en FP16 (~17GB) con ~4.1GB de margen — alrededor de 1 instancia simultánea.
FP16 · ~17GBFunciona bien
DeepSeek-R1 Distill 8B
DeepSeek · 8B · MIT
Cabe en FP16 (~17GB) con ~4.1GB de margen — alrededor de 1 instancia simultánea.
FP16 · ~17GBFunciona bien

Ver el catálogo completo de modelos →

Mejores modelos por carga de trabajo de negocio

Mejor para agentes de código

Autocompletado, revisión y refactorización de código sobre código fuente privado.

CodeLlama 13BFunciona bien
Qwen3 8BFunciona bien
DeepSeek-R1 Distill 8BFunciona bien

Mejor para RAG / búsqueda

Responder sobre tus documentos con citas.

LLaVA 13B (vision)Funciona bien
Gemma 3 12BFunciona bien
Mistral Nemo 12BFunciona bien

Mejor para automatización de negocio

Extracción de documentos y flujos de trabajo de back-office.

LLaVA 13B (vision)Funciona bien
Gemma 3 12BFunciona bien
Llama 3.2 Vision 11BFunciona bien

¿Bueno para un AI Business OS privado?

✓

Sí — este es un host viable para un AI Business OS privado en despliegue de un solo asistente, ejecutando modelos como CodeLlama 13B en hardware que tú controlas.

Consejo de mejora: Para modelos más grandes, contexto más largo o más agentes simultáneos, sube a una tarjeta de 24-48GB, una estación de trabajo multi-GPU, o absorbe los picos en la nube.

Modelo destacado que puede alojar: CodeLlama 13B.

Dónde se queda corto

▸El ancho de banda de memoria modesto limita el rendimiento de generación de tokens.
▸Requiere alimentación, refrigeración y espacio físico de clase centro de datos.

Agentes de negocio que tienen sentido

Cómo encaja esta máquina con los arquetipos de agentes principales de AI Business OS:

Agente de Atención al Cliente
Responde a clientes a partir de tus documentos, redacta respuestas y clasifica tickets.
Competente
Agente de Documentos / RAG
Lee contratos, informes y wikis y responde con citas.
Competente
Agente de Evidencia Legal (estilo DocMatch)
Busca en expedientes y pruebas para localizar y enlazar evidencias.
Asistencia en la nube
Agente de Hotel / Hostelería
Gestiona la mensajería con huéspedes, reservas y la automatización de recepción.
Competente
Agente de Contabilidad / Odoo
Extrae facturas, concilia datos y dirige flujos de trabajo en el ERP.
Asistencia en la nube
Agente de Programación / Ingeniería de Producto
Autocompletado, revisión y refactorización de código en local sobre código fuente privado.
Asistencia en la nube
Founder Ops / Centro de Mando del Negocio
Una flota de agentes cooperando para llevar todo el negocio de forma privada.
Asistencia en la nube

“Asistencia en la nube” significa ejecutarlo en local para cargas ligeras y absorber en la nube los trabajos más pesados. Consulta casos de uso de negocio para ver cómo se corresponde cada agente con el hardware.

Preguntas frecuentes

¿Es el Dual RTX 3060 Local Server (reference profile) bueno para ejecutar IA local?+

Obtiene 41/100 en nuestro Local AI Score (nivel Competente), según sus 24GB de memoria y el ancho de banda/cómputo disponibles. Eso lo hace adecuado para el nivel Starter del AI Business OS.

¿Qué LLMs puede ejecutar el Dual RTX 3060 Local Server (reference profile)?+

Con holgura: CodeLlama 34B (Q4_K_M), Qwen2.5 32B (Q4_K_M), Qwen3 32B (Q4_K_M). Los modelos más grandes pueden funcionar con una cuantización más agresiva o repartiéndolos entre varios dispositivos.

¿Debería ejecutar la IA en local o en la nube en el Dual RTX 3060 Local Server (reference profile)?+

Se recomienda un enfoque local primero. La capacidad de clase centro de datos se aprovecha mejor on-prem (o en colocation) para cargas privadas sostenidas y de gran volumen, con la nube como desbordamiento.

¿Puedo convertir el Dual RTX 3060 Local Server (reference profile) en un AI Business OS privado?+

Sí. AI Business OS puede ejecutarse en esta máquina en el nivel Starter, dándote agentes privados en tu propio hardware. Consulta la llamada a la acción de arriba para empezar.

Convierte el Dual RTX 3060 Local Server (reference profile) en un AI Business OS privado

Ejecuta tus propios agentes de IA en hardware que controlas: privado por diseño, sin datos por usuario saliendo de tus instalaciones. BrainOutput te ayuda a elegir la máquina adecuada y a convertirla en un AI Business OS en funcionamiento.

Empezar

Hardware relacionado

Supermicro · Servidores de IA

Supermicro 8x H100 SuperServer

100/100· Élite

Un servidor HGX H100 de 8 GPU con ~640GB de HBM3 combinada — entrenamiento a escala de centro de datos y servicio de alto rendimiento en un solo nodo.

Memoria: 640 GB
Arquitectura: NVIDIA HGX H100 (8-GPU)

Dell · Servidores de IA

Dell PowerEdge XE9680

100/100· Élite

El servidor de IA de 8 GPU insignia de Dell, configurable con H100 o H200 — un bloque de construcción a escala de rack para clústeres de IA.

Memoria: 640 GB
Arquitectura: NVIDIA HGX (8-GPU), H100/H200 options

Reference · Estaciones de trabajo de IA

Quad RTX 4090 AI Workstation (reference profile)

75/100· Potente

Una estación de trabajo de IA local seria: cuatro RTX 4090 combinan 96GB, suficiente para servir modelos insignia de 70B y ejecutar muchos agentes simultáneos de forma privada.

Memoria: 96 GB
Arquitectura: Ada Lovelace

Reference · Estaciones de trabajo de IA

Coding Agent Workstation (reference profile)

65/100· Potente

Una estación de trabajo afinada para agentes de programación locales: ~48GB entre dos tarjetas de 24GB ejecutan potentes modelos coder de 32B y dan servicio privado a un pequeño equipo de ingeniería.

Memoria: 48 GB
Arquitectura: Ada Lovelace