Small Business Mini PC (reference profile): IA local y encaje para empresas
Un mini PC diminuto y de bajo consumo con memoria compartida: una forma frugal de ejecutar un asistente privado de 7–14B para una pequeña empresa casi sin ruido ni coste de funcionamiento.
Esto es lo que significa el Small Business Mini PC (reference profile) para una empresa que quiere ejecutar IA privada en hardware que controla: qué LLM abiertos encajan, qué agentes puede impulsar, el nivel de AI Business OS que le corresponde y si conviene ejecutar en local, en la nube o de forma híbrida.
Recommended on-prem appliance
Run it on a GB10 box with AI Business OS pre-installed
The simplest way to put a private AI workforce on-premise: a compact GB10 Grace Blackwell appliance with ~128 GB unified memory — from ASUS, Dell or NVIDIA — shipped by BrainOutput with BrainOS pre-installed, so it runs your agents the day it arrives.
128GB unified · GB10 Grace Blackwell · on-prem
128GB unified · GB10 Grace Blackwell · on-prem
128GB unified · GB10 Grace Blackwell · on-prem
Especificaciones de un vistazo
- Memoria
- 32 GB unified
- Tipo de memoria
- Unified LPDDR5
- Ancho de banda
- 256 GB/s
- FP16 aprox.
- to verify
- Arquitectura
- Integrated NPU/iGPU
- Proceso
- to verify
- Consumo
- 90 W
- Año de lanzamiento
- 2024
Las especificaciones son cifras approximate. Perfil representativo de un mini PC con GPU/NPU integrada (p. ej. un mini escritorio con capacidad de IA). El ancho de banda de la memoria unificada limita la velocidad de tokens, así que conviene favorecer modelos más pequeños — pero es un punto de entrada extremadamente barato y silencioso.
Puntuaciones de compatibilidad con IA
Heurísticas transparentes de 0 a 100 que combinan memoria utilizable, ancho de banda y cómputo: orientación relativa, no pruebas de rendimiento.
~ Algunas especificaciones no están verificadas, así que estas puntuaciones son provisionales.
LLMs compatibles
Modelos abiertos de chat, código y razonamiento de nuestro catálogo, evaluados para el Small Business Mini PC (reference profile), los más adecuados primero.
- CodeLlama 13BCodeLlama · 13B · Llama Community License
Cabe en Q8_0 (~14GB) con ~8.4GB de margen — alrededor de 1 instancia simultánea.
Q8_0 · ~14GBFunciona bien - Gemma 3 12BGemma 3 · 12B · Gemma Terms of Use
Cabe en Q8_0 (~13GB) con ~9.4GB de margen — alrededor de 1 instancia simultánea.
Q8_0 · ~13GBFunciona bien - Mistral Nemo 12BMistral · 12B · Apache-2.0
Cabe en Q8_0 (~13GB) con ~9.4GB de margen — alrededor de 1 instancia simultánea.
Q8_0 · ~13GBFunciona bien - Gemma 2 9BGemma · 9B · Gemma Terms of Use
Cabe en FP16 (~19GB) con ~3.4GB de margen — alrededor de 1 instancia simultánea.
FP16 · ~19GBFunciona bien - Llama 3.1 8BLlama · 8B · Llama Community License
Cabe en FP16 (~17GB) con ~5.4GB de margen — alrededor de 1 instancia simultánea.
FP16 · ~17GBFunciona bien - Qwen3 8BQwen · 8B · Apache-2.0
Cabe en FP16 (~17GB) con ~5.4GB de margen — alrededor de 1 instancia simultánea.
FP16 · ~17GBFunciona bien - Granite 3 8BGranite · 8B · Apache-2.0
Cabe en FP16 (~17GB) con ~5.4GB de margen — alrededor de 1 instancia simultánea.
FP16 · ~17GBFunciona bien - DeepSeek-R1 Distill 8BDeepSeek · 8B · MIT
Cabe en FP16 (~17GB) con ~5.4GB de margen — alrededor de 1 instancia simultánea.
FP16 · ~17GBFunciona bien
Mejores modelos por carga de trabajo de negocio
Mejor para agentes de código
Autocompletado, revisión y refactorización de código sobre código fuente privado.
- CodeLlama 13BFunciona bien
- Qwen3 8BFunciona bien
- DeepSeek-R1 Distill 8BFunciona bien
Mejor para RAG / búsqueda
Responder sobre tus documentos con citas.
- LLaVA 13B (vision)Funciona bien
- Gemma 3 12BFunciona bien
- Mistral Nemo 12BFunciona bien
Mejor para automatización de negocio
Extracción de documentos y flujos de trabajo de back-office.
- LLaVA 13B (vision)Funciona bien
- Gemma 3 12BFunciona bien
- Llama 3.2 Vision 11BFunciona bien
¿Bueno para un AI Business OS privado?
Sí — este es un host viable para un AI Business OS privado en despliegue de equipo pequeño, ejecutando modelos como CodeLlama 13B en hardware que tú controlas.
Consejo de mejora: Para modelos más grandes, contexto más largo o más agentes simultáneos, sube a una tarjeta de 24-48GB, una estación de trabajo multi-GPU, o absorbe los picos en la nube.
Modelo destacado que puede alojar: CodeLlama 13B.
Dónde se queda corto
- ▸El ancho de banda de la memoria unificada queda por detrás de las GPU con HBM dedicada, así que los modelos grandes funcionan pero generan tokens más despacio.
Agentes de negocio que tienen sentido
Cómo encaja esta máquina con los arquetipos de agentes principales de AI Business OS:
- CompetenteAgente de Atención al Cliente
Responde a clientes a partir de tus documentos, redacta respuestas y clasifica tickets.
- CompetenteAgente de Documentos / RAG
Lee contratos, informes y wikis y responde con citas.
- Asistencia en la nubeAgente de Evidencia Legal (estilo DocMatch)
Busca en expedientes y pruebas para localizar y enlazar evidencias.
- CompetenteAgente de Hotel / Hostelería
Gestiona la mensajería con huéspedes, reservas y la automatización de recepción.
- Asistencia en la nubeAgente de Contabilidad / Odoo
Extrae facturas, concilia datos y dirige flujos de trabajo en el ERP.
- CompetenteAgente de Programación / Ingeniería de Producto
Autocompletado, revisión y refactorización de código en local sobre código fuente privado.
- Asistencia en la nubeFounder Ops / Centro de Mando del Negocio
Una flota de agentes cooperando para llevar todo el negocio de forma privada.
“Asistencia en la nube” significa ejecutarlo en local para cargas ligeras y absorber en la nube los trabajos más pesados. Consulta casos de uso de negocio para ver cómo se corresponde cada agente con el hardware.
Preguntas frecuentes
¿Es el Small Business Mini PC (reference profile) bueno para ejecutar IA local?+
Obtiene 48/100 en nuestro Local AI Score (nivel Competente), según sus 32GB de memoria y el ancho de banda/cómputo disponibles. Algunas especificaciones no están verificadas, así que considera la puntuación como provisional. Eso lo hace adecuado para el nivel Pro del AI Business OS.
¿Qué LLMs puede ejecutar el Small Business Mini PC (reference profile)?+
Con holgura: CodeLlama 34B (Q4_K_M), Qwen2.5 32B (Q4_K_M), Qwen3 32B (Q4_K_M). Los modelos más grandes pueden funcionar con una cuantización más agresiva o repartiéndolos entre varios dispositivos.
¿Debería ejecutar la IA en local o en la nube en el Small Business Mini PC (reference profile)?+
Se recomienda un enfoque híbrido. Lo bastante potente para agentes locales del día a día, pero descarga en la nube los trabajos puntuales de modelos grandes o alta concurrencia.
¿Puedo convertir el Small Business Mini PC (reference profile) en un AI Business OS privado?+
Sí. AI Business OS puede ejecutarse en esta máquina en el nivel Pro, dándote agentes privados en tu propio hardware. Consulta la llamada a la acción de arriba para empezar.
Convierte el Small Business Mini PC (reference profile) en un AI Business OS privado
Ejecuta tus propios agentes de IA en hardware que controlas: privado por diseño, sin datos por usuario saliendo de tus instalaciones. BrainOutput te ayuda a elegir la máquina adecuada y a convertirla en un AI Business OS en funcionamiento.
Hardware relacionado
AMD Ryzen AI Max Mini PC (Strix Halo class)
Un mini PC x86 compacto cuya gran memoria unificada (hasta ~128GB) permite a la GPU/NPU integrada ejecutar modelos locales de buen tamaño.
- Memoria
- 128 GB unified
- Arquitectura
- AMD Ryzen AI Max (Strix Halo)
Dual RTX 3060 Local Server (reference profile)
Una caja económica de dos GPU: combinar dos RTX 3060 de 12GB da 24GB en total para modelos mayores o dos asistentes en paralelo con un presupuesto ajustado.
- Memoria
- 24 GB
- Arquitectura
- Ampere
Quad RTX 4090 AI Workstation (reference profile)
Una estación de trabajo de IA local seria: cuatro RTX 4090 combinan 96GB, suficiente para servir modelos insignia de 70B y ejecutar muchos agentes simultáneos de forma privada.
- Memoria
- 96 GB
- Arquitectura
- Ada Lovelace
Coding Agent Workstation (reference profile)
Una estación de trabajo afinada para agentes de programación locales: ~48GB entre dos tarjetas de 24GB ejecutan potentes modelos coder de 32B y dan servicio privado a un pequeño equipo de ingeniería.
- Memoria
- 48 GB
- Arquitectura
- Ada Lovelace