AMD Ryzen AI Max Mini PC (Strix Halo class): IA local y encaje para empresas
Un mini PC x86 compacto cuya gran memoria unificada (hasta ~128GB) permite a la GPU/NPU integrada ejecutar modelos locales de buen tamaño.
Esto es lo que significa el AMD Ryzen AI Max Mini PC (Strix Halo class) para una empresa que quiere ejecutar IA privada en hardware que controla: qué LLM abiertos encajan, qué agentes puede impulsar, el nivel de AI Business OS que le corresponde y si conviene ejecutar en local, en la nube o de forma híbrida.
Especificaciones de un vistazo
- Memoria
- 128 GB unified
- Tipo de memoria
- LPDDR5X (unified)
- Ancho de banda
- 256 GB/s
- FP16 aprox.
- to verify
- Arquitectura
- AMD Ryzen AI Max (Strix Halo)
- Proceso
- TSMC N4
- Consumo
- 120 W
- Año de lanzamiento
- 2025
Las especificaciones son cifras approximate. Vendido por varios fabricantes bajo distintos nombres; la memoria mostrada es una configuración alta. Una alternativa x86 a Apple Silicon para inferencia local limitada por memoria. Ancho de banda y TOPS de la NPU a verificar por SKU.
Puntuaciones de compatibilidad con IA
Heurísticas transparentes de 0 a 100 que combinan memoria utilizable, ancho de banda y cómputo: orientación relativa, no pruebas de rendimiento.
~ Algunas especificaciones no están verificadas, así que estas puntuaciones son provisionales.
LLMs compatibles
Modelos abiertos de chat, código y razonamiento de nuestro catálogo, evaluados para el AMD Ryzen AI Max Mini PC (Strix Halo class), los más adecuados primero.
- CodeLlama 13BCodeLlama · 13B · Llama Community License
Cabe en FP16 (~26GB) con ~63.6GB de margen — alrededor de 3 instancias simultáneas.
FP16 · ~26GBFunciona bien - Gemma 3 12BGemma 3 · 12B · Gemma Terms of Use
Cabe en FP16 (~24GB) con ~65.6GB de margen — alrededor de 3 instancias simultáneas.
FP16 · ~24GBFunciona bien - Mistral Nemo 12BMistral · 12B · Apache-2.0
Cabe en FP16 (~24GB) con ~65.6GB de margen — alrededor de 3 instancias simultáneas.
FP16 · ~24GBFunciona bien - Gemma 2 9BGemma · 9B · Gemma Terms of Use
Cabe en FP16 (~19GB) con ~70.6GB de margen — alrededor de 4 instancias simultáneas.
FP16 · ~19GBFunciona bien - Llama 3.1 8BLlama · 8B · Llama Community License
Cabe en FP16 (~17GB) con ~72.6GB de margen — alrededor de 5 instancias simultáneas.
FP16 · ~17GBFunciona bien - Qwen3 8BQwen · 8B · Apache-2.0
Cabe en FP16 (~17GB) con ~72.6GB de margen — alrededor de 5 instancias simultáneas.
FP16 · ~17GBFunciona bien - Granite 3 8BGranite · 8B · Apache-2.0
Cabe en FP16 (~17GB) con ~72.6GB de margen — alrededor de 5 instancias simultáneas.
FP16 · ~17GBFunciona bien - DeepSeek-R1 Distill 8BDeepSeek · 8B · MIT
Cabe en FP16 (~17GB) con ~72.6GB de margen — alrededor de 5 instancias simultáneas.
FP16 · ~17GBFunciona bien
Mejores modelos por carga de trabajo de negocio
Mejor para agentes de código
Autocompletado, revisión y refactorización de código sobre código fuente privado.
- CodeLlama 13BFunciona bien
- Qwen3 8BFunciona bien
- DeepSeek-R1 Distill 8BFunciona bien
Mejor para RAG / búsqueda
Responder sobre tus documentos con citas.
- LLaVA 13B (vision)Funciona bien
- Gemma 3 12BFunciona bien
- Mistral Nemo 12BFunciona bien
Mejor para automatización de negocio
Extracción de documentos y flujos de trabajo de back-office.
- LLaVA 13B (vision)Funciona bien
- Gemma 3 12BFunciona bien
- Llama 3.2 Vision 11BFunciona bien
¿Bueno para un AI Business OS privado?
Sí — este es un host viable para un AI Business OS privado en despliegue a escala de departamento, ejecutando modelos como CodeLlama 13B en hardware que tú controlas.
Modelo destacado que puede alojar: CodeLlama 13B.
Dónde se queda corto
- ▸El ancho de banda de la memoria unificada queda por detrás de las GPU con HBM dedicada, así que los modelos grandes funcionan pero generan tokens más despacio.
- ▸El ecosistema de software (ROCm / oneAPI) está menos maduro que CUDA — verifica el soporte del framework para tu carga de trabajo.
Agentes de negocio que tienen sentido
Cómo encaja esta máquina con los arquetipos de agentes principales de AI Business OS:
- Muy adecuadoAgente de Atención al Cliente
Responde a clientes a partir de tus documentos, redacta respuestas y clasifica tickets.
- Muy adecuadoAgente de Documentos / RAG
Lee contratos, informes y wikis y responde con citas.
- CompetenteAgente de Evidencia Legal (estilo DocMatch)
Busca en expedientes y pruebas para localizar y enlazar evidencias.
- Muy adecuadoAgente de Hotel / Hostelería
Gestiona la mensajería con huéspedes, reservas y la automatización de recepción.
- CompetenteAgente de Contabilidad / Odoo
Extrae facturas, concilia datos y dirige flujos de trabajo en el ERP.
- CompetenteAgente de Programación / Ingeniería de Producto
Autocompletado, revisión y refactorización de código en local sobre código fuente privado.
- Asistencia en la nubeFounder Ops / Centro de Mando del Negocio
Una flota de agentes cooperando para llevar todo el negocio de forma privada.
“Asistencia en la nube” significa ejecutarlo en local para cargas ligeras y absorber en la nube los trabajos más pesados. Consulta casos de uso de negocio para ver cómo se corresponde cada agente con el hardware.
Preguntas frecuentes
¿Es el AMD Ryzen AI Max Mini PC (Strix Halo class) bueno para ejecutar IA local?+
Obtiene 66/100 en nuestro Local AI Score (nivel Potente), según sus 128GB de memoria y el ancho de banda/cómputo disponibles. Algunas especificaciones no están verificadas, así que considera la puntuación como provisional. Eso lo hace adecuado para el nivel Business del AI Business OS.
¿Qué LLMs puede ejecutar el AMD Ryzen AI Max Mini PC (Strix Halo class)?+
Con holgura: Qwen2.5 72B (Q8_0), Llama 3.1 70B (Q8_0), Llama 3.3 70B (Q8_0). Los modelos más grandes pueden funcionar con una cuantización más agresiva o repartiéndolos entre varios dispositivos.
¿Debería ejecutar la IA en local o en la nube en el AMD Ryzen AI Max Mini PC (Strix Halo class)?+
Se recomienda un enfoque local primero. Suficiente capacidad para alojar agentes reales en local con privacidad y coste predecible; usa la nube solo para absorber picos por encima de la demanda máxima.
¿Puedo convertir el AMD Ryzen AI Max Mini PC (Strix Halo class) en un AI Business OS privado?+
Sí. AI Business OS puede ejecutarse en esta máquina en el nivel Business, dándote agentes privados en tu propio hardware. Consulta la llamada a la acción de arriba para empezar.
Convierte el AMD Ryzen AI Max Mini PC (Strix Halo class) en un AI Business OS privado
Ejecuta tus propios agentes de IA en hardware que controlas: privado por diseño, sin datos por usuario saliendo de tus instalaciones. BrainOutput te ayuda a elegir la máquina adecuada y a convertirla en un AI Business OS en funcionamiento.
Hardware relacionado
Small Business Mini PC (reference profile)
Un mini PC diminuto y de bajo consumo con memoria compartida: una forma frugal de ejecutar un asistente privado de 7–14B para una pequeña empresa casi sin ruido ni coste de funcionamiento.
- Memoria
- 32 GB unified
- Arquitectura
- Integrated NPU/iGPU
AMD Radeon RX 7900 XTX
24GB de VRAM a precio de consumo — una tarjeta de IA local de gran valor si tu stack soporta bien ROCm/Vulkan.
- Memoria
- 24 GB
- Arquitectura
- RDNA 3
AMD Radeon PRO W7900
Tarjeta de estación de trabajo de 48GB ECC de AMD — gran VRAM con consumo de estación de trabajo, supeditada al soporte de ROCm para tu stack.
- Memoria
- 48 GB
- Arquitectura
- RDNA 3
AMD Instinct MI300X
El acelerador de centro de datos de AMD con unos 192GB de HBM3 líderes en su clase — una capacidad de memoria excepcional para modelos muy grandes en una sola tarjeta.
- Memoria
- 192 GB
- Arquitectura
- CDNA 3