AMD Ryzen AI Max Mini PC (Strix Halo class): IA local e adequação para empresas
Um mini PC x86 compacto cuja grande memória unificada (até ~128GB) permite à GPU/NPU integrada executar modelos locais de boa dimensão.
Eis o que o AMD Ryzen AI Max Mini PC (Strix Halo class) representa para uma empresa que quer executar IA privada em hardware que controla: que LLMs abertos encaixam, que agentes pode alimentar, o nível AI Business OS adequado e se deve executar em local, na nuvem ou em híbrido.
Especificações num relance
- Memória
- 128 GB unified
- Tipo de memória
- LPDDR5X (unified)
- Largura de banda
- 256 GB/s
- FP16 aprox.
- to verify
- Arquitetura
- AMD Ryzen AI Max (Strix Halo)
- Processo
- TSMC N4
- Consumo
- 120 W
- Ano de lançamento
- 2025
As especificações são valores approximate. Vendido por vários fabricantes sob diferentes nomes; a memória apresentada é uma configuração alta. Uma alternativa x86 ao Apple Silicon para inferência local limitada por memória. Largura de banda e TOPS da NPU a verificar por SKU.
Pontuações de compatibilidade com IA
Heurísticas transparentes de 0 a 100 que combinam memória utilizável, largura de banda e computação: orientação relativa, não testes de desempenho.
~ Algumas especificações não estão verificadas, por isso estas pontuações são provisórias.
LLMs compatíveis
Modelos de chat, programação e raciocínio de pesos abertos do nosso catálogo, classificados para o AMD Ryzen AI Max Mini PC (Strix Halo class), melhor encaixe primeiro.
- CodeLlama 13BCodeLlama · 13B · Llama Community License
Cabe em FP16 (~26GB) com ~63.6GB de margem — cerca de 3 instâncias em simultâneo.
FP16 · ~26GBCorre bem - Gemma 3 12BGemma 3 · 12B · Gemma Terms of Use
Cabe em FP16 (~24GB) com ~65.6GB de margem — cerca de 3 instâncias em simultâneo.
FP16 · ~24GBCorre bem - Mistral Nemo 12BMistral · 12B · Apache-2.0
Cabe em FP16 (~24GB) com ~65.6GB de margem — cerca de 3 instâncias em simultâneo.
FP16 · ~24GBCorre bem - Gemma 2 9BGemma · 9B · Gemma Terms of Use
Cabe em FP16 (~19GB) com ~70.6GB de margem — cerca de 4 instâncias em simultâneo.
FP16 · ~19GBCorre bem - Llama 3.1 8BLlama · 8B · Llama Community License
Cabe em FP16 (~17GB) com ~72.6GB de margem — cerca de 5 instâncias em simultâneo.
FP16 · ~17GBCorre bem - Qwen3 8BQwen · 8B · Apache-2.0
Cabe em FP16 (~17GB) com ~72.6GB de margem — cerca de 5 instâncias em simultâneo.
FP16 · ~17GBCorre bem - Granite 3 8BGranite · 8B · Apache-2.0
Cabe em FP16 (~17GB) com ~72.6GB de margem — cerca de 5 instâncias em simultâneo.
FP16 · ~17GBCorre bem - DeepSeek-R1 Distill 8BDeepSeek · 8B · MIT
Cabe em FP16 (~17GB) com ~72.6GB de margem — cerca de 5 instâncias em simultâneo.
FP16 · ~17GBCorre bem
Melhores modelos por carga de trabalho de negócio
Melhor para agentes de programação
Conclusão, revisão e refatoração de código sobre código-fonte privado.
- CodeLlama 13BCorre bem
- Qwen3 8BCorre bem
- DeepSeek-R1 Distill 8BCorre bem
Melhor para RAG / pesquisa
Respostas sobre os seus documentos com citações.
- LLaVA 13B (vision)Corre bem
- Gemma 3 12BCorre bem
- Mistral Nemo 12BCorre bem
Melhor para automação de negócio
Extração de documentos e fluxos de trabalho de back-office.
- LLaVA 13B (vision)Corre bem
- Gemma 3 12BCorre bem
- Llama 3.2 Vision 11BCorre bem
Bom para um AI Business OS privado?
Sim — este é um anfitrião privado viável para o AI Business OS em implementação uma implementação à escala de um departamento, executando modelos como o CodeLlama 13B em hardware que controla.
Modelo de destaque que consegue alojar: CodeLlama 13B.
Onde fica aquém
- ▸A largura de banda da memória unificada fica aquém das GPUs HBM discretas, pelo que modelos grandes correm mas geram tokens mais lentamente.
- ▸O ecossistema de software (ROCm / oneAPI) é menos maduro que o CUDA — verifique o suporte da framework para a sua carga de trabalho.
Agentes de negócio que fazem sentido
Como esta máquina encaixa nos principais arquétipos de agentes do AI Business OS:
- Bom encaixeAgente de Apoio ao Cliente
Responde a clientes a partir dos seus documentos, redige respostas, triagem de tickets.
- Bom encaixeAgente de Documentos / RAG
Lê contratos, relatórios e wikis e responde com citações.
- CapazAgente de Prova Jurídica (estilo DocMatch)
Pesquisa processos e documentos probatórios para revelar e ligar provas.
- Bom encaixeAgente de Hotelaria / Hospitalidade
Gere a comunicação com hóspedes, reservas e automação de receção.
- CapazAgente de Contabilidade / Odoo
Extrai faturas, reconcilia dados e conduz fluxos de trabalho de ERP.
- CapazAgente de Programação / Engenharia de Produto
Conclusão, revisão e refatoração de código localmente sobre código-fonte privado.
- Assistência na nuvemFounder Ops / Centro de Comando do Negócio
Uma frota de agentes cooperantes a gerir todo o negócio de forma privada.
“Assistência na nuvem” significa executá-lo localmente para cargas leves e recorrer à nuvem para trabalhos mais pesados. Veja casos de uso de negócio para saber como cada agente se mapeia ao hardware.
Perguntas frequentes
O AMD Ryzen AI Max Mini PC (Strix Halo class) é bom para executar IA local?+
Obtém 66/100 no nosso Local AI Score (nível Forte), com base nos seus 128GB de memória e na largura de banda/computação disponíveis. Algumas especificações não estão verificadas, por isso trate a pontuação como provisória. Isso torna-o adequado ao nível Business do AI Business OS.
Que LLMs consegue o AMD Ryzen AI Max Mini PC (Strix Halo class) executar?+
Confortavelmente: Qwen2.5 72B (Q8_0), Llama 3.1 70B (Q8_0), Llama 3.3 70B (Q8_0). Modelos maiores podem correr com quantização mais agressiva ou dividindo-os entre vários dispositivos.
Devo executar IA localmente ou na nuvem no AMD Ryzen AI Max Mini PC (Strix Halo class)?+
Local em primeiro lugar é recomendado. Capacidade suficiente para alojar agentes reais localmente, com privacidade e custo previsível; use a nuvem apenas para picos acima da procura máxima.
Posso transformar o AMD Ryzen AI Max Mini PC (Strix Halo class) num AI Business OS privado?+
Sim. O AI Business OS pode correr nesta máquina ao nível Business, dando-lhe agentes privados no seu próprio hardware. Veja o apelo à ação acima para começar.
Transforme o AMD Ryzen AI Max Mini PC (Strix Halo class) num AI Business OS privado
Execute os seus próprios agentes de IA em hardware que controla: privado por design, sem dados por utilizador a saírem das suas instalações. BrainOutput ajuda-o a escolher a máquina certa e a transformá-la num AI Business OS em funcionamento.
Hardware relacionado
Small Business Mini PC (reference profile)
Um mini PC minúsculo e de baixo consumo com memória partilhada: uma forma frugal de executar um assistente privado de 7–14B para uma pequena empresa quase sem ruído nem custo de funcionamento.
- Memória
- 32 GB unified
- Arquitetura
- Integrated NPU/iGPU
AMD Radeon RX 7900 XTX
24GB de VRAM a preço de consumo — uma placa de IA local de grande valor se o seu stack suportar bem ROCm/Vulkan.
- Memória
- 24 GB
- Arquitetura
- RDNA 3
AMD Radeon PRO W7900
Placa de estação de trabalho de 48GB ECC da AMD — muita VRAM com consumo de estação de trabalho, dependente do suporte ROCm para o seu stack.
- Memória
- 48 GB
- Arquitetura
- RDNA 3
AMD Instinct MI300X
O acelerador de centro de dados da AMD com uns 192GB de HBM3 líderes na sua classe — uma capacidade de memória excecional para modelos muito grandes numa única placa.
- Memória
- 192 GB
- Arquitetura
- CDNA 3