Small Business Mini PC (reference profile): IA local e adequação para empresas
Um mini PC minúsculo e de baixo consumo com memória partilhada: uma forma frugal de executar um assistente privado de 7–14B para uma pequena empresa quase sem ruído nem custo de funcionamento.
Eis o que o Small Business Mini PC (reference profile) representa para uma empresa que quer executar IA privada em hardware que controla: que LLMs abertos encaixam, que agentes pode alimentar, o nível AI Business OS adequado e se deve executar em local, na nuvem ou em híbrido.
Recommended on-prem appliance
Run it on a GB10 box with AI Business OS pre-installed
The simplest way to put a private AI workforce on-premise: a compact GB10 Grace Blackwell appliance with ~128 GB unified memory — from ASUS, Dell or NVIDIA — shipped by BrainOutput with BrainOS pre-installed, so it runs your agents the day it arrives.
128GB unified · GB10 Grace Blackwell · on-prem
128GB unified · GB10 Grace Blackwell · on-prem
128GB unified · GB10 Grace Blackwell · on-prem
Especificações num relance
- Memória
- 32 GB unified
- Tipo de memória
- Unified LPDDR5
- Largura de banda
- 256 GB/s
- FP16 aprox.
- to verify
- Arquitetura
- Integrated NPU/iGPU
- Processo
- to verify
- Consumo
- 90 W
- Ano de lançamento
- 2024
As especificações são valores approximate. Perfil representativo de um mini PC com GPU/NPU integrada (p. ex. um mini desktop com capacidade de IA). A largura de banda da memória unificada limita a velocidade de tokens, por isso favoreça modelos mais pequenos — mas é um ponto de entrada extremamente barato e silencioso.
Pontuações de compatibilidade com IA
Heurísticas transparentes de 0 a 100 que combinam memória utilizável, largura de banda e computação: orientação relativa, não testes de desempenho.
~ Algumas especificações não estão verificadas, por isso estas pontuações são provisórias.
LLMs compatíveis
Modelos de chat, programação e raciocínio de pesos abertos do nosso catálogo, classificados para o Small Business Mini PC (reference profile), melhor encaixe primeiro.
- CodeLlama 13BCodeLlama · 13B · Llama Community License
Cabe em Q8_0 (~14GB) com ~8.4GB de margem — cerca de 1 instância em simultâneo.
Q8_0 · ~14GBCorre bem - Gemma 3 12BGemma 3 · 12B · Gemma Terms of Use
Cabe em Q8_0 (~13GB) com ~9.4GB de margem — cerca de 1 instância em simultâneo.
Q8_0 · ~13GBCorre bem - Mistral Nemo 12BMistral · 12B · Apache-2.0
Cabe em Q8_0 (~13GB) com ~9.4GB de margem — cerca de 1 instância em simultâneo.
Q8_0 · ~13GBCorre bem - Gemma 2 9BGemma · 9B · Gemma Terms of Use
Cabe em FP16 (~19GB) com ~3.4GB de margem — cerca de 1 instância em simultâneo.
FP16 · ~19GBCorre bem - Llama 3.1 8BLlama · 8B · Llama Community License
Cabe em FP16 (~17GB) com ~5.4GB de margem — cerca de 1 instância em simultâneo.
FP16 · ~17GBCorre bem - Qwen3 8BQwen · 8B · Apache-2.0
Cabe em FP16 (~17GB) com ~5.4GB de margem — cerca de 1 instância em simultâneo.
FP16 · ~17GBCorre bem - Granite 3 8BGranite · 8B · Apache-2.0
Cabe em FP16 (~17GB) com ~5.4GB de margem — cerca de 1 instância em simultâneo.
FP16 · ~17GBCorre bem - DeepSeek-R1 Distill 8BDeepSeek · 8B · MIT
Cabe em FP16 (~17GB) com ~5.4GB de margem — cerca de 1 instância em simultâneo.
FP16 · ~17GBCorre bem
Melhores modelos por carga de trabalho de negócio
Melhor para agentes de programação
Conclusão, revisão e refatoração de código sobre código-fonte privado.
- CodeLlama 13BCorre bem
- Qwen3 8BCorre bem
- DeepSeek-R1 Distill 8BCorre bem
Melhor para RAG / pesquisa
Respostas sobre os seus documentos com citações.
- LLaVA 13B (vision)Corre bem
- Gemma 3 12BCorre bem
- Mistral Nemo 12BCorre bem
Melhor para automação de negócio
Extração de documentos e fluxos de trabalho de back-office.
- LLaVA 13B (vision)Corre bem
- Gemma 3 12BCorre bem
- Llama 3.2 Vision 11BCorre bem
Bom para um AI Business OS privado?
Sim — este é um anfitrião privado viável para o AI Business OS em implementação uma implementação para uma equipa pequena, executando modelos como o CodeLlama 13B em hardware que controla.
Dica de upgrade: Para modelos maiores, contexto mais longo ou mais agentes em simultâneo, suba para uma placa de 24-48GB, uma estação de trabalho multi-GPU, ou recorra à nuvem para picos.
Modelo de destaque que consegue alojar: CodeLlama 13B.
Onde fica aquém
- ▸A largura de banda da memória unificada fica aquém das GPUs HBM discretas, pelo que modelos grandes correm mas geram tokens mais lentamente.
Agentes de negócio que fazem sentido
Como esta máquina encaixa nos principais arquétipos de agentes do AI Business OS:
- CapazAgente de Apoio ao Cliente
Responde a clientes a partir dos seus documentos, redige respostas, triagem de tickets.
- CapazAgente de Documentos / RAG
Lê contratos, relatórios e wikis e responde com citações.
- Assistência na nuvemAgente de Prova Jurídica (estilo DocMatch)
Pesquisa processos e documentos probatórios para revelar e ligar provas.
- CapazAgente de Hotelaria / Hospitalidade
Gere a comunicação com hóspedes, reservas e automação de receção.
- Assistência na nuvemAgente de Contabilidade / Odoo
Extrai faturas, reconcilia dados e conduz fluxos de trabalho de ERP.
- CapazAgente de Programação / Engenharia de Produto
Conclusão, revisão e refatoração de código localmente sobre código-fonte privado.
- Assistência na nuvemFounder Ops / Centro de Comando do Negócio
Uma frota de agentes cooperantes a gerir todo o negócio de forma privada.
“Assistência na nuvem” significa executá-lo localmente para cargas leves e recorrer à nuvem para trabalhos mais pesados. Veja casos de uso de negócio para saber como cada agente se mapeia ao hardware.
Perguntas frequentes
O Small Business Mini PC (reference profile) é bom para executar IA local?+
Obtém 48/100 no nosso Local AI Score (nível Capaz), com base nos seus 32GB de memória e na largura de banda/computação disponíveis. Algumas especificações não estão verificadas, por isso trate a pontuação como provisória. Isso torna-o adequado ao nível Pro do AI Business OS.
Que LLMs consegue o Small Business Mini PC (reference profile) executar?+
Confortavelmente: CodeLlama 34B (Q4_K_M), Qwen2.5 32B (Q4_K_M), Qwen3 32B (Q4_K_M). Modelos maiores podem correr com quantização mais agressiva ou dividindo-os entre vários dispositivos.
Devo executar IA localmente ou na nuvem no Small Business Mini PC (reference profile)?+
Uma abordagem híbrida é recomendado. Forte o suficiente para agentes locais do dia a dia, mas descarregue para a nuvem trabalhos ocasionais com modelos grandes ou de alta concorrência.
Posso transformar o Small Business Mini PC (reference profile) num AI Business OS privado?+
Sim. O AI Business OS pode correr nesta máquina ao nível Pro, dando-lhe agentes privados no seu próprio hardware. Veja o apelo à ação acima para começar.
Transforme o Small Business Mini PC (reference profile) num AI Business OS privado
Execute os seus próprios agentes de IA em hardware que controla: privado por design, sem dados por utilizador a saírem das suas instalações. BrainOutput ajuda-o a escolher a máquina certa e a transformá-la num AI Business OS em funcionamento.
Hardware relacionado
AMD Ryzen AI Max Mini PC (Strix Halo class)
Um mini PC x86 compacto cuja grande memória unificada (até ~128GB) permite à GPU/NPU integrada executar modelos locais de boa dimensão.
- Memória
- 128 GB unified
- Arquitetura
- AMD Ryzen AI Max (Strix Halo)
Dual RTX 3060 Local Server (reference profile)
Uma caixa económica de duas GPU: combinar duas RTX 3060 de 12GB dá 24GB no total para modelos maiores ou dois assistentes em paralelo com um orçamento apertado.
- Memória
- 24 GB
- Arquitetura
- Ampere
Quad RTX 4090 AI Workstation (reference profile)
Uma estação de trabalho de IA local séria: quatro RTX 4090 combinam 96GB, suficiente para servir modelos emblemáticos de 70B e executar muitos agentes simultâneos de forma privada.
- Memória
- 96 GB
- Arquitetura
- Ada Lovelace
Coding Agent Workstation (reference profile)
Uma estação de trabalho afinada para agentes de programação locais: ~48GB entre duas placas de 24GB executam potentes modelos coder de 32B e servem em privado uma pequena equipa de engenharia.
- Memória
- 48 GB
- Arquitetura
- Ada Lovelace