Reference · AI Workstations

Coding Agent Workstation (reference profile): IA local e adequação para empresas

Name: Coding Agent Workstation (reference profile)
Brand: Reference

Uma estação de trabalho afinada para agentes de programação locais: ~48GB entre duas placas de 24GB executam potentes modelos coder de 32B e servem em privado uma pequena equipa de engenharia.

Eis o que o Coding Agent Workstation (reference profile) representa para uma empresa que quer executar IA privada em hardware que controla: que LLMs abertos encaixam, que agentes pode alimentar, o nível AI Business OS adequado e se deve executar em local, na nuvem ou em híbrido.

65/100· Forte

Recommended on-prem appliance

Run it on a GB10 box with AI Business OS pre-installed

The simplest way to put a private AI workforce on-premise: a compact GB10 Grace Blackwell appliance with ~128 GB unified memory — from ASUS, Dell or NVIDIA — shipped by BrainOutput with BrainOS pre-installed, so it runs your agents the day it arrives.

ASUS66/100

ASUS Ascent GX10 (GB10)

128GB unified · GB10 Grace Blackwell · on-prem

Dell66/100

Dell Pro Max with GB10

128GB unified · GB10 Grace Blackwell · on-prem

NVIDIA66/100

NVIDIA DGX Spark (GB10)

128GB unified · GB10 Grace Blackwell · on-prem

Request this appliance →Indicative GB10-class specs — exact SKU, availability and pricing to verify.

Especificações num relance

Memória: 48 GB
Tipo de memória: GDDR6X (2× 24GB)
Largura de banda: 1,008 GB/s
FP16 aprox.: 660 TFLOPS
Arquitetura: Ada Lovelace
Processo: TSMC 4N
Consumo: 900 W
Ano de lançamento: 2023

As especificações são valores approximate. Perfil representativo construído em torno de um par de GPU de classe 24GB (p. ex. RTX 4090/3090). Dimensionado para que um modelo coder de 32B e os serviços de apoio caibam com folga, mantendo o código-fonte proprietário em hardware que controla.

Pontuações de compatibilidade com IA

Heurísticas transparentes de 0 a 100 que combinam memória utilizável, largura de banda e computação: orientação relativa, não testes de desempenho.

IA local (global)65/100

RAG documental64/100

Agentes de programação68/100

Multiagente58/100

Automação de negócio62/100

LLMs compatíveis

Modelos de chat, programação e raciocínio de pesos abertos do nosso catálogo, classificados para o Coding Agent Workstation (reference profile), melhor encaixe primeiro.

Mixtral 8x7B (MoE)
Mistral · 47B · Apache-2.0
Cabe em Q4_K_M (~28GB) com ~14.2GB de margem — cerca de 1 instância em simultâneo.
Q4_K_M · ~28GBCorre bem
CodeLlama 34B
CodeLlama · 34B · Llama Community License
Cabe em Q8_0 (~37GB) com ~5.2GB de margem — cerca de 1 instância em simultâneo.
Q8_0 · ~37GBCorre bem
Qwen2.5 32B
Qwen · 32B · Apache-2.0
Cabe em Q8_0 (~34GB) com ~8.2GB de margem — cerca de 1 instância em simultâneo.
Q8_0 · ~34GBCorre bem
Qwen3 32B
Qwen · 32B · Apache-2.0
Cabe em Q8_0 (~34GB) com ~8.2GB de margem — cerca de 1 instância em simultâneo.
Q8_0 · ~34GBCorre bem
DeepSeek-R1 Distill 32B
DeepSeek · 32B · MIT
Cabe em Q8_0 (~34GB) com ~8.2GB de margem — cerca de 1 instância em simultâneo.
Q8_0 · ~34GBCorre bem
Qwen2.5-Coder 32B
Qwen · 32B · Apache-2.0
Cabe em Q8_0 (~34GB) com ~8.2GB de margem — cerca de 1 instância em simultâneo.
Q8_0 · ~34GBCorre bem
Gemma 2 27B
Gemma · 27B · Gemma Terms of Use
Cabe em Q8_0 (~29GB) com ~13.2GB de margem — cerca de 1 instância em simultâneo.
Q8_0 · ~29GBCorre bem
Gemma 3 27B
Gemma 3 · 27B · Gemma Terms of Use
Cabe em Q8_0 (~29GB) com ~13.2GB de margem — cerca de 1 instância em simultâneo.
Q8_0 · ~29GBCorre bem

Ver o catálogo completo de modelos →

Melhores modelos por carga de trabalho de negócio

Melhor para agentes de programação

Conclusão, revisão e refatoração de código sobre código-fonte privado.

CodeLlama 34BCorre bem
Qwen2.5 32BCorre bem
Qwen3 32BCorre bem

Melhor para RAG / pesquisa

Respostas sobre os seus documentos com citações.

Mixtral 8x7B (MoE)Corre bem
Qwen2.5 32BCorre bem
Qwen3 32BCorre bem

Melhor para automação de negócio

Extração de documentos e fluxos de trabalho de back-office.

Gemma 2 27BCorre bem
Gemma 3 27BCorre bem
Mistral Small 24BCorre bem

Bom para um AI Business OS privado?

✓

Sim — este é um anfitrião privado viável para o AI Business OS em implementação uma implementação à escala de um departamento, executando modelos como o Mixtral 8x7B (MoE) em hardware que controla.

Modelo de destaque que consegue alojar: Mixtral 8x7B (MoE).

Onde fica aquém

▸Sem limitações importantes para cargas de IA local típicas deste nível.

Agentes de negócio que fazem sentido

Como esta máquina encaixa nos principais arquétipos de agentes do AI Business OS:

Agente de Apoio ao Cliente
Responde a clientes a partir dos seus documentos, redige respostas, triagem de tickets.
Bom encaixe
Agente de Documentos / RAG
Lê contratos, relatórios e wikis e responde com citações.
Bom encaixe
Agente de Prova Jurídica (estilo DocMatch)
Pesquisa processos e documentos probatórios para revelar e ligar provas.
Capaz
Agente de Hotelaria / Hospitalidade
Gere a comunicação com hóspedes, reservas e automação de receção.
Bom encaixe
Agente de Contabilidade / Odoo
Extrai faturas, reconcilia dados e conduz fluxos de trabalho de ERP.
Bom encaixe
Agente de Programação / Engenharia de Produto
Conclusão, revisão e refatoração de código localmente sobre código-fonte privado.
Bom encaixe
Founder Ops / Centro de Comando do Negócio
Uma frota de agentes cooperantes a gerir todo o negócio de forma privada.
Capaz

“Assistência na nuvem” significa executá-lo localmente para cargas leves e recorrer à nuvem para trabalhos mais pesados. Veja casos de uso de negócio para saber como cada agente se mapeia ao hardware.

Perguntas frequentes

O Coding Agent Workstation (reference profile) é bom para executar IA local?+

Obtém 65/100 no nosso Local AI Score (nível Forte), com base nos seus 48GB de memória e na largura de banda/computação disponíveis. Isso torna-o adequado ao nível Business do AI Business OS.

Que LLMs consegue o Coding Agent Workstation (reference profile) executar?+

Confortavelmente: Llama 3.1 70B (Q4_K_M), Llama 3.3 70B (Q4_K_M), DeepSeek-R1 Distill Llama 70B (Q4_K_M). Modelos maiores podem correr com quantização mais agressiva ou dividindo-os entre vários dispositivos.

Devo executar IA localmente ou na nuvem no Coding Agent Workstation (reference profile)?+

Local em primeiro lugar é recomendado. Capacidade suficiente para alojar agentes reais localmente, com privacidade e custo previsível; use a nuvem apenas para picos acima da procura máxima.

Posso transformar o Coding Agent Workstation (reference profile) num AI Business OS privado?+

Sim. O AI Business OS pode correr nesta máquina ao nível Business, dando-lhe agentes privados no seu próprio hardware. Veja o apelo à ação acima para começar.

Transforme o Coding Agent Workstation (reference profile) num AI Business OS privado

Execute os seus próprios agentes de IA em hardware que controla: privado por design, sem dados por utilizador a saírem das suas instalações. BrainOutput ajuda-o a escolher a máquina certa e a transformá-la num AI Business OS em funcionamento.

Começar

Hardware relacionado

Dell · Estações de trabalho de IA

Dell Precision 7960 AI Workstation

74/100· Forte·~

Uma torre profissional capaz de alojar grandes GPU pro (p. ex. RTX 6000 Ada / A6000) para IA local séria de secretária.

Memória: 48 GB
Arquitetura: Configurable (multi-GPU tower)

HP · Estações de trabalho de IA

HP Z8 Fury G5 Workstation

87/100· Elite·~

Uma estação de trabalho topo de gama concebida para alojar várias GPU pro de largura dupla — uma plataforma de IA multi-GPU de secretária.

Memória: 96 GB
Arquitetura: Configurable (up to 4 GPUs)

Lenovo · Estações de trabalho de IA

Lenovo ThinkStation PX Workstation

87/100· Elite·~

Uma estação de trabalho de socket duplo construída para várias GPU profissionais — adequada a equipas que executam IA local mais pesada on-premise.

Memória: 96 GB
Arquitetura: Configurable (dual-socket, multi-GPU)

Supermicro · Estações de trabalho de IA

Supermicro AI Workstation

87/100· Elite·~

A linha de torres multi-GPU de secretária da Supermicro — uma plataforma flexível para IA local on-premise com várias placas pro ou de centro de dados.

Memória: 96 GB
Arquitetura: Configurable (multi-GPU tower)