Agente privado de documentos e RAG
O agente de documentos lê contratos, relatórios, políticas e wikis e responde a perguntas com citações, usando geração aumentada por recuperação (RAG) sobre uma base de conhecimento privada em vez dos seus dados de treino.
Como a recuperação e o modelo são ambos executados em hardware que você controla, o material de origem nunca sai das suas instalações — e normalmente basta um modelo de tamanho médio capaz mais um modelo de embeddings.
O que faz
- ▸Responde a partir dos seus documentos, contratos e wikis com citações
- ▸Recuperação sobre uma base de conhecimento privada (RAG)
- ▸Resumo e perguntas e respostas entre documentos
- ▸Mantém o material de origem em infraestrutura que você controla
Como funciona
O agente envolve um modelo aberto com recuperação sobre os seus dados, permissões definidas, ferramentas tipadas, confirmações e um registo de auditoria — a camada AI Business OS que o torna seguro de implantar.
A adequação baseia-se na pontuação de capacidade rag de cada máquina.
Modelos que o impulsionam
Todos os modelos →Modelos abertos na biblioteca adequados a esta função: 40. Alguns, do mais pequeno ao maior:
all-MiniLM (class)
tiny · very fast
Nomic Embed Text (class)
fast retrieval · lightweight
Snowflake Arctic Embed (class)
quality retrieval · RAG
mxbai-embed-large (class)
quality retrieval · RAG
BGE-M3 Embeddings (class)
multilingual retrieval · long documents
DeepSeek-R1 Distill 1.5B
tiny reasoning · edge
Hardware em que é executado
Todo o hardware →Máquinas que podem alojar este agente hoje, avaliadas para cargas de IA local reais — primeiro a opção mais económica com bom desempenho.
Apple Mac mini (M4 Pro)
Mais largura de banda de memória e até 64GB de memória unificada tornam esta uma caixa de IA local surpreendentemente capaz em formato compacto.
- Memória
- 64 GB unified
- Arquitetura
- Apple M4 Pro
NVIDIA L40S
Uma versátil placa de centro de dados de 48GB para inferência e gráficos — uma opção de serviço popular e económica em cloud e on-premise.
- Memória
- 48 GB
- Arquitetura
- Ada Lovelace
Coding Agent Workstation (reference profile)
Uma estação de trabalho afinada para agentes de programação locais: ~48GB entre duas placas de 24GB executam potentes modelos coder de 32B e servem em privado uma pequena equipa de engenharia.
- Memória
- 48 GB
- Arquitetura
- Ada Lovelace
Execute-o em privado, na sua nuvem ou híbrido
Mantenha este agente em hardware próprio para privacidade e custo previsível, execute-o em GPUs na nuvem da sua própria conta para picos e os maiores modelos, ou ambos.
Perguntas frequentes
O que é o agente de Documentos / RAG?+
O agente de documentos lê contratos, relatórios, políticas e wikis e responde a perguntas com citações, usando geração aumentada por recuperação (RAG) sobre uma base de conhecimento privada em vez dos seus dados de treino.
O agente de Documentos / RAG pode ser executado de forma privada no meu próprio hardware?+
Sim. É executado em modelos de pesos abertos que você mesmo aloja numa caixa privada, num servidor on-premise ou na sua própria conta de nuvem, de modo que os dados permanecem na infraestrutura que você controla. Também pode funcionar em híbrido: local por defeito, expandindo para a nuvem para os maiores modelos.
Que modelos impulsionam o agente de Documentos / RAG?+
Funciona com modelos abertos como all-MiniLM (class), Nomic Embed Text (class), Snowflake Arctic Embed (class). O tamanho certo depende das necessidades de qualidade e do hardware em que o executa — consulte a biblioteca de modelos para ver a VRAM por quantização.
Que hardware precisa o agente de Documentos / RAG?+
Normalmente corresponde ao nível —. Uma máquina como a Apple Mac mini (M4 Pro) adapta-se muito bem a esta função; hardware mais leve ou mais potente altera quantos pedidos simultâneos e que tamanho de modelo pode executar.
Contrate outro agente
Ponha o agente de Documentos / RAG a trabalhar com a BrainOutput
Implante o agente de Documentos / RAG de forma privada, ligue as suas ferramentas e cresça até uma equipa de IA completa em infraestrutura que você controla.