Agent privé de documents et RAG
L'agent documentaire lit les contrats, rapports, politiques et wikis et répond aux questions avec des citations, en utilisant la génération augmentée par récupération (RAG) sur une base de connaissances privée plutôt que ses données d'entraînement.
Comme la récupération et le modèle s'exécutent tous deux sur du matériel que vous contrôlez, le matériel source ne quitte jamais vos locaux — et un modèle de taille moyenne performant plus un modèle d'embeddings suffisent généralement.
Ce qu'il fait
- ▸Répond à partir de vos documents, contrats et wikis avec des citations
- ▸Récupération sur une base de connaissances privée (RAG)
- ▸Résumé et questions-réponses entre documents
- ▸Garde le matériel source sur une infrastructure que vous contrôlez
Comment ça marche
L'agent enveloppe un modèle ouvert avec de la recherche sur vos données, des permissions cadrées, des outils typés, des confirmations et un journal d'audit — la couche AI Business OS qui le rend sûr à déployer.
L'adéquation dépend du score de capacité rag de chaque machine.
Modèles qui l'alimentent
Tous les modèles →Modèles ouverts de la bibliothèque adaptés à ce rôle : 40. Quelques-uns, du plus petit au plus grand :
all-MiniLM (class)
tiny · very fast
Nomic Embed Text (class)
fast retrieval · lightweight
Snowflake Arctic Embed (class)
quality retrieval · RAG
mxbai-embed-large (class)
quality retrieval · RAG
BGE-M3 Embeddings (class)
multilingual retrieval · long documents
DeepSeek-R1 Distill 1.5B
tiny reasoning · edge
Le matériel qui l'exécute
Tout le matériel →Machines capables d'héberger cet agent aujourd'hui, évaluées pour des charges d'IA locale réelles — l'option la moins chère et performante d'abord.
Apple Mac mini (M4 Pro)
Plus de bande passante mémoire et jusqu'à 64 Go de mémoire unifiée font de ce mini une boîte d'IA locale étonnamment capable en format compact.
- Mémoire
- 64 GB unified
- Architecture
- Apple M4 Pro
NVIDIA L40S
Une carte de centre de données 48 Go polyvalente pour l'inférence et le graphisme — une option de service populaire et économique en cloud et on-premise.
- Mémoire
- 48 GB
- Architecture
- Ada Lovelace
Coding Agent Workstation (reference profile)
Une station de travail optimisée pour les agents de codage locaux : ~48 Go répartis sur deux cartes de 24 Go exécutent de puissants modèles coder 32B et servent en privé une petite équipe d'ingénierie.
- Mémoire
- 48 GB
- Architecture
- Ada Lovelace
Exécutez-le en privé, dans votre cloud ou en hybride
Gardez cet agent sur du matériel que vous possédez pour la confidentialité et un coût prévisible, exécutez-le sur des GPU cloud de votre propre compte pour les pics et les plus grands modèles, ou les deux.
Questions fréquentes
Qu'est-ce que l'agent Documents / RAG ?+
L'agent documentaire lit les contrats, rapports, politiques et wikis et répond aux questions avec des citations, en utilisant la génération augmentée par récupération (RAG) sur une base de connaissances privée plutôt que ses données d'entraînement.
L'agent Documents / RAG peut-il s'exécuter en privé sur mon propre matériel ?+
Oui. Il s'exécute sur des modèles à poids ouverts que vous hébergez vous-même sur un boîtier privé, un serveur on-premise ou votre propre compte cloud, de sorte que les données restent sur l'infrastructure que vous contrôlez. Vous pouvez aussi fonctionner en hybride : local par défaut, avec basculement vers le cloud pour les plus grands modèles.
Quels modèles alimentent l'agent Documents / RAG ?+
Il fonctionne avec des modèles ouverts comme all-MiniLM (class), Nomic Embed Text (class), Snowflake Arctic Embed (class). La bonne taille dépend de vos exigences de qualité et du matériel sur lequel vous l'exécutez — consultez la bibliothèque de modèles pour la VRAM par quantification.
Quel matériel l'agent Documents / RAG nécessite-t-il ?+
Il correspond généralement au niveau —. Une machine comme la Apple Mac mini (M4 Pro) convient parfaitement à ce rôle ; un matériel plus léger ou plus puissant modifie le nombre de requêtes simultanées et la taille de modèle possible.
Recruter un autre agent
Mettez l'agent Documents / RAG au travail avec BrainOutput
Déployez l'agent Documents / RAG en privé, connectez vos outils et évoluez vers une équipe IA complète sur une infrastructure que vous contrôlez.