Bibliothèque de LLM locaux et besoins matériels

67 modèles que vous pouvez rechercher et filtrer par type, capacité et taille. Les chiffres de mémoire sont des estimations de l'ensemble de travail par quantification (à considérer comme ±) : ils associent les tailles de modèle à des niveaux de matériel, pas à des benchmarks exacts. Ouvrez chaque modèle pour voir les appareils compatibles et une configuration recommandée.

Meilleurs LLM locaux Meilleurs LLM de code Meilleurs modèles RAG Besoins matériels des LLM Trouver le bon modèle →

Type

Capability

Size

67 models

Sort by

Parcourir par famille

Comparez toutes les tailles d'une famille côte à côte, avec le matériel nécessaire à chacune.

Qwen16 DeepSeek7 Llama7 Mistral4 CodeLlama3 Gemma3 Gemma 33 LLaVA3 Phi3 StarCoder3 Granite2 Qwen2.52

À propos des modèles API de pointe : Claude (Anthropic API), GPT-class (OpenAI API), Gemini-class (Google API) sont listés uniquement comme repères de qualité et de coût pour la stratégie hybride — ils fonctionnent comme des services hébergés, pas sur du matériel local, et envoient des données au fournisseur.

Une note sur l'honnêteté : les tailles de modèles, les fenêtres de contexte et les empreintes mémoire changent d'une version à l'autre, et les licences varient. Considérez les chiffres comme des indications approximatives et vérifiez la variante exacte et ses conditions avant de déployer. Les entrées de raisonnement, de vision et d'API sont signalées en conséquence.

Exécutez ces modèles dans un AI Business OS privé

Run your own AI agents on hardware you control — private by design, no per-seat data leaving your premises. BrainOutput helps you pick the right machine and turn it into a working AI Business OS.

Explorer l'AI Business OS

DeepSeek-R1 671B (MoE)

Llama 3.1 405B

Qwen3 235B-A22B (MoE)

Qwen2.5 72B

Llama 3.1 70B

Llama 3.3 70B

DeepSeek-R1 Distill Llama 70B

Mixtral 8x7B (MoE)

CodeLlama 34B

Qwen2.5 32B

Qwen3 32B

DeepSeek-R1 Distill 32B

Qwen2.5-Coder 32B

Gemma 2 27B

Gemma 3 27B

Mistral Small 24B

DeepSeek-Coder V2 (class)

StarCoder2 15B

Qwen2.5 14B

Qwen3 14B

Phi-3 Medium (14B)

Phi-4 (14B)

DeepSeek-R1 Distill 14B

Qwen2.5-Coder 14B

CodeLlama 13B

LLaVA 13B (vision)

Gemma 3 12B

Mistral Nemo 12B

Llama 3.2 Vision 11B

Gemma 2 9B

Llama 3.1 8B

Qwen3 8B

Granite 3 8B

DeepSeek-R1 Distill 8B

LLaVA-Llama3 8B (vision)

MiniCPM-V 8B (vision)

Qwen2.5 7B Instruct

Qwen2.5 Coder 7B Instruct

Qwen2.5 7B

Mistral 7B

Qwen2.5-Coder 7B

CodeLlama 7B

StarCoder2 7B

Qwen2-VL 7B (vision)

LLaVA 7B (vision)

Gemma 3 4B

Phi-3.5 Mini (3.8B)

Llama 3.2 3B

Qwen2.5 3B

StarCoder2 3B

Gemma 2 2B

Granite 3 2B

Moondream 2 (vision)

SmolLM2 1.7B

Qwen2.5 1.5B

DeepSeek-R1 Distill 1.5B

Qwen2.5-Coder 1.5B

Llama 3.2 1B

BGE-M3 Embeddings (class)

Qwen2.5 0.5B

mxbai-embed-large (class)

Snowflake Arctic Embed (class)

Nomic Embed Text (class)

all-MiniLM (class)

Claude (Anthropic API)

GPT-class (OpenAI API)

Gemini-class (Google API)

Parcourir par famille

Exécutez ces modèles dans un AI Business OS privé