Biblioteca de LLMs locais e requisitos de hardware

67 modelos que pode pesquisar e filtrar por tipo, capacidade e tamanho. Os valores de memória são estimativas do conjunto de trabalho por quantização (trate-os como ±): associam tamanhos de modelo a níveis de hardware, não a benchmarks exatos. Abra cada modelo para ver dispositivos compatíveis e uma configuração recomendada.

Melhores LLMs locais Melhores LLMs de programação Melhores modelos RAG Requisitos de hardware para LLMs Encontrar o modelo certo →

Type

Capability

Size

67 models

Sort by

Explorar por família

Compare todos os tamanhos de uma família lado a lado, com o hardware que cada um precisa.

Qwen16 DeepSeek7 Llama7 Mistral4 CodeLlama3 Gemma3 Gemma 33 LLaVA3 Phi3 StarCoder3 Granite2 Qwen2.52

Sobre os modelos de API de ponta: Claude (Anthropic API), GPT-class (OpenAI API), Gemini-class (Google API) estão listados apenas como referência de qualidade e custo para a estratégia híbrida — funcionam como serviços alojados, não em hardware local, e enviam dados ao fornecedor.

Uma nota sobre honestidade: os tamanhos dos modelos, as janelas de contexto e a pegada de memória mudam entre versões, e as licenças variam. Trate os valores como orientação aproximada e verifique a variante exata e os seus termos antes de implantar. As entradas de raciocínio, visão e API estão assinaladas em conformidade.

Execute estes modelos dentro de um AI Business OS privado

Run your own AI agents on hardware you control — private by design, no per-seat data leaving your premises. BrainOutput helps you pick the right machine and turn it into a working AI Business OS.

Explorar o AI Business OS

DeepSeek-R1 671B (MoE)

Llama 3.1 405B

Qwen3 235B-A22B (MoE)

Qwen2.5 72B

Llama 3.1 70B

Llama 3.3 70B

DeepSeek-R1 Distill Llama 70B

Mixtral 8x7B (MoE)

CodeLlama 34B

Qwen2.5 32B

Qwen3 32B

DeepSeek-R1 Distill 32B

Qwen2.5-Coder 32B

Gemma 2 27B

Gemma 3 27B

Mistral Small 24B

DeepSeek-Coder V2 (class)

StarCoder2 15B

Qwen2.5 14B

Qwen3 14B

Phi-3 Medium (14B)

Phi-4 (14B)

DeepSeek-R1 Distill 14B

Qwen2.5-Coder 14B

CodeLlama 13B

LLaVA 13B (vision)

Gemma 3 12B

Mistral Nemo 12B

Llama 3.2 Vision 11B

Gemma 2 9B

Llama 3.1 8B

Qwen3 8B

Granite 3 8B

DeepSeek-R1 Distill 8B

LLaVA-Llama3 8B (vision)

MiniCPM-V 8B (vision)

Qwen2.5 7B Instruct

Qwen2.5 Coder 7B Instruct

Qwen2.5 7B

Mistral 7B

Qwen2.5-Coder 7B

CodeLlama 7B

StarCoder2 7B

Qwen2-VL 7B (vision)

LLaVA 7B (vision)

Gemma 3 4B

Phi-3.5 Mini (3.8B)

Llama 3.2 3B

Qwen2.5 3B

StarCoder2 3B

Gemma 2 2B

Granite 3 2B

Moondream 2 (vision)

SmolLM2 1.7B

Qwen2.5 1.5B

DeepSeek-R1 Distill 1.5B

Qwen2.5-Coder 1.5B

Llama 3.2 1B

BGE-M3 Embeddings (class)

Qwen2.5 0.5B

mxbai-embed-large (class)

Snowflake Arctic Embed (class)

Nomic Embed Text (class)

all-MiniLM (class)

Claude (Anthropic API)

GPT-class (OpenAI API)

Gemini-class (Google API)

Explorar por família

Execute estes modelos dentro de um AI Business OS privado