BBrainOutput
NVIDIA·GPU

NVIDIA RTX 4090 : spécifications et compatibilité IA locale

Le fleuron grand public : 24GB et une large bande passante font bien tourner les modèles de 32B.

Spécifications

Mémoire
24 GB
Type de mémoire
GDDR6X
Bande passante
1,008 GB/s
FP16 approx.
165 TFLOPS
Architecture
Ada Lovelace
Gravure
TSMC 4N
Consommation
450 W
Sortie
2022

Modèles que cette puce peut exécuter

Modèles ouverts évalués pour une seule NVIDIA RTX 4090, du meilleur ajustement d'abord.

  • Gemma 2 27B
    Gemma · ~27B · 8K ctx · Gemma Terms of Use

    Tient en Q4_K_M (~17GB) avec ~4.1GB de marge — environ 1 instance simultanée.

    Q4_K_M · ~17GBFonctionne bien
  • Gemma 3 27B
    Gemma 3 · ~27B · 128K ctx · Gemma Terms of Use

    Tient en Q4_K_M (~17GB) avec ~4.1GB de marge — environ 1 instance simultanée.

    Q4_K_M · ~17GBFonctionne bien
  • Mistral Small 24B
    Mistral · ~24B · 32K ctx · Apache-2.0

    Tient en Q4_K_M (~14GB) avec ~7.1GB de marge — environ 1 instance simultanée.

    Q4_K_M · ~14GBFonctionne bien
  • DeepSeek-Coder V2 (class)
    DeepSeek · ~16B · 128K ctx · DeepSeek License

    Tient en Q8_0 (~18GB) avec ~3.1GB de marge — environ 1 instance simultanée.

    Q8_0 · ~18GBFonctionne bien
  • StarCoder2 15B
    StarCoder · ~15B · 16K ctx · BigCode OpenRAIL-M

    Tient en Q8_0 (~17GB) avec ~4.1GB de marge — environ 1 instance simultanée.

    Q8_0 · ~17GBFonctionne bien
  • Qwen2.5 14B
    Qwen · ~14B · 128K ctx · Apache-2.0

    Tient en Q8_0 (~16GB) avec ~5.1GB de marge — environ 1 instance simultanée.

    Q8_0 · ~16GBFonctionne bien
  • Qwen3 14B
    Qwen · ~14B · 128K ctx · Apache-2.0

    Tient en Q8_0 (~16GB) avec ~5.1GB de marge — environ 1 instance simultanée.

    Q8_0 · ~16GBFonctionne bien
  • Phi-3 Medium (14B)
    Phi · ~14B · 128K ctx · MIT

    Tient en Q8_0 (~15GB) avec ~6.1GB de marge — environ 1 instance simultanée.

    Q8_0 · ~15GBFonctionne bien

Appareils basés sur cette puce

Construisez un AI Business OS privé sur NVIDIA RTX 4090

Run your own AI agents on hardware you control — private by design, no per-seat data leaving your premises. BrainOutput helps you pick the right machine and turn it into a working AI Business OS.