BBrainOutput
NVIDIA·Rechenzentrums-Beschleuniger

NVIDIA L4 24GB: Spezifikationen & Eignung für lokale KI

Stromsparende 24GB-Inferenzkarte für effiziente Bereitstellung.

Spezifikationen

Speicher
24 GB
Speichertyp
GDDR6
Bandbreite
300 GB/s
FP16 ca.
30 TFLOPS
Architektur
Ada Lovelace
Fertigung
TSMC 4N
Leistung
72 W
Markteinführung
2023

Modelle, die dieser Chip ausführen kann

Offene Modelle, bewertet für einen einzelnen NVIDIA L4 24GB, beste Eignung zuerst.

  • CodeLlama 13B
    CodeLlama · ~13B · 16K ctx · Llama Community License

    Passt mit Q8_0 (~14GB) bei ~7.1GB Reserve — etwa 1 gleichzeitige Instanz.

    Q8_0 · ~14GBLäuft gut
  • Gemma 3 12B
    Gemma 3 · ~12B · 128K ctx · Gemma Terms of Use

    Passt mit Q8_0 (~13GB) bei ~8.1GB Reserve — etwa 1 gleichzeitige Instanz.

    Q8_0 · ~13GBLäuft gut
  • Mistral Nemo 12B
    Mistral · ~12B · 128K ctx · Apache-2.0

    Passt mit Q8_0 (~13GB) bei ~8.1GB Reserve — etwa 1 gleichzeitige Instanz.

    Q8_0 · ~13GBLäuft gut
  • Gemma 2 9B
    Gemma · ~9B · 8K ctx · Gemma Terms of Use

    Passt mit FP16 (~19GB) bei ~2.1GB Reserve — etwa 1 gleichzeitige Instanz.

    FP16 · ~19GBLäuft gut
  • Llama 3.1 8B
    Llama · ~8B · 128K ctx · Llama Community License

    Passt mit FP16 (~17GB) bei ~4.1GB Reserve — etwa 1 gleichzeitige Instanz.

    FP16 · ~17GBLäuft gut
  • Qwen3 8B
    Qwen · ~8B · 128K ctx · Apache-2.0

    Passt mit FP16 (~17GB) bei ~4.1GB Reserve — etwa 1 gleichzeitige Instanz.

    FP16 · ~17GBLäuft gut
  • Granite 3 8B
    Granite · ~8B · 128K ctx · Apache-2.0

    Passt mit FP16 (~17GB) bei ~4.1GB Reserve — etwa 1 gleichzeitige Instanz.

    FP16 · ~17GBLäuft gut
  • DeepSeek-R1 Distill 8B
    DeepSeek · ~8B · 128K ctx · MIT

    Passt mit FP16 (~17GB) bei ~4.1GB Reserve — etwa 1 gleichzeitige Instanz.

    FP16 · ~17GBLäuft gut

Bauen Sie ein privates AI Business OS auf NVIDIA L4 24GB

Run your own AI agents on hardware you control — private by design, no per-seat data leaving your premises. BrainOutput helps you pick the right machine and turn it into a working AI Business OS.