NVIDIA·Acelerador de centro de datos

NVIDIA H100 80GB: especificaciones y compatibilidad con IA local

El caballo de batalla Hopper: 80GB HBM3 y un ancho de banda muy alto.

Especificaciones

Memoria: 80 GB
Tipo de memoria: HBM3
Ancho de banda: 3,350 GB/s
FP16 aprox.: 990 TFLOPS
Arquitectura: Hopper
Proceso: TSMC 4N
Consumo: 700 W
Lanzamiento: 2022

Modelos que este chip puede ejecutar

Modelos abiertos evaluados para un solo NVIDIA H100 80GB, primero el de mejor ajuste.

Qwen2.5 72B
Qwen · ~72B · 128K ctx · Qwen License
Cabe en Q4_K_M (~44GB) con ~26.4GB de margen — alrededor de 1 instancia simultánea.
Q4_K_M · ~44GBFunciona bien
Llama 3.1 70B
Llama · ~70B · 128K ctx · Llama Community License
Cabe en Q4_K_M (~42GB) con ~28.4GB de margen — alrededor de 1 instancia simultánea.
Q4_K_M · ~42GBFunciona bien
Llama 3.3 70B
Llama · ~70B · 128K ctx · Llama Community License
Cabe en Q4_K_M (~42GB) con ~28.4GB de margen — alrededor de 1 instancia simultánea.
Q4_K_M · ~42GBFunciona bien
DeepSeek-R1 Distill Llama 70B
DeepSeek · ~70B · 128K ctx · MIT
Cabe en Q4_K_M (~42GB) con ~28.4GB de margen — alrededor de 1 instancia simultánea.
Q4_K_M · ~42GBFunciona bien
Mixtral 8x7B (MoE)
Mistral · ~47B · 32K ctx · Apache-2.0
Cabe en Q8_0 (~50GB) con ~20.4GB de margen — alrededor de 1 instancia simultánea.
Q8_0 · ~50GBFunciona bien
CodeLlama 34B
CodeLlama · ~34B · 16K ctx · Llama Community License
Cabe en FP16 (~68GB) con ~2.4GB de margen — alrededor de 1 instancia simultánea.
FP16 · ~68GBFunciona bien
Qwen2.5 32B
Qwen · ~32B · 128K ctx · Apache-2.0
Cabe en FP16 (~64GB) con ~6.4GB de margen — alrededor de 1 instancia simultánea.
FP16 · ~64GBFunciona bien
Qwen3 32B
Qwen · ~32B · 128K ctx · Apache-2.0
Cabe en FP16 (~64GB) con ~6.4GB de margen — alrededor de 1 instancia simultánea.
FP16 · ~64GBFunciona bien

Dispositivos basados en este chip

Dell

Dell PowerEdge XE9680 (H100)

Crea un AI Business OS privado sobre NVIDIA H100 80GB

Run your own AI agents on hardware you control — private by design, no per-seat data leaving your premises. BrainOutput helps you pick the right machine and turn it into a working AI Business OS.

Explorar el AI Business OS