NelsaHost

Hardware AI Models Compatibility Compare

search Login

smart_toy

Qwen Large Language Models

Qwen 2.5 32B (32.00B)

Parameters

32.00B

VRAM (FP16)

64.0GB

VRAM (INT4)

16.0GB

Context

131072

check_circle View Compatible GPUs open_in_new View on HuggingFace

tune Quantization Options

Quantization	VRAM Required	Min GPU
FP16 (Half Precision)	64.0GB	A100 / H100
INT8 (8-bit Integer)	32.0GB	A6000 / 2x 4090
Q4_K_M (GGUF 4-bit)	16.0GB	RTX 4080
q3_k_m	12.8GB	RTX 4080

memory Compatible GPUs

check_circle

RTX 4090

24.0GB VRAM

Perfect

check_circle

RTX 4090

24.0GB VRAM

Perfect

check_circle

RTX 3090 Ti

24.0GB VRAM

Perfect

check_circle

RTX 3090 Ti

24.0GB VRAM

Perfect

check_circle

RTX 3090

24.0GB VRAM

Perfect

check_circle

RTX 3090

24.0GB VRAM

Perfect

View All Compatible GPUs

Model Details

Family Qwen

Category Large Language Models

Parameters 32.00B

Context Length 131072

Similar Models

Qwen 2.5 14B 14.00B Qwen 2.5 72B 72.00B Qwen 2.5 7B 7.00B Qwen2-VL 72B 72.00B