How much VRAM does Qwen 2.5 Coder 1.5B need?

Qwen 2.5 Coder 1.5B (1.5B parameters) requires approximately 3.3 GB of memory with Q4_K_M quantization.

What is the best quantization for Qwen 2.5 Coder 1.5B?

The recommended quantization for Qwen 2.5 Coder 1.5B is Q4_K_M, which balances quality and memory efficiency.

Can it run?

Can RTX 3050 Ti Laptop 4GB run Qwen 2.5 Coder 1.5B?

Q: Can RTX 3050 Ti Laptop 4GB run Qwen 2.5 Coder 1.5B?

Yes, RTX 3050 Ti Laptop 4GB can run Qwen 2.5 Coder 1.5B with a C grade (Tight fit). Expected decode speed: 149.8 tok/s.

CUsable

Tight fit

Using Q4_K_M in Ollama

Capabilities:

Fit status

Tight fit

Decode

149.8 tok/s

TTFT

1293 ms

Safe context

19K

Memory

3.3 GB / 4.0 GB

Memory breakdown

Weights0.9 GB

KV Cache0.8 GB

Runtime1.2 GB

Headroom0.4 GB

Performance by workload

Workload	Grade	Fit	Decode	TTFT	Context
Agentic Coding	C	Tight fit	149.8 tok/s	1880 ms	33K
Chat	C	Tight fit	149.8 tok/s	705 ms	10K
Coding	C	Tight fit	149.8 tok/s	1293 ms	19K
RAG	C	Tight fit	149.8 tok/s	2350 ms	33K
Reasoning	C	Tight fit	149.8 tok/s	1528 ms	19K

Quantization options

How Qwen 2.5 Coder 1.5B (1.5B params) fits at each quantization level on RTX 3050 Ti Laptop 4GB (4.0 GB usable).

Quant	Bits	VRAM	Quality	Fit
Q2_K	2	0.6 GB	Low	D32
Q3_K_S	3	0.7 GB	Low	D32
NVFP4	4	0.8 GB	Medium	D33
Q4_K_M	4	0.9 GB	Medium	D33
Q5_K_M	5	1.1 GB	High	D34
Q6_K	6	1.2 GB	High	D35
Q8_0Best for your GPU	8	1.6 GB	Very High	D37
F16	16	3.1 GB	Maximum	C43

Get started

Ollama

ollama run qwen-2.5-coder-1.5b

HuggingFace

huggingface-cli download qwen-2.5-coder-1.5b

Upgrade options

Hardware that runs Qwen 2.5 Coder 1.5B well

RTX 2060 6GBBudget pick

C191.5 tok/s decode

~$349 MSRP

Intel Arc A380 6GBBiggest leap

C91.1 tok/s decode

GTX 1060 6GBNVIDIA upgrade

C113.3 tok/s decode

See all results for RTX 3050 Ti Laptop 4GB See all hardware for Qwen 2.5 Coder 1.5B

Can it run?

Can RTX 3050 Ti Laptop 4GB run Qwen 2.5 Coder 1.5B?

CUsable

Tight fit

Using Q4_K_M in Ollama

Capabilities:

Fit status

Tight fit

Decode

149.8 tok/s

TTFT

1293 ms

Safe context

19K

Memory

3.3 GB / 4.0 GB

Memory breakdown

Weights0.9 GB

KV Cache0.8 GB

Runtime1.2 GB

Headroom0.4 GB

Performance by workload

Workload	Grade	Fit	Decode	TTFT	Context
Agentic Coding	C	Tight fit	149.8 tok/s	1880 ms	33K
Chat	C	Tight fit	149.8 tok/s	705 ms	10K
Coding	C	Tight fit	149.8 tok/s	1293 ms	19K
RAG	C	Tight fit	149.8 tok/s	2350 ms	33K
Reasoning	C	Tight fit	149.8 tok/s	1528 ms	19K

Quantization options

How Qwen 2.5 Coder 1.5B (1.5B params) fits at each quantization level on RTX 3050 Ti Laptop 4GB (4.0 GB usable).

Quant	Bits	VRAM	Quality	Fit
Q2_K	2	0.6 GB	Low	D32
Q3_K_S	3	0.7 GB	Low	D32
NVFP4	4	0.8 GB	Medium	D33
Q4_K_M	4	0.9 GB	Medium	D33
Q5_K_M	5	1.1 GB	High	D34
Q6_K	6	1.2 GB	High	D35
Q8_0Best for your GPU	8	1.6 GB	Very High	D37
F16	16	3.1 GB	Maximum	C43

Get started

Ollama

ollama run qwen-2.5-coder-1.5b

HuggingFace

huggingface-cli download qwen-2.5-coder-1.5b

Upgrade options

Hardware that runs Qwen 2.5 Coder 1.5B well

RTX 2060 6GBBudget pick

C191.5 tok/s decode

~$349 MSRP

Intel Arc A380 6GBBiggest leap

C91.1 tok/s decode

GTX 1060 6GBNVIDIA upgrade

C113.3 tok/s decode

See all results for RTX 3050 Ti Laptop 4GB See all hardware for Qwen 2.5 Coder 1.5B