How much VRAM does DeepSeek R1 0528 Qwen3 8B need?

DeepSeek R1 0528 Qwen3 8B (8B parameters) requires approximately 8.4 GB of memory with Q4_K_M quantization.

What is the best quantization for DeepSeek R1 0528 Qwen3 8B?

The recommended quantization for DeepSeek R1 0528 Qwen3 8B is Q4_K_M, which balances quality and memory efficiency.

Can it run?

Can RTX 2080 Ti 11GB run DeepSeek R1 0528 Qwen3 8B?

Q: Can RTX 2080 Ti 11GB run DeepSeek R1 0528 Qwen3 8B?

Yes, RTX 2080 Ti 11GB can run DeepSeek R1 0528 Qwen3 8B with a B grade (Runs well). Expected decode speed: 82.0 tok/s.

BGood

Runs well

Using Q4_K_M in Ollama

Capabilities:

Fit status

Runs well

Decode

82.0 tok/s

TTFT

2360 ms

Safe context

21K

Memory

8.4 GB / 11.0 GB

Memory breakdown

Weights4.9 GB

KV Cache1.3 GB

Runtime1.2 GB

Headroom1.1 GB

Performance by workload

Workload	Grade	Fit	Decode	TTFT	Context
Agentic Coding	C	Tight fit	82.0 tok/s	3432 ms	36K
Chat	B	Runs well	82.0 tok/s	1287 ms	11K
Coding	B	Runs well	82.0 tok/s	2360 ms	21K
RAG	C	Tight fit	82.0 tok/s	4290 ms	36K
Reasoning	B	Runs well	82.0 tok/s	2789 ms	21K

Quantization options

How DeepSeek R1 0528 Qwen3 8B (8B params) fits at each quantization level on RTX 2080 Ti 11GB (11.0 GB usable).

Quant	Bits	VRAM	Quality	Fit
Q2_K	2	3.1 GB	Low	D35
Q3_K_S	3	3.9 GB	Low	D37
NVFP4	4	4.5 GB	Medium	D38
Q4_K_M	4	4.9 GB	Medium	D39
Q5_K_M	5	5.8 GB	High	C41
Q6_KBest for your GPU	6	6.6 GB	High	C42
Q8_0	8	8.6 GB	Very High	C44
F16	16	16.4 GB	Maximum	F0

Get started

Upgrade options

Hardware that runs DeepSeek R1 0528 Qwen3 8B well

RTX 5070 12GBBudget pick

B86.8 tok/s decode

~$549 MSRP

RTX 3080 12GBBest value

B142 tok/s decode

~$799 MSRP

RTX 3080 Ti 12GBBiggest leap

B138.3 tok/s decode

~$1,199 MSRP

See all results for RTX 2080 Ti 11GB See all hardware for DeepSeek R1 0528 Qwen3 8B

Can it run?

Can RTX 2080 Ti 11GB run DeepSeek R1 0528 Qwen3 8B?

BGood

Runs well

Using Q4_K_M in Ollama

Capabilities:

Fit status

Runs well

Decode

82.0 tok/s

TTFT

2360 ms

Safe context

21K

Memory

8.4 GB / 11.0 GB

Memory breakdown

Weights4.9 GB

KV Cache1.3 GB

Runtime1.2 GB

Headroom1.1 GB

Performance by workload

Workload	Grade	Fit	Decode	TTFT	Context
Agentic Coding	C	Tight fit	82.0 tok/s	3432 ms	36K
Chat	B	Runs well	82.0 tok/s	1287 ms	11K
Coding	B	Runs well	82.0 tok/s	2360 ms	21K
RAG	C	Tight fit	82.0 tok/s	4290 ms	36K
Reasoning	B	Runs well	82.0 tok/s	2789 ms	21K

Quantization options

How DeepSeek R1 0528 Qwen3 8B (8B params) fits at each quantization level on RTX 2080 Ti 11GB (11.0 GB usable).

Quant	Bits	VRAM	Quality	Fit
Q2_K	2	3.1 GB	Low	D35
Q3_K_S	3	3.9 GB	Low	D37
NVFP4	4	4.5 GB	Medium	D38
Q4_K_M	4	4.9 GB	Medium	D39
Q5_K_M	5	5.8 GB	High	C41
Q6_KBest for your GPU	6	6.6 GB	High	C42
Q8_0	8	8.6 GB	Very High	C44
F16	16	16.4 GB	Maximum	F0

Get started

Upgrade options

Hardware that runs DeepSeek R1 0528 Qwen3 8B well

RTX 5070 12GBBudget pick

B86.8 tok/s decode

~$549 MSRP

RTX 3080 12GBBest value

B142 tok/s decode

~$799 MSRP

RTX 3080 Ti 12GBBiggest leap

B138.3 tok/s decode

~$1,199 MSRP

See all results for RTX 2080 Ti 11GB See all hardware for DeepSeek R1 0528 Qwen3 8B