Question 1

Can RTX PRO 6000 Blackwell Server Edition 96GB run Qwen3.5 9B Uncensored HauhauCS Aggressive?

Accepted Answer

Yes, RTX PRO 6000 Blackwell Server Edition 96GB can run Qwen3.5 9B Uncensored HauhauCS Aggressive with a C grade (Runs well). Expected decode speed: 209.4 tok/s.

Question 2

How much VRAM does Qwen3.5 9B Uncensored HauhauCS Aggressive need?

Accepted Answer

Qwen3.5 9B Uncensored HauhauCS Aggressive (9B parameters) requires approximately 17.7 GB of memory with Q4_K_M quantization.

Question 3

What is the best quantization for Qwen3.5 9B Uncensored HauhauCS Aggressive?

Accepted Answer

The recommended quantization for Qwen3.5 9B Uncensored HauhauCS Aggressive is Q4_K_M, which balances quality and memory efficiency.

Workload	Grade	Fit	Decode	TTFT	Context
Agentic Coding	C	Runs well	244.3 tok/s	1152 ms	161K
Chat	C	Runs well	244.3 tok/s	432 ms	45K
Coding	C	Runs well	209.4 tok/s	924 ms	87K
RAG	C	Runs well	244.3 tok/s	1441 ms	161K
Reasoning	C	Runs well	244.3 tok/s	936 ms	87K

Quant	Bits	VRAM	Quality	Fit
Q2_K	2	3.5 GB	Low	D30
Q3_K_S	3	4.4 GB	Low	D31
NVFP4

Can RTX PRO 6000 Blackwell Server Edition 96GB run Qwen3.5 9B Uncensored HauhauCS Aggressive?

Memory breakdown

Performance by workload

Quantization options

Get started

Hardware that runs Qwen3.5 9B Uncensored HauhauCS Aggressive well