Zhipu

GLM-4 9B

Current

152.0KDownloads702LikesJun 2024Released128K tokensContextGLMLicense3 EntryQuality

Get started

— copy & paste to run locally

Ollama

ollama run glm-4-9b

HuggingFace

huggingface-cli download glm-4-9b

Quick specs

Parameters9B

Architecturedense

Context128K tokens

Modalitytext

Min RAM3.5 GB

Rec. RAM5.5 GB (Q4_K_M)

LicenseGLM

FamilyGLM

✓ Chat

About this model

2024/11/25, 我们建议使用从 `transformers>=4.46.0` 开始，使用 glm-4-9b-chat-hf 以减少后续 transformers 升级导致的兼容性问题。

Related models

Quick picks

Intel Arc B580 12GB~$249 — 40 tok/s

RTX 3080 12GB~$799 — 126 tok/s

Best hardware

Top picks for GLM-4 9B

RTX 3080 Ti 12GBB

RTX 2080 Ti 11GBB

RTX 4070 Super 12GBB

Quantization options

VRAM estimates by quant level

No hardware detected — fit column shows raw VRAM estimates

Quant	Bits	VRAM	Quality	Fit
Q2_K	2	3.5 GB	Low	—
Q3_K_S	3	4.4 GB	Low	—
NVFP4	4	5.0 GB	Medium	—
Q4_K_M	4	5.5 GB	Medium	—
Q5_K_M	5	6.5 GB	High	—
Q6_K	6	7.4 GB	High	—
Q8_0	8	9.6 GB	Very High	—
F16	16	18.5 GB	Maximum	—

Hardware compatibility

Fit estimates across all hardware

Open calculator

Computing compatibility...

Memory breakdown

Reference: NVIDIA A10 24GB

Weights5.5 GB

KV Cache1.4 GB

Runtime0.9 GB

Headroom2.4 GB