Models Capabilities Use Cases Benchmarks Papers Glossary

Models Capabilities Use Cases Benchmarks Papers Glossary

About Privacy Terms RSS

ThinkLLM

Spot an error in our data? Let us know.

GPTQ

formats

A quantization technique that compresses model weights to lower precision, reducing file size and memory requirements while maintaining reasonable performance.

GPTQ — Glossary — ThinkLLM