Models Capabilities Use Cases Benchmarks Papers Glossary

Models Capabilities Use Cases Benchmarks Papers Glossary

About Privacy Terms RSS

ThinkLLM

Spot an error in our data? Let us know.

Glossary/NF4 Quantization

NF4 Quantization

deployment

A specific 4-bit quantization method that uses a normalized float format to preserve model accuracy while dramatically reducing memory requirements.

NF4 Quantization — Glossary — ThinkLLM