Models Capabilities Use Cases Benchmarks Papers Glossary

Models Capabilities Use Cases Benchmarks Papers Glossary

About Privacy Terms RSS

ThinkLLM

Spot an error in our data? Let us know.

Glossary/Preference-Based Fine-tuning

Preference-Based Fine-tuning

techniques

Refining a model by learning from human comparisons of outputs rather than explicit numerical scores.

Preference-Based Fine-tuning — Glossary — ThinkLLM