Models Capabilities Use Cases Benchmarks Papers Glossary

Models Capabilities Use Cases Benchmarks Papers Glossary

About Privacy Terms RSS

ThinkLLM

Spot an error in our data? Let us know.

Glossary/Reward Modeling

Reward Modeling

techniques

Training a model to predict human preferences so it can score outputs and guide AI training through reinforcement learning.

Reward Modeling — Glossary — ThinkLLM