Models Capabilities Use Cases Benchmarks Papers Glossary

Models Capabilities Use Cases Benchmarks Papers Glossary

About Privacy Terms RSS

ThinkLLM

Spot an error in our data? Let us know.

Glossary/Confidence-Driven Reinforcement Learning

Confidence-Driven Reinforcement Learning

techniques

Training a model using rewards based on how well its confidence scores match its actual correctness.

Confidence-Driven Reinforcement Learning — Glossary — ThinkLLM