Models Capabilities Use Cases Benchmarks Papers Glossary

Models Capabilities Use Cases Benchmarks Papers Glossary

About Privacy Terms RSS

ThinkLLM

Spot an error in our data? Let us know.

Glossary/Task Accuracy

Task Accuracy

techniques

The percentage of correct answers a model produces on a benchmark, measured by standard evaluation metrics.

Task Accuracy — Glossary — ThinkLLM