Models Capabilities Use Cases Benchmarks Papers Glossary

Models Capabilities Use Cases Benchmarks Papers Glossary

About Privacy Terms RSS

ThinkLLM

Spot an error in our data? Let us know.

Glossary/Content Safety Classification

Content Safety Classification

behavior

The task of automatically detecting and categorizing text that violates policies or could cause harm, such as hate speech, violence, or misinformation.

Content Safety Classification — Glossary — ThinkLLM