Models Capabilities Use Cases Benchmarks Papers Glossary

Models Capabilities Use Cases Benchmarks Papers Glossary

About Privacy Terms RSS

ThinkLLM

Spot an error in our data? Let us know.

Glossary/Vision-Language

Vision-Language

architecture

A model designed to understand and reason about both visual content (images) and natural language text together.

Learn more on Wikipedia

Related Capabilities

Quality of vision, audio, and image understanding (distinct from modality support)

Vision-Language — Glossary — ThinkLLM