Models Capabilities Use Cases Benchmarks Papers Glossary

Models Capabilities Use Cases Benchmarks Papers Glossary

About Privacy Terms RSS

ThinkLLM

Spot an error in our data? Let us know.

Glossary/Vision-Language-Action Model

Vision-Language-Action Model

architecture

A model that combines visual perception, language understanding, and robotic action generation to interpret instructions and control robot movements.

Learn more on Wikipedia

Related Capabilities

Instruction Following

Adhering to complex, structured, or constrained instructions

Function calling, structured output, agent-style tool orchestration

Vision-Language-Action Model — Glossary — ThinkLLM