MT-Bench — Benchmark — ThinkLLM