All tracked LLMs

53 open-weight models with benchmarks and hardware requirements.

Kimi K2.6
Moonshot AI · 1000B params · 250k context · Kimi
MMLU-Pro —
DeepSeek V3 671B
DeepSeek · 671B params · 125k context · MIT
MMLU-Pro 75.9
DeepSeek R1 671B
DeepSeek · 671B params · 125k context · MIT
MMLU-Pro —
Llama 3.1 405B Instruct
Meta · 405B params · 125k context · Llama 3.1 Community
MMLU-Pro 73.3
Llama 4 Maverick 400B
Meta · 400B params · 977k context · Llama 4 Community
MMLU-Pro 79.0
Qwen3 235B-A22B (MoE)
Alibaba · 235B params · 128k context · Apache 2.0
MMLU-Pro —
Mixtral 8x22B Instruct v0.1
Mistral AI · 141B params · 64k context · Apache 2.0
MMLU-Pro 40.0
Qwen 3.5 122B-A10B (MoE)
Alibaba · 122B params · 256k context · Apache 2.0
MMLU-Pro —
Llama 4 Scout 109B
Meta · 109B params · 9766k context · Llama 4 Community
MMLU-Pro 70.0
Qwen 2.5 72B Instruct
Alibaba · 72B params · 125k context · Qwen
MMLU-Pro 58.1
Llama 3.3 70B Instruct
Meta · 70B params · 125k context · Llama 3.3 Community
MMLU-Pro 68.9
DeepSeek R1 Distill Llama 70B
DeepSeek · 70B params · 125k context · MIT
MMLU-Pro 70.0
Llama 3.1 70B Instruct
Meta · 70B params · 125k context · Llama 3.1 Community
MMLU-Pro 66.4
Mixtral 8x7B Instruct v0.1
Mistral AI · 46.7B params · 32k context · Apache 2.0
MMLU-Pro 29.7
Command-R 35B
Cohere · 35B params · 125k context · CC-BY-NC 4.0
MMLU-Pro 33.0
Qwen 3.5 35B-A3B (MoE)
Alibaba · 35B params · 256k context · Apache 2.0
MMLU-Pro —
Yi 1.5 34B Chat
01.AI · 34.4B params · 32k context · Apache 2.0
MMLU-Pro 37.0
Qwen3 32B
Alibaba · 32.8B params · 128k context · Apache 2.0
MMLU-Pro —
Qwen 2.5 32B Instruct
Alibaba · 32.5B params · 125k context · Apache 2.0
MMLU-Pro 55.1
Qwen 2.5 Coder 32B Instruct
Alibaba · 32.5B params · 125k context · Apache 2.0
MMLU-Pro 50.4
DeepSeek R1 Distill Qwen 32B
DeepSeek · 32.5B params · 125k context · MIT
MMLU-Pro 65.0
Gemma 4 31B
Google · 31B params · 250k context · Apache 2.0
MMLU-Pro —
Qwen3 30B-A3B (MoE)
Alibaba · 30B params · 128k context · Apache 2.0
MMLU-Pro —
Gemma 2 27B Instruct
Google · 27.2B params · 8k context · Gemma
MMLU-Pro 38.0
Gemma 3 27B Instruct
Google · 27B params · 128k context · Gemma
MMLU-Pro —
Qwen 3.6 27B
Alibaba · 27B params · 256k context · Apache 2.0
MMLU-Pro —
Gemma 4 26B (MoE)
Google · 26B params · 250k context · Apache 2.0
MMLU-Pro —
Mistral Small 3.1 24B Instruct
Mistral AI · 24B params · 128k context · Apache 2.0
MMLU-Pro —
Mistral Small 22B
Mistral AI · 22.2B params · 32k context · Mistral Research
MMLU-Pro 49.2
Qwen3 14B
Alibaba · 14.8B params · 128k context · Apache 2.0
MMLU-Pro —
Qwen 2.5 14B Instruct
Alibaba · 14.7B params · 125k context · Apache 2.0
MMLU-Pro 51.2
Phi-4 14B Instruct
Microsoft · 14B params · 16k context · MIT
MMLU-Pro 56.1
Mistral Nemo 12B Instruct
Mistral AI · 12.2B params · 125k context · Apache 2.0
MMLU-Pro 35.6
Gemma 3 12B Instruct
Google · 12.2B params · 128k context · Gemma
MMLU-Pro —
Gemma 2 9B Instruct
Google · 9.2B params · 8k context · Gemma
MMLU-Pro 32.0
Llama 3.1 8B Instruct
Meta · 8B params · 125k context · Llama 3.1 Community
MMLU-Pro 37.5
DeepSeek R1 Distill Llama 8B
DeepSeek · 8B params · 125k context · MIT
MMLU-Pro 41.0
Qwen3 8B
Alibaba · 8B params · 128k context · Apache 2.0
MMLU-Pro —
Qwen 2.5 7B Instruct
Alibaba · 7.6B params · 125k context · Apache 2.0
MMLU-Pro 36.5
Mistral 7B Instruct v0.3
Mistral AI · 7.25B params · 32k context · Apache 2.0
MMLU-Pro 30.0
Gemma 3 4B Instruct
Google · 4B params · 128k context · Gemma
MMLU-Pro —
Gemma 4 E4B
Google · 4B params · 125k context · Apache 2.0
MMLU-Pro —
Phi-3.5 Mini Instruct
Microsoft · 3.8B params · 125k context · MIT
MMLU-Pro 35.6
Llama 3.2 3B Instruct
Meta · 3.2B params · 125k context · Llama 3.2 Community
MMLU-Pro 24.0
Qwen 2.5 3B Instruct
Alibaba · 3.1B params · 32k context · Qwen Research
MMLU-Pro 32.4
Gemma 2 2B Instruct
Google · 2.6B params · 8k context · Gemma
MMLU-Pro 17.8
Gemma 4 E2B
Google · 2B params · 125k context · Apache 2.0
MMLU-Pro —
SmolLM2 1.7B Instruct
Hugging Face · 1.7B params · 8k context · Apache 2.0
MMLU-Pro 19.0
Qwen 2.5 1.5B Instruct
Alibaba · 1.5B params · 32k context · Apache 2.0
MMLU-Pro 16.8
Llama 3.2 1B Instruct
Meta · 1.24B params · 125k context · Llama 3.2 Community
MMLU-Pro 12.5
Gemma 3 1B Instruct
Google · 1B params · 32k context · Gemma
MMLU-Pro —
Qwen 2.5 0.5B Instruct
Alibaba · 0.5B params · 32k context · Apache 2.0
MMLU-Pro 10.0
SmolLM2 360M Instruct
Hugging Face · 0.36B params · 8k context · Apache 2.0
MMLU-Pro 8.0