Note: Overall leaderboard rankings may not reflect true model quality — individual benchmarks give a clearer picture. ARC-Challenge MMLU GPQA GSM8K Artificial Analysis Intelligence Index v4.0
← Back to leaderboard

MUSR

6 models

Top 5 Models Performance

qwen/qwen3-4b ######################################## 60.5
tencent/youtu-llm-2b ###################################### 57.4
qwen/qwen3-1.7b ##################################### 56.6
huggingfacetb/smollm3-3b #################################### 54.1
deepseek-ai/deepseek-r1-distill-qwen-1.5b ############################# 43.8
69K – 862.0B
2019 – 2026
Rank Model Score
🥇 qwen/qwen3-4b 60.5
🥈 tencent/youtu-llm-2b 57.4
🥉 qwen/qwen3-1.7b 56.6
4 huggingfacetb/smollm3-3b 54.1
5 deepseek-ai/deepseek-r1-distill-qwen-1.5b 43.8
6 tiiuae/falcon3-mamba-7b-base 4.5