MUSR
6 models
Top 5 Models Performance
| qwen/qwen3-4b | ######################################## | 60.5 |
| tencent/youtu-llm-2b | ###################################### | 57.4 |
| qwen/qwen3-1.7b | ##################################### | 56.6 |
| huggingfacetb/smollm3-3b | #################################### | 54.1 |
| deepseek-ai/deepseek-r1-distill-qwen-1.5b | ############################# | 43.8 |
| Rank | Model | Score |
|---|---|---|
| 🥇 | qwen/qwen3-4b | 60.5 |
| 🥈 | tencent/youtu-llm-2b | 57.4 |
| 🥉 | qwen/qwen3-1.7b | 56.6 |
| 4 | huggingfacetb/smollm3-3b | 54.1 |
| 5 | deepseek-ai/deepseek-r1-distill-qwen-1.5b | 43.8 |
| 6 | tiiuae/falcon3-mamba-7b-base | 4.5 |