MUSR

6 models

qwen/qwen3-4b	########################################	60.5
tencent/youtu-llm-2b	######################################	57.4
qwen/qwen3-1.7b	#####################################	56.6
huggingfacetb/smollm3-3b	####################################	54.1
deepseek-ai/deepseek-r1-distill-qwen-1.5b	#############################	43.8

Rank	Model	Score
🥇	qwen/qwen3-4b	60.5
🥈	tencent/youtu-llm-2b	57.4
🥉	qwen/qwen3-1.7b	56.6
4	huggingfacetb/smollm3-3b	54.1
5	deepseek-ai/deepseek-r1-distill-qwen-1.5b	43.8
6	tiiuae/falcon3-mamba-7b-base	4.5