Note: Overall leaderboard rankings may not reflect true model quality — individual benchmarks give a clearer picture. ARC-Challenge MMLU GPQA GSM8K Artificial Analysis Intelligence Index v4.0

← Back to leaderboard

AGIEval

3 models

Top 10 Models Performance

google/gemma-3-27b-pt	########################################	66.2
google/gemma-3-12b-pt	###################################	57.4
google/gemma-3-4b-pt	#########################	42.1

Rank	Model	Score
🥇	google/gemma-3-27b-pt	66.2
🥈	google/gemma-3-12b-pt	57.4
🥉	google/gemma-3-4b-pt	42.1

JavaScript enhances filtering and charts. All data is rendered server-side.

View the sitemap for available pages.