Note: Overall leaderboard rankings may not reflect true model quality — individual benchmarks give a clearer picture. ARC-Challenge MMLU GPQA GSM8K Artificial Analysis Intelligence Index v4.0

← Back to leaderboard

PathMCQA

4 models

Top 10 Models Performance

google/medgemma-27b-it	########################################	71.6
google/medgemma-1.5-4b-it	#######################################	70
google/medgemma-4b-it	#######################################	69.8
google/gemma-3-4b-it	#####################	37.1

Rank	Model	Score
🥇	google/medgemma-27b-it	71.6
🥈	google/medgemma-1.5-4b-it	70
🥉	google/medgemma-4b-it	69.8
4	google/gemma-3-4b-it	37.1

JavaScript enhances filtering and charts. All data is rendered server-side.

View the sitemap for available pages.