Note: Overall leaderboard rankings may not reflect true model quality — individual benchmarks give a clearer picture. ARC-Challenge MMLU GPQA GSM8K Artificial Analysis Intelligence Index v4.0
← Back to leaderboard

PathMCQA

4 models

Top 10 Models Performance

google/medgemma-27b-it ######################################## 71.6
google/medgemma-1.5-4b-it ####################################### 70
google/medgemma-4b-it ####################################### 69.8
google/gemma-3-4b-it ##################### 37.1
68.8K – 862.0B
Rank Model Score
🥇 google/medgemma-27b-it 71.6
🥈 google/medgemma-1.5-4b-it 70
🥉 google/medgemma-4b-it 69.8
4 google/gemma-3-4b-it 37.1