Note: Overall leaderboard rankings may not reflect true model quality — individual benchmarks give a clearer picture. ARC-Challenge MMLU GPQA GSM8K Artificial Analysis Intelligence Index

← Back to leaderboard

inception/mercury-2

5 benchmarks

AIME 2025 91.1 GPQA 74 IFBench 71 SciCode 38 Artificial Analysis Intelligence Index (Maximum Reasoning) 32.8

JavaScript enhances filtering and charts. All data is rendered server-side.

View the sitemap for available pages.