Note: Overall leaderboard rankings may not reflect true model quality — individual benchmarks give a clearer picture. ARC-Challenge MMLU GPQA GSM8K Artificial Analysis Intelligence Index v4.0

← Back to leaderboard

google/gemini-3.5-flash

2 benchmarks

Artificial Analysis Agentic Index (Maximum Reasoning) 70.3 Artificial Analysis Intelligence Index v4.0 (Maximum Reasoning) 55.3

JavaScript enhances filtering and charts. All data is rendered server-side.

View the sitemap for available pages.