Artificial Analysis publica cada semana su Intelligence Index, un ranking que mide la inteligencia de los principales modelos de lenguaje usando benchmarks estandarizados. En esta actualización de 25 de Abril de 2026, presentamos los 31 modelos con score igual o superior a 45, sobre un total de 203 modelos evaluados.
Top 31 — Artificial Analysis Intelligence Index (>=45)
| # | Modelo | Provider | Score |
|---|---|---|---|
| 1 | GPT-5.5 (xhigh) | OpenAI | 60 |
| 2 | GPT-5.5 (high) | OpenAI | 59 |
| 3 | Claude Opus 4.7 (max) | Anthropic | 57 |
| 4 | Gemini 3.1 Pro Preview | 57 | |
| 5 | GPT-5.4 (xhigh) | OpenAI | 57 |
| 6 | GPT-5.5 (medium) | OpenAI | 57 |
| 7 | Kimi K2.6 | Moonshot AI | 54 |
| 8 | MiMo-V2.5-Pro | Xiaomi | 54 |
| 9 | GPT-5.3 Codex (xhigh) | OpenAI | 54 |
| 10 | Muse Spark | Meta | 52 |
| 11 | Claude Opus 4.7 (Non-reasoning, high) | Anthropic | 52 |
| 12 | Qwen3.6 Max Preview | Qwen/Alibaba | 52 |
| 13 | Claude Sonnet 4.6 (max) | Anthropic | 52 |
| 14 | DeepSeek V4 Pro (Max) | DeepSeek | 52 |
| 15 | GLM-5.1 | Zhipu AI | 51 |
| 16 | GPT-5.5 (low) | OpenAI | 51 |
| 17 | Qwen3.6 Plus | Qwen/Alibaba | 50 |
| 18 | DeepSeek V4 Pro (High) | DeepSeek | 50 |
| 19 | GLM-5 | Zhipu AI | 50 |
| 20 | MiniMax-M2.7 | MiniMax | 50 |
| 21 | Grok 4.20 0309 v2 | xAI | 49 |
| 22 | MiMo-V2-Pro | Xiaomi | 49 |
| 23 | GPT-5.4 mini (xhigh) | OpenAI | 49 |
| 24 | GLM-5-Turbo | Zhipu AI | 47 |
| 25 | DeepSeek V4 Flash (Max) | DeepSeek | 47 |
| 26 | Gemini 3 Flash | 46 | |
| 27 | Qwen3.6 27B | Qwen/Alibaba | 46 |
| 28 | Qwen3.5 397B A17B | Qwen/Alibaba | 45 |
| 29 | MiMo-V2-Omni-0327 | Xiaomi | 45 |
| 30 | DeepSeek V4 Flash (High) | DeepSeek | 45 |
31 modelos con score igual o superior a 45. Total de modelos evaluados: 203.
Analisis por proveedor
OpenAI: 7 modelos en el top 30, lider absoluto
OpenAI domina el ranking con 7 modelos entre los 31 mejores. GPT-5.5 (xhigh) alcanza el primer puesto con 60 puntos, la puntuación mas alta registrada. La familia GPT-5.5 completa (xhigh, high, medium, low) ocupa 4 posiciones, demostrando la estrategia de OpenAI de ofrecer el mismo modelo en distintos niveles de «thinking effort».
GPT-5.4 (xhigh) (57 pts) y GPT-5.3 Codex (xhigh) (54 pts) demuestran que OpenAI mantiene ventaja en capacidad pura. GPT-5.4 mini (xhigh) (49 pts) confirma la apuesta por modelos pequeños de alto rendimiento.
Anthropic: 3 modelos, precision sobre potencia
Anthropic situúa a Claude Opus 4.7 (max) (57 pts) en el top 3, empatado con Gemini 3.1 Pro y GPT-5.4. Su variant Non-reasoning, high (52 pts) y Claude Sonnet 4.6 (max) (52 pts) completan la presencia de Anthropic. La principal ventaja de Claude sigue siendo su menor tasa de alucinación, significativamente inferior a la de GPT-5.5.
Google: 2 modelos, mejor velocidad/precio del ranking
Gemini 3.1 Pro Preview (57 pts) iguala a Claude Opus 4.7 y GPT-5.4, con la mejor relacion inteligencia/precio del top 4 ($4.50/M) y una velocidad de 127 tokens/s que lo sitúa entre los mas rápidos. Gemini 3 Flash (46 pts) ofrece una opción ligera y accesible.
DeepSeek: 4 modelos, referente open-source
DeepSeek confirma su posicion con 4 modelos: V4 Pro (Max: 52 pts, High: 50 pts) y V4 Flash (Max: 47 pts, High: 45 pts). Sigue siendo el referente open-source mas inteligente, aunque con la velocidad mas baja del top 30 (36 tokens/s para V4 Pro Max).
Qwen/Alibaba: 4 modelos, la sorpresa china
Qwen entra con fuerza en el ranking con 4 modelos: Qwen3.6 Max Preview (52 pts), Qwen3.6 Plus (50 pts), Qwen3.6 27B (46 pts) y Qwen3.5 397B A17B (45 pts). El ecosistema Qwen se posiciona como alternativa solida a los grandes proveedores occidentales.
Xiaomi: 3 modelos, entrada sorpresiva
Xiaomi es la sorpresa del ranking con 3 modelos: MiMo-V2.5-Pro (54 pts), MiMo-V2-Pro (49 pts) y MiMo-V2-Omni-0327 (45 pts). El MiMo-V2.5-Pro se cuela en el top 10 con 54 puntos, demostrando que el fabricante chino esta invirtiendo fuertemente en IA.
Zhipu AI: 3 modelos, el otro actor chino
GLM-5.1 (51 pts), GLM-5 (50 pts) y GLM-5-Turbo (47 pts) situan a Zhipu AI como otro actor chino relevante. Sus modelos compiten directamente con Qwen en el segmento de modelos de tamaño medio.
Moonshot AI: Kimi K2.6 sigue en el top
Kimi K2.6 (54 pts) se mantiene en el top 10 con un precio competitivo ($1.70/M) y 112 tokens/s. Es la mejor opción en su rango de precio entre los modelos de razonamiento.
Meta: Muse Spark, gratis y en el top
Muse Spark (52 pts) de Meta sigue siendo el único modelo gratuito del ranking con 52 puntos de inteligencia. Multimodal y con razonamiento activo, es imbatible si el presupuesto es cero.
xAI: Grok 4.20 cierra el top 30
Grok 4.20 0309 v2 (49 pts) cierra el top 30 con una velocidad notable de 122 tok/s y un precio medio de $3/M. xAI se consolida como alternativa solida fuera del trio OpenAI-Anthropic-Google.
MiniMax: MiniMax-M2.7 entra en el ranking
MiniMax-M2.7 (50 pts) aparece en el rank 20. Soporta 1M de contexto y ofrece una relación calidad/precio muy competitiva.
Conclusiones
- OpenAI lidera en inteligencia con 7 modelos en el top 30, pero a precios premium (hasta $11.30/M).
- La mejor relación inteligencia/precio del ranking es Gemini 3.1 Pro ($4.50, 57 pts) o Kimi K2.6 ($1.70, 54 pts).
- El mejor modelo gratuito sigue siendo Muse Spark de Meta con 52 puntos y soporte multimodal.
- Qwen y Zhipu AI demuestran que el ecosistema chino de IA es mas diverso y competitivo que nunca, con 7 modelos combinados en el top 30.
- Xiaomi emerge como nuevo actor relevante con 3 modelos, incluyendo MiMo-V2.5-Pro en el top 10.
- DeepSeek mantiene su posición como referente open-source con 4 modelos.
- El mercado se estratifica: OpenAI/Claude/Gemini en la cima (57-60 pts), un grupo denso de competidores chinos y occidentales en 45-57 pts.
