Los mejores modelos de IA según el «Artificial Analysis Intelligence Index» (Abril 2026)

Artificial Analysis publica cada semana su Intelligence Index, un ranking que mide la inteligencia de los principales modelos de lenguaje usando benchmarks estandarizados. En esta actualización de 25 de Abril de 2026, presentamos los 31 modelos con score igual o superior a 45, sobre un total de 203 modelos evaluados.

Top 31 — Artificial Analysis Intelligence Index (>=45)

# Modelo Provider Score
1 GPT-5.5 (xhigh) OpenAI 60
2 GPT-5.5 (high) OpenAI 59
3 Claude Opus 4.7 (max) Anthropic 57
4 Gemini 3.1 Pro Preview Google 57
5 GPT-5.4 (xhigh) OpenAI 57
6 GPT-5.5 (medium) OpenAI 57
7 Kimi K2.6 Moonshot AI 54
8 MiMo-V2.5-Pro Xiaomi 54
9 GPT-5.3 Codex (xhigh) OpenAI 54
10 Muse Spark Meta 52
11 Claude Opus 4.7 (Non-reasoning, high) Anthropic 52
12 Qwen3.6 Max Preview Qwen/Alibaba 52
13 Claude Sonnet 4.6 (max) Anthropic 52
14 DeepSeek V4 Pro (Max) DeepSeek 52
15 GLM-5.1 Zhipu AI 51
16 GPT-5.5 (low) OpenAI 51
17 Qwen3.6 Plus Qwen/Alibaba 50
18 DeepSeek V4 Pro (High) DeepSeek 50
19 GLM-5 Zhipu AI 50
20 MiniMax-M2.7 MiniMax 50
21 Grok 4.20 0309 v2 xAI 49
22 MiMo-V2-Pro Xiaomi 49
23 GPT-5.4 mini (xhigh) OpenAI 49
24 GLM-5-Turbo Zhipu AI 47
25 DeepSeek V4 Flash (Max) DeepSeek 47
26 Gemini 3 Flash Google 46
27 Qwen3.6 27B Qwen/Alibaba 46
28 Qwen3.5 397B A17B Qwen/Alibaba 45
29 MiMo-V2-Omni-0327 Xiaomi 45
30 DeepSeek V4 Flash (High) DeepSeek 45

31 modelos con score igual o superior a 45. Total de modelos evaluados: 203.

Analisis por proveedor

OpenAI: 7 modelos en el top 30, lider absoluto

OpenAI domina el ranking con 7 modelos entre los 31 mejores. GPT-5.5 (xhigh) alcanza el primer puesto con 60 puntos, la puntuación mas alta registrada. La familia GPT-5.5 completa (xhigh, high, medium, low) ocupa 4 posiciones, demostrando la estrategia de OpenAI de ofrecer el mismo modelo en distintos niveles de «thinking effort».

GPT-5.4 (xhigh) (57 pts) y GPT-5.3 Codex (xhigh) (54 pts) demuestran que OpenAI mantiene ventaja en capacidad pura. GPT-5.4 mini (xhigh) (49 pts) confirma la apuesta por modelos pequeños de alto rendimiento.

Anthropic: 3 modelos, precision sobre potencia

Anthropic situúa a Claude Opus 4.7 (max) (57 pts) en el top 3, empatado con Gemini 3.1 Pro y GPT-5.4. Su variant Non-reasoning, high (52 pts) y Claude Sonnet 4.6 (max) (52 pts) completan la presencia de Anthropic. La principal ventaja de Claude sigue siendo su menor tasa de alucinación, significativamente inferior a la de GPT-5.5.

Google: 2 modelos, mejor velocidad/precio del ranking

Gemini 3.1 Pro Preview (57 pts) iguala a Claude Opus 4.7 y GPT-5.4, con la mejor relacion inteligencia/precio del top 4 ($4.50/M) y una velocidad de 127 tokens/s que lo sitúa entre los mas rápidos. Gemini 3 Flash (46 pts) ofrece una opción ligera y accesible.

DeepSeek: 4 modelos, referente open-source

DeepSeek confirma su posicion con 4 modelos: V4 Pro (Max: 52 pts, High: 50 pts) y V4 Flash (Max: 47 pts, High: 45 pts). Sigue siendo el referente open-source mas inteligente, aunque con la velocidad mas baja del top 30 (36 tokens/s para V4 Pro Max).

Qwen/Alibaba: 4 modelos, la sorpresa china

Qwen entra con fuerza en el ranking con 4 modelos: Qwen3.6 Max Preview (52 pts), Qwen3.6 Plus (50 pts), Qwen3.6 27B (46 pts) y Qwen3.5 397B A17B (45 pts). El ecosistema Qwen se posiciona como alternativa solida a los grandes proveedores occidentales.

Xiaomi: 3 modelos, entrada sorpresiva

Xiaomi es la sorpresa del ranking con 3 modelos: MiMo-V2.5-Pro (54 pts), MiMo-V2-Pro (49 pts) y MiMo-V2-Omni-0327 (45 pts). El MiMo-V2.5-Pro se cuela en el top 10 con 54 puntos, demostrando que el fabricante chino esta invirtiendo fuertemente en IA.

Zhipu AI: 3 modelos, el otro actor chino

GLM-5.1 (51 pts), GLM-5 (50 pts) y GLM-5-Turbo (47 pts) situan a Zhipu AI como otro actor chino relevante. Sus modelos compiten directamente con Qwen en el segmento de modelos de tamaño medio.

Moonshot AI: Kimi K2.6 sigue en el top

Kimi K2.6 (54 pts) se mantiene en el top 10 con un precio competitivo ($1.70/M) y 112 tokens/s. Es la mejor opción en su rango de precio entre los modelos de razonamiento.

Meta: Muse Spark, gratis y en el top

Muse Spark (52 pts) de Meta sigue siendo el único modelo gratuito del ranking con 52 puntos de inteligencia. Multimodal y con razonamiento activo, es imbatible si el presupuesto es cero.

xAI: Grok 4.20 cierra el top 30

Grok 4.20 0309 v2 (49 pts) cierra el top 30 con una velocidad notable de 122 tok/s y un precio medio de $3/M. xAI se consolida como alternativa solida fuera del trio OpenAI-Anthropic-Google.

MiniMax: MiniMax-M2.7 entra en el ranking

MiniMax-M2.7 (50 pts) aparece en el rank 20. Soporta 1M de contexto y ofrece una relación calidad/precio muy competitiva.

Conclusiones

  • OpenAI lidera en inteligencia con 7 modelos en el top 30, pero a precios premium (hasta $11.30/M).
  • La mejor relación inteligencia/precio del ranking es Gemini 3.1 Pro ($4.50, 57 pts) o Kimi K2.6 ($1.70, 54 pts).
  • El mejor modelo gratuito sigue siendo Muse Spark de Meta con 52 puntos y soporte multimodal.
  • Qwen y Zhipu AI demuestran que el ecosistema chino de IA es mas diverso y competitivo que nunca, con 7 modelos combinados en el top 30.
  • Xiaomi emerge como nuevo actor relevante con 3 modelos, incluyendo MiMo-V2.5-Pro en el top 10.
  • DeepSeek mantiene su posición como referente open-source con 4 modelos.
  • El mercado se estratifica: OpenAI/Claude/Gemini en la cima (57-60 pts), un grupo denso de competidores chinos y occidentales en 45-57 pts.

Fuente: Artificial Analysis Intelligence Index

Scroll al inicio