Los mejores modelos de IA según el «Artificial Analysis Intelligence Index» (Abril 2026)

Artificial Analysis publica cada semana su Intelligence Index, un ranking que mide la inteligencia de los principales modelos de lenguaje usando benchmarks estandarizados. En esta actualización de 25 de Abril de 2026, presentamos los 31 modelos con score igual o superior a 45, sobre un total de 203 modelos evaluados.

Top 31 — Artificial Analysis Intelligence Index (>=45)

#	Modelo	Provider	Score
1	GPT-5.5 (xhigh)	OpenAI	60
2	GPT-5.5 (high)	OpenAI	59
3	Claude Opus 4.7 (max)	Anthropic	57
4	Gemini 3.1 Pro Preview	Google	57
5	GPT-5.4 (xhigh)	OpenAI	57
6	GPT-5.5 (medium)	OpenAI	57
7	Kimi K2.6	Moonshot AI	54
8	MiMo-V2.5-Pro	Xiaomi	54
9	GPT-5.3 Codex (xhigh)	OpenAI	54
10	Muse Spark	Meta	52
11	Claude Opus 4.7 (Non-reasoning, high)	Anthropic	52
12	Qwen3.6 Max Preview	Qwen/Alibaba	52
13	Claude Sonnet 4.6 (max)	Anthropic	52
14	DeepSeek V4 Pro (Max)	DeepSeek	52
15	GLM-5.1	Zhipu AI	51
16	GPT-5.5 (low)	OpenAI	51
17	Qwen3.6 Plus	Qwen/Alibaba	50
18	DeepSeek V4 Pro (High)	DeepSeek	50
19	GLM-5	Zhipu AI	50
20	MiniMax-M2.7	MiniMax	50
21	Grok 4.20 0309 v2	xAI	49
22	MiMo-V2-Pro	Xiaomi	49
23	GPT-5.4 mini (xhigh)	OpenAI	49
24	GLM-5-Turbo	Zhipu AI	47
25	DeepSeek V4 Flash (Max)	DeepSeek	47
26	Gemini 3 Flash	Google	46
27	Qwen3.6 27B	Qwen/Alibaba	46
28	Qwen3.5 397B A17B	Qwen/Alibaba	45
29	MiMo-V2-Omni-0327	Xiaomi	45
30	DeepSeek V4 Flash (High)	DeepSeek	45

31 modelos con score igual o superior a 45. Total de modelos evaluados: 203.

Analisis por proveedor

OpenAI: 7 modelos en el top 30, lider absoluto

OpenAI domina el ranking con 7 modelos entre los 31 mejores. GPT-5.5 (xhigh) alcanza el primer puesto con 60 puntos, la puntuación mas alta registrada. La familia GPT-5.5 completa (xhigh, high, medium, low) ocupa 4 posiciones, demostrando la estrategia de OpenAI de ofrecer el mismo modelo en distintos niveles de «thinking effort».

GPT-5.4 (xhigh) (57 pts) y GPT-5.3 Codex (xhigh) (54 pts) demuestran que OpenAI mantiene ventaja en capacidad pura. GPT-5.4 mini (xhigh) (49 pts) confirma la apuesta por modelos pequeños de alto rendimiento.

Anthropic: 3 modelos, precision sobre potencia

Anthropic situúa a Claude Opus 4.7 (max) (57 pts) en el top 3, empatado con Gemini 3.1 Pro y GPT-5.4. Su variant Non-reasoning, high (52 pts) y Claude Sonnet 4.6 (max) (52 pts) completan la presencia de Anthropic. La principal ventaja de Claude sigue siendo su menor tasa de alucinación, significativamente inferior a la de GPT-5.5.

Google: 2 modelos, mejor velocidad/precio del ranking

Gemini 3.1 Pro Preview (57 pts) iguala a Claude Opus 4.7 y GPT-5.4, con la mejor relacion inteligencia/precio del top 4 ($4.50/M) y una velocidad de 127 tokens/s que lo sitúa entre los mas rápidos. Gemini 3 Flash (46 pts) ofrece una opción ligera y accesible.

DeepSeek: 4 modelos, referente open-source

DeepSeek confirma su posicion con 4 modelos: V4 Pro (Max: 52 pts, High: 50 pts) y V4 Flash (Max: 47 pts, High: 45 pts). Sigue siendo el referente open-source mas inteligente, aunque con la velocidad mas baja del top 30 (36 tokens/s para V4 Pro Max).

Qwen/Alibaba: 4 modelos, la sorpresa china

Qwen entra con fuerza en el ranking con 4 modelos: Qwen3.6 Max Preview (52 pts), Qwen3.6 Plus (50 pts), Qwen3.6 27B (46 pts) y Qwen3.5 397B A17B (45 pts). El ecosistema Qwen se posiciona como alternativa solida a los grandes proveedores occidentales.

Xiaomi: 3 modelos, entrada sorpresiva

Xiaomi es la sorpresa del ranking con 3 modelos: MiMo-V2.5-Pro (54 pts), MiMo-V2-Pro (49 pts) y MiMo-V2-Omni-0327 (45 pts). El MiMo-V2.5-Pro se cuela en el top 10 con 54 puntos, demostrando que el fabricante chino esta invirtiendo fuertemente en IA.

Zhipu AI: 3 modelos, el otro actor chino

GLM-5.1 (51 pts), GLM-5 (50 pts) y GLM-5-Turbo (47 pts) situan a Zhipu AI como otro actor chino relevante. Sus modelos compiten directamente con Qwen en el segmento de modelos de tamaño medio.

Moonshot AI: Kimi K2.6 sigue en el top

Kimi K2.6 (54 pts) se mantiene en el top 10 con un precio competitivo ($1.70/M) y 112 tokens/s. Es la mejor opción en su rango de precio entre los modelos de razonamiento.

Meta: Muse Spark, gratis y en el top

Muse Spark (52 pts) de Meta sigue siendo el único modelo gratuito del ranking con 52 puntos de inteligencia. Multimodal y con razonamiento activo, es imbatible si el presupuesto es cero.

xAI: Grok 4.20 cierra el top 30

Grok 4.20 0309 v2 (49 pts) cierra el top 30 con una velocidad notable de 122 tok/s y un precio medio de $3/M. xAI se consolida como alternativa solida fuera del trio OpenAI-Anthropic-Google.

MiniMax: MiniMax-M2.7 entra en el ranking

MiniMax-M2.7 (50 pts) aparece en el rank 20. Soporta 1M de contexto y ofrece una relación calidad/precio muy competitiva.

Conclusiones

OpenAI lidera en inteligencia con 7 modelos en el top 30, pero a precios premium (hasta $11.30/M).
La mejor relación inteligencia/precio del ranking es Gemini 3.1 Pro ($4.50, 57 pts) o Kimi K2.6 ($1.70, 54 pts).
El mejor modelo gratuito sigue siendo Muse Spark de Meta con 52 puntos y soporte multimodal.
Qwen y Zhipu AI demuestran que el ecosistema chino de IA es mas diverso y competitivo que nunca, con 7 modelos combinados en el top 30.
Xiaomi emerge como nuevo actor relevante con 3 modelos, incluyendo MiMo-V2.5-Pro en el top 10.
DeepSeek mantiene su posición como referente open-source con 4 modelos.
El mercado se estratifica: OpenAI/Claude/Gemini en la cima (57-60 pts), un grupo denso de competidores chinos y occidentales en 45-57 pts.

Fuente: Artificial Analysis Intelligence Index