GPT-5.5 Instant llega a ChatGPT: más inteligente, menos alucinaciones y mejor personalización

OpenAI ha lanzado GPT-5.5 Instant, la actualización del modelo por defecto de ChatGPT que reemplaza a GPT-5.3 Instant. El despliegue comenzó el 5 de mayo de 2026 y alcanza a todos los usuarios, tanto gratuitos como de pago. Qué cambia con GPT-5.5 Instant Tres mejoras principales respecto a su predecesor GPT-5.3 Instant: Respuestas más inteligentes […]

GPT-5.5 Instant llega a ChatGPT: más inteligente, menos alucinaciones y mejor personalización Leer más »

OpenAI Symphony

Source Blog post: https://openai.com/index/open-source-codex-orchestration-symphony/ GitHub: https://github.com/openai/symphony Type orchestration-spec What it is Especificación open-source para orquestar agentes de código Codex a nivel de proyecto. Symphony convierte el trabajo en ejecuciones autónomas aisladas, permitiendo a equipos gestionar trabajo en lugar de supervisar agentes. Licencia Apache 2.0, implementado principalmente en Elixir, con implementaciones alternativas en Go, Python y

OpenAI Symphony Leer más »

Coding Assistants: GPT-5.5 vs Opus 4.7, DeepSeek V4 y por qué los benchmarks no son fiables

Desde que SemiAnalysis publicó su análisis sobre el Claude Code inflection point el 5 de febrero, hemos visto una cascada de lanzamientos de modelos: Opus, Mythos, Codex, Gemini, DeepSeek, Kimi, Qwen, GLM, MiniMax, Composer, Muse Spark y más. Hoy desgranamos todos estos lanzamientos, explicamos cuándo puedes confiar en los benchmarks y damos nuestras predicciones para

Coding Assistants: GPT-5.5 vs Opus 4.7, DeepSeek V4 y por qué los benchmarks no son fiables Leer más »

«Scheming»: ¿Pueden las IA Engañarnos Deliberadamente?

En el mundo de la inteligencia artificial actual, surge una inquietante pregunta: ¿Pueden las IA ocultar intenciones y actuar de forma engañosa para alcanzar sus metas? Esta discusión se conecta directamente con el tema abordado anteriormente en nuestro post sobre la auto-replicación en IA, ya que ambas capacidades reflejan el potencial de los sistemas de

«Scheming»: ¿Pueden las IA Engañarnos Deliberadamente? Leer más »

MLE-BENCH: El Nuevo Estándar para Evaluar Agentes de IA

MLE-BENCH de OpenAI: El Nuevo Estándar para Evaluar Agentes de IA en Machine Learning 1. Introducción La inteligencia artificial (IA) ha avanzado a pasos agigantados en los últimos años, y uno de los objetivos más ambiciosos es crear sistemas de IA capaces de realizar tareas complejas de manera autónoma. Uno de los avances más emocionantes

MLE-BENCH: El Nuevo Estándar para Evaluar Agentes de IA Leer más »

Scroll al inicio