Aceleración 3× en Gemma 4: el truco de Google no es el modelo, es la predicción multi-token

Google ha liberado los MTP drafters para Gemma 4, una implementación que multiplica por 3 la velocidad de generación de texto sin perder calidad. No cambia el modelo base, solo cómo se genera: en vez de predecir un token cada vez, predice varios en paralelo. Y es open-source (Apache 2.0) desde el primer día. ¿Qué […]

Aceleración 3× en Gemma 4: el truco de Google no es el modelo, es la predicción multi-token Leer más »

OpenAI Symphony

Source Blog post: https://openai.com/index/open-source-codex-orchestration-symphony/ GitHub: https://github.com/openai/symphony Type orchestration-spec What it is Especificación open-source para orquestar agentes de código Codex a nivel de proyecto. Symphony convierte el trabajo en ejecuciones autónomas aisladas, permitiendo a equipos gestionar trabajo en lugar de supervisar agentes. Licencia Apache 2.0, implementado principalmente en Elixir, con implementaciones alternativas en Go, Python y

OpenAI Symphony Leer más »

Gemma 4 en tu navegador: extensión Chrome con IA on-device

Una extensión de Chrome permite usar Gemma 4 localmente, sin servidor externo. Procesa todo en WebGPU dentro del navegador. Gestiona pestañas, busca en historial con lenguaje natural y extrae contenido de páginas via RAG. ¿Qué es? Gemma4-Browser-Extension es una extensión de Chrome que ejecuta un agente de IA completamente en el dispositivo del usuario. Usa

Gemma 4 en tu navegador: extensión Chrome con IA on-device Leer más »

Qwen3.6-27B: el modelo denso de 27B que supera al MoE de 397B en codificación

Qwen3.6-27B es un modelo de lenguaje multimodal denso de 27.000 millones de parámetros, de código abierto, que logra un rendimiento de nivel flagship en codificación agentiva — superando al modelo MoE Qwen3.5-397B-A17B (397B totales / 17B activos) en todos los principales benchmarks de programación. ¿Qué es Qwen3.6-27B? Después del lanzamiento de Qwen3.6-Plus y Qwen3.6-35B-A3B, Alibaba

Qwen3.6-27B: el modelo denso de 27B que supera al MoE de 397B en codificación Leer más »

DeepSeek-V4: 1M tokens de contexto y eficiencia 10x para razonamiento escalable

DeepSeek ha lanzado oficialmente DeepSeek-V4, su nueva serie de modelos de lenguaje basados en Mixture-of-Experts (MoE), disponibles en dos variantes: DeepSeek-V4-Pro (1.6T parámetros totales, 49B activados) y DeepSeek-V4-Flash (284B totales, 13B activados). Ambos soportan un contexto de un millón de tokens, marcando un hito en eficiencia computacional. Arquitectura: CSA + HCA y Hyper-Connections DeepSeek-V4 introduce

DeepSeek-V4: 1M tokens de contexto y eficiencia 10x para razonamiento escalable Leer más »

Scroll al inicio