Aceleración 3× en Gemma 4: el truco de Google no es el modelo, es la predicción multi-token
Google ha liberado los MTP drafters para Gemma 4, una implementación que multiplica por 3 la velocidad de generación de texto sin perder calidad. No cambia el modelo base, solo cómo se genera: en vez de predecir un token cada vez, predice varios en paralelo. Y es open-source (Apache 2.0) desde el primer día. ¿Qué […]
