Gadgetsven: Gemma 4: así son los nuevos modelos de IA open source de Google

Modelos de IA Gemma 4 open source

La nueva familia Gemma 4 se ha convertido en uno de los movimientos más comentados en el panorama de la inteligencia artificial abierta. Google DeepMind ha decidido redoblar su apuesta por los modelos de peso abierto con una generación que combina rendimiento competitivo, ejecución local y una licencia mucho más permisiva que en versiones anteriores.

Este lanzamiento sitúa a Gemma 4 en el centro del debate sobre modelos de IA open source, un terreno donde hasta ahora destacaban sobre todo propuestas de Meta, Mistral y laboratorios chinos como DeepSeek. Con cuatro variantes pensadas para ir desde un móvil Android o una Raspberry Pi hasta una GPU de gama alta en la nube, Google busca que desarrolladores, empresas europeas y administraciones públicas puedan desplegar IA avanzada en su propia infraestructura sin tantos condicionantes legales ni técnicos.

Qué es Gemma 4 y qué lugar ocupa en el ecosistema de IA abierta

Gemma 4 es una familia de cuatro modelos de lenguaje de peso abierto construidos sobre la misma base de investigación que Gemini 3. A diferencia de generaciones anteriores de Gemma, esta serie llega desde el primer día bajo licencia Apache 2.0, un punto clave porque permite uso comercial, modificación y redistribución sin las restricciones adicionales que frenaban su adopción en entornos corporativos.

Con este movimiento, Google DeepMind intenta recuperar terreno en un segmento donde modelos como Llama de Meta o las familias chinas Qwen, DeepSeek o GLM habían ganado mucha visibilidad, como muestra una comparativa Gemma 3 y DeepSeek. Los modelos de Gemma ya sumaban más de 400 millones de descargas y más de 100.000 variantes comunitarias antes de Gemma 4; ahora, con una licencia estándar y clara, el objetivo es que esa tracción se traduzca en más proyectos en producción real, también en el mercado europeo.

La propia DeepMind presenta Gemma 4 como una colección de modelos open-weight de última generación, orientados tanto a la experimentación como al despliegue industrial. La idea es que cualquier equipo técnico, desde una startup de Barcelona hasta un grupo de investigación en Berlín, pueda descargar los pesos, ajustarlos a su dominio y ejecutarlos localmente o en la nube europea de su elección.

Gemma 4 modelos de IA para ejecutarse en local

Las cuatro variantes de Gemma 4: del móvil a la GPU H100

La familia se compone de cuatro modelos con tamaños y arquitecturas diferenciadas, diseñados para cubrir prácticamente todo el espectro de hardware disponible, desde el edge hasta grandes servidores.

En la gama ligera están Gemma 4 E2B y Gemma 4 E4B, pensados para ejecución en dispositivos móviles, Raspberry Pi, Jetson Nano y otros equipos edge con recursos limitados. Estos modelos priorizan la baja latencia y el consumo contenido, sin necesidad de conexión constante a la nube, algo especialmente interesante para aplicaciones industriales, sanitarias o educativas en Europa que requieran mantener los datos en local por motivos de privacidad o cumplimiento normativo.

En el extremo superior se sitúan Gemma 4 26B MoE y Gemma 4 31B Dense. El primero utiliza una arquitectura Mixture-of-Experts (MoE) con hasta 128 «expertos», lo que permite ofrecer un rendimiento cercano al de modelos de mucho mayor tamaño, pero con costes de inferencia comparables a modelos medianos. El segundo, la versión 31B Dense, está optimizada para calidad y se ha colocado ya en el top 3 del ranking de Arena AI para modelos abiertos de texto, compitiendo con propuestas considerablemente más grandes.

Google afirma que las variantes de 26B y 31B ofrecen capacidades de nivel casi frontera con una sobrecarga de hardware reducida. En la práctica, los pesos a precisión completa de los modelos grandes caben en una GPU Nvidia H100 de 80 GB, y las versiones cuantizadas pueden ejecutarse en hardware de consumo, lo que abre la puerta a su uso en estaciones de trabajo avanzadas en empresas europeas sin necesidad de grandes clústeres.

Arquitectura Gemma 4 y variantes de modelos

Capacidades técnicas: multimodalidad, razonamiento y contexto extendido

Más allá del tamaño, Gemma 4 destaca por una combinación de capacidades avanzadas en razonamiento, código y multimodalidad. Los modelos introducen mejoras claras en razonamiento multietapa, lo que se traduce en respuestas más robustas en tareas de matemáticas, lógica y planificación, ámbitos clave para aplicaciones empresariales y científicas.

En el terreno del desarrollo de software, Gemma 4 está afinado para generación de código offline y tareas de programación complejas. Las pruebas iniciales apuntan a una alta fiabilidad zero-shot: el modelo es capaz de producir fragmentos de código que compilan y funcionan a la primera, incluso si la solución no es especialmente sofisticada desde el punto de vista creativo. Para muchos equipos de ingeniería en Europa, esa fiabilidad puede ser más valiosa que respuestas llamativas pero frágiles.

Otro pilar de Gemma 4 es la multimodalidad nativa. Toda la familia puede procesar texto, imágenes y vídeo de forma integrada, y las variantes ligeras también incluyen entrada de audio con soporte para comandos hablados y transcripción local. Esto facilita construir asistentes que entiendan capturas de pantalla, documentos escaneados o clips de vídeo, algo útil tanto en contextos domésticos como en entornos profesionales.

En cuanto al contexto, Gemma 4 soporta ventanas de hasta 256.000 tokens en los modelos grandes y alrededor de 128.000 tokens en los modelos edge. Esta capacidad para manejar grandes cantidades de información permite trabajar con documentación extensa, bases de conocimiento internas o historiales completos de conversación sin perder contexto, un aspecto muy valorado por empresas europeas que quieren integrar IA en sus sistemas de gestión documental o CRM.

Gemma 4 capacidades multimodales y de código

Ejecución local y optimización para edge: IA sin depender siempre de la nube

Uno de los rasgos más relevantes de Gemma 4 es su enfoque decidido en la IA ejecutable en local. Los modelos E2B y E4B están optimizados para teléfonos Android, dispositivos edge e incluso placas de bajo coste como Raspberry Pi o pequeños SoC orientados a IoT. El objetivo es reducir la dependencia continua de la nube y bajar la latencia a niveles casi imperceptibles para el usuario final.

Esta filosofía encaja bastante bien con las necesidades de muchas organizaciones en España y el resto de Europa, donde el cumplimiento del RGPD y otras normativas obliga a tratar los datos con especial cuidado. Poder desplegar modelos de lenguaje y visión por ordenador que procesan información directamente en el dispositivo o en un servidor on-premise simplifica las auditorías de cumplimiento y evita transferencias de datos innecesarias a terceros países.

Para maximizar la eficiencia en entornos edge, los modelos ligeros incorporan técnicas como Per-Layer Embeddings (PLE), que buscan extraer más rendimiento de cada parámetro y mantener un equilibrio razonable entre consumo, velocidad y calidad de respuesta. Esto resulta especialmente interesante para proyectos piloto en industria 4.0, smart cities o sanidad conectada, donde el hardware disponible en campo no siempre es especialmente potente.

Al mismo tiempo, los modelos de 26B y 31B se han ajustado para rendir bien en GPU modernas de Nvidia y AMD, así como en la infraestructura de Google Cloud TPU. En la práctica, esto permite a empresas europeas evaluar distintas estrategias: desde ejecución local en un CPD propio hasta despliegues híbridos en nubes públicas con centros de datos en la UE.

Gemma 4 desplegado en dispositivos móviles y edge

Licencia Apache 2.0: por qué es tan importante para empresas y startups

Si algo ha cambiado la percepción de Gemma 4 en el ecosistema de desarrolladores es su licencia Apache 2.0. Hasta ahora, Google distribuía Gemma con una licencia propia más restrictiva, que generaba dudas en los departamentos legales de grandes compañías europeas y frenaba la adopción en proyectos con vocación comercial clara.

Con Apache 2.0, las reglas del juego son mucho más sencillas: los modelos se pueden usar, modificar, redistribuir y empaquetar en productos comerciales sin necesidad de negociar acuerdos específicos con Google. Además, las empresas pueden mantener la propiedad intelectual sobre sus ajustes y derivados, siempre que respeten las condiciones estándar de la licencia, algo a lo que los equipos legales ya están acostumbrados porque es habitual en proyectos open source consolidados.

Otro punto relevante para compañías con presencia en varios países europeos es que Apache 2.0 proporciona una base jurídica bien conocida y relativamente homogénea. Eso reduce la incertidumbre a la hora de escalar productos a otros mercados de la UE o del Espacio Económico Europeo, donde las normativas de protección de datos y las exigencias de transparencia pueden variar, pero donde las referencias en materia de licencias de software abierto son muy similares.

Para las startups tecnológicas, esta licencia supone poder construir SaaS, herramientas internas o soluciones verticales basadas en Gemma 4 sin que cada ronda de financiación tenga que ir acompañada de una revisión jurídica exhaustiva del modelo base. En un contexto donde la velocidad de ejecución es clave, contar con una licencia estandarizada facilita mucho el camino.

Gemma 4 modelos de IA open source con licencia Apache

Integración, ecosistema y herramientas compatibles

Uno de los objetivos declarados de Google con Gemma 4 es que los modelos se integren bien con el ecosistema open source existente. Por eso, desde el primer día están disponibles en Hugging Face, una de las plataformas clave para la comunidad de IA, y cuentan con soporte en herramientas populares como Ollama, LM Studio o Docker. Esto facilita que tanto desarrolladores individuales como equipos de datos en empresas puedan probar los modelos sin un proceso de despliegue complejo.

Además, Gemma 4 incorpora de serie funciones pensadas para agentes autónomos y flujos avanzados, como el function calling nativo, la generación de salidas en JSON estructurado y el soporte para instrucciones de sistema. Estas características simplifican la construcción de asistentes que llamen a APIs, conecten con bases de datos o interactúen con otras herramientas corporativas sin necesidad de capas adicionales de ingeniería.

En el plano de despliegue en la nube, los modelos se integran con Google AI Studio, Vertex AI y Google AI Edge Gallery, pero también pueden ejecutarse en otras infraestructuras gracias a su distribución como pesos abiertos. Esto permite a organizaciones europeas optar por nubes con centros de datos en la UE o, si lo prefieren, mantener todo el procesamiento en instalaciones propias para reforzar el control sobre los datos.

El soporte para más de 140 idiomas convierte a Gemma 4 en una opción razonable para aplicaciones multilingües, algo particularmente relevante en Europa, donde conviven mercados nacionales con fuertes particularidades lingüísticas. Desde asistentes en castellano y catalán hasta interfaces en francés, alemán o italiano, la familia Gemma está pensada para adaptarse sin necesidad de recurrir a modelos distintos para cada idioma.

En conjunto, la combinación de pesos abiertos, herramientas compatibles y licencia permisiva coloca a Gemma 4 como una de las opciones más completas para quienes necesitan modelos de IA que puedan ajustarse, auditarse y desplegarse con cierto control, sin renunciar a un rendimiento competitivo frente a otras alternativas abiertas del mercado.

Todo este movimiento por parte de Google DeepMind refuerza la sensación de que la IA abierta de alto nivel ha dejado de ser un experimento de laboratorio para convertirse en una pieza estratégica de producto y de infraestructura. Gemma 4 llega en un momento en el que empresas y administraciones públicas europeas buscan equilibrar innovación, soberanía tecnológica y cumplimiento normativo, y encaja bien en ese escenario al ofrecer modelos potentes, ejecutables en local y con una licencia estándar. Para desarrolladores y organizaciones que quieran explorar o consolidar soluciones basadas en modelos de lenguaje abiertos, Gemma 4 se suma así a la lista corta de alternativas a tener seriamente en cuenta.

from Actualidad Gadget https://ift.tt/ft3SbxK
via IFTTT