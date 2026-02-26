Compartir Facebook

Google ha anunciado el lanzamiento de Nano Banana 2, también identificado como Gemini 3.1 Flash Image, una nueva evolución dentro de su familia de herramientas de generación visual con inteligencia artificial. La compañía asegura que este modelo está pensado para ofrecer una experiencia mucho más ágil en la creación y edición de imágenes, combinando una respuesta especialmente rápida con un alto nivel de precisión en la interpretación de las instrucciones del usuario.

Con este movimiento, el gigante tecnológico amplía su catálogo de soluciones de IA visual tras la llegada, en noviembre del año pasado, de Nano Banana Pro, una versión orientada a priorizar la exactitud y la fidelidad en los resultados. Ahora, con Nano Banana 2, Google apuesta por una propuesta que busca equilibrar mejor dos factores que hasta ahora solían entrar en conflicto en este tipo de sistemas: la velocidad de generación y la calidad final de la imagen.

Según ha explicado la compañía en una publicación oficial de su blog, este nuevo modelo ha sido desarrollado para reducir de forma notable la distancia entre la rapidez de respuesta y la fidelidad visual. En términos prácticos, esto significa que los usuarios pueden obtener imágenes más deprisa, pero sin que ello suponga una pérdida significativa en aspectos clave como el detalle, la coherencia visual o la calidad estética del resultado.

Google sostiene que Nano Banana 2 incorpora mejoras visibles en la representación de la luz, la textura y la nitidez, lo que se traduce en composiciones más vivas y acabadas. Entre las novedades destacadas, la empresa menciona una iluminación más intensa y creíble, una mayor riqueza en las superficies y materiales, y una mejor definición general de los elementos presentes en la imagen. Además, el modelo estaría preparado para generar resultados con una apariencia realista y resoluciones que pueden llegar hasta 4K, en función del uso y del entorno en el que se emplee.

Uno de los pilares de esta nueva versión, de acuerdo con Google, es su capacidad para aplicar el potencial de razonamiento de Gemini al terreno visual. La firma asegura que Nano Banana 2 aprovecha la base de conocimiento del mundo real asociada a Gemini y, al mismo tiempo, puede apoyarse en información actual obtenida a través de la Búsqueda web, con el objetivo de representar escenas, objetos o conceptos con una mayor exactitud contextual. Esta combinación permitiría que el modelo produzca imágenes más alineadas con la realidad y mejor ajustadas a la intención de quien introduce la solicitud.

Más allá de la creación de imágenes desde cero, Google también subraya el potencial de esta herramienta en tareas de edición fotográfica rápida. Es decir, no solo serviría para generar nuevas composiciones, sino también para modificar imágenes ya existentes con mayor inmediatez, facilitando ajustes o cambios visuales sin largos tiempos de espera. Este enfoque refuerza el posicionamiento de Nano Banana 2 como una solución diseñada para flujos de trabajo en los que la rapidez es especialmente importante.

Otro de los apartados en los que el nuevo modelo pretende destacar es en el tratamiento del texto dentro de las imágenes. La compañía indica que Nano Banana 2 mejora la capacidad de renderizar texto de forma precisa y legible, un aspecto que históricamente ha sido uno de los más complejos para los generadores visuales basados en IA. Gracias a ello, sería posible crear piezas como maquetas publicitarias, materiales promocionales, tarjetas de felicitación o diseños con textos integrados de forma más limpia y útil.

En esa misma línea, Google señala que el modelo también puede ayudar en la detección, localización y traducción de texto incluido en fotografías, ampliando así sus posibles aplicaciones en ámbitos creativos, publicitarios y de productividad. Esta funcionalidad apunta a un uso más versátil, en el que la IA no solo genera contenido visual, sino que también interactúa con elementos lingüísticos presentes dentro de la imagen.

La empresa también afirma haber avanzado en un aspecto crucial para la creación de escenas complejas: la consistencia del sujeto. En concreto, asegura que Nano Banana 2 es capaz de mantener el parecido de hasta cinco personajes y preservar la fidelidad de hasta 14 objetos dentro de un mismo flujo de trabajo. Esto permitiría construir secuencias, composiciones o narrativas visuales más elaboradas sin que los protagonistas cambien de aspecto de una imagen a otra, algo especialmente relevante para campañas creativas, storytelling visual o procesos de diseño iterativo.

A ello se suma, siempre según Google, una mejora en la comprensión y seguimiento de instrucciones. La compañía defiende que el sistema interpreta con más precisión los matices del ‘prompt’ o la petición realizada por el usuario, ajustándose de forma más estricta a lo que se le solicita. En la práctica, esto debería traducirse en imágenes más cercanas a la idea original, reduciendo el margen de desviación entre la intención del usuario y el resultado generado.

Nano Banana 2 también amplía sus posibilidades técnicas en lo relativo a formatos y resoluciones. Google indica que el modelo puede producir imágenes con diferentes relaciones de aspecto y tamaños, adaptándose a necesidades diversas. Entre las opciones mencionadas, el rango iría desde composiciones de 512 píxeles hasta archivos de calidad 4K, lo que abre la puerta a usos tanto rápidos y funcionales como más orientados a piezas visuales de mayor exigencia.

En paralelo al anuncio del nuevo modelo, Google ha insistido en que continúa reforzando sus medidas de transparencia para el contenido generado con IA. En este sentido, la compañía ha recordado que sigue impulsando su tecnología de marca de agua SynthID, junto con el uso de credenciales de contenido basadas en el estándar C2PA. Con ello, busca que los usuarios puedan identificar no solo si una imagen ha sido creada o modificada mediante inteligencia artificial, sino también obtener más contexto sobre la forma en que se ha realizado ese proceso. Además, la empresa ha adelantado que la verificación mediante C2PA llegará próximamente a la aplicación de Gemini.

En cuanto a su despliegue, Google asegura que Nano Banana 2 ya está disponible en varios de sus productos, incluida la aplicación de Gemini. Dentro de esta plataforma, el nuevo modelo pasará a reemplazar a Nano Banana Pro en los modos Rápido, Pensamiento y Pro, aunque la compañía matiza que los suscriptores de Google AI Pro y Ultra seguirán conservando acceso a la versión anterior para determinados usos especializados.

La integración de Nano Banana 2 no se limita a Gemini. Google también ha indicado que este sistema estará presente en otros servicios de su ecosistema, como la Búsqueda, a través del Modo IA y de Lens, tanto en la aplicación de Google como en navegadores móviles y de escritorio. Del mismo modo, estará disponible en AI Studio + API, en Google Cloud, en Flow y en Google Ads, lo que refuerza la intención de la compañía de extender esta tecnología a entornos de consumo, desarrollo y negocio.

Con este lanzamiento, Google refuerza su estrategia en el terreno de la inteligencia artificial aplicada a la creación visual, apostando por un modelo que, al menos según su presentación oficial, intenta responder a una demanda cada vez más clara: herramientas capaces de generar imágenes de alta calidad en menos tiempo y con un mayor grado de control para el usuario.

Esto es lo que dice Google para los desarrolladores https://blog.google/innovation-and-ai/technology/developers-tools/build-with-nano-banana-2/

Hoy presentamos Nano Banana 2 (Gemini 3.1 Flash Image), que incorpora generación de imágenes de alta fidelidad y edición más rápida y avanzada al nuevo modelo Flash. Permite implementar creación visual sofisticada a escala con una excelente relación calidad-precio.

Aquí tienes un vistazo a las nuevas funciones que puedes usar en Google AI Studio o la API de Gemini . Se requiere una clave API de pago para usar el modelo en Google AI Studio. Mejor conocimiento del mundo Nano Banana 2 aprovecha el amplio conocimiento del mundo del modelo Gemini para crear imágenes mejoradas mediante búsquedas web. Esto permite a los desarrolladores generar representaciones más detalladas inspiradas en referencias de la vida real. Para mostrar esta base visual en acción, creamos una aplicación de ejemplo llamada “ Window Seat ” que utiliza el conocimiento de Nano Banana 2 y la búsqueda de imágenes web para crear vistas de ventanas fotorrealistas inspiradas en ubicaciones del mundo y datos meteorológicos en vivo.

Representación y localización de texto avanzada La creación de generadores de interfaz de usuario dinámicos o herramientas creativas requiere texto nítido y preciso. Nano Banana 2 ofrece una mejora con respecto a los modelos de imagen Flash anteriores, con una representación de texto más fiable. Ya sea que estés creando aplicaciones que producen imágenes a escala o aplicaciones creativas, el texto ahora se puede renderizar con la misma precisión que la ilustración. Nano Banana 2 también admite la localización en la imagen, lo que te permite generar o traducir texto en varios idiomas directamente dentro de la imagen. Para demostrar estas capacidades, creamos una aplicación de demostración, » Global Ad Localizer «, que traduce un anuncio a diferentes idiomas para mercados internacionales. Esto no solo resalta la localización avanzada en imagen del modelo al renderizar el texto traducido, sino que también comprende y localiza simultáneamente las imágenes.

Mayor control creativo y consistencia Nano Banana 2 ofrece velocidad y fidelidad visual, con iluminación vibrante, texturas más ricas y detalles más nítidos. Ahora tienes mayor control sobre estas salidas de alta fidelidad con varias funciones creativas avanzadas: Relaciones de aspecto nativas: Genere o edite imágenes fácilmente para adaptarlas a las necesidades de su proyecto. Compatible con todas las relaciones de aspecto existentes, como 4:1, 1:4, 8:1 y 1:8. Consulte la lista completa de relaciones de aspecto compatibles .

Nueva resolución de 512 px : Optimizada para una mayor eficiencia. Este nuevo nivel de resolución, que se suma a nuestras ofertas de 1K, 2K y 4K, minimiza la latencia para iteraciones rápidas y flujos de trabajo intensivos.

Seguimiento de instrucciones mejorado: el modelo se adhiere de forma mucho más estricta a las instrucciones complejas y de múltiples capas del desarrollador, lo que ayuda a garantizar que la imagen que solicita su aplicación sea la que se genere.

Niveles de razonamiento configurables: Ahora tienes mayor control sobre el razonamiento del modelo. Ajusta los niveles de razonamiento (Mínimo (predeterminado) o Alto/Dinámico) para que el modelo razone con indicaciones complejas antes de renderizar, lo que mejora significativamente la calidad del resultado y la adherencia a las indicaciones. Nuestra demostración de » Pasaporte para Mascotas » toma una sola foto de tu mascota y la envía a una aventura global a lugares famosos. Mantiene la apariencia de tu mascota en diferentes destinos del mundo. Para un resultado verdaderamente personalizado, hemos incluido diferentes ajustes de controles creativos.