- Combina las funciones avanzadas de Nano Banana Pro con la velocidad de Gemini Flash, lo que permite generación de imágenes de alta velocidad y ciclos de edición iterativos
- Ofrece a gran velocidad funciones de nivel profesional como renderizado basado en conocimiento del mundo, representación y traducción precisa de texto, mantenimiento de la consistencia del sujeto y compatibilidad con resolución 4K
- Se implementa en todo el ecosistema de aplicaciones de Google: app de Gemini, Búsqueda, AI Studio y Gemini API, Flow, Google Ads, entre otros
- Refuerza las funciones de identificación y verificación del origen del contenido generado por IA al combinar SynthID con las credenciales de contenido C2PA
- Con Nano Banana 2, Google sigue avanzando hacia un modelo que mejora al mismo tiempo la confiabilidad y utilidad de los medios generativos
Resumen de Nano Banana 2
- Nano Banana 2 (Gemini 3.1 Flash Image), presentado por Google DeepMind, es un modelo que combina las capacidades avanzadas del anterior Nano Banana Pro con la velocidad de Gemini Flash
- El modelo previo, Nano Banana, llamó la atención por redefinir la forma de generar y editar imágenes, mientras que Nano Banana Pro ofrecía funciones de control de nivel estudio
- Esta versión integra las fortalezas de ambos modelos para lograr al mismo tiempo generación de imágenes de alta calidad y procesamiento rápido
- Nano Banana 2 se caracteriza por su conocimiento avanzado del mundo, renderizado preciso de texto, consistencia del sujeto y compatibilidad con especificaciones de producción, entre otros aspectos
Inteligencia y calidad visual a velocidad Flash
- Nano Banana 2 aplica la inteligencia de alta velocidad de Gemini Flash a la generación visual para permitir edición rápida y trabajo iterativo
- Conocimiento avanzado del mundo: usa información en tiempo real de Gemini y datos basados en imágenes web para representar con mayor precisión temas específicos
- Gracias a esto, puede generar infografías, diagramas y visualizaciones de datos
- Con su capacidad de renderizado y traducción precisa de texto, puede generar texto nítido para mockups de marketing o diseño de tarjetas, y también traducir y localizar texto dentro de las imágenes
Controles creativos mejorados
- Nano Banana 2 reduce la brecha entre velocidad y fidelidad visual para generar rápidamente imágenes realistas y de alta calidad
- Consistencia del sujeto: mantiene de forma coherente hasta 5 personajes y 14 objetos dentro del mismo flujo de trabajo
- Ejecución precisa de instrucciones: refleja fielmente los matices detallados de solicitudes complejas
- Especificaciones de producción: admite resoluciones de 512 px a 4K y varias proporciones, desde publicaciones para redes sociales hasta fondos panorámicos
- Mejora de la fidelidad visual: ofrece texturas, iluminación y detalles más ricos
Integración de producto y accesibilidad
- Nano Banana 2 se está implementando de forma gradual en todo Google
- App de Gemini: Nano Banana 2 viene integrado por defecto en los modelos Fast, Thinking y Pro, y los suscriptores Pro y Ultra también pueden seguir usando el modelo Pro
- Búsqueda (Search): disponible en móvil y escritorio a través del modo IA y Lens, con soporte adicional en 141 países y 8 idiomas
- AI Studio y Gemini API: disponible como versión preliminar, y también puede usarse en Vertex AI
- Flow: configurado como el modelo base de generación de imágenes gratuito para todos los usuarios
- Google Ads: aplicado a la función de sugerencias de imágenes al crear campañas publicitarias
Verificación de origen y refuerzo de la confianza
- Google combina SynthID con C2PA Content Credentials para aumentar la confiabilidad de los medios generativos
- Esta combinación ofrece no solo información sobre si se usó IA, sino también contexto sobre cómo se utilizó
- Desde su lanzamiento, la función de verificación de SynthID se ha usado más de 20 millones de veces para identificar imágenes, video y audio generados por IA
- Próximamente, la app de Gemini también añadirá funciones de verificación C2PA
Resumen
- Nano Banana 2 es el modelo más reciente de Google para generación de imágenes, con velocidad, precisión y calidad
- Integrado en todo el ecosistema de Gemini, ofrece utilidad inmediata para desarrolladores, diseñadores y especialistas en marketing
- Es un ejemplo de la evolución estratégica de Google, que busca al mismo tiempo garantizar la transparencia del contenido de IA y mejorar la productividad creativa
1 comentarios
Comentarios de Hacker News
Hago algunas predicciones sobre el impacto que tendrán las herramientas de generación de imágenes con IA en el arte
A medida que avance la tecnología, incluso el “gusto” podría resolverse técnicamente. Que hoy la IA “no sea cool” es solo una cuestión de etapa de desarrollo
Como en el caso de SpaceX, usar metas que aún no se han alcanzado para despreciar todo el conjunto es una crítica equivocada
En cambio, pienso que el "diseño emergente" (emergent design) será la próxima tendencia. Por ejemplo, Czinger muestra un enfoque que encuentra formas mediante optimización probabilística
Por ejemplo, aunque Sora hiciera un video de fútbol perfecto, los fans seguirían viendo partidos reales. Disfrutamos el arte por la conexión emocional que sentimos al saber que fue hecho por humanos
Por eso quiero preguntarle a quien dice “el arte con IA es cool”: “entonces, ¿para qué sirve el arte?”
He visto muchas obras impresionantes hechas por artistas reales con IA, y me entusiasma pensar qué intentos creativos surgirán con esta herramienta
Estoy construyendo una casa ahora mismo, y el modelo de imágenes de Nano Banana cambió por completo las reglas del juego en el proceso de diseño
Hicimos cientos de renders hasta encontrar un diseño que nos gustara, y lo incorporamos al plan del diseñador de interiores
En CAD es difícil expresar curvas o elementos decorativos, pero Nano Banana genera muy bien diseños orgánicos
Como resultado, la casa está quedando muchísimo mejor
Puedes ver un ejemplo relacionado en este blog
Salvo algunas ideas originales propuestas por el diseñador, en la mayoría de cosas Gemini fue mejor
Sigue sorprendiéndome que puedas cambiar colores, muebles y distribución en cuestión de segundos
Últimamente las imágenes de IA son tan realistas que mucha gente común las confunde con fotos reales
Por ejemplo, como las fotos de comida en Facebook o las imágenes de modelos falsas.
La capacidad expresiva mejoró, pero al mismo tiempo también se siente un lado inquietante
Hay casos obvios, pero la mayoría son imposibles de distinguir
Ahora cualquiera puede crear imágenes falsas, así que la gente aprenderá naturalmente a verificar la fuente y juzgar la confiabilidad
A largo plazo, las imágenes se convertirán en mercancía y perderán su valor emocional
Antes una sola foto era valiosa, pero ahora es apenas una entre miles.
Con el arte de IA pasará lo mismo: cuando haya demasiado, dejará de conmover tanto
Yo hago fotografía de bodas, y en los últimos 2 años han aumentado muchísimo las solicitudes para film.
La popularidad de los vinilos o de las cámaras digitales antiguas va en la misma línea
El ejemplo de "cubismo" (cubism) del nuevo modelo es algo decepcionante
La esencia del cubismo era poner múltiples puntos de vista, tiempos y estilos en una misma imagen,
pero la IA solo está imitando una división geométrica. Sigue dando la impresión de copiar solo la “forma” y no el “significado”
Antes generaba edificios aleatorios, pero ahora busca materiales reales y los usa como referencia
Puedes ver más detalles en la página de DeepMind Gemini Image Flash
Si una IA así hubiera existido en el pasado, quizá obras como la Mona Lisa o el techo de la Capilla Sixtina no habrían existido
Porque se podrían haber hecho más barato con prompts
La IA es una herramienta que elevará aún más esos límites
Cuanto más avance la tecnología, más desaparecerá la “escasez”, y el valor real se concentrará en los sistemas de control
A los grandes maestros del pasado se les recuerda gracias a sus mecenas, pero los creadores de hoy están quedando enterrados por tener que ganarse la vida
Como dijo Terence McKenna, el futuro irá cada vez hacia una dirección más extraña y contradictoria
El video relacionado está en este enlace
Por ejemplo, puede hacer “una pintura de Jesús clavando una bandera en la luna”, pero “una pintura de jacquesm clavando una bandera en la luna” sale fatal
Probé los resultados de
gemini-3.1-flash-image-preview(NB 2) en GenAI ShowdownLa mejora de NB → NB Pro fue grande, pero de NB Pro → NB Pro 2 no hubo una gran mejora
En especial, la calidad de la edición local (localization) incluso empeoró
Más comparaciones en este enlace
Probé NB Pro 2 un momento, y está más cerca de una mejora incremental que de un salto funcional
Aun así, fue sorprendente que pasara la “King Louie jump rope test”
Puedes ver los resultados en esta página
Para edición de fotos personales, las restricciones de detección de celebridades siguen siendo demasiado fuertes
Casi cualquier persona es reconocida como “parecida a una celebridad”, así que no se puede editar
Desde una perspectiva de ingeniería es una tecnología genial, pero dudo que tenga una justificación de uso válida en términos de negocio
Parece que en la mayoría de los casos se usa porque “no quieren pagarle a un artista”
Cuando las grandes empresas empiezan a lanzar contenido a gran escala, el impacto negativo incluso podría ser mayor
Este tipo de eficiencia también se puede aplicar perfectamente a pequeños negocios