- Se ofrece una función para convertir prompts basados en texto en videos de alta resolución de 8 segundos mediante Gemini y Whisk
- Con el modelo Veo 2 es posible generar videos realistas, y está disponible para suscriptores de Google One AI Premium
- Con Whisk Animate también es posible convertir imágenes en clips animados de 8 segundos
- Por seguridad, todos los videos generados incluyen una marca de agua digital SynthID
Cómo generar videos en Gemini
- Veo 2 es un modelo capaz de generar videos detallados en alta resolución, y ofrece movimientos de personajes vívidos y escenas realistas al comprender la física del mundo real y el movimiento humano
- Los usuarios pueden seleccionar Veo 2 en Gemini para generar clips de video de 8 segundos con resolución de 720p
- Al describir una escena, Gemini convierte la idea en video, y cuanto más detallada sea la descripción, mayor será el control sobre el video final
- Los videos generados se pueden compartir fácilmente en plataformas como TikTok o YouTube Shorts
Dar vida a imágenes con Whisk Animate
- Whisk es un experimento de Google Labs que permite visualizar ideas nuevas usando prompts de texto e imagen
- Con Whisk Animate, es posible convertir imágenes en videos vivos de 8 segundos, y está disponible para suscriptores de Google One AI Premium
Enfoque de seguridad
- Para la seguridad en la generación de video, todos los videos creados con Veo 2 incluyen una marca de agua digital SynthID
- Está previsto seguir mejorando el sistema con retroalimentación de los usuarios, y se están realizando evaluaciones para evitar la generación de contenido que infrinja las políticas
2 comentarios
Google DeepMind presenta Veo 2, el modelo de generación de video
Opiniones de Hacker News
Whisk se lanzó discretamente hace unos meses como una demo de Imagen 3. Sorprendentemente, es divertido y la implementación es sólida
Quiero comprar acciones de "sí" en el evento de Polymarket que dice que para 2027 una película hecha por una sola persona recaudará más de 100 millones de dólares
Hacer 12 videos de 8 segundos en Veo2 me consumió 48 dólares en créditos de GCP. Ojo con eso
No pensé que generar videos de 8 segundos fuera a ser posible fuera de una API de pago
No soy técnicamente muy hábil en esta área, pero me pregunto por qué todo es texto-a-X
Hacer anuncios en estilo Ghibli es algo atrevido. Pensé que para ahora ese estilo ya estaría agotado
Google Vids también usa Veo 2. Hay confusión de productos
La moderación de contenido es muy frustrante. Puede que sea la razón principal por la que Veo2 y Gemini terminen fracasando
Todo esto es técnicamente asombroso, pero es una gran advertencia para cualquiera que haya trabajado duro en esta área
Krita-ai-diffusion, conectado a Krita y combinando img2img, enmascaramiento y txt2img, es la herramienta más cercana a algo que realmente empodera a los artistas
Es un lanzamiento muy impresionante comparado con hace un año. En ML ahora mismo todas las grandes empresas están compitiendo entre sí y empujando la tecnología hacia adelante, lo cual es algo bueno. Eso es raro en EE. UU. (o en general)