1 puntos por GN⁺ 2025-04-17 | 2 comentarios | Compartir por WhatsApp
  • Se ofrece una función para convertir prompts basados en texto en videos de alta resolución de 8 segundos mediante Gemini y Whisk
  • Con el modelo Veo 2 es posible generar videos realistas, y está disponible para suscriptores de Google One AI Premium
  • Con Whisk Animate también es posible convertir imágenes en clips animados de 8 segundos
  • Por seguridad, todos los videos generados incluyen una marca de agua digital SynthID

Cómo generar videos en Gemini

  • Veo 2 es un modelo capaz de generar videos detallados en alta resolución, y ofrece movimientos de personajes vívidos y escenas realistas al comprender la física del mundo real y el movimiento humano
  • Los usuarios pueden seleccionar Veo 2 en Gemini para generar clips de video de 8 segundos con resolución de 720p
  • Al describir una escena, Gemini convierte la idea en video, y cuanto más detallada sea la descripción, mayor será el control sobre el video final
  • Los videos generados se pueden compartir fácilmente en plataformas como TikTok o YouTube Shorts

Dar vida a imágenes con Whisk Animate

  • Whisk es un experimento de Google Labs que permite visualizar ideas nuevas usando prompts de texto e imagen
  • Con Whisk Animate, es posible convertir imágenes en videos vivos de 8 segundos, y está disponible para suscriptores de Google One AI Premium

Enfoque de seguridad

  • Para la seguridad en la generación de video, todos los videos creados con Veo 2 incluyen una marca de agua digital SynthID
  • Está previsto seguir mejorando el sistema con retroalimentación de los usuarios, y se están realizando evaluaciones para evitar la generación de contenido que infrinja las políticas

2 comentarios

 
GN⁺ 2025-04-17
Opiniones de Hacker News
  • Whisk se lanzó discretamente hace unos meses como una demo de Imagen 3. Sorprendentemente, es divertido y la implementación es sólida

    • Usa el truco de convertir las imágenes subidas en descripciones de texto
    • Puede aprovechar la fortaleza del codificador de texto moderno de Imagen 3 para seguir descripciones convertidas largas
  • Quiero comprar acciones de "sí" en el evento de Polymarket que dice que para 2027 una película hecha por una sola persona recaudará más de 100 millones de dólares

  • Hacer 12 videos de 8 segundos en Veo2 me consumió 48 dólares en créditos de GCP. Ojo con eso

  • No pensé que generar videos de 8 segundos fuera a ser posible fuera de una API de pago

  • No soy técnicamente muy hábil en esta área, pero me pregunto por qué todo es texto-a-X

    • Me pregunto si no sería posible tener un editor tradicional estilo keyframe donde uno haga un boceto aproximado del terreno, meta una foto del personaje y dibuje splines 3D para tener control creativo detallado
  • Hacer anuncios en estilo Ghibli es algo atrevido. Pensé que para ahora ese estilo ya estaría agotado

  • Google Vids también usa Veo 2. Hay confusión de productos

  • La moderación de contenido es muy frustrante. Puede que sea la razón principal por la que Veo2 y Gemini terminen fracasando

    • Quiero hacer un video divertido de un niño jugando a ser superhéroe, pero sigue fallando
  • Todo esto es técnicamente asombroso, pero es una gran advertencia para cualquiera que haya trabajado duro en esta área

    • El texto-a-lo-que-sea cansa muchísimo. Aunque el resultado se vea genial, no siento nada porque no lo hice yo
    • En el 97% de los casos el resultado no es lo que quiero. Si cambio un poco el texto, sale otro resultado equivocado
    • Todo este proceso me drena la cartera, la paciencia y el alma
    • No veo cómo estas "herramientas" vayan a ayudar a los creadores. Hasta ahora, los únicos productos que salen de estas herramientas son empresas de spam de TikTok/internet en general
  • Krita-ai-diffusion, conectado a Krita y combinando img2img, enmascaramiento y txt2img, es la herramienta más cercana a algo que realmente empodera a los artistas

  • Es un lanzamiento muy impresionante comparado con hace un año. En ML ahora mismo todas las grandes empresas están compitiendo entre sí y empujando la tecnología hacia adelante, lo cual es algo bueno. Eso es raro en EE. UU. (o en general)