- Sora es un modelo de IA que crea escenas realistas e imaginativas a partir de instrucciones de texto
- Puede generar videos de hasta 1 minuto manteniendo la fidelidad al prompt del usuario y la calidad visual
- Se presentan ejemplos de videos generados a partir de diversos prompts que ofrecen escenarios detallados
- Todos los videos de esta página fueron creados directamente por Sora y no han sido editados en absoluto
- Actualmente, Sora está siendo proporcionado a equipos de "red teaming" para evaluar riesgos, y también está recibiendo retroalimentación de artistas visuales, diseñadores y cineastas
- OpenAI busca compartir el progreso de la investigación para recibir retroalimentación externa y mostrar al público el futuro de las capacidades de la IA
Capacidades de Sora
- Puede generar escenas complejas con múltiples personajes, movimientos específicos y detalles precisos del sujeto y el fondo
- Comprende no solo el prompt del usuario, sino también cómo existen las cosas en el mundo físico
Seguridad de Sora
- OpenAI planea tomar varias medidas de seguridad antes de integrar Sora en sus productos
- Esto incluye desarrollar herramientas para detectar contenido engañoso y un clasificador que permita determinar si un video fue generado por Sora
Tecnología de investigación
- Sora es un modelo de difusión que comienza con un video lleno de ruido y lo va eliminando gradualmente para generar el video
- Usa una arquitectura transformer similar a la de los modelos GPT, lo que ofrece una excelente capacidad de escalamiento
Opinión de GN⁺
- Sora es una tecnología de IA innovadora que genera video a partir de instrucciones basadas en texto y abre nuevas posibilidades para profesionales creativos
- Aprender del uso en el mundo real mediante medidas de seguridad y retroalimentación cumple un papel importante para volver gradualmente más seguros los sistemas de IA
- Esta tecnología parece ser un hito importante para alcanzar la futura AGI (inteligencia artificial general)
6 comentarios
De verdad no me sale más que admiración.
¿Seguro que van a conseguir 7 billones...?
A simple vista, no se sabe bien si es un video real o uno creado por IA.
Vaya... quiero probarlo pronto.
Supongo que eso de modelo de difusión significa que funciona de forma similar a Stable Diffusion, ¿no?
Parece que el mercado de stock photos y stock videos la va a tener difícil..
La calidad de generación es impresionante. ¿Está avanzando así de rápido?
Comentarios en Hacker News