2 puntos por kiyeonjeon21 20 일 전 | Aún no hay comentarios. | Compartir por WhatsApp

Hola.

Últimamente he estado experimentando hasta dónde se puede llevar el trabajo de video con agentes de programación como Codex / Claude Code / Cursor, y estoy creando una CLI llamada VibeFrame.

Sentí que la mayoría de las herramientas de video existentes guardan su estado dentro de una UI, lo que dificulta que un agente las manipule. Por eso la estoy diseñando en una dirección donde los proyectos de video se puedan tratar lo más posible como proyectos de código.

El flujo básico es así.

  • STORYBOARD.md: escenas, narración, tiempos, cues para generación de imagen/video
  • DESIGN.md: tono, layout, tipografía, dirección de movimiento
  • vibe build: generación de assets + composición de escenas
  • vibe render: renderizado a MP4
  • vibe inspect: inspección del resultado del render

En la práctica se usa de esta manera.

curl -fsSL https://vibeframe.ai/install.sh | bash  
vibe setup --scope project  
vibe init launch --from brief.md  
  
# Después de hacer que Codex / Claude Code / Cursor, etc.  
# actualicen STORYBOARD.md y DESIGN.md con base en la investigación  
  
vibe build launch --dry-run  
vibe build launch  
vibe render launch  
vibe inspect render launch --cheap  

La parte de scene composition estuvo muy influida por las ideas de Hyperframes. La forma de trabajar es ver las escenas de video como una composition de HTML/CSS/JS sobre una línea de tiempo, capturarlas de forma determinista en el navegador y renderizarlas a MP4.

VibeFrame está más cerca de poner encima de eso una capa de proyecto fácil de manejar para agentes de programación. Toma STORYBOARD.md / DESIGN.md como source of truth y agrega workflows agénticos como generación multi-provider de imagen/video/narración/música, edit/remix basado en FFmpeg, salida JSON, dry-run, configuración acotada al proyecto e inspect report.

En esta demo, partiendo solo de vibe setup --scope project seguido de vibe init launch, grabé el proceso en el que un agente de programación investiga un tema específico, actualiza STORYBOARD.md / DESIGN.md y luego construye hasta el MP4 final, incluyendo los cues de generación de imágenes.

Video del proceso completo:
https://t.co/YD0SYyODcQ

Como todavía está en una etapa inicial, me interesa especialmente recibir feedback sobre estos puntos.

  • si resulta natural usar STORYBOARD.md + DESIGN.md como interfaz del agente para el trabajo de video
  • si la separación en tres workflow lanes: build / generate / edit-remix es fácil de entender
  • si la superficie de la CLI parece demasiado amplia o, por el contrario, si da la impresión de que faltan funciones

Es un intento de llevar la edición de video desde una GUI hacia una CLI agéntica, así que me gustaría escuchar opiniones de quienes hayan pasado por problemas parecidos.

Aún no hay comentarios.

Aún no hay comentarios.