1. Presentación
Hola.
Soy el desarrollador independiente que la vez pasada les presentó el lector de eBooks (Folio).
Al editar video, a veces quieres quitar el fondo sin usar chroma key,
o extraer solo la voz o solo un instrumento específico de una canción,
y por eso terminé creando esta herramienta con la idea de resolver tanto la eliminación de fondo como la separación de audio en una sola aplicación.
2. Resumen del servicio en una línea
AlphaClip es una app de escritorio que elimina automáticamente el fondo de videos con IA y puede separar el audio en pistas individuales (voz, batería, bajo, guitarra, etc.).
3. Introducción al servicio
AlphaClip (Habom) es una herramienta de IA enfocada en la posproducción de video.
- Elimina automáticamente el fondo de videos con IA (se recomienda fondo blanco o negro)
- Separa el audio en pistas individuales (voz, batería, bajo, guitarra, etc.)
- Permite una eliminación de fondo limpia incluso sin equipo de chroma key
- Automatiza de forma más simple la función de eliminación de fondo de After Effects
Puede usarse para crear videos de personajes, edición musical y posproducción de video.
4. Funciones principales
🎬 Eliminación de fondo de video
- Eliminación automática de fondo basada en IA
- Extrae solo el sujeto sin necesidad de chroma key
- Compatibilidad con aceleración GPU (CUDA) para mejorar la velocidad de procesamiento
🎵 Separación de audio
- Extracción de pistas individuales como voz / batería / bajo / guitarra
- Permite aislar solo el instrumento deseado de una canción
🎞️ Creación de video de personaje
- Generación del video final del personaje utilizando IA
5. Stack tecnológico
- Python (desarrollo basado en vibe coding)
- CUDA (aceleración por GPU)
- Modelos de IA (eliminación de fondo / separación de audio)
6. Dificultades durante el desarrollo
- Optimización del uso de GPU mediante configuración de CUDA
- Equilibrio entre calidad de eliminación de fondo y velocidad de procesamiento
- Manejo de errores remanentes por ser una semana 1 de desarrollo con vibe coding
7. Estado actual
- Desarrollo en curso durante aproximadamente una semana con vibe coding
- Actualmente enfocado en implementar funciones, y todavía quedan algunos errores
- Planeo dejarlo gratis por un tiempo y seguir mejorándolo
- Más adelante planeo usarlo para crear personajes animados y fondos (78 cartas) para una app de tarot
- El objetivo final es reunir pequeños proyectos y convertirlos en un solo pipeline de automatización
Como ahora mismo llevo entre 2 y 4 tareas en paralelo, siento que necesito un poco más de enfoque y priorización.
Dicho de forma simple:
- RVC, dicho de forma sencilla, cambiar la voz de personajes usando aprendizaje/inferencia speech-to-speech
- La página de market de abajo también me tomó alrededor de un mes, incluso completé los pagos, pero pienso seguir mejorándola
- Herramienta de gestión de notificaciones para apps (APNs/FCM), herramienta de análisis de funnel (similar a Google Analytics)
Además de eso hay más cosas, pero aunque tome tiempo, se las iré presentando una por una con calma.!!
8. ¿Qué me gustaría recibir?
- Feedback de usuarios reales (¡los reportes de errores son más que bienvenidos! ¡Pueden mandarlos por video o por SNS cuando quieran!)
- Opiniones sobre el flujo de trabajo de edición de video
Si ven puntos débiles o tienen ideas de mejora, no duden en comentarlas.
¡Les agradecería mucho que disfruten el video!
Probé crear el video de abajo usando este programa, así que espero que lo disfruten(?) :)
Video demo
https://www.youtube.com/watch?v=lZhiMreW94Q
- ¡También subí al market la herramienta de monitoreo de CPU/GPU que aparece en el video!
(¡La hice en unos 30 minutos a 1 hora cuando estaba descansando(?) mientras hacía las tools de AlphaClip Habom!)
⬇️ Enlace de descarga
📥 Descarga: https://market.habom.kr
Aún no hay comentarios.