- Soporta reemplazo facial en tiempo real con un solo clic usando una sola imagen gracias a tecnología de IA de vanguardia (video deepfake)
- Multiplataforma: compatible con CPU, NVIDIA CUDA y Apple Silicon (M1/M2)
- Función de verificación integrada para evitar el procesamiento de contenido inapropiado y garantizar un uso legal y ético
- Open source en Python
- Pasos de uso
- Configurar el entorno necesario (
python, pip, ffmpeg)
- Clonar el repositorio de GitHub
- Descargar los modelos necesarios (
GFPGANv1.4, inswapper_128_fp16.onnx)
- Instalar las dependencias (usando
venv: CUDA, CoreML, DirectML, OpenVINO)
- Ejecutar el programa
- Seleccionar la imagen fuente y el objetivo
- Iniciar el proceso de reemplazo facial
Funciones principales de Deep Live Cam
- Reemplazo facial en tiempo real: permite cambiar rostros en tiempo real usando una sola imagen y ofrece vista previa inmediata
- Deepfake de video con un clic: permite crear videos deepfake de alta calidad de forma rápida y sencilla con una operación simple
- Soporte multiplataforma: puede ejecutarse en distintas configuraciones de hardware, incluyendo CPU, NVIDIA CUDA y Apple Silicon
- Protecciones para uso ético: incorpora verificaciones integradas para evitar el procesamiento de contenido inapropiado y asegurar un uso legal y ético
- Rendimiento optimizado: usa algoritmos optimizados para mejorar notablemente la velocidad de procesamiento, especialmente en GPUs NVIDIA con soporte CUDA
# Resumen de GN⁺
- Deep Live Cam es una herramienta de IA de vanguardia para reemplazo facial en tiempo real y deepfakes de video, capaz de ejecutarse en diversas plataformas
- Incluye protecciones para garantizar un uso ético y recibe apoyo continuo de la comunidad open source
- Esta herramienta es útil para proyectos creativos y producción de video, especialmente cuando se buscan resultados visuales de alta calidad en poco tiempo
- Otros proyectos con funciones similares incluyen DeepFaceLab y FaceSwap
4 comentarios
Lo implementé yo mismo, y aunque no es completamente imposible distinguirlo, pensé: ¿de verdad se puede llegar a este nivel con una sola imagen real...? Me da la impresión de que las personas mayores sí podrían caer completamente, así que de verdad parece que vivimos en un mundo donde ya no sabes qué creer.
Para haberse hecho con una sola imagen, el resultado es excelente. Parece que ya de verdad no vamos a poder confiar en los videos.
Opiniones en Hacker News
Las "salvaguardas para uso ético" previenen el manejo de contenido inapropiado
Técnicamente, la calidad es sorprendente
Este proyecto está basado en "GFPGAN v1.4" y "FaceSwap Extension - Automatic 1111 - Proof of Concept"
Este proyecto parece ser un fork de roop, que fue descontinuado, con mejoras principalmente en la UI
Es técnicamente impresionante, pero cuesta encontrar buenos casos de uso que no estén relacionados con propaganda o fraude
Si le agregan mejora de voz, podrían vaciar las cuentas bancarias de todas las abuelas y abuelos
Se duda de que esta tecnología tenga casos de uso legítimos
"La función de verificación integrada previene el manejo de contenido inapropiado y garantiza un uso legal y ético"
Hemos llegado a un punto en el que solo se debería confiar en contenido multimedia verificado de forma cruzada por fuentes confiables
Sienten que el momento de lanzar esta herramienta es extremadamente inapropiado
"Los ingenieros de software esperan que las armas no salten de la mesa para dispararle a la gente" jajaja