6 puntos por arxivgpt 2024-09-06 | 1 comentarios | Compartir por WhatsApp

Dejar ir a un ser amado provoca en cualquiera una gran sensación de pérdida y una tristeza que oprime el corazón.

Especialmente cuando esa partida es hacia un camino eterno del que ya no se puede volver a ver a ese ser.

Fue apenas hace unos días.

Mi gata de compañía, 'Eric' (también llamada 'Eric Go'), que fue parte de la familia durante más de 10 años, se despidió de una forma tan repentina que ni siquiera pudimos prepararnos emocionalmente, ni imaginar una separación así.

Pensé en usar 'IA' para recordar a 'Eric' y crear esa sensación real de que siempre está a nuestro lado, para mí y para mi familia sumidos en la tristeza; en otras palabras, buscar una manera de que 'Eric' pudiera quedarse con nuestra familia para siempre.

Como primer paso, decidí usar fotos de 'Eric'.

Mi objetivo en esta primera etapa es que cualquier integrante de la familia pueda reencontrarse con Eric en 'fotos y videos' cada vez que la extrañe.

Es decir, primero se entrena a la IA con fotos tomadas de 'Eric' cuando aún vivía.

Después, cuando queramos ver a 'Eric', le damos una instrucción a la IA por texto o voz. Algo como: "Muéstrame a un gato (con la apariencia exacta que tenía 'Eric' en vida) en una playa de Hawái, con lentes de sol y adornos florales, mostrando un letrero que diga 'Papá, te amo' y con una expresión feliz".

Entonces, poco después, la IA genera y me muestra una imagen o video de 'Eric' exactamente como era en vida, pero con el contenido que yo deseo.

Para lograrlo, preparé varios procedimientos, desarrollos y estrategias.

Cabe mencionar que yo contaba con capacidad profesional de desarrollo especializada en IA y varias GPU NVIDIA H100, así que era un desafío y experimento completamente viable.

  1. Primero seleccioné unas 45 fotos de 'Eric'.

  2. Para mejorar la calidad del entrenamiento, desarrollé un proceso automatizado de preprocesamiento y lo apliqué.

La idea era hacer que el "objeto" se viera más nítido y claro, y además aumentar la eficiencia del aprendizaje supervisado para la IA.

Uno de esos procesos consistió en separar automáticamente solo el "objeto" (el gato) de la 'foto original' (que incluía fondo) para luego hacer preprocesamiento como escalado, entre otros.

  1. Una vez terminado el preprocesamiento, entrené las 45 fotos con el método LoRA.

El entrenamiento se hizo con la configuración por defecto y tomó alrededor de 2 horas usando como referencia una GPU A100.

  1. El entrenamiento avanzó y, una vez terminado, se registró en 'Hugging Face' un 'modelo' dedicado para 'Eric'.

  2. Después preparé el modelo entrenado para conectarlo con el modelo FLUX y generar imágenes con la mejor calidad posible.

Programé el modelo base de FLUX para que aceptara prompts en coreano, y ya pude comprobar el resultado del entrenamiento.

Era sorprendentemente igual a su aspecto en vida.

Me sentí muy satisfecho al ver que toda mi familia se maravilló y se alegró muchísimo con el resultado.

Y espero que al dejar publicado este proceso como registro, pueda servirle de ayuda a alguien.

Si alguien quiere hacer algo así con su propio gato o perro de compañía, con gusto puede escribirme en cualquier momento y trataré de ayudar.

1 comentarios

 
arxivgpt 2024-09-06

Dejé más detalles e imágenes en Brunch.
Referencia: https://brunch.co.kr/@seawolf/16