1 puntos por GN⁺ 2023-11-28 | 1 comentarios | Compartir por WhatsApp

Fiesta de transformación de imágenes con DALL·E

  • DALL·E ofrece una fiesta para la transformación de imágenes.
  • Entre los temas de imagen que les gustan a los usuarios están los “gnomos”, los “ancianos siberianos” y los “gatos extraños”.
  • Se puede iniciar la generación de imágenes a partir de un prompt inicial usando una clave de la API de OpenAI.

Configuración avanzada

  • Mediante configuraciones avanzadas como el número de iteraciones, los usuarios pueden ajustar el proceso de generación de imágenes.
  • Usando prompts de visión de GPT-4, es posible modificar el prompt base o personalizarlo para hacerlo más divertido, más raro, más ingenioso, o incluso convertir todo en gatos.

Opinión de GN⁺

  • Lo más importante de este artículo es que, usando DALL·E, se pueden generar diversas imágenes y transformarlas de la manera que el usuario quiera.
  • La capacidad de generar imágenes creativas y personalizadas ofrece una experiencia interesante para las personas, y puede verse como un ejemplo del avance tecnológico y de las posibilidades de la inteligencia artificial.

1 comentarios

 
GN⁺ 2023-11-28
Opiniones de Hacker News
  • Jugar con los prompts y ver qué se puede crear a través de una serie de imágenes es bastante divertido. Inspirado por una publicación reciente en Twitter, probé una configuración que aumenta la "intensidad" en cada prompt. El tema, que empezó como una sugerencia de mi hijo, me dejó maravillado al ver cómo el alboroto de una cabra común escalaba hasta convertirse en un horror cósmico del fin del universo. Enlace: dalle.party
  • Un prompt personalizado que disfruté personalmente: conceptualizar la imagen considerando cuidadosamente cada detalle, incluyendo estilo, color e iluminación. En el paso final, comprimir todo eso en un solo párrafo y resumir la idea usando los rasgos más destacados y un lenguaje muy preciso. Enlace: dalle.party
  • También es divertido jugar con conceptos contrastantes. Empieza con un gato simple, evoluciona hacia un pepino recostado cómodamente y finalmente cambia a un mundo opuesto. Enlace: dalle.party
  • Esto me recuerda al juego de fiesta "Telestrations". Los participantes se turnan para dibujar y escribir lo que vieron, y es entretenido ver el resultado mientras intentas adivinar cuál será el siguiente dibujo. Estaría bien tener un modo de visualización alternativo que muestre la imagen y el siguiente prompt. Puedes cambiar a modo móvil o ajustar el tamaño de la ventana para leer el prompt antes de ver la imagen.
  • Esperaba una evolución técnica gradual más que una regresión técnica, pero en realidad se desvía rápidamente hacia un terreno surrealista. Prompt inicial: "un híbrido entre una locomotora de vapor futurista y una máquina voladora de Da Vinci". Resultado: dalle.party
  • Parece que los modelos de imagen a texto no tienen ni idea de lo que realmente contiene una foto. Da la impresión de que solo están haciendo coincidir patrones presentes en los datos de entrenamiento. Esto hace que, al renderizar imágenes desde texto, parezca que el modelo "entiende" lo que quiere, pero en la dirección inversa está muy lejos de cualquier "comprensión".
  • Aún no lo he probado, pero supongo que esto es similar a un juego comercial llamado Scrawl. Los participantes van pasando hojas de papel y convierten en dibujo lo que escribió su vecino, o al revés, y luego lo vuelven a pasar. Enlace: boardgamegeek.com
  • Cuando probé con el prompt inicial "inteligencia artificial dibujando su propio retrato", el resultado mostró consistentemente a un robot pintando sobre un lienzo. Las primeras 4 son dibujos del robot, las siguientes 3 son galaxias y las últimas 2 son paisajes. Enlace: dalle.party
  • Es interesante ver que ciertos prompts y temas se mantienen relativamente estables. Por ejemplo, el caso de "ejemplo de gnomo" es estable, pero el de "un gato dando una conferencia a un ratón" se va rápidamente hacia un territorio extraño y surrealista.
  • Me decepciona que los resultados tengan bastante ruido, pero el concepto en sí es atractivo. Enlace: dalle.party