17 puntos por xguru 2022-08-19 | 2 comentarios | Compartir por WhatsApp
  • Juego de aventura al estilo de Sierra y LucasArts de los años 90
  • Si le pides a DALL-E que dibuje pixel art directamente, el resultado no es bueno
  • La pixelación y el dithering se hicieron con ImageMagick
  • Después de varios intentos, encontró una frase de estilo que produce imágenes adecuadas
    → " in the style of a high quality, atmospheric high renaissance oil on canvas painting"
  • Cosas que hizo para ajustar la perspectiva y representar el lugar deseado
    • Especificar época, hora e iluminación: "on a sunny day in the 2000s"
    • Descripción concreta de la ubicación general ("town", "city" o un lugar famoso)
    • Punto de enfoque ("facade", "hotel entrance") y edificios alrededor ("houses", "streets", "plains")
    • Se puede pedir explícitamente espacio vacío: "…and street in front", "plaza surrounded by…"
    • Hay que pedir que deje espacio libre. Si no, DALL-E tiende a rellenarlo con algo
    • Se puede indicar la posición de la cámara: "seen from second-floor balcony"
    • Nunca incluir "video game". Si lo haces, todo termina lleno de luces neón azules
  • Como DALL-E genera imágenes de 1024x1024, para ajustarlas a pantallas actuales hay que cambiarlas a algo como 19:10
    • Cortar la imagen por la mitad y volver transparentes las partes vacías de ambos lados,
    • Volver a subirla a DALL-E y pedirle con el mismo prompt que genere el resto
    • También se puede modificar el prompt para que agregue algo más
  • Haciendo cuentas con la estructura de precios actual de DALL-E
    • Un juego exitoso suele tener unas 70 escenas, pero suponiendo que se haga con 50
    • Para obtener una sola imagen del lugar deseado, hay que probar con unas 200. Para 50 lugares, eso da 10,000 imágenes en total
    • Si asumimos que se necesita el doble para correcciones y expansión horizontal, habría que generar unas 20,000 imágenes
    • 20,000 * $0.0543 = alrededor de $1,087, así que considerando que a veces se acierta más rápido, serían unos $1000
    • Si cada generación tarda 6 segundos, 120000 segundos = 33 horas

2 comentarios

 
ifmkl 2022-08-19

Aunque es algo extra, imageMagick me parece realmente lo máximo...

 
eususu 2022-08-19

Sinceramente, ¡está buenísimo!