2 puntos por GN⁺ 2025-01-11 | 1 comentarios | Compartir por WhatsApp
  • Visualización de ISBN

    • Anna's Archive ofrece el catálogo abierto de libros más grande de la historia de la humanidad.
    • Cada píxel representa 2,500 ISBN, y el píxel se muestra en verde cuando hay un archivo disponible.
    • Solo el 16% de todos los libros tienen respaldo, y se necesita mucho más trabajo.
  • Antecedentes

    • Anna's Archive crea un catálogo de libros utilizando números ISBN para respaldar el conocimiento de la humanidad.
    • Los ISBN se asignan a los libros publicados en la mayoría de los países desde la década de 1970.
    • Funciona como un sistema distribuido sin autoridad central, y los números se asignan en el orden de países, grandes editoriales y editoriales pequeñas.
    • Anna's Archive recopila metadatos de diversas fuentes como ISBNdb, Worldcat y Google Books, y posee el mayor conjunto abierto de metadatos de libros.
    • Es importante identificar y preservar libros raros y en riesgo.
  • Visualización

    • Se pueden ver distintos conjuntos de datos por separado, y es posible cambiar entre ellos usando el menú desplegable y los botones.
    • Los conjuntos de datos incluyen Anna's Archive, Google Books, Goodreads, Internet Archive y otros.
    • En la visualización se pueden observar patrones como líneas y bloques regulares, así como áreas vacías.
  • Recompensa de $10,000

    • Hay una recompensa para mejorar la visualización, y se debe enviar código de código abierto antes del 31 de enero de 2025.
    • La mejor propuesta recibirá $6,000, la segunda $3,000 y la tercera $1,000, pagados en Monero (XMR).
    • Incluso si no se cumple el criterio mínimo, podría pagarse una parte de la recompensa.
    • Las propuestas deben mejorar la visualización modificando el HTML, y deben funcionar bien en escritorio y móvil.
    • Se otorgarán puntos adicionales según la usabilidad y el atractivo visual.
  • Código

    • El código de generación de imágenes y los ejemplos están en un directorio específico.
    • Se utiliza un formato de datos comprimido de 75MB para proporcionar información de ISBN.
    • No es necesario usar este formato para participar en la recompensa, pero es el formato más conveniente para comenzar.
    • Todo el código debe proporcionarse como código abierto.

1 comentarios

 
GN⁺ 2025-01-11
Comentarios de Hacker News
  • Si se visualizan los datos usando una curva de Hilbert, los puntos cercanos en una lista ordenada también quedan visualmente cerca. La primera parte del ISBN corresponde al país, la segunda a la editorial y la tercera al título; si se quita el checksum y se ordena como un número grande, los principales países editores se verían como “islas”. Estaría bien etiquetar esas áreas

  • El ISBN no es jerárquico y, como se compra por bloques, la visualización no resulta interesante ni útil. Una visualización usando LoC o Dewey Decimal sería más útil

  • Anna's Archive es una de las maravillas del mundo, y aunque la humanidad casi desapareciera, si Anna's Archive siguiera existiendo habría esperanza de una reconstrucción rápida

  • Por daltonismo no podía distinguir los píxeles rojos de los verdes, e incluso usando una extensión del navegador no pude diferenciar más colores. Me pregunto si la gráfica está rara

  • La IP del servidor fue bloqueada en la UE. En el ISP Ziggo de Países Bajos apareció el mensaje: "Este sitio web ha sido bloqueado. Sanciones europeas"

  • Me pregunto si alguien más está viendo el mensaje: "Este servidor no puede demostrar que es annas-archive.org, y su certificado de seguridad fue emitido para *.hs.llnwd.net. Esto puede deberse a una configuración incorrecta o a que un atacante está interceptando la conexión"

  • Las visualizaciones hechas con D3 son divertidas, y se puede mapear y ampliar muchas cosas

  • Es difícil saber qué corresponde a qué en la gráfica. Si alguien señalara Bookland (es decir, 978), sería más fácil de entender

  • Me pregunto si es ilegal descargar y usar el archivo de ISBN. Me pregunto qué tendría de malo poseer esa información

  • Cada píxel representa 2,500 ISBN, y si el archivo de ISBN lo tiene, el píxel se vuelve más verde. No sé qué significa exactamente “más verde”, y me pregunto si los píxeles negros representan ISBN no registrados