-
Visualización de ISBN
- Anna's Archive ofrece el catálogo abierto de libros más grande de la historia de la humanidad.
- Cada píxel representa 2,500 ISBN, y el píxel se muestra en verde cuando hay un archivo disponible.
- Solo el 16% de todos los libros tienen respaldo, y se necesita mucho más trabajo.
-
Antecedentes
- Anna's Archive crea un catálogo de libros utilizando números ISBN para respaldar el conocimiento de la humanidad.
- Los ISBN se asignan a los libros publicados en la mayoría de los países desde la década de 1970.
- Funciona como un sistema distribuido sin autoridad central, y los números se asignan en el orden de países, grandes editoriales y editoriales pequeñas.
- Anna's Archive recopila metadatos de diversas fuentes como ISBNdb, Worldcat y Google Books, y posee el mayor conjunto abierto de metadatos de libros.
- Es importante identificar y preservar libros raros y en riesgo.
-
Visualización
- Se pueden ver distintos conjuntos de datos por separado, y es posible cambiar entre ellos usando el menú desplegable y los botones.
- Los conjuntos de datos incluyen Anna's Archive, Google Books, Goodreads, Internet Archive y otros.
- En la visualización se pueden observar patrones como líneas y bloques regulares, así como áreas vacías.
-
Recompensa de $10,000
- Hay una recompensa para mejorar la visualización, y se debe enviar código de código abierto antes del 31 de enero de 2025.
- La mejor propuesta recibirá $6,000, la segunda $3,000 y la tercera $1,000, pagados en Monero (XMR).
- Incluso si no se cumple el criterio mínimo, podría pagarse una parte de la recompensa.
- Las propuestas deben mejorar la visualización modificando el HTML, y deben funcionar bien en escritorio y móvil.
- Se otorgarán puntos adicionales según la usabilidad y el atractivo visual.
-
Código
- El código de generación de imágenes y los ejemplos están en un directorio específico.
- Se utiliza un formato de datos comprimido de 75MB para proporcionar información de ISBN.
- No es necesario usar este formato para participar en la recompensa, pero es el formato más conveniente para comenzar.
- Todo el código debe proporcionarse como código abierto.
1 comentarios
Comentarios de Hacker News
Si se visualizan los datos usando una curva de Hilbert, los puntos cercanos en una lista ordenada también quedan visualmente cerca. La primera parte del ISBN corresponde al país, la segunda a la editorial y la tercera al título; si se quita el checksum y se ordena como un número grande, los principales países editores se verían como “islas”. Estaría bien etiquetar esas áreas
El ISBN no es jerárquico y, como se compra por bloques, la visualización no resulta interesante ni útil. Una visualización usando LoC o Dewey Decimal sería más útil
Anna's Archive es una de las maravillas del mundo, y aunque la humanidad casi desapareciera, si Anna's Archive siguiera existiendo habría esperanza de una reconstrucción rápida
Por daltonismo no podía distinguir los píxeles rojos de los verdes, e incluso usando una extensión del navegador no pude diferenciar más colores. Me pregunto si la gráfica está rara
La IP del servidor fue bloqueada en la UE. En el ISP Ziggo de Países Bajos apareció el mensaje: "Este sitio web ha sido bloqueado. Sanciones europeas"
Me pregunto si alguien más está viendo el mensaje: "Este servidor no puede demostrar que es annas-archive.org, y su certificado de seguridad fue emitido para *.hs.llnwd.net. Esto puede deberse a una configuración incorrecta o a que un atacante está interceptando la conexión"
Las visualizaciones hechas con D3 son divertidas, y se puede mapear y ampliar muchas cosas
Es difícil saber qué corresponde a qué en la gráfica. Si alguien señalara Bookland (es decir, 978), sería más fácil de entender
Me pregunto si es ilegal descargar y usar el archivo de ISBN. Me pregunto qué tendría de malo poseer esa información
Cada píxel representa 2,500 ISBN, y si el archivo de ISBN lo tiene, el píxel se vuelve más verde. No sé qué significa exactamente “más verde”, y me pregunto si los píxeles negros representan ISBN no registrados