1 puntos por GN⁺ 2024-02-14 | 1 comentarios | Compartir por WhatsApp

Intento de abrir el archivo original de la propuesta de la WWW

  • En el sitio web del W3C está la propuesta original de la WWW escrita por Tim Berners-Lee.
  • El archivo original de la propuesta es un archivo de Word para Macintosh 4.0, y se estima que fue creado en 1990.
  • El documento original tiene un tamaño de 68,608 bytes y, al verificar su tipo de archivo en una Mac, aparece como un archivo de Microsoft Word for Macintosh 4.0.

Intentos de abrirlo con varios programas

  • Microsoft Word: se subió el archivo original a OneDrive y se abrió en Microsoft Word con la extensión .doc.
  • Apple Pages: no entiende los archivos antiguos de Microsoft Word for Macintosh.
  • Apache OpenOffice: puede abrir el archivo, pero se pierde el formato y faltan diagramas.
  • LibreOffice: abre el archivo y los diagramas también se ven con claridad, pero hay problemas con los márgenes y otros detalles de formato.

Comparación entre el PDF de CERN y el PDF generado por LibreOffice

  • El PDF proporcionado por CERN fue generado en 1998 y tiene 20 páginas.
  • La versión importada con LibreOffice tiene 24 páginas.
  • Al comparar ambos PDF, hay diferencias en márgenes, tamaño de fuente, encabezados y pies de página, así como en la división de páginas.

Verificación del documento original mediante emulación

  • Se emuló una Macintosh de los años 90 para ejecutar el Word for Macintosh 4.0 real y comprobar cómo se veía el documento original.
  • El documento original y el PDF de CERN son bastante diferentes, y el documento original aparece como un documento de 22 páginas en papel A4.

Conclusión

  • Convertir el documento original con software moderno es una victoria para el software de código abierto y también muestra la dificultad de preservar documentos.
  • Para conservar el documento, se subió una versión .odt a GitHub.
  • Resulta algo decepcionante que un documento de 34 años siga siendo difícil de abrir y que, incluso al abrirlo, no sea exactamente igual al original.

Opinión de GN⁺

  • Esta entrada de blog destaca la importancia de la preservación digital y la accesibilidad del documento original de la propuesta de la WWW.
  • Muestra el papel tan importante que juega el software de código abierto al manejar formatos de documentos antiguos.
  • Sirve para entender las dificultades de preservar documentos y reconocer la importancia de considerar la compatibilidad y la accesibilidad a largo plazo conforme avanza la tecnología.

1 comentarios

 
GN⁺ 2024-02-14
Opiniones de Hacker News
  • Se compartió un documento convertido a un formato moderno de Word

    • Se compartió un documento en un formato moderno de Word, conservando todo el arte vectorial y las fuentes.
    • Para convertir el documento, primero se abrió y volvió a guardarse usando Word 98 ejecutándose en una Power Mac emulada con QEMU.
    • Sin embargo, faltaban imágenes, y Word afirmaba que no tenía suficiente memoria o espacio en disco para mostrarlas o imprimirlas.
    • Para restaurar las imágenes, se imprimió a PDF usando Acrobat desde Word 98 y luego se extrajo cada imagen como un PDF separado con Adobe Illustrator.
    • Restaurar las imágenes fue sencillo: se eliminaron las imágenes originales y se arrastraron y soltaron los reemplazos en PDF desde Finder.
    • Para comparar, se compartieron un PDF creado con Word 98 en Power Mac y otro PDF creado con Word moderno ejecutándose en macOS Sonoma.
  • Verificación de fuentes y diseño

    • Es necesario contar con las fuentes originales para verificar cómo debería verse el documento.
    • Word 4.0 tenía archivos de fuentes separados para pantalla e impresora según distintas resoluciones de salida.
    • Si faltaba la fuente de impresora, imprimía una versión escalada de la fuente de pantalla; si faltaba la fuente de pantalla, la reemplazaba por la fuente del sistema.
    • En este caso se necesitaban las conocidas fuentes Palatino y Courier, pero LibreOffice sustituyó por Times New Roman aunque Palatino Linotype estaba instalada.
  • La utilidad del comando file

    • El comando file es muy útil para resolver dudas sobre archivos y ofrecer información útil.
  • El excelente soporte de LibreOffice para formatos antiguos de archivos de documentos

    • LibreOffice soporta muy bien los formatos antiguos de archivos de documentos, por eso se usa para esto.
    • También es divertido usar los emuladores BasiliskII e InfiniteMac.
  • La compatibilidad retroactiva de Microsoft Word

    • En la versión de Word para Windows, el archivo se abre mayormente bien y el diseño coincide con el PDF del artículo.
    • No se pudieron abrir las imágenes porque faltaba el filtro gráfico, pero se espera que Word 2003 pueda abrirlas.
  • Las sorprendentes capacidades de LibreOffice

    • LibreOffice no solo puede abrir muchos formatos de documentos, sino que también puede automatizar tareas mediante opciones de línea de comandos.
  • Impresión de documentos en un emulador

    • En un emulador que ejecuta Mac 4.0, se puede instalar una cola de impresión capaz de generar archivos .ps (PostScript), que luego pueden convertirse a PDF.
  • Decepción con la compatibilidad de documentos de Microsoft Word

    • Hay quienes opinan que Microsoft debería asumir la responsabilidad de que Word pueda abrir documentos creados con cualquier versión de Word.
    • Si existen preocupaciones por vulnerabilidades, debería ofrecer una función para convertirlos a una versión nueva ejecutándolos en un sandbox aislado en un proceso externo.
  • Posibles problemas de los respaldos con retención infinita

    • Algunas empresas tienen respaldos con retención infinita, lo que provoca problemas al no entender la diferencia entre algo "legible" y algo "utilizable".
  • Uso de Mac antiguas y Word

    • Hay una Mac SE/30 con System 7.1 y Word 5 instalado; si se envía el documento, podrían ayudar a actualizarlo a Office 2001.