3 puntos por GN⁺ 2025-11-10 | 2 comentarios | Compartir por WhatsApp
  • En un depósito de la Universidad de Utah, se descubrió una cinta de UNIX V4 de Bell Labs de 1973, lo que plantea la posibilidad de restaurar datos originales del Unix temprano
  • Esta versión es un material raro del que no se conoce una copia completa hasta ahora: Unix en el que el kernel y las utilidades principales fueron escritos por primera vez en lenguaje C
  • La cinta lleva una etiqueta escrita a mano que dice “UNIX Original From Bell Labs V4”, y se confirmó que la letra corresponde al fallecido profesor Jay Lepreau
  • La cinta hallada era un original que Martin Newell, inventor de la ‘tetera de Utah’ (Teapot), recibió de AT&T, y actualmente se prepara su traslado al Computer History Museum (CHM)
  • Al Kossow del CHM estará a cargo de la restauración y planea leer los datos con equipo de conversión analógico-digital; se considera un material importante para la restauración de la investigación sobre el Unix temprano

Descubrimiento de la cinta de Unix V4

  • Mientras se ordenaba un almacén del departamento de informática de la Universidad de Utah, se encontró un carrete de cinta de 9 pistas con la etiqueta UNIX V4 (1973) de Bell Labs
    • En la etiqueta está escrito a mano: “UNIX Original From Bell Labs V4 (See Manual for format)”
    • La caligrafía corresponde al profesor Jay Lepreau, fallecido en 2008, según confirmó su alumno, el profesor Robert Ricci
  • Ricci dio a conocer el hallazgo a través de Mastodon y explicó que se trata de una versión de la que se cree que no existe una copia completa
  • Está previsto que esta cinta sea transportada directamente al Computer History Museum (CHM)

Importancia histórica de Unix V4

  • Unix V4 fue la versión en la que el kernel y algunas utilidades principales se reescribieron por primera vez en lenguaje C, un punto de inflexión importante en la evolución de Unix
  • Hasta ahora, lo único que se conservaba era parte del código fuente del kernel de versiones anteriores, algunas páginas de man y el manual del programador de noviembre de 1973
  • Por eso, este hallazgo se considera un material que abre la posibilidad de una restauración completa del Unix temprano basado en C

Origen de la cinta y personas relacionadas

  • Investigaciones adicionales confirmaron que esta cinta fue recibida por Martin Newell de parte de AT&T
    • Newell es conocido en el campo de los gráficos por computadora como el inventor de la ‘tetera de Utah’ (Teapot), que incluso apareció en el salvapantallas OpenGL de Windows NT
  • Ricci reveló además este dato y señaló que el valor histórico de la cinta aumentó aún más

Plan de restauración y enfoque técnico

  • El archivista de software del CHM, Al Kossow, estará a cargo del trabajo de restauración
    • Planea conectar un amplificador de lectura de cabezal y usar un convertidor analógico-digital multicanal de alta velocidad para volcar los datos a unos 100 GB de RAM,
      y luego procesarlos con el programa de análisis readtape, escrito por Len Shustek
    • La cinta es una cinta 3M de 9 pistas y 1200 pies de longitud de la década de 1970, y se considera que tiene altas probabilidades de poder restaurarse
  • Kossow mencionó que elevó este proyecto a alta prioridad y ya impulsa el trabajo de restauración

Importancia del hallazgo

  • Este descubrimiento se considera una oportunidad poco común para restaurar el proceso de evolución técnica del Unix temprano
  • El CHM y el equipo de Bitsavers colaboran en la restauración, y el caso está atrayendo la atención de la comunidad de preservación de la historia de la computación y del software de código abierto
  • The Register expresó su expectativa de éxito en la restauración al afirmar que este valioso material “no podría haber quedado en mejores manos”

2 comentarios

 
click 2025-11-10

La cinta realmente se conserva muy bien.

 
GN⁺ 2025-11-10
Opiniones de Hacker News
  • El contenido de la cinta tenía una sencilla lista de pendientes
    Por ejemplo, cosas como hacer más fácil salir de Emacs o cambiar el nombre del directorio temporal. Los nombres anteriores, bin o dev, daban una sensación algo graciosa por lo confusos que resultaban

    • A mí de hecho me gusta la ambigüedad de bin y dev
      Unix está lleno de juegos de palabras como cat, man y more/less. Aunque etc sí se siente un poco raro
  • Da pena que el campo de la computación casi olvide su pasado
    Se restauran y estudian armas antiguas o los experimentos de Galileo, pero los logros de los hackers de los 60 y 70 se están olvidando. Y eso que habría mucho que aprender de las limitaciones con las que trabajaban en esa época

    • La industria del cine es parecida. Casi no tiene sistemas de preservación, así que muchas películas clásicas se quemaron o desaparecieron
      Incluso una legendaria película muda estadounidense fue encontrada por casualidad en una biblioteca de España y luego restaurada. Da la impresión de que artistas y empresas se enfocan solo en el presente y no ven sus obras pasadas como parte de la historia
    • Yo no estoy de acuerdo. Sigue habiendo mucho interés por la computación retro y la demoscene
      Hay proyectos muy activos, como descifrar máquinas arcade de los 90 o restaurar juegos clásicos a nivel de bits
    • En realidad, todos los campos son parecidos. La mayor parte del pasado solo fue preservada por accidente
      Incluso las pirámides y los artefactos antiguos habrían desaparecido si no existieran restricciones de costo o espacio
    • El campo de la computación sigue siendo demasiado joven
      Los arqueólogos trabajan con objetos de hace cientos o miles de años. Dentro de algunos siglos, inventos como Unix también serán reconocidos por su valor histórico
    • Yo también discrepo. Ya hay muchísima gente dedicando enormes esfuerzos a la preservación de la historia de la computación
  • Tengo un lector/escritor CCT de 9 pistas capaz de leer cintas desde 1982
    Me sorprendió que una cinta de 1973 fuera de 9 pistas, pero limpié el cabezal con un líquido de limpieza que hoy es ilegal y todos los datos se recuperaron perfectamente. Eran cintas de varios sistemas, incluidos minicomputadores DEC

    • La transición a 9 pistas ocurrió en 1964, cuando el IBM 360 introdujo bytes de 8 bits
    • Me da curiosidad cuál era ese “líquido de limpieza ilegal”. También por qué fue prohibido y si hay planes de publicar los datos recuperados con fines de arqueología digital
  • Es un hallazgo realmente asombroso. Sería genial poder emular Unix v4 a partir de este código fuente, compilarlo y ejecutarlo

    • SIMH emula varios minicomputadores y microcomputadores tempranos, incluido el PDP-11
      En la lista de correo de TUHS incluso restauraron y ejecutaron el código fuente de una versión de Unix de 1972
      Ver este repositorio de GitHub relacionado
    • Si estas primeras versiones tuvieran spyware o código publicitario escondido, sería realmente impactante
    • También hubo quien preguntó: “¿y qué se supone que vas a hacer con eso?”
  • El hilo de discusión original está en esta publicación de discuss.systems

    • En el artículo también dejaron enlaces a esa publicación, a los comentarios posteriores y a la discusión en TUHS
  • Cuando era estudiante de licenciatura guardé un proyecto de compilador en una cinta de acero UNIVAC UNISERVO II
    Tenía una estructura de 8 pistas (6 bits de datos, 1 bit de paridad y 1 bit de reloj), y supongo que hoy ya no debe existir una unidad capaz de leerla. Aun así, físicamente probablemente siga en buen estado

    • Pero en cuanto intentes leerla, existe el riesgo de dañarla
  • Gran hallazgo. Esto recuerda a la época en que se perdieron las cintas de las misiones lunares. Si buscan un poco más, quizá aparezcan más cosas

  • El laboratorio de cintas de IBM Tucson recuperó en su momento datos de cinta del Challenger
    Creo que una cinta de 52 años perfectamente podría recuperarse

  • “Oh, este es mi artículo. ¡Gracias, Ricardo!”

  • Con la versión SIMH-classic seguro que sí se puede ejecutar
    Mejor olvidarse de la versión comercializada de v4 y usar la versión abierta