14 puntos por GN⁺ 2025-12-28 | 3 comentarios | Compartir por WhatsApp
  • El texto es la tecnología de comunicación más poderosa de la historia humana, con una capacidad expresiva y una eficiencia que superan a cualquier otro medio
  • Es el medio más adecuado para transmitir con precisión conceptos abstractos y pensamientos complejos frente a imágenes, video o audio
  • Es una tecnología con durabilidad y estabilidad comprobadas, al punto de que todavía podemos leer registros de hace miles de años
  • En costos de almacenamiento y transmisión es abrumadoramente eficiente, y una y otra vez ha servido como punto de partida para el avance de las tecnologías de comunicación
  • Ningún otro medio puede igualarlo en el alcance y la profundidad de su utilidad social, desde la búsqueda y la traducción hasta el resumen y la colaboración

Postura básica sobre el texto

  • Cada vez que recibe preguntas sobre video, 3D, juegos o sistemas multimedia dinámicos, ha repetido la misma postura
  • No niega el valor de las imágenes, las fotos, el cine o la música, pero considera que la superioridad del texto es absoluta
  • Define al texto como la tecnología de comunicación más poderosa, útil y efectiva

La tecnología más antigua y estable

  • El habla y la lengua de señas existen de forma natural en la sociedad humana, pero el texto es una tecnología que se adquiere mediante aprendizaje y transmisión
  • Tiene una durabilidad que resiste el paso del tiempo, al grado de que hoy todavía podemos leer registros de hace unos 5 mil años
  • Al estar inscrito en medios físicos como la piedra, incluso puede permanecer más tiempo que la propia humanidad

El medio de expresión más flexible

  • Las imágenes pueden ser poderosas en ciertas situaciones, pero es imposible expresar visualmente una frase abstracta arbitraria
  • Enunciados conceptuales como la definición de los derechos humanos no pueden reemplazarse con dibujos
  • El texto permite transmitir ideas controlando el nivel de precisión y ambigüedad
  • No es casualidad que la literatura, la filosofía, la historia, las matemáticas, la lógica, la programación y la ingeniería se basen en texto

La forma de comunicación más eficiente

  • El texto tiene una eficiencia de otro nivel en espacio de almacenamiento y costo de transmisión
  • Miles de bytes de texto pueden ocupar menos que una simple imagen de ícono
  • Desde el telégrafo óptico, el telégrafo eléctrico y el teletipo hasta las primeras redes de computadoras, el texto siempre apareció primero
  • La voz, las imágenes y el video solo llegaron cuando el ancho de banda se volvió lo bastante barato
  • Tiene una densidad tal que es posible llevar Wikipedia completa en un smartphone

La tecnología socialmente más útil

  • Funciona de manera eficiente tanto en comunicación 1:1 como 1:N y M:N
  • Permite búsqueda e indexación, incluso manuales
  • Está optimizado para el procesamiento algorítmico, como traducción, comparación, diff, agrupamiento, corrección, resumen y filtrado
  • Puede usarse de forma asíncrona y permite ajustar libremente la velocidad
  • Admite edición colaborativa, citas, anotaciones, discusiones ramificadas, resúmenes, reseñas y obras derivadas
  • No existe una tecnología capaz de sustituir el nivel de complejidad social y cognitiva de las bibliotecas y las publicaciones en internet

Conclusión

  • Por eso, la postura sobre el texto es clara: siempre hay que elegir primero el texto (always pick text first)
  • Tomando prestadas las palabras de un antiguo jefe: siempre hay que apostar por el texto (always bet on text)
  • Si algo puede hacerse con texto, debería hacerse así. El texto casi nunca decepciona

3 comentarios

 
cronex 2025-12-30

Es cierto que el texto es una herramienta de expresión realmente buena y también muy importante, pero...
No se puede guardar absolutamente todo como texto.
Al final, el texto es una expresión comprimida. Comprime y expresa en un formato socialmente consensuado aquello que podemos percibir con los cinco sentidos (vista, oído, tacto, gusto y olfato).
Pero si no existe información sobre el objeto original del que proviene, por mucho que guardemos los datos en texto, ese texto pierde su significado más adelante si ya no se conoce el objeto original al que hacía referencia.
Nosotros sabemos lo que es un casete, pero si a niños pequeños nacidos recientemente solo se les muestra la palabra "casete" y se les pregunta qué es, ¿cuántos podrían responder correctamente? Aunque se describan con mucho detalle la forma, la función y el modo de funcionamiento de un casete, ¿sería posible recrearlo perfectamente dentro de miles de años basándose solo en ese texto?
En un caso así, podrían resultar más útiles unas cuantas fotos del casete, algunos planos, o unos minutos de video mostrando cómo se usa el casete.

 
roxie 2025-12-29

El texto sin duda es estable, pero no estoy seguro de que sea intuitivo.

 
GN⁺ 2025-12-28
Comentarios en Hacker News
  • No entiendo esta dicotomía de la discusión
    No sé por qué tendría que existir una situación donde tenga que elegir entre UTF-8 y una grabación de alguien tocando piano
    Se siente como si alguien entusiasmado con el tema solo pudiera hablar en una oposición simplista tipo “Ford vs. Chevy”
    A todos nos gusta el texto, así que ojalá no intentaran convencernos a la fuerza

  • Estoy de acuerdo con la flexibilidad infinita y la durabilidad del texto, pero después de ver el trabajo de Bret Victor empecé a notar los límites del texto
    Cuando aprendí piano tenía un ciclo de retroalimentación inmediata, y ese tipo de aprendizaje es difícil de implementar con texto
    El punto central de Victor es aplicar este aprendizaje centrado en la retroalimentación a la ingeniería y la educación en general
    El texto sigue siendo importante, pero creo que también hay mucho potencial en formas que aprovechan otras intuiciones sensoriales

    • A corto plazo, implementar un medio más rico que el texto implica una dificultad de ingeniería mucho mayor
      Las demos de Bret Victor son impresionantes, pero llevar eso a la práctica requiere un esfuerzo enorme
      La idea en sí es excelente, pero hay que entender que hacerla realidad exige una gran inversión y compromiso
    • Si trabajas en ciencia, este punto se vuelve más claro
      Explicar datos o resultados con texto es difícil, pero un gráfico transmite muchísima información de inmediato
      El texto es bueno por su naturaleza asíncrona, pero los humanos prefieren de forma instintiva hablar o expresarse visualmente
      Al final, un enfoque mixto resulta más natural que una sola forma de comunicación
    • Por ejemplo, explicar con texto cómo desenredar un montón de cables es ineficiente
      Un niño simplemente mira y aprende, y lo entiende mediante intuición física
      El conocimiento que se aprende con el cuerpo, como andar en bicicleta, casi no se puede transmitir con texto
    • Yo diría: “siempre apuesta por la representación simbólica
      El texto es simbólico, y la imagen es sensorial
      Es imposible expresar perfectamente con texto una pintura de Norman Rockwell
      Los sistemas simbólicos basados en texto, como la partitura o los diagramas de Feynman, siguen siendo muy poderosos
    • Esta misma discusión demuestra la superioridad del texto
      Resumí la publicación del OP en 30 segundos, pero el video de Bret Victor dura 54 minutos, así que la mayoría ni lo verá
      El texto sigue siendo el mejor medio en términos de eficiencia y transformabilidad
      Creo que otros medios conviene usarlos como apoyo
  • Yo me llamo a mí mismo un maximalista del texto
    El texto es el punto natural de contacto entre humanos y máquinas, y el equilibrio entre eficiencia y transparencia
    Todo puede guardarse como cadenas, y expresarse con base64, JSON, HTML, CSS, SQL, etc.
    Al final, la bala de plata (silver bullet) que perseguía la industria eran las cadenas
    Los formatos binarios complejos pierden legibilidad, y después de comprimir con GZIP casi también desaparecen sus ventajas

    • Pero no se pueden tener al mismo tiempo “eficiencia, flexibilidad y transparencia”
      Los protocolos basados en texto se vuelven inestables por el problema de la ley de Postel
      Una diferencia de 30% en ancho de banda no es poca cosa, y esa es también la razón por la que HTTP3 cambió a binario
      Aunque comprimas base64, la legibilidad ya se perdió
      Referencias relacionadas: Robustness principle, problema de Regex, ReDoS
    • Respecto a la afirmación de que “el costo de CPU de deserializar es insignificante”, también podría decirse lo contrario: “el costo de usar herramientas para que lo lea una persona” también es insignificante
      De todos modos, nadie puede leer directamente un JSON comprimido con gzip, así que pasar por herramientas no es un gran problema
    • Yo trabajo a diario con protobuf, y la estructura binaria de este formato existe para garantizar compatibilidad
      Para archivos de configuración manejados por personas, text proto o JSON son más adecuados
    • Migré el almacenamiento de documentos de DOC o PDF a texto Markdown
      grep, git y las conversiones son fáciles
      Algunos artículos viejos los escribí en Lotus Word Pro y ahora ya no puedo leerlos, pero si hubieran sido texto no habría problema
    • La versión de texto de protobuf no es base64 ni JSON
      En sistemas a gran escala circulan muchos archivos de texto, pero casi no tienen transparencia
      En entornos grandes, ahorrar unos cuantos bits puede traducirse en una gran reducción de costos, así que se excluyen los campos autoetiquetados
  • El texto al final no es más que una representación de bytes
    Pero la razón por la que la gente se aferra al texto tiene que ver con lo cerrados que son los formatos binarios y la falta de herramientas
    Aunque un CSV tenga millones de columnas en base64, sin las herramientas adecuadas no sería mejor que un binario

    • El texto no es simplemente bytes, sino un sistema de símbolos legible para humanos
    • El texto impone restricciones sobre las secuencias de bytes permitidas y contiene una estructura de compresión producto de la evolución del lenguaje
      Gracias a la estandarización podemos compartir significado, y modelos como los LLM pueden aprenderlo
    • Medio en broma, también existe una civilización que se comunica en binariocivilización Bynar
  • Como dice eso de “intenta expresar con una imagen una frase aleatoria de Wikipedia”, no todo puede sustituirse con texto
    A la inversa, también es imposible describir perfectamente con texto un clip de película
    El texto no es un superconjunto de todos los medios, solo es otro tipo de representación

  • Sobre la afirmación de que “el texto es la tecnología de comunicación más antigua y estable”
    En realidad, el lenguaje en sí es una tecnología más antigua
    La tradición oral transmitió conocimiento entre generaciones, y el lenguaje humano es la más compleja de todas
    Por ejemplo, los Gunditjmara de Australia transmiten en relatos una erupción volcánica de hace 30 mil años (Budj Bim)
    El texto es único porque puede transmitir información entre generaciones sin distorsionarla
    Al final, la conclusión sería “apuesta por el lenguaje”

    • Si incluyéramos también la comunicación biológica, el código genético del RNA sería probablemente el “texto” más antiguo
    • El caso Gunditjmara es atractivo, pero no deja de ser una estimación imposible de verificar
  • Los LLM son impresionantes porque la humanidad lleva miles de años registrando todo su conocimiento en texto
    Los modelos de imagen también avanzaron gracias a un espacio de embeddings compartido entre texto e imagen

    • Pero que un LLM encuentre la respuesta deseada tras decenas de preguntas y respuestas no es tanto eficiente como exploratorio
      Es conveniente, pero cuesta llamarlo un modelo realmente “efectivo”
  • Como lingüista, creo que al documentar lenguas en peligro el texto (Unicode) es el formato más sostenible
    Aún hoy se pueden leer gramáticas de griego o sánscrito de hace miles de años
    Nuestro equipo publicó en PDF, pero internamente conservó todo en XML
    Ojalá siga siendo legible dentro de 2000 años

    • Pero en lo personal, me ha pasado que archivos de texto guardados hace 10 años eran más difíciles de abrir
      Había mucha confusión de codificaciones, como UTF-16, SJIS o EUC, mientras que PDF o JPEG seguían abriéndose perfectamente
      Si el espacio de almacenamiento lo permite, siento que guardar en formatos de imagen es más seguro
      Además, todavía existen caracteres que ni siquiera pueden representarse en Unicode
    • Como pasa con la notación musical, hay representaciones que no se pueden dividir simplemente entre texto y binario
      Las pinturas rupestres transmiten mejor la intención que el texto
  • Si ves la serie Future Text Publishing,
    “texto” es en esencia un dibujo 2D
    Las computadoras no entienden texto; solo procesan números
    Los humanos fueron quienes dieron significado a esos números y construyeron sistemas de símbolos y lenguaje
    El DNA/RNA puede verse como un ejemplo de un sistema universal de escritura construido físicamente

  • Este artículo ya se ha publicado varias veces antes en HN
    En 2014, 2015 y 2021 también recibió cientos de comentarios
    versión de 2014, versión de 2015, versión de 2021