- El texto es la tecnología de comunicación más poderosa de la historia humana, con una capacidad expresiva y una eficiencia que superan a cualquier otro medio
- Es el medio más adecuado para transmitir con precisión conceptos abstractos y pensamientos complejos frente a imágenes, video o audio
- Es una tecnología con durabilidad y estabilidad comprobadas, al punto de que todavía podemos leer registros de hace miles de años
- En costos de almacenamiento y transmisión es abrumadoramente eficiente, y una y otra vez ha servido como punto de partida para el avance de las tecnologías de comunicación
- Ningún otro medio puede igualarlo en el alcance y la profundidad de su utilidad social, desde la búsqueda y la traducción hasta el resumen y la colaboración
Postura básica sobre el texto
- Cada vez que recibe preguntas sobre video, 3D, juegos o sistemas multimedia dinámicos, ha repetido la misma postura
- No niega el valor de las imágenes, las fotos, el cine o la música, pero considera que la superioridad del texto es absoluta
- Define al texto como la tecnología de comunicación más poderosa, útil y efectiva
La tecnología más antigua y estable
- El habla y la lengua de señas existen de forma natural en la sociedad humana, pero el texto es una tecnología que se adquiere mediante aprendizaje y transmisión
- Tiene una durabilidad que resiste el paso del tiempo, al grado de que hoy todavía podemos leer registros de hace unos 5 mil años
- Al estar inscrito en medios físicos como la piedra, incluso puede permanecer más tiempo que la propia humanidad
El medio de expresión más flexible
- Las imágenes pueden ser poderosas en ciertas situaciones, pero es imposible expresar visualmente una frase abstracta arbitraria
- Enunciados conceptuales como la definición de los derechos humanos no pueden reemplazarse con dibujos
- El texto permite transmitir ideas controlando el nivel de precisión y ambigüedad
- No es casualidad que la literatura, la filosofía, la historia, las matemáticas, la lógica, la programación y la ingeniería se basen en texto
La forma de comunicación más eficiente
- El texto tiene una eficiencia de otro nivel en espacio de almacenamiento y costo de transmisión
- Miles de bytes de texto pueden ocupar menos que una simple imagen de ícono
- Desde el telégrafo óptico, el telégrafo eléctrico y el teletipo hasta las primeras redes de computadoras, el texto siempre apareció primero
- La voz, las imágenes y el video solo llegaron cuando el ancho de banda se volvió lo bastante barato
- Tiene una densidad tal que es posible llevar Wikipedia completa en un smartphone
La tecnología socialmente más útil
- Funciona de manera eficiente tanto en comunicación 1:1 como 1:N y M:N
- Permite búsqueda e indexación, incluso manuales
- Está optimizado para el procesamiento algorítmico, como traducción, comparación, diff, agrupamiento, corrección, resumen y filtrado
- Puede usarse de forma asíncrona y permite ajustar libremente la velocidad
- Admite edición colaborativa, citas, anotaciones, discusiones ramificadas, resúmenes, reseñas y obras derivadas
- No existe una tecnología capaz de sustituir el nivel de complejidad social y cognitiva de las bibliotecas y las publicaciones en internet
Conclusión
- Por eso, la postura sobre el texto es clara: siempre hay que elegir primero el texto (always pick text first)
- Tomando prestadas las palabras de un antiguo jefe: siempre hay que apostar por el texto (always bet on text)
- Si algo puede hacerse con texto, debería hacerse así. El texto casi nunca decepciona
3 comentarios
Es cierto que el texto es una herramienta de expresión realmente buena y también muy importante, pero...
No se puede guardar absolutamente todo como texto.
Al final, el texto es una expresión comprimida. Comprime y expresa en un formato socialmente consensuado aquello que podemos percibir con los cinco sentidos (vista, oído, tacto, gusto y olfato).
Pero si no existe información sobre el objeto original del que proviene, por mucho que guardemos los datos en texto, ese texto pierde su significado más adelante si ya no se conoce el objeto original al que hacía referencia.
Nosotros sabemos lo que es un casete, pero si a niños pequeños nacidos recientemente solo se les muestra la palabra "casete" y se les pregunta qué es, ¿cuántos podrían responder correctamente? Aunque se describan con mucho detalle la forma, la función y el modo de funcionamiento de un casete, ¿sería posible recrearlo perfectamente dentro de miles de años basándose solo en ese texto?
En un caso así, podrían resultar más útiles unas cuantas fotos del casete, algunos planos, o unos minutos de video mostrando cómo se usa el casete.
El texto sin duda es estable, pero no estoy seguro de que sea intuitivo.
Comentarios en Hacker News
No entiendo esta dicotomía de la discusión
No sé por qué tendría que existir una situación donde tenga que elegir entre UTF-8 y una grabación de alguien tocando piano
Se siente como si alguien entusiasmado con el tema solo pudiera hablar en una oposición simplista tipo “Ford vs. Chevy”
A todos nos gusta el texto, así que ojalá no intentaran convencernos a la fuerza
Estoy de acuerdo con la flexibilidad infinita y la durabilidad del texto, pero después de ver el trabajo de Bret Victor empecé a notar los límites del texto
Cuando aprendí piano tenía un ciclo de retroalimentación inmediata, y ese tipo de aprendizaje es difícil de implementar con texto
El punto central de Victor es aplicar este aprendizaje centrado en la retroalimentación a la ingeniería y la educación en general
El texto sigue siendo importante, pero creo que también hay mucho potencial en formas que aprovechan otras intuiciones sensoriales
Las demos de Bret Victor son impresionantes, pero llevar eso a la práctica requiere un esfuerzo enorme
La idea en sí es excelente, pero hay que entender que hacerla realidad exige una gran inversión y compromiso
Explicar datos o resultados con texto es difícil, pero un gráfico transmite muchísima información de inmediato
El texto es bueno por su naturaleza asíncrona, pero los humanos prefieren de forma instintiva hablar o expresarse visualmente
Al final, un enfoque mixto resulta más natural que una sola forma de comunicación
Un niño simplemente mira y aprende, y lo entiende mediante intuición física
El conocimiento que se aprende con el cuerpo, como andar en bicicleta, casi no se puede transmitir con texto
El texto es simbólico, y la imagen es sensorial
Es imposible expresar perfectamente con texto una pintura de Norman Rockwell
Los sistemas simbólicos basados en texto, como la partitura o los diagramas de Feynman, siguen siendo muy poderosos
Resumí la publicación del OP en 30 segundos, pero el video de Bret Victor dura 54 minutos, así que la mayoría ni lo verá
El texto sigue siendo el mejor medio en términos de eficiencia y transformabilidad
Creo que otros medios conviene usarlos como apoyo
Yo me llamo a mí mismo un maximalista del texto
El texto es el punto natural de contacto entre humanos y máquinas, y el equilibrio entre eficiencia y transparencia
Todo puede guardarse como cadenas, y expresarse con base64, JSON, HTML, CSS, SQL, etc.
Al final, la bala de plata (silver bullet) que perseguía la industria eran las cadenas
Los formatos binarios complejos pierden legibilidad, y después de comprimir con GZIP casi también desaparecen sus ventajas
Los protocolos basados en texto se vuelven inestables por el problema de la ley de Postel
Una diferencia de 30% en ancho de banda no es poca cosa, y esa es también la razón por la que HTTP3 cambió a binario
Aunque comprimas base64, la legibilidad ya se perdió
Referencias relacionadas: Robustness principle, problema de Regex, ReDoS
De todos modos, nadie puede leer directamente un JSON comprimido con gzip, así que pasar por herramientas no es un gran problema
Para archivos de configuración manejados por personas, text proto o JSON son más adecuados
grep,gity las conversiones son fácilesAlgunos artículos viejos los escribí en Lotus Word Pro y ahora ya no puedo leerlos, pero si hubieran sido texto no habría problema
En sistemas a gran escala circulan muchos archivos de texto, pero casi no tienen transparencia
En entornos grandes, ahorrar unos cuantos bits puede traducirse en una gran reducción de costos, así que se excluyen los campos autoetiquetados
El texto al final no es más que una representación de bytes
Pero la razón por la que la gente se aferra al texto tiene que ver con lo cerrados que son los formatos binarios y la falta de herramientas
Aunque un CSV tenga millones de columnas en base64, sin las herramientas adecuadas no sería mejor que un binario
Gracias a la estandarización podemos compartir significado, y modelos como los LLM pueden aprenderlo
Como dice eso de “intenta expresar con una imagen una frase aleatoria de Wikipedia”, no todo puede sustituirse con texto
A la inversa, también es imposible describir perfectamente con texto un clip de película
El texto no es un superconjunto de todos los medios, solo es otro tipo de representación
Ej.: Flight management system, NOTAM
Sobre la afirmación de que “el texto es la tecnología de comunicación más antigua y estable”
En realidad, el lenguaje en sí es una tecnología más antigua
La tradición oral transmitió conocimiento entre generaciones, y el lenguaje humano es la más compleja de todas
Por ejemplo, los Gunditjmara de Australia transmiten en relatos una erupción volcánica de hace 30 mil años (Budj Bim)
El texto es único porque puede transmitir información entre generaciones sin distorsionarla
Al final, la conclusión sería “apuesta por el lenguaje”
Los LLM son impresionantes porque la humanidad lleva miles de años registrando todo su conocimiento en texto
Los modelos de imagen también avanzaron gracias a un espacio de embeddings compartido entre texto e imagen
Es conveniente, pero cuesta llamarlo un modelo realmente “efectivo”
Como lingüista, creo que al documentar lenguas en peligro el texto (Unicode) es el formato más sostenible
Aún hoy se pueden leer gramáticas de griego o sánscrito de hace miles de años
Nuestro equipo publicó en PDF, pero internamente conservó todo en XML
Ojalá siga siendo legible dentro de 2000 años
Había mucha confusión de codificaciones, como UTF-16, SJIS o EUC, mientras que PDF o JPEG seguían abriéndose perfectamente
Si el espacio de almacenamiento lo permite, siento que guardar en formatos de imagen es más seguro
Además, todavía existen caracteres que ni siquiera pueden representarse en Unicode
Las pinturas rupestres transmiten mejor la intención que el texto
Si ves la serie Future Text Publishing,
“texto” es en esencia un dibujo 2D
Las computadoras no entienden texto; solo procesan números
Los humanos fueron quienes dieron significado a esos números y construyeron sistemas de símbolos y lenguaje
El DNA/RNA puede verse como un ejemplo de un sistema universal de escritura construido físicamente
Este artículo ya se ha publicado varias veces antes en HN
En 2014, 2015 y 2021 también recibió cientos de comentarios
versión de 2014, versión de 2015, versión de 2021