- En la lista de libros recomendados de A16Z se encontró una frase fácticamente incorrecta en la descripción de algunas obras que decía que “la mayoría de los libros se detiene a mitad de una oración"
- Neal Stephenson señaló con claridad que, aunque sus novelas puedan ser objeto de controversia, en realidad ninguna termina a mitad de una frase
- Sugirió que el error probablemente se debió a que se publicó una frase generada por IA sin revisión humana
- Al revisar el historial del repositorio de GitHub, se confirmó que existía un borrador generado por Cursor IDE y una posterior edición descuidada por parte de una persona
- Este caso es significativo porque muestra problemas de confiabilidad y falta de verificación en el contenido generado por IA
La lista de libros de A16Z y la frase incorrecta
- Neal Stephenson tenía varias obras incluidas en la lista de lectura recomendada publicada por A16Z
- En una de las descripciones figuraba una frase que afirmaba que “la mayoría de los libros se detiene a mitad de una frase (es decir, literalmente termina a mitad de una oración, mid-sentence)”
- Stephenson señaló que esa frase no es verdadera y que, dado que incluía la palabra “literally”, era un error evidente y no una metáfora
- Explicó que aunque algunos lectores puedan no quedar satisfechos con los finales, obras como 《Snow Crash》, 《The Diamond Age》 y 《Seveneves》 tienen finales claros
Naturaleza y problemas del error
- Esta frase no es una simple crítica literaria (opinion); es una afirmación fáctica e incorrecta
- Stephenson señaló que este error daña la diligencia y honestidad del autor y el editor
- Planteó el problema de cómo una afirmación así pudo aparecer en el sitio web de A16Z
Hipótesis 1: texto generado por IA
- Presentó como explicación más probable que se haya publicado texto generado por IA sin revisarlo antes
- Los errores de ortografía en los nombres y ciertas particularidades de estilo respaldan esa posibilidad
- Este fenómeno ya se da con frecuencia en áreas tan diversas como el derecho, la academia y los medios
- Stephenson lo comparó con el “Inhuman Centipede” y advirtió del riesgo de que la información incorrecta se vuelva a aprender en los próximos LLM
Hipótesis 2: uso humano de datos incorrectos
- Como segunda posibilidad, planteó un error humano basado en información errónea
- Subhipótesis A: usar una copia ilegal en PDF (bootleg) y haber tomado como referencia una versión truncada a mitad
- Subhipótesis B: que problemas de calidad en la traducción hicieran que pareciera que una oración se cortaba a mitad
Trazar la causa real
- Stephenson encontró pistas al investigar el sitio en el historial de commits del repositorio de GitHub
- En el commit del 21 de julio de 2023 se confirmó el texto original generado por Cursor IDE
- El texto original tenía una analogía de “segfault”, pero luego una persona lo corrigió de forma incorrecta a “se para a mitad de una frase”
- Después, otra persona añadió un error tipográfico durante el resumen, y el error quedó completo
- Stephenson lo evaluó como el resultado combinado de la pereza al usar IA y la negligencia humana
Confiabilidad de internet y contenido generado por IA
- Stephenson señaló que los usuarios de internet siguen mostrando una confianza ciega en la información en línea
- Mencionó casos anteriores de fragmentos de su novela Cryptonomicon insertados al azar en correos spam
- Esos fragmentos sí estaban cortados a mitad de una frase, y recordó la posibilidad de que un LLM hubiera aprendido este tipo de datos
- A través de este caso, enfatizó el riesgo de que la IA genere contenido sin distinguir entre hechos y ficción
Conclusión
- Stephenson expresó agradecimiento por la recomendación de A16Z, pero también planteó la necesidad de una verificación de hechos clara sobre la frase incorrecta
- Este caso se valora como un ejemplo que revela la falta de verificación en contenidos generados por IA y la responsabilidad humana en la revisión
1 comentarios
Opinión de Hacker News
Como el historial de commits es público, se puede ver fácilmente que esa lista de lecturas pasó por manos de una IA
Véase este commit relacionado
El mensaje del commit dice simplemente “stephenson”, así que no queda claro por qué lo cambiaron
Enlace al commit corregido
Mi experiencia con los LLM no ha sido tan positiva como la de otras personas
Por ejemplo, en una promoción de Gemini de Google presentaron una línea de tiempo para preparar la cena de Acción de Gracias, pero al hacer preguntas terminó dando tres versiones contradictorias entre sí
Hubiera bastado con algo simple como “cubre el pan con una toalla para mantenerlo caliente”, pero en vez de eso repetía respuestas completamente fuera de lugar
La generación de código solo funciona 1 de cada 6 veces, las preguntas tipo StackOverflow salen bien 5 de cada 6, y las preguntas generales son muy irregulares
Cuando falla, falla tan fuerte que da miedo ver al mundo correr hacia este uso masivo de LLM
Incluso cuando le pregunté “el precio de la acción el día antes del lanzamiento de AI Overview”, también se equivocó en eso
Era más largo que el propio código y un espagueti sin sentido de declaraciones de variables repetidas. No lo vuelvo a usar
No creo que haya que tomar en serio a A16Z. Parecen una bola de charlatanes
Habría sido genial si el post del blog realmente hubiera terminado a mitad de una oración
Otras obras suyas también muestran el caos interior humano, pero sin cierre ni moraleja
Después de leer más de 2000 páginas, mi conclusión sigue siendo “no lo recomiendo”
A Neal Stephenson me dan ganas de decirle: “gracias por terminar con una oración completa”
Sus libros siempre dan la impresión de terminar demasiado pronto o demasiado tarde, así que por más interesantes que sean las premisas, no me dan muchas ganas de leerlos
Me recordó a la autobiografía de Werner Herzog
En el prólogo dice que “una bala de francotirador podría cortarle la vida” y anuncia que lo usará como recurso para terminar el libro de golpe
Y en efecto termina así, pero justo después añade “este es exactamente el final que había anunciado”, en un típico giro herzoguiano
Que una gran empresa publique una lista de lecturas de fin de año es un mensaje de PR de “somos personas con emociones y gustos”
Pero con este caso quedó claro que no era más que una puesta en escena promocional
Al ver que terminaba con la frase “el sentido de la vida era un entero (integer)”, sentí de inmediato que eso sí era claramente una frase escrita por IA
Toda la lista está llena del tono típico de los LLM
Dado de dónde viene, ni siquiera sorprende. En realidad, todo debió terminar desde la primera hipótesis: que lo escribió un LLM
Se burlan de Stephenson como si fuera un escritor dadaísta que termina todo a mitad de una oración
Otra hipótesis es que simplemente haya sido un error de memoria
Que alguien recordara haber leído hace mucho un libro de Stephenson con un final decepcionante y lo mezclara con otro que “termina a mitad de una oración”