La deuda cognitiva que se acumula al escribir ensayos con asistentes de IA

(arxiv.org)

1 puntos por GN⁺ 2025-06-17 | 1 comentarios | Compartir por WhatsApp

Un paper en prepublicación que mide el costo cognitivo del uso de LLM en la enseñanza de escritura de ensayos, y experimenta si las herramientas de IA ampliamente usadas en el aprendizaje y el trabajo pueden debilitar las capacidades de aprendizaje
Los participantes se dividieron en grupos LLM, Search Engine y Brain-only, y escribieron ensayos en 3 sesiones; en la 4.ª sesión, parte del grupo LLM escribió sin herramientas y parte del grupo Brain-only usó un LLM
En las sesiones 1 a 3 participaron 54 personas, y en la 4.ª participaron 18 de ellas; se usaron EEG, análisis NLP, entrevistas por sesión y calificaciones de docentes humanos junto con un AI judge desarrollado por separado
Cuanto mayor era el apoyo externo, menor era la conectividad cerebral: el grupo Brain-only mostró la red más fuerte, el grupo Search Engine un nivel intermedio y el apoyo de LLM el acoplamiento general más débil
Durante 4 sesiones a lo largo de 4 meses, el grupo LLM mostró un desempeño inferior al grupo Brain-only en los niveles neuronal, lingüístico y de calificación, además de menor sentido de propiedad y menor capacidad de citar inmediatamente después

El costo cognitivo del LLM medido en la escritura de ensayos

Se enfoca en comprobar el costo que el uso de LLM deja en los procesos cognitivos al escribir ensayos en entornos educativos
Los LLM permiten experiencias de aprendizaje personalizadas, feedback inmediato y mayor acceso a recursos educativos, pero a medida que su uso se vuelve más extendido, podría reducirse la participación del pensamiento crítico y de los procesos de análisis profundo
La escritura de ensayos es una tarea común para evaluar las capacidades de los estudiantes en escuelas y exámenes estandarizados, y fue elegida como una actividad compleja que exige múltiples procesos cognitivos simultáneamente
El paper está en estado de preprint, under review

Participantes y diseño de las sesiones

Los participantes se dividieron en tres grupos
- Grupo LLM: escribió ensayos con una herramienta LLM designada
- Grupo Search Engine: escribió ensayos usando un motor de búsqueda
- Grupo Brain-only: escribió ensayos sin herramientas externas
En las sesiones 1 a 3, cada participante mantuvo la misma condición de grupo asignada
En la 4.ª sesión se cambiaron las condiciones de algunos participantes
- LLM-to-Brain: participantes que antes usaban LLM escribieron sin herramientas
- Brain-to-LLM: participantes que antes escribían sin herramientas usaron un LLM
En las sesiones 1 a 3 participaron en total 54 personas, y la 4.ª sesión fue completada por 18 de ellas
En cada sesión escribieron un ensayo eligiendo uno de los temas del SAT; en las sesiones 1 a 3 se ofrecieron 3 temas por sesión, con un total de 9 temas disponibles

Métodos de medición

Para medir la actividad cerebral se usó EEG
- Se registró la actividad cerebral de los participantes para evaluar la participación cognitiva y la carga cognitiva
- También se incluyó el objetivo de comprender con mayor profundidad la activación neuronal durante la escritura del ensayo
A los textos de los ensayos se les aplicó análisis NLP
- Named Entities Recognition(NER)
- n-gram
- ontología de temas
- similitud y distancia basadas en embeddings
Después de cada sesión se realizaron entrevistas a los participantes
- Cumplimiento de la estructura del ensayo
- Capacidad de citar partes del ensayo
- Exactitud de las citas
- Sentido de propiedad sobre el ensayo
- Satisfacción, entre otros aspectos
Para la calificación se usaron conjuntamente docentes humanos y un AI judge creado por separado

Resultados EEG: a mayor apoyo externo, menor conectividad cerebral

Los tres grupos mostraron patrones de conectividad neuronal distintos, lo que refleja estrategias cognitivas diferentes
La conectividad cerebral disminuyó de manera sistemática según la cantidad de apoyo externo
- Grupo Brain-only: mostró la red más fuerte y amplia
- Grupo Search Engine: mostró un nivel intermedio de participación
- Apoyo de LLM: tuvo el acoplamiento general más débil
En la 4.ª sesión, los participantes LLM-to-Brain mostraron conectividad neuronal más débil y menor participación de las redes alpha y beta
En cambio, los participantes Brain-to-LLM mostraron mayor recuperación de memoria y una reactivación amplia de nodos occipito-parietales y prefrontales
- Este patrón podría estar relacionado con el procesamiento visual y es similar a un comportamiento observado con frecuencia en el grupo Search Engine

Características de los ensayos reveladas por el análisis lingüístico

Dentro de cada grupo se encontró una homogeneidad consistente en NER, n-gram y ontología de temas
Los ensayos del grupo LLM mostraron rasgos lingüísticos más homogéneos dentro del mismo grupo
El grupo Search Engine mostró en algunos temas un uso de n-gram que parece reflejar la influencia de la optimización de búsqueda
- Ej.: en el tema PHILANTHROPY apareció un foco en el n-gram homeless
La distancia entre los ensayos del grupo Brain-only fue siempre significativa y mayor que en los grupos LLM o Search Engine
En algunos temas aparecieron diferencias casi ortogonales entre el grupo LLM y el grupo Brain-only
- Ej.: temas HAPPINESS y PHILANTHROPY

Sentido de propiedad, memoria y capacidad de citar

En las entrevistas, el grupo LLM mostró un sentido de propiedad más bajo sobre sus propios ensayos
El grupo Search Engine también mostró un alto sentido de propiedad, aunque inferior al del grupo Brain-only
La capacidad de citar contenido de su propio ensayo escrito apenas unos minutos antes también fue menor en el grupo LLM
El grupo Brain-only mostró un alto sentido de propiedad y una alta capacidad de citar
En la 4.ª sesión, los participantes Brain-to-LLM usaron un LLM, pero mostraron una mejor integración de contenido combinada con la influencia de las sesiones Brain-only previas, mientras que el sentido de propiedad apareció dividido

Diferencias en el experimento de cambio de la 4.ª sesión

Los participantes Brain-to-LLM mostraron mayor conectividad neuronal en la condición de reescribir con una herramienta de IA después de haber escrito previamente sin IA
- La directed connectivity en las bandas alpha, beta, theta y delta aumentó en toda la red
- Aparecieron interacciones de redes cerebrales más amplias que en las sesiones 1 a 3 anteriores de LLM-only
Los participantes LLM-to-Brain mostraron un esfuerzo neuronal menos coordinado en la mayoría de las bandas al escribir sin herramientas después de haber usado previamente LLM
- También apareció un sesgo hacia vocabulario característico de LLM
- Aunque tanto el AI judge como los docentes humanos les dieron puntajes altos, las distancias de uso en NER y n-gram fueron menos marcadas que en otros grupos y sesiones
Cuando el grupo Brain-only usó un LLM en la 4.ª sesión, la conectividad cerebral de esa sesión no volvió al patrón de la 1.ª sesión Brain-only de nivel principiante ni alcanzó el nivel de la 3.ª sesión Brain-only
- Mostró un estado intermedio de participación de red

Conclusiones y limitaciones

El uso de LLM tuvo efectos medibles en los participantes y, aunque las ventajas iniciales parecían claras, en las sesiones a lo largo de 4 meses el grupo LLM mostró un desempeño inferior al grupo Brain-only en varios niveles
El bajo desempeño se observó conjuntamente en la conectividad neuronal, las características lingüísticas y los resultados de calificación
En un momento en que el impacto educativo de los LLM en el público general apenas empieza a consolidarse, la posibilidad de una disminución de las capacidades de aprendizaje sigue siendo un tema importante
Este paper busca servir como guía preliminar para entender los efectos cognitivos y prácticos de la IA en los entornos de aprendizaje

1 comentarios

GN⁺ 2025-06-17

Opiniones de Hacker News

En vez de llamarlo “acumulación de deuda cognitiva”, yo lo llamaría simplemente deterioro cognitivo o pérdida de capacidades cognitivas.
Es natural que, si no usas un lenguaje, lo olvides, y el cerebro no retiene información que no necesita. También hubo estudios sobre el uso de la navegación de Google Maps que encontraron que “el uso habitual del GPS afecta negativamente la memoria espacial durante la navegación autónoma”, o que observaron una reducción de materia gris en usuarios de mapas.
Cualquiera que haya desarrollado experiencia en un campo científico sabe que, para entender algo, hay que darle vueltas y explorar cómo se conecta cada idea con las demás. No puedes aprender matemáticas solo hojeando un libro de texto; tienes que detenerte a pensar. Creo que los objetos mentales que luego puedes usar para razonar los crea precisamente el acto de pensar.
- En “no puedes aprender matemáticas solo hojeando un libro de texto; tienes que detenerte a pensar”, lo más importante es escribir.
  Hay que escribir mucho. Escribir hace que el cerebro estructure el pensamiento, permite tener una conversación estructurada con uno mismo y explorar varios caminos. Solo con pensar y reflexionar pronto llegas a un límite, pero escribir te permite explorar el pensamiento casi sin fin.
  Si el pensamiento está tan estrechamente ligado a la escritura, y la escritura puede ser prosa, dibujos, ecuaciones, gráficos, diagramas o lo que sea, es interesante preguntarse qué efecto tendrá sobre las capacidades cognitivas que los LLM se encarguen de cada vez más escritura.
- Yo sí lo llamaría deuda cognitiva. ¿Alguna vez escribiste un informe grande con un LLM?
  Es muy tentador hacer que el LLM escriba mucho texto, le dé estructura y cree argumentos y material visual. Si le vas delegando un poco más cada vez, al final el resultado deja de ser tuyo por completo.
  Pero mi nombre aparece en ese informe, y se espera que yo lo explique y lo entienda. En teoría, un informe debería ser una “proyección bidimensional” de una “realidad de alta dimensión” que está en tu cabeza, pero un informe generado en una décima parte del tiempo no lo es. En papel puede verse convincente, pero al intentar explicar los conceptos te quedas trabado.
  Al final entiendes que tienes que hacer el trabajo tú mismo, construir un modelo mental, expresarlo, volver a expresarlo y expresarlo otra vez. Y hacerlo de distintas maneras según el público objetivo.
  Creo que deuda cognitiva es un término adecuado para describir la brecha entre el modelo mental que habrías tenido que construir para escribir un informe antes de los LLM, y el modelo mental que casi no necesitas construir cuando usas un LLM.
  Al final, mi nombre aparece en el informe o en el paper. ¿Qué se puede esperar de mí como autor? Con el tiempo, esas expectativas podrían bajar. Si surgen preguntas profundas, quizá se salten al autor y dependan del “modelo” mental del LLM. Pero otros modelos, como los LLM, pueden tener “modelos” distintos —es decir, algoritmos predictivos— sobre la verdad fundamental y la realidad. ¿Cuál permite hacer las predicciones más precisas? Para eso hace falta cierta profundidad de comprensión, y si dependes demasiado de un LLM para escribir, esa profundidad no aparece.
  A largo plazo, esto podría conducir realmente a un “deterioro cognitivo, o pérdida de capacidades cognitivas” a nivel poblacional, pero sería prudente no afirmarlo de forma categórica. La imprenta no produjo ese resultado, aunque las élites religiosas de la época temían que la gente común no pudiera interpretar correctamente los textos.
  Como también se dijo en este hilo, creo que “escribir es pensar”. Aunque quizá exista algo mejor que escribir que todavía no hemos inventado. Pensar consiste en desarrollar modelos mentales detallados que permitan predecir el futuro con una probabilidad mayor que el azar. Nuestra supervivencia depende de eso y, desde la perspectiva de la teoría de la información, la evolución es precisamente eso [0]. “Nada en biología tiene sentido sin la luz de la información”.
  [0] https://www.youtube.com/watch?v=4PCHelnFKGc
- Si “el cerebro no retiene información que no necesita”, ¿por qué todavía sé cómo configurar config.sys y autoexec.bat para optimizar la memoria convencional de DOS?
  No lo he hecho en 20 años, y estoy bastante seguro de que nunca volveré a hacerlo.
- Expresiones como “deterioro cognitivo” o “podredumbre cerebral” pueden haber sonado demasiado sensacionalistas y, para ser justos, los autores también señalaron la limitación del tamaño reducido de la muestra.
  También parece un título raro que el paper no ofrezca referencias ni citas para el término “deuda cognitiva”. Tal vez lo cambiaron a último momento.
  Es un estudio interesante del MIT. Como toda investigación en psicología, requiere sano escepticismo y verificación independiente. También se siente un poco como una mezcla de todo, con neuroimagen y evaluaciones psicométricas incluidas, pero ¿a quién no le gustaría una imagen tipo “así se ve tu cerebro cuando usas un LLM”?
- La frase “el cerebro no retiene información que no necesita” suena plausible, pero ¿cómo explicamos habilidades como andar en bicicleta, de las que suele decirse que, una vez aprendidas, no se pierden?
Cada vez más, los LLM se sienten como otra tecnología frente a la cual la sociedad terminará desarrollando inmunidad por sí sola.
En educación, esto ya está empezando con docentes que conversan con los estudiantes, observan cómo aprenden y verifican el proceso mediante el cual demuestran sus habilidades. En los negocios, pronto también se darán cuenta de que la mayor parte de la comunicación valiosa debe ser creada directamente por las personas como autoras de lo que quieren decir. El acto de autoría representa más o menos dos tercios de lo esencial en la mayoría de las comunicaciones.
Claro que, antes de eso, para desarrollar una inmunidad adecuada a los efectos secundarios, habrá que pasar por un choque dramático de superficialización del pensamiento. El rechazo de los expertos a los LLM frente a entusiastas ingenuos que veneran la “mediocridad” parece una experiencia temprana de inmunidad: https://fly.io/blog/youre-all-nuts/
Cuando uso LLM de forma “macro” en mis proyectos, mi pensamiento siempre se deteriora mucho, me quita capacidad de decisión y empeora mi preparación para las adaptaciones necesarias posteriores. En trabajos importantes, los LLM son estrictamente una herramienta microscópica para rellenar huecos.
Esto no es como una calculadora. No se trata de que me quite un algoritmo que me gustaba para hacer cálculos a mano. Es un sistema que reemplaza el pensamiento mismo por no pensamiento, y en todos los ámbitos donde se usa perjudica gravemente la preparación, la profundidad, la adaptabilidad y el sentido de propiedad.
- Creo que una de las capacidades más subestimadas en los negocios es la de entretejer una narrativa coherente.
  Participo en muchas reuniones con ingenieros muy brillantes, pero muchas veces no logran presentar sus argumentos de una forma que puedan seguir tanto personas técnicas como no técnicas. Hay un arte en escribir y hablar, y recién ahora, entrando en la segunda mitad de mis 40, estoy empezando a apreciar de verdad su valor. El lenguaje es una herramienta poderosa, y la elección de una sola palabra a veces puede salvar o arruinar un argumento.
  No veo qué podría hacer un LLM en esta situación salvo empeorarla mucho en general.
- Ya está pasando todo esto. Estoy hablando de ideas recientes con un ingeniero junior en una plataforma de chat, y sus respuestas en tiempo real empiezan a salir de una página de largo y estructuradas con viñetas.
  Lo aterrador no es solo que usen ChatGPT para evitar pensar, sino que crean que nadie se va a dar cuenta, o que así es como conversan normalmente los adultos.
- Me gusta el optimismo de “otra tecnología frente a la cual la sociedad desarrollará inmunidad”. Aunque todavía no hemos desarrollado inmunidad colectiva frente a las tecnologías de redes sociales de la década de 2010, acepto ese optimismo.
- Si la mayor parte de la comunicación valiosa debe venir de personas, también podríamos preguntarnos qué proporción de la comunicación es, en realidad, valiosa.
  En la práctica, creo que hay mucha comunicación con poco valor. Aun así se sigue produciendo, y si nadie la lee, ¿no podría automatizarse su generación?
  Por supuesto, también hay bastantes cosas importantes que sí hay que hacer bien.
- La clave es cuánta comunicación “valiosa” hay.
  Estoy en el ámbito académico, que en teoría debería ser una de las profesiones que más pensamiento exige. Sin embargo, más de la mitad de lo que escribo son todo tipo de informes, solicitudes de financiamiento, solicitudes de ética y gestión de datos, cartas de recomendación y formularios administrativos. Difícilmente son “valiosos” en el sentido de que no requieren pensamiento útil; mientras se cumplan los requisitos tontos, a nadie le importa en absoluto si el texto suena como yo.
  Para estos usos, los LLM son una bendición, y como me permiten dedicar más tiempo a la investigación real y a las clases presenciales, incluso podrían ayudarme a pensar más.
Creo que la discusión sobre la deuda cognitiva aquí es correcta, pero quizá incluso demasiado conservadora.
No se trata del nivel de olvidar una habilidad como el lenguaje o perder memoria espacial por usar GPS. Podría tratarse de una atrofia sistemática e irreversible de las vías neuronales responsables del razonamiento integrado.
El riesgo central no es la “deuda” en sí, con su matiz de que puede pagarse con práctica, sino cruzar un punto de inflexión cognitivo. Es un umbral en el que la función ejecutiva, la síntesis y la argumentación se trasladan en exceso a sistemas externos como los LLM, y el cerebro biológico no solo poda, con eficiencia implacable, las conexiones que no usa, sino que además pierde la metacapacidad de reconstruirlas.
Nuestro hardware biológico húmedo es un sistema de “si no lo usas, lo pierdes” sin control de versiones. Cuando se atrofian funciones cognitivas complejas, el “código fuente” se daña. No hay git revert para las redes neuronales colapsadas que sostenían el pensamiento profundo y estructurado.
Este hilo de HN se concentra en la escritura de ensayos, pero si ampliamos la escala, estamos realizando un enorme experimento incontrolable de externalización de la cognición colectiva. El resultado a largo plazo podría no ser una sociedad de personas menos capacitadas, sino una sociedad de personas estructuralmente incapaces de realizar el tipo de pensamiento que creó nuestro mundo.
Por lo tanto, la pregunta no es “¿cómo evitamos la deuda cognitiva?”. La pregunta realmente aterradora es: “si el recipiente de la mente biológica se optimiza para la pereza de manera tan implacable, quizá irreversible, ¿qué recipiente necesita nuestra mente?”.
https://github.com/dmf-archive/dmf-archive.github.io
- Cada quien debe decidir para qué usa los LLM. Para tareas con mucha fricción y bajo rendimiento, por ejemplo hacer investigación en línea con herramientas de búsqueda deficientes, los modelos de texto me parecen excelentes.
  Son buenos para preguntar lo que uno no sabe o saltarse las “partes aburridas”. En particular, no siento en absoluto que buscar soluciones a problemas técnicos oscuros en varias páginas de foros o redes sociales me haga más inteligente. De todos modos hay que verificar la información y tomarla con cautela.
  StackExchange, tal como fue concebido originalmente, habría sido mucho más valioso que los modelos de texto. Pero las personas reales son imperfectas y cargan con todo tipo de sesgos cognitivos y equipaje, y un LLM no cierra una pregunta por ser “demasiado amplia” justo después de que recibió votos positivos e interacción.
  En cambio, la escritura con LLM sobre temas que conozco bien me sigue pareciendo muy inferior. Por ejemplo, si intento escribir un email, termino dedicando más o menos el mismo tiempo a ajustar el prompt para mantener el rumbo o a reescribir mucho el resultado. Prefiero escribir directamente siguiendo mi propio flujo que corregir o hacer revisión por pares de un modelo de texto.
La IA es lo opuesto a Zettelkasten
En vez de trabajar activamente sobre un tema y obtener insights cada vez más profundos, uno itera rápido pero de forma superficial sobre un corpus de contenido generado por IA.
Por ejemplo, quería entender mejor la situación en Medio Oriente, así que escribí un ensayo de 10 páginas sobre los orígenes de Hamas y Hizbulah con OpenAI como coautor.
Pero no recuerdo nada y, peor aún, no sé si las cosas que recuerdo son alucinaciones que corregí o hechos reales.
- La gente inteligente, en general, sabe que escribir es tanto pensar como obtener un resultado escrito.
  Un LLM puede ser un excelente sparring si se usa no como una herramienta que escribe por uno, sino como una que ayuda a encontrar errores, señalar huecos y fallas, e investigar preguntas generales sobre el mundo. Claro, siempre hay que tener cuidado y verificar las fuentes.
- Soy bastante optimista sobre la utilidad de los LLM, pero estoy de acuerdo con esto.
  Uno desarrolla cierta intuición sobre cómo dirigir el modelo y reducir alucinaciones, pero no está acumulando conocimiento que pueda explicar con claridad ni ejercitando un pensamiento desafiante. Se parece más a aprender respuestas de memoria muscular: ver cierta forma en la salida del LLM y decidir si confiar más en ella, probar otra estrategia de prompt, borrar o no el contexto, etc.
  Aunque se pueda llamar a eso una habilidad, es muy probable que deje de servir en unos años cuando los modelos mejoren. Da una sensación de impotencia como la que podría sentir un trabajador de línea de ensamblaje.
- Tendemos a recordar mejor las partes donde hubo problemas que las cosas que salieron bien, así que supongo que recuerdas las partes que tuviste que corregir tú mismo.
- Me parece interesante la idea de ver la IA como lo opuesto a acceder a conocimiento conectado, es decir, a un Zettelkasten.
Personalmente, el resultado no me sorprende. Cuando uso IA para mi escritura o traducción, no siento que esté mentalmente tan inmerso en el proceso de escribir o traducir como cuando lo hago todo yo mismo.
Pero también descubrí que usar IA de otras maneras puede ser, en sí mismo, muy mentalmente absorbente. Durante las últimas 2 semanas estuve experimentando con Claude Code para ver hasta qué punto puedo automatizar por completo el brainstorming, la investigación y la redacción de ensayos y papers de investigación. Me sumergí tan profundamente como cuando escribo o traduzco por mi cuenta, pero la forma de esa inmersión es distinta.
Los resultados del experimento hasta ahora son bastante buenos. Es decir, incluso sabiendo que los escribió un agente de IA, a menudo me resulta interesante leer los ensayos y papers producidos. Por supuesto, no tengo planes de publicarlos ni compartirlos.
- Uso herramientas de IA para divertirme o para preguntas aleatorias, pero casi nunca para trabajo real.
  Me pregunto si no voy a terminar perteneciendo a un grupo cada vez más raro: gente que todavía puede hacer cosas de verdad, mientras el resto se vuelve cada vez más incompetente.
Que “los participantes del grupo LLM tuvieron un desempeño inferior al grupo Brain-only en todos los niveles: actividad cerebral, lenguaje y puntaje” no sorprende, pero es desolador.
- Parece encajar con la vieja paradoja de la automatización [1].
  Cuando a las personas se les deja el rol de revisar resultados y poner el sello de aprobación, por lo general lo hacen pésimo.
  Hace tiempo que pienso que, para crear un flujo de trabajo de aumento verdaderamente útil, la forma de participación es clave. ¿Revisar código escrito por un LLM? No muy bueno. ¿Que el LLM observe mis cambios y me dé feedback? Es una historia completamente distinta. Puede ser difícil y quizá no muy popular, pero si no logramos de algún modo seguir en el asiento del conductor, el panorama se va a poner bastante oscuro.
  [1]: https://en.m.wikipedia.org/wiki/Ironies_of_Automation
- “Debemos negar a las máquinas pensantes. Los humanos deben establecer sus propias directrices. Eso no es algo que una máquina pueda hacer. ¡El razonamiento depende de la programación, no del hardware, y nosotros somos el programa definitivo! Nuestra yihad es un ‘programa de descarte’: desechar las cosas que nos destruyen como humanos”.
  https://dune.fandom.com/wiki/Butlerian_Jihad
Ahora que hago la mayor parte de la programación con IA, un efecto secundario algo inesperado es que me canso mucho menos y puedo concentrarme por más tiempo.
Me permite sacar trabajo adelante incluso cuando hay otras distracciones. Básicamente, al delegar parte de la capacidad mental en la IA, queda capacidad libre en otros lados.
- A mí me pasa exactamente lo contrario. Me volví mucho más productivo y hago varias cosas en paralelo, y al final del día estoy extremadamente cansado, como si mi cerebro hubiera trabajado al 100% de capacidad.
- Por un lado reduce el cansancio a corto plazo, pero si no tienes cuidado también hay un punto de inflexión en el que aumenta el cansancio en una escala de tiempo más larga.
  Antes, los errores inesperados o tener que revisar documentación funcionaban como “topes” que me hacían tomar aire, y normalmente ahí me daba cuenta de lo agotado que estaba y hacía una pausa.
  Con IA esos topes siguen existiendo, pero a veces aparece un pequeño impulso extra que no me deja desacelerar lo suficiente como para reflexionar sobre cuán cansado estoy.
  Ni siquiera hace falta que la IA tenga razón. A veces, solo leer una sugerencia adaptada a la situación actual dispara mi flujo de pensamiento y cuesta volver a contenerlo.
- Me gusta pensar en la IA como un auto.
  Podrías caminar hasta un Walmart fuera de la ciudad, cargar las cosas y volver, pero con un auto es mucho más rápido y menos cansado. Entonces puedes dedicar más tiempo de calidad a lo que te gusta hacer.
En la época en que los GAN estaban de moda, entrené un modelo generador-discriminador para generación de imágenes.
Después de pensarlo bastante, me di cuenta de que discriminar es mucho más fácil que generar.
Por ejemplo, puedo distinguir una buena UI de una mala, pero ni aunque me suplicaran por mi vida podría crear una buena UI. Sé de inmediato si una película es buena, pero escribir un cuento decente es un trabajo arduo.
Puedo juzgar qué tan realista es un dibujo, pero no puedo dibujar ni una simple bicicleta de forma convincente.
En muchos casos puedo juzgar si lo que genera un LLM es bueno o malo. Entonces, como estrategia burda, puedo descartar los malos resultados y seguir generando hasta alcanzar el objetivo. Los LLM son útiles precisamente por esta brecha entre discriminación y generación.
Estas dos habilidades son distintas. La capacidad de generar es difícil de adquirir y muy valiosa. Si no se sigue entrenando, se atrofiará.
- En casos muy simples, por ejemplo distinguir un dibujo obviamente malo de uno bueno, creo que es cierto.
  Pero no necesariamente en tareas más complejas, sobre todo en áreas que requieren evaluación profunda. Por ejemplo, revisar 5 PR no triviales probablemente sea más difícil y lleve más tiempo que escribirlos uno mismo.
  La razón por la que funciona bien con imágenes o historias cortas es que el filtro que aplicas no es “bueno vs. malo”, sino me gusta vs. no me gusta.
Creemos que es muy probable que aprendamos a tener una relación más saludable con esta tecnología. No sabemos el calendario. Podría tomar generaciones, o podría ocurrir antes de lo que pensamos
Está claro que los modelos de lenguaje son un acelerador puro. Pero si la persona promedio se vuelve más “elocuente”, las señales que indican inteligencia bruta también cambiarán con el tiempo
Nadie quiere tener una relación con un modelo de lenguaje. Pero los modelos de lenguaje pueden ayudar a personas que no están preparadas para lidiar con grandes cambios de vida y frustraciones. Son una herramienta, y basta con saber usarla
Como ejemplo real, veamos los consejos amorosos. Con el tiempo, creo que las “relaciones guiadas por ChatGPT” se dividirán en dos tipos. Uno es el tipo “copiar y pegar”, que solo agrega complejidad a una comunicación que ya era deficiente de por sí; es decir, el tipo de “simplemente copié lo que dijo ChatGPT”. El otro es el tipo “acelerado”, que usa ChatGPT para analizar las motivaciones propias y de la pareja, y encontrar mejores soluciones a problemas comunes
Para juzgar correctamente lo segundo, todavía se necesita cerebro y empatía. Lo primero siempre terminará en desamor. Confío en que la gente acabará entendiendo esta diferencia
- No estoy seguro de la afirmación “nadie quiere tener una relación con un modelo de lenguaje”
  No tengo experiencia directa ni indirecta, pero he escuchado muchos casos de personas que efectivamente caen en una especie de relación con una IA, y también entiendo en cierta medida su atractivo. Puedes tener a “alguien” que no te juzga en absoluto, que siempre está ahí cuando quieres hablar de lo tuyo y que no te exige nada. No se parece en nada a una relación real, pero objetivamente es mejor que las peores relaciones humanas, y posiblemente sea mejor para la salud mental que la soledad
  Para bien o para mal, creo que las relaciones humano-IA aumentarán rápidamente durante los próximos 10 años. Por un lado, habrá mejoras en la memoria y la capacidad de planificación a largo plazo, y quizá también en cuerpos robóticos; por el otro, se extenderá la epidemia de soledad
A esto se le llama descarga cognitiva. Quien haya trabajado suficiente tiempo con herramientas de asistencia para programar lo reconocerá
- O también se puede reconocer trabajando como gerente de ingeniería
  Es una consecuencia inevitable de trabajar en un nivel de abstracción más alto. No es el fin del mundo. Mis habilidades en assembly también se han oxidado

La deuda cognitiva que se acumula al escribir ensayos con asistentes de IA

El costo cognitivo del LLM medido en la escritura de ensayos

Participantes y diseño de las sesiones

Métodos de medición

Resultados EEG: a mayor apoyo externo, menor conectividad cerebral

Características de los ensayos reveladas por el análisis lingüístico

Sentido de propiedad, memoria y capacidad de citar

Diferencias en el experimento de cambio de la 4.ª sesión

Conclusiones y limitaciones

Lecturas relacionadas

1 comentarios

Opiniones de Hacker News