El cansancio de hablar con herramientas
(ohadravid.github.io)- Los LLM no funcionan como buenas herramientas que se vuelven parte del cuerpo, como un teclado o un auto, sino más bien como interlocutores que exigen pedidos y negociación, consumiendo la energía social del usuario
- Las buenas herramientas, gracias a su consistencia y velocidad, hacen que el cerebro las acepte como una extensión del cuerpo, pero los LLM como Claude o Cursor todavía no llegan a ese nivel
- Los usuarios de LLM terminan pidiendo, persuadiendo y a veces hasta enojándose, como si hablaran con personas, pagando así un costo social
- Interactuar con personas da recompensas como aprendizaje, desafío, inspiración o refutación, pero los LLM en general devuelven más código, más pruebas, excusas y, a veces, reportes de errores
- Algunas tareas ya son posibles a un nivel que hace un año era difícil para una sola persona, pero no está claro si gastar energía social en un LLM es mejor que usarla con colegas reales en todos los casos
LLM que dejan de ser herramientas para volverse interlocutores
- Los LLM cansan porque requieren energía social para hacerlos funcionar
- Puede que esa energía esté mejor invertida en la interacción con personas reales
- Cuando usamos buenas herramientas, el cerebro las incorpora como si fueran parte del cuerpo
- Conducir un auto
- Escribir en un teclado
- Ejecutar tareas en Vim o VSCode con combinaciones de teclas
- En cambio, al hablar con personas entramos en un modo de conciencia social
- Conversamos
- Pedimos ayuda
- Colaboramos para que un ticket no se pase al siguiente trimestre
- Este trabajo mental social es más difícil que usar una herramienta simple y exige más energía
Lo que devuelven los LLM y la falta de recompensa
- Los LLM no ofrecen la magia de una herramienta como la de un teclado o un auto
- Casi nadie diría que Claude o Cursor se sienten como una extensión del cuerpo
- No tienen suficiente consistencia ni velocidad como para que el cerebro los asimile como una herramienta
- En cambio, el usuario termina conversando, negociando, persuadiendo y a veces enojándose con el LLM, pagando un impuesto social
- Vale la pena asumir ese costo social con personas porque la recompensa suele ser mayor
- Uno puede aprender algo nuevo o ser desafiado
- Puede encontrar inspiración
- Si uno dice tonterías, la otra persona puede rechazarlo
- Y también puede enseñar, desafiar o inspirar a alguien más
- Los LLM por lo general devuelven más código, más pruebas y más excusas
- A veces también entregan más reportes de errores, y eso sí puede ser valioso
- En algunas tareas, gracias a los LLM, una sola persona puede hacer cosas que hace un año eran imposibles
- Pero no está claro que en todas las tareas sea adecuado gastar trabajo mental social en conversar con un LLM
- Los LLM exigen que el usuario les hable, pero rara vez entregan una recompensa proporcional a ese esfuerzo
1 comentarios
Opiniones en Lobste.rs
En mi caso, hablar con una IA ya se volvió como una segunda naturaleza. Ahora abro como 10 chats al día con todo tipo de preguntas, y casi ni lo noto
El flujo de poner una pregunta, leer, responder y volver a leer se parece a buscar en Google. Igual que manejar, cuando las manos ya se mueven solas, hablar con una IA al menos para mí empezó a ocupar ese mismo lugar
Porque hace demasiado por ti en lo de encontrar fuentes y conectar conocimientos. Claro, está bien cuando quieres obtener rápido una respuesta de poca importancia, pero en general creo que hay que mantener afilada la capacidad de investigar
También le hago preguntas al codebase cuando tengo dudas específicas, pero eso para mí se parece más a preguntarle a un colega. Porque hay que pensar cómo formularlo, a veces hay que repreguntar con más detalle, y de vez en cuando recibes una respuesta falsa y tienes que reformular otra vez
Dependiendo de cómo los uses, terminas delegando casi todo el pensamiento, así que también existe el riesgo de deterioro de capacidades. Habría que intentar depender menos de los LLM, no más
Sobre lo de la “recompensa”, vi algo interesante hace unos días. Estoy trabajando con dos programadores junior, y para mí es un equilibrio bastante difícil. Me gusta animar a la gente, pero al hacer coaching a gente junior también tengo que evaluar su trabajo críticamente
Por eso busco oportunidades para felicitarlos, pero al revisar trabajo hecho apoyándose en un LLM me di cuenta de que el LLM me quitó la oportunidad de elogiar y ayudar a crecer. No puedo distinguir qué parte fue generada y qué parte es resultado de algo que realmente aprendieron
Al final terminas criticando el trabajo que hizo el LLM y diciendo “haz que el LLM haga más/menos”, o la otra persona se pone a la defensiva con un “pero el LLM dijo esto”. Sinceramente, eso me hace replantear el valor mismo del code review. Ahora que todos tienen su propio “compa de código” virtual, parece que se redujeron las oportunidades de compartir conocimiento mediante revisiones de código
Ambos niveles admiten retroalimentación, pero en el segundo todavía no hay expertos, así que se parece más a una colaboración. Aun así, la primera regla es clara. Si no puedes explicar el motivo y el contenido del cambio más allá de “el LLM dijo eso”, se rechaza y hay que rehacerlo
Estoy de acuerdo en que estar arreando a un LLM cansa, pero no se compara con manejar. Llevo más de 30 años manejando legalmente, pero si tuviera que manejar durante toda la jornada laboral, probablemente necesitaría descansar al día siguiente
No solo te preocupas por tus propios errores, sino que tu vida puede correr peligro por la temeridad y la incompetencia de otros conductores. Supongo que también importa dónde manejas 😅
Si sigo la definición de herramienta del autor, para mí Firefox no calificaría como herramienta, y con ese criterio Chromium es activamente malicioso y hostil
Me da la impresión de que la discusión sobre el ahorro/gasto de energía mental alrededor de los LLM es muy multidimensional. Está el grado en que uno se siente atraído de inmediato por chatear como con una persona o por algo que no tiene una mente persistente, y encima de eso se suman las tendencias introvertidas/ambivertidas/extrovertidas. También importa si tu pensamiento se parece más o menos al lenguaje lineal, así que un LLM puede estar reemplazando el pensamiento o puede estar reemplazando la tarea de traducir el pensamiento real a convenciones molestas de comunicación humana. También está la diferencia entre velocidad de lectura y velocidad de tipeo
Sobre la persona social y la conversación de ida y vuelta de la que habla el texto, yo no leo bien a las personas y tampoco puedo deshacer a una persona, así que pedirle algo a un LLM no se parece en nada a una conversación humana. Puedo mirar las partes verbosas antes de la respuesta para ver cómo se interpretó la ambigüedad de mi frase, y puedo reescribir la última solicitud manteniendo el principio de la conversación para evitar una mala interpretación. Después incluso puedo reescribir las respuestas previas del propio LLM en el historial para guiar la respuesta posterior
Puede que los LLM alojados sean menos entusiastas a la hora de dejarte reescribir por completo pensamientos relacionados con la seguridad, pero esa es otra razón más para usar solo modelos locales. El mero hecho de ser servicios alojados por oligopolios, con cambios de comportamiento sin aviso y pesos ocultos, ya da suficientes razones para evitarlos
Claro, aunque puedas hacer ese tipo de manipulación con un humano, sería algo malo. Los humanos tienen una personalidad duradera. Por eso a veces es menos cansado conversar con una herramienta que no está diseñada para tener una mente persistente. Si hablo demasiado corto y seco, a la herramienta no le molesta
Y el consejo actual, ¿no es que casi siempre conviene más reescribir la consulta inicial para evitar errores, en vez de dejar malentendidos en el contexto como en una conversación humana y luego tener que explicarlos?
Me gusta hablar con Claude, y como fue entrenado para ser muy amable de acuerdo con las preferencias humanas, supongo que a mucha gente le pasa algo parecido