El cansancio de hablar con herramientas

(ohadravid.github.io)

2 puntos por GN⁺ 7 시간 전 | 1 comentarios | Compartir por WhatsApp

Los LLM no funcionan como buenas herramientas que se vuelven parte del cuerpo, como un teclado o un auto, sino más bien como interlocutores que exigen pedidos y negociación, consumiendo la energía social del usuario
Las buenas herramientas, gracias a su consistencia y velocidad, hacen que el cerebro las acepte como una extensión del cuerpo, pero los LLM como Claude o Cursor todavía no llegan a ese nivel
Los usuarios de LLM terminan pidiendo, persuadiendo y a veces hasta enojándose, como si hablaran con personas, pagando así un costo social
Interactuar con personas da recompensas como aprendizaje, desafío, inspiración o refutación, pero los LLM en general devuelven más código, más pruebas, excusas y, a veces, reportes de errores
Algunas tareas ya son posibles a un nivel que hace un año era difícil para una sola persona, pero no está claro si gastar energía social en un LLM es mejor que usarla con colegas reales en todos los casos

LLM que dejan de ser herramientas para volverse interlocutores

Los LLM cansan porque requieren energía social para hacerlos funcionar
Puede que esa energía esté mejor invertida en la interacción con personas reales
Cuando usamos buenas herramientas, el cerebro las incorpora como si fueran parte del cuerpo
- Conducir un auto
- Escribir en un teclado
- Ejecutar tareas en Vim o VSCode con combinaciones de teclas
En cambio, al hablar con personas entramos en un modo de conciencia social
- Conversamos
- Pedimos ayuda
- Colaboramos para que un ticket no se pase al siguiente trimestre
Este trabajo mental social es más difícil que usar una herramienta simple y exige más energía

Lo que devuelven los LLM y la falta de recompensa

Los LLM no ofrecen la magia de una herramienta como la de un teclado o un auto
- Casi nadie diría que Claude o Cursor se sienten como una extensión del cuerpo
- No tienen suficiente consistencia ni velocidad como para que el cerebro los asimile como una herramienta
En cambio, el usuario termina conversando, negociando, persuadiendo y a veces enojándose con el LLM, pagando un impuesto social
Vale la pena asumir ese costo social con personas porque la recompensa suele ser mayor
- Uno puede aprender algo nuevo o ser desafiado
- Puede encontrar inspiración
- Si uno dice tonterías, la otra persona puede rechazarlo
- Y también puede enseñar, desafiar o inspirar a alguien más
Los LLM por lo general devuelven más código, más pruebas y más excusas
- A veces también entregan más reportes de errores, y eso sí puede ser valioso
En algunas tareas, gracias a los LLM, una sola persona puede hacer cosas que hace un año eran imposibles
Pero no está claro que en todas las tareas sea adecuado gastar trabajo mental social en conversar con un LLM
Los LLM exigen que el usuario les hable, pero rara vez entregan una recompensa proporcional a ese esfuerzo

1 comentarios

GN⁺ 7 시간 전

Opiniones en Lobste.rs

En mi caso, hablar con una IA ya se volvió como una segunda naturaleza. Ahora abro como 10 chats al día con todo tipo de preguntas, y casi ni lo noto
El flujo de poner una pregunta, leer, responder y volver a leer se parece a buscar en Google. Igual que manejar, cuando las manos ya se mueven solas, hablar con una IA al menos para mí empezó a ocupar ese mismo lugar
- Yo también la uso de forma parecida, pero últimamente complemento cada vez más con Brave Search. Siento que depender demasiado de un LLM puede atrofiar a largo plazo la capacidad de investigar
  Porque hace demasiado por ti en lo de encontrar fuentes y conectar conocimientos. Claro, está bien cuando quieres obtener rápido una respuesta de poca importancia, pero en general creo que hay que mantener afilada la capacidad de investigar
- No incluiría esto en el flujo general de vibe coding. De acuerdo. A mí también me resulta bastante liviano abrir un chat como quien hace una búsqueda en Google para averiguar algo, mantener las preguntas cortas y no empezar largas conversaciones de ida y vuelta
  También le hago preguntas al codebase cuando tengo dudas específicas, pero eso para mí se parece más a preguntarle a un colega. Porque hay que pensar cómo formularlo, a veces hay que repreguntar con más detalle, y de vez en cuando recibes una respuesta falsa y tienes que reformular otra vez
- Considerando que los LLM alucinan con frecuencia, no me parece que eso sea algo bueno. Recuerdo haber visto un estudio donde casi la mitad de las respuestas de los LLM no eran correctas, y no me da la impresión de que esa cifra haya mejorado mucho desde entonces
  Dependiendo de cómo los uses, terminas delegando casi todo el pensamiento, así que también existe el riesgo de deterioro de capacidades. Habría que intentar depender menos de los LLM, no más
Sobre lo de la “recompensa”, vi algo interesante hace unos días. Estoy trabajando con dos programadores junior, y para mí es un equilibrio bastante difícil. Me gusta animar a la gente, pero al hacer coaching a gente junior también tengo que evaluar su trabajo críticamente
Por eso busco oportunidades para felicitarlos, pero al revisar trabajo hecho apoyándose en un LLM me di cuenta de que el LLM me quitó la oportunidad de elogiar y ayudar a crecer. No puedo distinguir qué parte fue generada y qué parte es resultado de algo que realmente aprendieron
Al final terminas criticando el trabajo que hizo el LLM y diciendo “haz que el LLM haga más/menos”, o la otra persona se pone a la defensiva con un “pero el LLM dijo esto”. Sinceramente, eso me hace replantear el valor mismo del code review. Ahora que todos tienen su propio “compa de código” virtual, parece que se redujeron las oportunidades de compartir conocimiento mediante revisiones de código
- Cuando entra un LLM, el enfoque sí tiene que cambiar. Ahora hay dos niveles en la revisión: el cambio de código en sí y la forma en que se usó la herramienta para producir ese cambio
  Ambos niveles admiten retroalimentación, pero en el segundo todavía no hay expertos, así que se parece más a una colaboración. Aun así, la primera regla es clara. Si no puedes explicar el motivo y el contenido del cambio más allá de “el LLM dijo eso”, se rechaza y hay que rehacerlo
Estoy de acuerdo en que estar arreando a un LLM cansa, pero no se compara con manejar. Llevo más de 30 años manejando legalmente, pero si tuviera que manejar durante toda la jornada laboral, probablemente necesitaría descansar al día siguiente
No solo te preocupas por tus propios errores, sino que tu vida puede correr peligro por la temeridad y la incompetencia de otros conductores. Supongo que también importa dónde manejas 😅
- Eso me parece mucho más cercano a estar rodeado de desconocidos que hacen algo con consecuencias fatales al manipular esa experiencia de usuario, que a la usabilidad de la experiencia de usuario automotriz en sí
Si sigo la definición de herramienta del autor, para mí Firefox no calificaría como herramienta, y con ese criterio Chromium es activamente malicioso y hostil
Me da la impresión de que la discusión sobre el ahorro/gasto de energía mental alrededor de los LLM es muy multidimensional. Está el grado en que uno se siente atraído de inmediato por chatear como con una persona o por algo que no tiene una mente persistente, y encima de eso se suman las tendencias introvertidas/ambivertidas/extrovertidas. También importa si tu pensamiento se parece más o menos al lenguaje lineal, así que un LLM puede estar reemplazando el pensamiento o puede estar reemplazando la tarea de traducir el pensamiento real a convenciones molestas de comunicación humana. También está la diferencia entre velocidad de lectura y velocidad de tipeo
Sobre la persona social y la conversación de ida y vuelta de la que habla el texto, yo no leo bien a las personas y tampoco puedo deshacer a una persona, así que pedirle algo a un LLM no se parece en nada a una conversación humana. Puedo mirar las partes verbosas antes de la respuesta para ver cómo se interpretó la ambigüedad de mi frase, y puedo reescribir la última solicitud manteniendo el principio de la conversación para evitar una mala interpretación. Después incluso puedo reescribir las respuestas previas del propio LLM en el historial para guiar la respuesta posterior
Puede que los LLM alojados sean menos entusiastas a la hora de dejarte reescribir por completo pensamientos relacionados con la seguridad, pero esa es otra razón más para usar solo modelos locales. El mero hecho de ser servicios alojados por oligopolios, con cambios de comportamiento sin aviso y pesos ocultos, ya da suficientes razones para evitarlos
Claro, aunque puedas hacer ese tipo de manipulación con un humano, sería algo malo. Los humanos tienen una personalidad duradera. Por eso a veces es menos cansado conversar con una herramienta que no está diseñada para tener una mente persistente. Si hablo demasiado corto y seco, a la herramienta no le molesta
Y el consejo actual, ¿no es que casi siempre conviene más reescribir la consulta inicial para evitar errores, en vez de dejar malentendidos en el contexto como en una conversación humana y luego tener que explicarlos?
Me gusta hablar con Claude, y como fue entrenado para ser muy amable de acuerdo con las preferencias humanas, supongo que a mucha gente le pasa algo parecido

El cansancio de hablar con herramientas

LLM que dejan de ser herramientas para volverse interlocutores

Lo que devuelven los LLM y la falta de recompensa

Lecturas relacionadas

1 comentarios

Opiniones en Lobste.rs