Empleados de Amazon están inventando trabajo ante la presión por usar IA

(fastcompany.com)

1 puntos por GN⁺ 2 시간 전 | 1 comentarios | Compartir por WhatsApp

Los empleados de Amazon están bajo presión para meter más IA en su trabajo, pero como no está claro dónde aplicarla, se está generando trabajo innecesario
Algunos empleados están usando la herramienta interna MeshClaw para crear agentes que aumenten la actividad de IA, más que para mejorar la productividad
Los empleados creen que el seguimiento del consumo de tokens de IA ha creado un ambiente donde se prioriza el uso por encima de la calidad
Amazon afirmó que no existe una métrica de IA a nivel de toda la empresa ni una tabla de clasificación interna, pero empleados dicen que sí hay una meta de uso del 80% y seguimiento
OpenClaw y MeshClaw se ejecutan de forma local, lo que les da más independencia, pero el riesgo puede aumentar si se les otorgan permisos de acceso excesivos

Presión por usar IA y uso de MeshClaw

Los empleados de Amazon están bajo presión para incluir más IA en sus flujos de trabajo, pero no está claro dónde debería aplicarse, así que crece la posibilidad de que los recursos de IA se usen en tareas innecesarias
Según un reporte de Financial Times, algunos empleados de Amazon están usando la herramienta interna de IA MeshClaw para crear agentes de IA innecesarios que aumenten la actividad de IA, en vez de mejorar la productividad
Un empleado dijo: “Hay demasiada presión para usar estas herramientas”, y señaló que algunos usan MeshClaw para maximizar el uso de tokens

Diferencias alrededor de las métricas de uso

Los empleados creen que, al rastrear el consumo de tokens de IA, Amazon ha hecho que algunos colegas prioricen la cantidad sobre la calidad en el uso de la tecnología
Varios empleados anónimos de Amazon creen que el entorno laboral está empeorando a medida que aumentan las expectativas de uso de IA
Al parecer, Amazon informó a sus empleados que las estadísticas de uso de IA no se incluyen en las evaluaciones de desempeño, pero no todos los empleados lo creen
Otro empleado considera que el seguimiento del uso crea incentivos perversos y hace que algunos empleados actúen de forma muy competitiva
Los empleados entrevistados dijeron que la empresa tiene la meta de que 80% de los desarrolladores usen IA cada semana, y que el consumo de tokens de los empleados se rastrea en una tabla de clasificación interna
Un portavoz de Amazon declaró que no existe una métrica de IA a nivel de toda la empresa ni una tabla de clasificación interna donde se compare a los empleados entre sí
Según Amazon, los empleados pueden ver su propio uso de IA en un panel personal

OpenClaw y los riesgos de la ejecución local

MeshClaw, que algunos empleados de Amazon usan para inflar el uso de IA, es una herramienta inspirada en otra herramienta de IA llamada OpenClaw
A diferencia de otros modelos de IA, OpenClaw y MeshClaw se ejecutan localmente en el propio hardware del usuario, lo que les da mayor independencia
A inicios de este año, la directora de alineación de Meta Superintelligence Labs llamó la atención por un incidente en el que OpenClaw estuvo a punto de borrar toda su bandeja de entrada de correo, lo que dejó en evidencia los riesgos de darle a la IA permisos de acceso excesivos

1 comentarios

GN⁺ 2 시간 전

Opiniones de Hacker News

No es solo Amazon; da la impresión de que las grandes tecnológicas en general y hasta algunas empresas pequeñas se están volviendo locas al mismo tiempo
Es parecido a una situación en la que el CEO un día diga: “Hay que incentivar el gasto en viáticos, así que reserven tantos viajes como puedan y gasten lo máximo posible. Vuelen en primera clase cuando vayan a oficinas satélite, tomen limusina en vez de Uber y coman en restaurantes caros. Si no gastan suficiente en viáticos, recibirán una calificación baja en la evaluación de desempeño”
Estamos viviendo tiempos completamente anormales
- Por eso terminé creando una nueva herramienta CLI, Burn, Baby, Burn: https://github.com/dtnewman/burn-baby-burn/tree/main
  Si yo fuera vicepresidente de Amazon, hasta consideraría una oferta de adquisición, y además estoy trabajando en una versión enterprise con funciones extra
  Show HN: https://news.ycombinator.com/item?id=48151287
- A alguien le dijeron que usara más IA en el trabajo, así que creó un agente que solo quema tokens, y al parecer usó unas 10 veces más que el siguiente empleado que más usaba
  Pensó que lo iban a regañar, pero en cambio lo reconocieron e incluso le pidieron una breve presentación para compartir con otros empleados cómo había logrado ese “éxito”
- En nuestra empresa, el gasto en IA sí entra en la evaluación de desempeño, y nos dijeron que ya llegó la “singularidad”
  Ahora el 20% del gasto en infraestructura son tokens, y el número semanal de pull requests por desarrollador subió de 4.2 a 5.1
  Buena parte de eso son agentes cambiando una o dos líneas en archivos de configuración, así que todo esto se siente como puro pensamiento mágico
- Mi papá trabajó a inicios de los 90 en una empresa que tenía su propia agencia de viajes, y muchas veces le reservaban vuelos más caros porque así la agencia ganaba más dinero
  Incluso cuando en otra aerolínea la primera clase salía más barata, la política de la empresa no permitía volar en primera clase
  Siempre hemos vivido en tiempos anormales
- Puede que algunas empresas se hayan tragado el marketing de que la IA va a volver a todos sus empleados 10,000 veces más productivos y les va a ahorrar miles de millones de dólares
  Como eso no está ocurriendo, parece que asumen que es porque los empleados no están usando esa IA mágica con suficiente frecuencia
  Las empresas que desarrollan sus propios productos de IA también podrían querer que sus empleados usen IA lo máximo posible para obtener datos de entrenamiento que eventualmente reemplacen a la mayoría o a todos ellos
  Castigar a empleados que se niegan a entrenar su propio reemplazo por IA puede tener sentido para ellos si consideran que, aunque hoy cueste dinero, el ahorro futuro será muchísimo mayor
Hace unos 6 meses, un empleado de AWS nos dio una presentación sobre herramientas de IA para nuestro caso de uso
En medio de la presentación, de repente mostró en pantalla compartida cuánto había gastado en tokens ese mes y dijo: “Miren cuánto usé este mes. Le doy durísimo a Opus”, y la cifra era insultantemente grande
En ese momento pensé: “Qué forma tan rara de presumir. ¿No es una señal de alerta que esto sea tan caro y aun así estés orgulloso de usarlo tanto?”
Luego mostró varios casos de uso de Claude Code para administrar y ajustar infraestructura de AWS, pero a mis ojos de sysadmin de barba gris, más viejo que internet, todo se veía como “usó IA para hacer algo que se resuelve con un solo comando”
Así que esta historia sí cuadra. Al parecer ya desde hace 6 meses los estaban incentivando a usarlo a lo loco
- Muchas sugerencias de Cursor son cosas que el linter debería corregir automáticamente
  Pero si presionas tab, esa línea cuenta como una línea editada por IA
  Y gran parte del resto también son cosas que ya podrías hacer a velocidad parecida si hubieras aprendido multicursor, navegación en vim y macros
  En la práctica, nunca aprendí eso porque nunca fui tan lento como para que subir código a la pantalla fuera el cuello de botella
- Todavía no sé cómo reconciliar estos casos con las historias de que el desarrollo asistido por agentes de IA generativa es ahora la única forma de trabajar, sobre todo en startups
  Supongo que no es algo binario y que dependerá de muchos factores, pero igual es raro ver reportes tan distintos al mismo tiempo
- Es muy probable que muchos grandes inversionistas estén profundamente metidos no solo en varias tecnológicas, sino también en OpenAI y Anthropic
  Si es así, ya se entiende de dónde vienen estas directrices y por qué no son más cautelosas o equilibradas
- Con el tiempo, cuando se acumulan capas de abstracción, las generaciones posteriores dejan de entender las capas inferiores
  Eso es una gran debilidad en el desarrollo de sistemas y puede convertirse en una enorme superficie de ataque para un adversario
- Que “usó IA para hacer algo que se resolvía con un solo comando” en realidad es algo bueno
  Gran parte del valor de la IA está justo ahí
  Ahora ya no hace falta conocer ese comando; basta con entender el contrato funcional para poder realizar la tarea necesaria
  Es un cambio enorme
Están apareciendo muchas historias de gente que “tenía que usar tokens y los quemó en cosas inútiles”, y eso es difícil de creer en medio de una emergencia climática
Si seguimos empujando, hasta podríamos llegar a 3 grados de calentamiento
Me recuerda a la historia de cómo la URSS casi llevó a las ballenas a la extinción intentando cumplir cuotas de carne de ballena que nadie quería comer
- Mientras más de arriba hacia abajo se vuelve la economía, más se siente soviética
  En la práctica ya existe una planificación centralizada y con ella llegan las mismas patologías del sistema; la diferencia con la URSS es solo que nuestro GOSPLAN lo dirigen unos cuantos que se hicieron ricos por accidente o sobornando a la persona correcta
- Entonces, ¿para esto están arrasando bosques enteros para construir nuevos centros de datos?
  Ni siquiera por una mejora de productividad “real”, sino simplemente para gastar tokens
- No hay de qué preocuparse. Seguimos usando popotes de papel, porque eso sí es lo verdaderamente importante
  Si no quemas tokens, no cumples las métricas y te pueden colgar la etiqueta de ludita y correrte antes de que la IA te quite el empleo
  Estoy de acuerdo en que esta tendencia y los belicistas están destruyendo el planeta
- La URSS representaba solo alrededor del 15% de la captura mundial de ballenas, y el primer lugar era Japón
  Además, la afirmación de que “nadie quería comerla” tampoco tiene mucho sustento
- Pero al final, ¿qué se puede hacer? Yo tampoco quiero que me castiguen en la empresa
  Por suerte trabajo del lado de administración de apps, y descubrí que solo pueden ver la última fecha de uso, así que con una sola consulta al día estoy bien
  Pero ya estoy realmente harto de este sobrecalentamiento de la IA
Trabajo en una empresa FAANG, aunque no en Amazon, y he escuchado muchas historias así tanto por dentro como por fuera
Pero lo importante es que jamás he oído que la gente realmente importante, o sea el liderazgo, lo diga de manera oficial
Siempre empieza como rumor o con algún dashboard o métrica armada por alguien dentro de la empresa y luego va creciendo
También he escuchado a líderes decir: “Eso no es lo que estamos observando, y no deben desperdiciar tokens caros”
Claro, antes sí han usado métricas tontas como líneas de código o número de commits sin admitirlo del todo, pero no creo que sea algo tan simple como más tokens siempre es mejor
- Yo también estoy en FAANG, y en la reunión semanal de managers el liderazgo promueve aumentar el uso de tokens
  Cuando les discutimos, el liderazgo reconoce que el gasto en tokens no es una buena métrica y que la gente probablemente la va a manipular, pero de inmediato vuelve a decirnos que incrementemos el gasto en tokens de nuestros equipos
  Sé que existe un dashboard de seguimiento de tokens que el liderazgo revisa, porque lo muestran directamente en las reuniones
  Al menos todavía no lo han hecho público para todos como si fuera una tabla de posiciones
  Circulan muchos rumores de que el gasto en tokens va a entrar en la evaluación de desempeño, y el liderazgo lo niega, pero acto seguido siguen convocando reuniones sobre lo importante que es subir ese gasto y comentando las carencias que se ven en el dashboard
- Estoy en un gran grupo de pares de engineering managers, y el uso excesivo de tokens de IA se está volviendo un problema cada vez mayor
  En las empresas donde hacen rankings de uso de tokens o insinúan que podrían despedir ingenieros por negarse a usar herramientas de IA, el problema explota
  Entonces empieza una competencia por gastar la mayor cantidad posible de tokens para sobrevivir
  Se nota especialmente entre desarrolladores que consumen muchas redes sociales
  En Twitter, Threads, Mastodon, LinkedIn y otras plataformas se reciclan sin parar historias virales sobre volverse AI-native y despedir a quien no use suficiente IA, y los desarrolladores ansiosos sienten que, para evitar una reestructuración inevitable, tienen que quemar tokens más rápido que sus colegas
- Dejé FAANG hace poco, y justo antes de irme el director de nuestra organización fue reprendido por el VP de su línea de reporte porque el uso de tokens de la organización era bajo
  Después de eso, a los contribuidores individuales de la organización les dijeron que debían usar IA para todo y que, si no lo hacían, podría afectarles en la carrera
- En consultoría enterprise también se está poniendo cada vez más ridículo
  Siguen imponiendo capacitaciones, talleres y hackatones obligatorios para “motivar” el uso de IA en el trabajo cotidiano
  Incluso para cosas que se resuelven fácil con un script de shell, preguntan: “¿Cómo podríamos convertir esto en un agente?”
- En nuestra empresa sí viene directamente del liderazgo
  Gastaron mucho dinero en Copilot, así que quieren ver a la gente usándolo
También es posible que el objetivo sea justamente hacer que la gente juegue con la métrica
Si empujas a todos a usar más IA, van a probar cosas, experimentar y “desperdiciar” tiempo mientras aprenden
Ese es el objetivo final
Por ahora están gastando tokens en cosas inútiles mientras descubren para qué sí sirve, y también necesitan aprender así para qué no sirve
En nuestra empresa están haciendo lo mismo
- Si les dices que instalen meshclaw y se pongan a gastar tokens a lo bestia, entonces ya es otra historia
- Exactamente ese es el punto
  Puede ser desperdiciador, pero es la forma más rápida de explorar dónde la IA realmente puede ser útil para el negocio
  Aunque el 80% de los empleados solo desperdicie tokens, el otro 20% sí está encontrando la manera
- Perdón, pero eso es una locura
  Si tienes tanto dinero como para quemarlo, seguramente también puedes imaginar formas peores de gastarlo, pero hablando en serio, es una tontería
  ¿Cuándo antes las empresas habían gastado millones de dólares y tiempo de su gente en una herramienta solo para “descubrir qué utilidad podría tener”?
  Es una solución en busca de un problema
  Si al principio ni siquiera está claro qué problema resuelve la herramienta, hay que descartarla y seguir adelante
  Ese dinero sobrante sería mejor dárselo a empleados y accionistas
Qué pena que la IA ya tenga un programa de empleo básico universal, mientras que los humanos todavía no
Las empresas están pagando para que una IA cave hoyos y otra IA los vuelva a tapar
[1] https://locusmag.com/feature/cory-doctorow-full-employment/
- Eso ya ha pasado antes
  La URSS logró hace mucho el 100% de empleo[0], junto con la pobreza que venía incluida
  Esto no es igual porque no se financia con impuestos
  Son empresas privadas experimentando con su propio dinero y asumiendo el riesgo de que luego sus costos suban y los clientes se vayan a otra parte
  Eso es mucho mejor que darle dinero a la gente mediante impuestos obligatorios sin relación con la productividad
  [0] https://nintil.com/the-soviet-union-achieving-full-employmen...
Dentro de Amazon, al usar Kiro, el uso de tokens está gamificado
Porque no es como en AWS, donde el costo se le cobra al equipo, ni como en el sistema anterior, donde tenías que justificar capacidad
Antes de que nadie viera rankings internos, ya escuchaba historias bastante creíbles de que la gente manipulaba esa métrica, y además hay muchos usuarios entusiastas armando y compartiendo toda clase de proyectos internos
Sin duda, los managers que escuchan en presentaciones internas cosas como mejoras de productividad del N00% sí están metiendo presión, pero donde yo estoy detectarían bastante rápido si alguien se inventa trabajo falso en vez de hacer trabajo real
La presión viene más bien de plazos agresivos y del cambio hacia una forma más ágil dentro del proceso anual OP1
También he escuchado historias parecidas de empleados de AWS y de otras FAANG no relacionadas con AWS
Todos los rankings de tokens vienen con un descargo de responsabilidad que dice “esto no se usará en la evaluación de desempeño”, pero da la sensación de que detrás hay un guiño implícito
En una organización de la que oí hablar, hay alguien que deja GasTown corriendo 24/7 tragándose tokens
Aporta poco, pero ocupa cómodamente el primer lugar
- Varias personas me han contado que incluso en organizaciones medianas y pequeñas el uso de tokens y la adopción de IA se han vuelto el centro de la evaluación de desempeño
- Mi manager en una empresa de 400 personas es exactamente así
  Deja GasTown corriendo y hace que los agentes toquen partes del codebase por todos lados, así que termina con unas 50 confirmaciones al día
  Cosas como versiones compatibles, formato y similares
  Pero el problema no es la tecnología, sino él
  Ya era así incluso antes de los LLM
  Solía “refactorizar” repositorios en otros más pequeños para que de pronto su nombre apareciera por todo el código, y a simple vista parecía que él había creado grandes partes del codebase de la empresa
  Rechazaba cosas que yo quería hacer y luego más tarde las hacía él mismo
  A mis pull requests les encontraba defectos infinitos o directamente decía que no debíamos hacer ese trabajo, para luego darse la vuelta e implementarlo él mismo
  No copia y pega mi código, pero después de que mi PR ya está abierto, vuelve a implementar la misma idea que antes había rechazado
  Es muy inteligente, pero también muy deshonesto, y sabe ocultarlo bien
  Si le preguntas, responde cosas como “me pareció que así se vería más ordenado”
  Desde fuera, siempre hay margen para decir que una forma era mejor que la otra, así que la deshonestidad no se ve tan clara, pero yo observo al 100% lo que hace y el patrón es totalmente evidente
  Además, una vez dije que quería tomar vacaciones en cierta semana; no me las negó explícitamente, pero dijo que había mucha presión por entregar The Thing y preguntó si podía moverlas
  Yo dije: “No, no las voy a mover”, y entonces las aprobó, pero cuando llegó esa semana, él mismo también se fue de vacaciones en esas mismas fechas
  No lo confronté por eso. Ya sabía bastante bien que no le da vergüenza exigirles a otros cosas que él jamás aceptaría para sí mismo
Si un portavoz de Amazon dijo que no existe una métrica corporativa de uso de IA, ni rankings internos para comparar empleados, y que en los dashboards personales cada quien solo puede ver su propio uso, entonces eso es una completa mentira
Existe un dashboard global que clasifica por empleado el uso de Kiro/QuickSuite (antes Amazon Q) según tokens
El dashboard en sí está en QuickSight, que de todas maneras ahora también forma parte de QuickSuite
Los datos no solo están abiertos para cualquiera, sino que además se pueden ordenar por ranking y por uso diario, semanal, mensual y anual
Incluye tanto a empleados actuales como a exempleados usando sus aliases internos
Encima de eso, también hay un sistema interno de “premios” que aparece en el perfil de PhoneTool, donde cada empleado recibe títulos de Kiro/AmazonQ/Quicksuite como “Blaze” o “Thunderstorm”
Y con solo hacer clic también puedes ver a otras personas que recibieron el mismo premio
Para contexto, PhoneTool es un directorio interno de perfiles para buscar a otros empleados
Mientras tanto, conozco a varias personas que no pueden escribir código decente por sí solas ni integrar nada directamente
Gente a la que siempre hay que llevar de la mano está generando cantidades enormes con Kiro/AmazonQ y hoy aparece por encima de SDE reales en el ranking
Son más bien gente de SysDev, ingenieros de soporte o TPM que SDE
Eso en sí no es automáticamente bueno ni malo, pero si haces stack ranking por uso de tokens, es muy probable que un buen ingeniero que se esfuerza por escribir código “bueno” termine peor evaluado que alguien que ni siquiera intenta encontrar una solución concisa
Al final la calidad va a caer, y para cuando el liderazgo entienda lo que pasó, ya será demasiado tarde
Ya he visto incidentes relacionados con Amazon-Q/Kiro y aun así lo siguen negando
En mi trabajo también viene esa misma tendencia
Si no uso Copilot de MS Office todos los días, me manda notificaciones molestas, así que solo escribo Hello

Empleados de Amazon están inventando trabajo ante la presión por usar IA

Presión por usar IA y uso de MeshClaw

Diferencias alrededor de las métricas de uso

OpenClaw y los riesgos de la ejecución local

Lecturas relacionadas

1 comentarios

Opiniones de Hacker News