Empleados de Amazon están inventando trabajo ante la presión por usar IA
(fastcompany.com)- Los empleados de Amazon están bajo presión para meter más IA en su trabajo, pero como no está claro dónde aplicarla, se está generando trabajo innecesario
- Algunos empleados están usando la herramienta interna MeshClaw para crear agentes que aumenten la actividad de IA, más que para mejorar la productividad
- Los empleados creen que el seguimiento del consumo de tokens de IA ha creado un ambiente donde se prioriza el uso por encima de la calidad
- Amazon afirmó que no existe una métrica de IA a nivel de toda la empresa ni una tabla de clasificación interna, pero empleados dicen que sí hay una meta de uso del 80% y seguimiento
- OpenClaw y MeshClaw se ejecutan de forma local, lo que les da más independencia, pero el riesgo puede aumentar si se les otorgan permisos de acceso excesivos
Presión por usar IA y uso de MeshClaw
- Los empleados de Amazon están bajo presión para incluir más IA en sus flujos de trabajo, pero no está claro dónde debería aplicarse, así que crece la posibilidad de que los recursos de IA se usen en tareas innecesarias
- Según un reporte de Financial Times, algunos empleados de Amazon están usando la herramienta interna de IA MeshClaw para crear agentes de IA innecesarios que aumenten la actividad de IA, en vez de mejorar la productividad
- Un empleado dijo: “Hay demasiada presión para usar estas herramientas”, y señaló que algunos usan MeshClaw para maximizar el uso de tokens
Diferencias alrededor de las métricas de uso
- Los empleados creen que, al rastrear el consumo de tokens de IA, Amazon ha hecho que algunos colegas prioricen la cantidad sobre la calidad en el uso de la tecnología
- Varios empleados anónimos de Amazon creen que el entorno laboral está empeorando a medida que aumentan las expectativas de uso de IA
- Al parecer, Amazon informó a sus empleados que las estadísticas de uso de IA no se incluyen en las evaluaciones de desempeño, pero no todos los empleados lo creen
- Otro empleado considera que el seguimiento del uso crea incentivos perversos y hace que algunos empleados actúen de forma muy competitiva
- Los empleados entrevistados dijeron que la empresa tiene la meta de que 80% de los desarrolladores usen IA cada semana, y que el consumo de tokens de los empleados se rastrea en una tabla de clasificación interna
- Un portavoz de Amazon declaró que no existe una métrica de IA a nivel de toda la empresa ni una tabla de clasificación interna donde se compare a los empleados entre sí
- Según Amazon, los empleados pueden ver su propio uso de IA en un panel personal
OpenClaw y los riesgos de la ejecución local
- MeshClaw, que algunos empleados de Amazon usan para inflar el uso de IA, es una herramienta inspirada en otra herramienta de IA llamada OpenClaw
- A diferencia de otros modelos de IA, OpenClaw y MeshClaw se ejecutan localmente en el propio hardware del usuario, lo que les da mayor independencia
- A inicios de este año, la directora de alineación de Meta Superintelligence Labs llamó la atención por un incidente en el que OpenClaw estuvo a punto de borrar toda su bandeja de entrada de correo, lo que dejó en evidencia los riesgos de darle a la IA permisos de acceso excesivos
1 comentarios
Opiniones de Hacker News
No es solo Amazon; da la impresión de que las grandes tecnológicas en general y hasta algunas empresas pequeñas se están volviendo locas al mismo tiempo
Es parecido a una situación en la que el CEO un día diga: “Hay que incentivar el gasto en viáticos, así que reserven tantos viajes como puedan y gasten lo máximo posible. Vuelen en primera clase cuando vayan a oficinas satélite, tomen limusina en vez de Uber y coman en restaurantes caros. Si no gastan suficiente en viáticos, recibirán una calificación baja en la evaluación de desempeño”
Estamos viviendo tiempos completamente anormales
Si yo fuera vicepresidente de Amazon, hasta consideraría una oferta de adquisición, y además estoy trabajando en una versión enterprise con funciones extra
Show HN: https://news.ycombinator.com/item?id=48151287
Pensó que lo iban a regañar, pero en cambio lo reconocieron e incluso le pidieron una breve presentación para compartir con otros empleados cómo había logrado ese “éxito”
Ahora el 20% del gasto en infraestructura son tokens, y el número semanal de pull requests por desarrollador subió de 4.2 a 5.1
Buena parte de eso son agentes cambiando una o dos líneas en archivos de configuración, así que todo esto se siente como puro pensamiento mágico
Incluso cuando en otra aerolínea la primera clase salía más barata, la política de la empresa no permitía volar en primera clase
Siempre hemos vivido en tiempos anormales
Como eso no está ocurriendo, parece que asumen que es porque los empleados no están usando esa IA mágica con suficiente frecuencia
Las empresas que desarrollan sus propios productos de IA también podrían querer que sus empleados usen IA lo máximo posible para obtener datos de entrenamiento que eventualmente reemplacen a la mayoría o a todos ellos
Castigar a empleados que se niegan a entrenar su propio reemplazo por IA puede tener sentido para ellos si consideran que, aunque hoy cueste dinero, el ahorro futuro será muchísimo mayor
Hace unos 6 meses, un empleado de AWS nos dio una presentación sobre herramientas de IA para nuestro caso de uso
En medio de la presentación, de repente mostró en pantalla compartida cuánto había gastado en tokens ese mes y dijo: “Miren cuánto usé este mes. Le doy durísimo a Opus”, y la cifra era insultantemente grande
En ese momento pensé: “Qué forma tan rara de presumir. ¿No es una señal de alerta que esto sea tan caro y aun así estés orgulloso de usarlo tanto?”
Luego mostró varios casos de uso de Claude Code para administrar y ajustar infraestructura de AWS, pero a mis ojos de sysadmin de barba gris, más viejo que internet, todo se veía como “usó IA para hacer algo que se resuelve con un solo comando”
Así que esta historia sí cuadra. Al parecer ya desde hace 6 meses los estaban incentivando a usarlo a lo loco
Pero si presionas
tab, esa línea cuenta como una línea editada por IAY gran parte del resto también son cosas que ya podrías hacer a velocidad parecida si hubieras aprendido multicursor, navegación en vim y macros
En la práctica, nunca aprendí eso porque nunca fui tan lento como para que subir código a la pantalla fuera el cuello de botella
Supongo que no es algo binario y que dependerá de muchos factores, pero igual es raro ver reportes tan distintos al mismo tiempo
Si es así, ya se entiende de dónde vienen estas directrices y por qué no son más cautelosas o equilibradas
Eso es una gran debilidad en el desarrollo de sistemas y puede convertirse en una enorme superficie de ataque para un adversario
Gran parte del valor de la IA está justo ahí
Ahora ya no hace falta conocer ese comando; basta con entender el contrato funcional para poder realizar la tarea necesaria
Es un cambio enorme
Están apareciendo muchas historias de gente que “tenía que usar tokens y los quemó en cosas inútiles”, y eso es difícil de creer en medio de una emergencia climática
Si seguimos empujando, hasta podríamos llegar a 3 grados de calentamiento
Me recuerda a la historia de cómo la URSS casi llevó a las ballenas a la extinción intentando cumplir cuotas de carne de ballena que nadie quería comer
En la práctica ya existe una planificación centralizada y con ella llegan las mismas patologías del sistema; la diferencia con la URSS es solo que nuestro GOSPLAN lo dirigen unos cuantos que se hicieron ricos por accidente o sobornando a la persona correcta
Ni siquiera por una mejora de productividad “real”, sino simplemente para gastar tokens
Si no quemas tokens, no cumples las métricas y te pueden colgar la etiqueta de ludita y correrte antes de que la IA te quite el empleo
Estoy de acuerdo en que esta tendencia y los belicistas están destruyendo el planeta
Además, la afirmación de que “nadie quería comerla” tampoco tiene mucho sustento
Por suerte trabajo del lado de administración de apps, y descubrí que solo pueden ver la última fecha de uso, así que con una sola consulta al día estoy bien
Pero ya estoy realmente harto de este sobrecalentamiento de la IA
Trabajo en una empresa FAANG, aunque no en Amazon, y he escuchado muchas historias así tanto por dentro como por fuera
Pero lo importante es que jamás he oído que la gente realmente importante, o sea el liderazgo, lo diga de manera oficial
Siempre empieza como rumor o con algún dashboard o métrica armada por alguien dentro de la empresa y luego va creciendo
También he escuchado a líderes decir: “Eso no es lo que estamos observando, y no deben desperdiciar tokens caros”
Claro, antes sí han usado métricas tontas como líneas de código o número de commits sin admitirlo del todo, pero no creo que sea algo tan simple como más tokens siempre es mejor
Cuando les discutimos, el liderazgo reconoce que el gasto en tokens no es una buena métrica y que la gente probablemente la va a manipular, pero de inmediato vuelve a decirnos que incrementemos el gasto en tokens de nuestros equipos
Sé que existe un dashboard de seguimiento de tokens que el liderazgo revisa, porque lo muestran directamente en las reuniones
Al menos todavía no lo han hecho público para todos como si fuera una tabla de posiciones
Circulan muchos rumores de que el gasto en tokens va a entrar en la evaluación de desempeño, y el liderazgo lo niega, pero acto seguido siguen convocando reuniones sobre lo importante que es subir ese gasto y comentando las carencias que se ven en el dashboard
En las empresas donde hacen rankings de uso de tokens o insinúan que podrían despedir ingenieros por negarse a usar herramientas de IA, el problema explota
Entonces empieza una competencia por gastar la mayor cantidad posible de tokens para sobrevivir
Se nota especialmente entre desarrolladores que consumen muchas redes sociales
En Twitter, Threads, Mastodon, LinkedIn y otras plataformas se reciclan sin parar historias virales sobre volverse AI-native y despedir a quien no use suficiente IA, y los desarrolladores ansiosos sienten que, para evitar una reestructuración inevitable, tienen que quemar tokens más rápido que sus colegas
Después de eso, a los contribuidores individuales de la organización les dijeron que debían usar IA para todo y que, si no lo hacían, podría afectarles en la carrera
Siguen imponiendo capacitaciones, talleres y hackatones obligatorios para “motivar” el uso de IA en el trabajo cotidiano
Incluso para cosas que se resuelven fácil con un script de shell, preguntan: “¿Cómo podríamos convertir esto en un agente?”
Gastaron mucho dinero en Copilot, así que quieren ver a la gente usándolo
También es posible que el objetivo sea justamente hacer que la gente juegue con la métrica
Si empujas a todos a usar más IA, van a probar cosas, experimentar y “desperdiciar” tiempo mientras aprenden
Ese es el objetivo final
Por ahora están gastando tokens en cosas inútiles mientras descubren para qué sí sirve, y también necesitan aprender así para qué no sirve
En nuestra empresa están haciendo lo mismo
Puede ser desperdiciador, pero es la forma más rápida de explorar dónde la IA realmente puede ser útil para el negocio
Aunque el 80% de los empleados solo desperdicie tokens, el otro 20% sí está encontrando la manera
Si tienes tanto dinero como para quemarlo, seguramente también puedes imaginar formas peores de gastarlo, pero hablando en serio, es una tontería
¿Cuándo antes las empresas habían gastado millones de dólares y tiempo de su gente en una herramienta solo para “descubrir qué utilidad podría tener”?
Es una solución en busca de un problema
Si al principio ni siquiera está claro qué problema resuelve la herramienta, hay que descartarla y seguir adelante
Ese dinero sobrante sería mejor dárselo a empleados y accionistas
Qué pena que la IA ya tenga un programa de empleo básico universal, mientras que los humanos todavía no
Las empresas están pagando para que una IA cave hoyos y otra IA los vuelva a tapar
[1] https://locusmag.com/feature/cory-doctorow-full-employment/
La URSS logró hace mucho el 100% de empleo[0], junto con la pobreza que venía incluida
Esto no es igual porque no se financia con impuestos
Son empresas privadas experimentando con su propio dinero y asumiendo el riesgo de que luego sus costos suban y los clientes se vayan a otra parte
Eso es mucho mejor que darle dinero a la gente mediante impuestos obligatorios sin relación con la productividad
[0] https://nintil.com/the-soviet-union-achieving-full-employmen...
Dentro de Amazon, al usar Kiro, el uso de tokens está gamificado
Porque no es como en AWS, donde el costo se le cobra al equipo, ni como en el sistema anterior, donde tenías que justificar capacidad
Antes de que nadie viera rankings internos, ya escuchaba historias bastante creíbles de que la gente manipulaba esa métrica, y además hay muchos usuarios entusiastas armando y compartiendo toda clase de proyectos internos
Sin duda, los managers que escuchan en presentaciones internas cosas como mejoras de productividad del N00% sí están metiendo presión, pero donde yo estoy detectarían bastante rápido si alguien se inventa trabajo falso en vez de hacer trabajo real
La presión viene más bien de plazos agresivos y del cambio hacia una forma más ágil dentro del proceso anual OP1
También he escuchado historias parecidas de empleados de AWS y de otras FAANG no relacionadas con AWS
Todos los rankings de tokens vienen con un descargo de responsabilidad que dice “esto no se usará en la evaluación de desempeño”, pero da la sensación de que detrás hay un guiño implícito
En una organización de la que oí hablar, hay alguien que deja GasTown corriendo 24/7 tragándose tokens
Aporta poco, pero ocupa cómodamente el primer lugar
Deja GasTown corriendo y hace que los agentes toquen partes del codebase por todos lados, así que termina con unas 50 confirmaciones al día
Cosas como versiones compatibles, formato y similares
Pero el problema no es la tecnología, sino él
Ya era así incluso antes de los LLM
Solía “refactorizar” repositorios en otros más pequeños para que de pronto su nombre apareciera por todo el código, y a simple vista parecía que él había creado grandes partes del codebase de la empresa
Rechazaba cosas que yo quería hacer y luego más tarde las hacía él mismo
A mis pull requests les encontraba defectos infinitos o directamente decía que no debíamos hacer ese trabajo, para luego darse la vuelta e implementarlo él mismo
No copia y pega mi código, pero después de que mi PR ya está abierto, vuelve a implementar la misma idea que antes había rechazado
Es muy inteligente, pero también muy deshonesto, y sabe ocultarlo bien
Si le preguntas, responde cosas como “me pareció que así se vería más ordenado”
Desde fuera, siempre hay margen para decir que una forma era mejor que la otra, así que la deshonestidad no se ve tan clara, pero yo observo al 100% lo que hace y el patrón es totalmente evidente
Además, una vez dije que quería tomar vacaciones en cierta semana; no me las negó explícitamente, pero dijo que había mucha presión por entregar The Thing y preguntó si podía moverlas
Yo dije: “No, no las voy a mover”, y entonces las aprobó, pero cuando llegó esa semana, él mismo también se fue de vacaciones en esas mismas fechas
No lo confronté por eso. Ya sabía bastante bien que no le da vergüenza exigirles a otros cosas que él jamás aceptaría para sí mismo
Si un portavoz de Amazon dijo que no existe una métrica corporativa de uso de IA, ni rankings internos para comparar empleados, y que en los dashboards personales cada quien solo puede ver su propio uso, entonces eso es una completa mentira
Existe un dashboard global que clasifica por empleado el uso de Kiro/QuickSuite (antes Amazon Q) según tokens
El dashboard en sí está en QuickSight, que de todas maneras ahora también forma parte de QuickSuite
Los datos no solo están abiertos para cualquiera, sino que además se pueden ordenar por ranking y por uso diario, semanal, mensual y anual
Incluye tanto a empleados actuales como a exempleados usando sus aliases internos
Encima de eso, también hay un sistema interno de “premios” que aparece en el perfil de PhoneTool, donde cada empleado recibe títulos de Kiro/AmazonQ/Quicksuite como “Blaze” o “Thunderstorm”
Y con solo hacer clic también puedes ver a otras personas que recibieron el mismo premio
Para contexto, PhoneTool es un directorio interno de perfiles para buscar a otros empleados
Mientras tanto, conozco a varias personas que no pueden escribir código decente por sí solas ni integrar nada directamente
Gente a la que siempre hay que llevar de la mano está generando cantidades enormes con Kiro/AmazonQ y hoy aparece por encima de SDE reales en el ranking
Son más bien gente de SysDev, ingenieros de soporte o TPM que SDE
Eso en sí no es automáticamente bueno ni malo, pero si haces stack ranking por uso de tokens, es muy probable que un buen ingeniero que se esfuerza por escribir código “bueno” termine peor evaluado que alguien que ni siquiera intenta encontrar una solución concisa
Al final la calidad va a caer, y para cuando el liderazgo entienda lo que pasó, ya será demasiado tarde
Ya he visto incidentes relacionados con Amazon-Q/Kiro y aun así lo siguen negando
En mi trabajo también viene esa misma tendencia
Si no uso Copilot de MS Office todos los días, me manda notificaciones molestas, así que solo escribo Hello