5 puntos por GN⁺ 4 시간 전 | Aún no hay comentarios. | Compartir por WhatsApp
  • La herramienta de codificación agéntica Claude Code genera un cambio más grande en la creación de productos y la reconfiguración de flujos de trabajo que en la simple escritura de código
  • En una encuesta de Microsoft a usuarios de IA en el trabajo aparecieron al mismo tiempo la presión por adoptar IA rápidamente, la creación de nuevos entregables y un aumento del tiempo dedicado a tareas de mayor valor, pero las recompensas por experimentar con IA siguieron siendo bajas
  • Cuando una organización toma como objetivo el simple volumen de uso, aparecen los rankings de tokens y la inflación artificial del uso; son más importantes las métricas conectadas con la forma en que la IA agrega valor
  • Boris Cherny cree que el título de ingeniero podría cambiar hacia un rol más cercano a builder, y que incluso personas no ingenieras crearán código mientras los ingenieros se enfocan menos en teclear directamente y más en el juicio, la planificación y la comprensión del usuario
  • El aumento de productividad por IA no necesariamente se traduce solo en menos horas de trabajo o menos empleos; las empresas reconfigurarán sus flujos alrededor de la IA y las personas tendrán más opciones y más apalancamiento

Los datos del trabajo con IA y la trampa de las métricas organizacionales

  • Microsoft encuestó a 20,000 usuarios que usan IA en trabajo real y encontró un fenómeno que llama la "paradoja de la transformación"
    • 65% teme quedarse atrás si no adopta IA rápidamente
    • 58% está creando con IA entregables que hace un año no habría podido producir
    • 66% respondió que gracias a la IA ahora dedica tiempo a tareas de mayor valor
    • En cambio, solo 13% dijo que recibe recompensas en su trabajo por experimentar con IA, lo que muestra una brecha entre la disposición de uso y la organización
  • En otro estudio de Microsoft, cuando los gerentes muestran directamente cómo usan IA, el uso aumenta 17% y la confianza en los agentes sube 30%
    • Más que consignas como "la IA es el futuro", lo que da resultados es que el gerente muestre la forma concreta en que realmente la usa
    • Si los empleados creen que pueden compartir los beneficios de la productividad ganada con IA, su motivación para usarla puede cambiar, pero casi no hay lugares que la recompensen económicamente de esa manera
  • Algunos lugares de trabajo subsidian el costo de tokens, pero ese apoyo no siempre termina dando buenos resultados

Token maxing — efectos secundarios de las métricas de uso

  • En grandes empresas tecnológicas ha aparecido el fenómeno de token maxing, es decir, gastar tokens en exceso para inflar el volumen de uso
    • Según empleados de Amazon citados por Financial Times, Amazon introdujo una herramienta interna inspirada en OpenClaw llamada mesh claw y promovió su uso
    • Había un ranking interno de uso de tokens, y algunos empleados hacían correr agentes improductivos sin sentido para subir su consumo
    • En Meta, el uso máximo llegó a cientos de miles de millones de tokens, y una cantidad equivalente a millones de dólares terminó siendo básicamente desperdiciada
  • La posición oficial de Amazon es que el uso de tokens no es una métrica de evaluación gerencial, pero los empleados creen que los gerentes sí lo ven y por eso aumentan el uso bruto
    • En Amazon existe una meta desde arriba para que 80% de los desarrolladores use IA cada semana
    • Si no hay una recompensa concreta, la gente solo cumple con el "usen IA" y pierde de vista el propósito original de "hagan mejor su trabajo"
    • Para los desarrolladores hacen falta métricas productivas claramente conectadas con la creación de valor, en lugar de métodos ambiguos de seguimiento

El nacimiento de Claude Code y su rápida expansión

  • Claude Code es una herramienta de codificación agéntica lanzada por Anthropic en mayo del año anterior, una herramienta que recibe palabras y devuelve código
    • En 8 meses desde su lanzamiento pasó a representar alrededor de 4% de todo el código subido a GitHub
    • En febrero de ese año alcanzó una tasa anualizada de ingresos de 2,500 millones de dólares, convirtiéndose en el producto empresarial que más rápido llegó a ese nivel
    • Su creador, Boris Cherny, estudió economía sin tener un título en ciencias de la computación; dejó la universidad a los 18, dirigió una startup, pasó por un hedge fund y luego trabajó 5 años como principal engineer en Meta antes de unirse a Anthropic a fines de 2024
    • Actualmente Cherny no escribe ni una sola línea de código directamente y aun así ejecuta 5 agentes en paralelo en 5 pestañas de terminal y procesa entre 20 y 30 pull requests al día
  • No empezó como una misión de construir una herramienta de código, sino como un proyecto paralelo mientras aprendía la API
    • Al principio era algo simple que conectaba Claude con AppleScript para mostrar la música que estaba escuchando
    • En dos meses apareció una versión de Claude Code y el primer día la usó 20% del equipo de ingeniería de Anthropic
  • Se unió en septiembre de 2024 a un pequeño equipo de labs
    • Ese equipo creó Claude Code, MCP, skills y la app de escritorio, y manejaba muchas ideas experimentales cuyo éxito era incierto
    • Anthropic venía enfocándose en empresa, codificación y seguridad, y concluyó que si iba a construir un producto, uno de código era razonable porque ayudaría tanto a mejores modelos de programación como a la investigación de seguridad
  • En ese momento, la mayoría de los productos de código eran extensiones de IDE, y al nivel de Sonnet 3.5 se parecían más a un autocompletado avanzado
    • Sintieron un model overhang: el modelo podía hacer más, pero no existía un producto que sacara esa capacidad; y esa sensación sigue igual hoy
    • Lo construyeron en cuestión de días como la forma más barata posible, corriendo en la terminal sin UI ni app separada
    • El uso se expandió desde el entorno cercano y en pocas semanas mucha gente dentro de la empresa lo usaba a diario; en 5 días ya lo usaba la mitad del equipo de ingeniería
    • Hasta ingenieros que evitaban la terminal lo usaban, y Cherny, más que analizar si "la ingeniería de software cambió para siempre", se concentró simplemente en lanzarlo

¿Desaparecen los ingenieros? — la mezcla de roles

  • El primer shock fue el momento en que Claude le dijo qué música estaba sonando
    • Ante la pregunta, Claude escribió código AppleScript para abrir el reproductor de música; Cherny no conocía ese lenguaje ni se le habría ocurrido resolverlo de esa forma
    • Resolvió el problema de una manera que un ingeniero no habría elegido
  • Los modelos avanzan muy rápido, así que cuando se construyen productos sobre ellos hace falta reajustar cada mes
    • Con Co-work reservó 8 vuelos y 5 hoteles; el único error fue un hotel de alrededor de 5,000 dólares por noche, así que solo volvió a reservar ese caso
  • La tendencia es exponencial, por lo que nadie sabe con precisión qué pasará, y dos cosas ocurren al mismo tiempo
    • Empresas que necesitan menos ingenieros para el mismo trabajo porque sube la productividad por ingeniero
    • Empresas que, al aumentar la productividad por persona, lanzan más productos y negocios y por eso necesitan más ingenieros (el equipo de Cherny sigue limitado por falta de buenos ingenieros y contrata tan rápido como puede)
  • Los roles se están mezclando de forma interesante
    • La gerente Fiona no había programado en 15 años, pero al unirse volvió a hacerlo, y todo el equipo —incluyendo a la product manager Cat y a la diseñadora Megan— programa
    • Las personas no ingenieras escriben algo más de código, mientras ingenieros como Cherny llevan más de 6 meses sin escribir código directamente y aun así construyen cosas todo el día
    • No está claro si habrá que llamarlo builder, engineer o product manager, pero el rol en sí claramente está cambiando

La analogía del tractor — el tiempo de difusión de una tecnología

  • El tractor fue inventado por John Frick en Iowa en la década de 1890, pero en Estados Unidos no superó en número a los caballos sino hasta la década de 1960, es decir, tomó unos 70 años
    • El tractor elevó mucho el rendimiento y la productividad, pero requería entrenamiento para aprender a usarlo y al principio era caro, así que el caballo salía más barato
    • También le faltaba desempeño: servía para trigo pero no para maíz, por ejemplo, y tomó mucho tiempo adaptarlo a distintos cultivos
    • La transición actual con IA es la misma clase de problema, pero en modo speedrun
  • Esto conecta con la idea de AI as normal technology: aunque aparezcan modelos muy capaces, los cambios en personas y organizaciones siguen siendo lentos
    • Aun así, viendo la trayectoria de ingresos de Anthropic, también existe el contraargumento de que esta vez la velocidad es mayor, y todavía estamos midiendo la velocidad real del cambio
  • Las computadoras aumentan la productividad, pero eso no significa automáticamente menos horas de trabajo; significa hacer más en el mismo tiempo

¿Ya está “resuelta” la programación?

  • "coding is solved" es una expresión limitada al tipo de programación que él hace
    • Los productos de Cherny, como cloud CLI, la app de escritorio y la app móvil, tienen codebases relativamente nuevas y simples
    • En cambio, en codebases grandes y complejas de clientes grandes como NASA, eso todavía no está resuelto, y además los modelos no son perfectos y se equivocan
  • Las objeciones de los ingenieros —que programar no es teclear sino juicio, criterio y pensamiento crítico, y que los agentes son débiles en eso— son válidas
    • Incluso antes, en un día típico de Cherny, solo alrededor de 50% era teclear código; el resto era hablar con usuarios, brainstorming, debugging, diseño y planificación
    • Si el modelo se encarga del código, el ingeniero queda liberado para el trabajo más disfrutable: hablar con usuarios e imaginar lo siguiente
  • Claude Code lleva más de 6 meses escrito 100% con Claude Code, y lo mismo ocurre con otros productos como Co-work
    • En una charla reciente con el batch actual de Y Combinator, cuando preguntaron quién escribe 100% de su código con Claude Code, levantó la mano cerca de la mitad de varios cientos de personas; cuando preguntaron quién no escribe nada con modelos, solo una persona; el resto estaba entre 50 y 100%
    • Considera que los cambios en ingeniería son un indicador adelantado de lo que luego pasará en todos los demás campos
  • Temor al deterioro de habilidades y evolución de la programación

    • Existe la preocupación de que, si uno ya no escribe código directamente, pueda producirse una atrofia en la comprensión de la propia profesión
      • La ingeniera del equipo Lena escribe C++ a mano los fines de semana por placer, y ese espacio siempre puede existir
      • Cherny no lo ve como una atrofia, sino como parte de la evolución constante de la programación
        • En la época soviética existían las tarjetas perforadas, y en tiempos del programa Apolo también se hacía trabajo manual sobre papel que entonces también era "programación"
        • Después se pasó de lenguaje máquina a ensamblador y luego a JavaScript y Python; ahora el cambio es hacia hablar con agentes, y pronto, según él, hacia agentes hablándole a agentes para programar
      • Es como usar calculadora aunque eso deteriore algo de habilidad matemática; se sigue usando igual. Pero si esa herramienta se vuelve superinteligente y debilita al usuario de manera encubierta, ese ya es otro problema
  • La polémica sobre la degradación del rendimiento de los modelos

    • Después de cada nuevo modelo aparece periódicamente la crítica de que “el rendimiento empeoró mucho”
      • Hubo 2 casos reales causados por bugs, y Anthropic publicó en su blog tanto la causa como la corrección
      • En la mayoría de los demás casos, podría tratarse del fenómeno tipo luna de miel, donde uno se acostumbra al modelo y se desvanece el asombro inicial
    • A diferencia de hace un año, ahora el código del modelo es mejor que el que Cherny escribiría personalmente
      • Antes tenía que revisar tres veces cada línea; ahora se lo encarga a Claude, le hace volver a revisar y probar el resultado, y al mismo tiempo ejecuta 15 Claude en paralelo

La paradoja de la productividad y la ampliación de opciones

  • Incluso si la productividad sube, eso no significa que las horas de trabajo bajen, y en gran medida depende de la elección personal y de la situación de cada empresa
  • Lo explica con la anécdota de la lavadora
    • Antes de la lavadora, una sola tanda de ropa tomaba entre 5 y 6 horas y requería caminar cerca de 3,000 pies; había que prender fuego, hervir agua, restregar en la tabla y exprimir, y repetirlo todos los días según el tamaño de la familia
    • La lavadora redujo unas 3 horas por tanda
    • Fue uno de los factores que permitieron la entrada masiva de las mujeres al mercado laboral
    • Ese tiempo ahorrado creó opciones personales: pasarlo con los hijos, caminar, leer, ver amigos o entrar a trabajos de fábrica u oficina; la IA ampliará las opciones del mismo modo
  • Consejo para alguien de 22 años recién egresado de una carrera de CS: los puestos junior siguen existiendo, pero si tiene siquiera una mínima inclinación emprendedora, recomienda fundar una startup
    • Es una edad dorada para emprender como nunca antes, y "tú y tus agentes" pueden construir una empresa enorme
    • Ya hay equipos de 1 a 3 personas construyendo compañías valuadas en miles de millones y startups sobresalientes, y el apalancamiento de una sola persona es enorme
  • En tres años quizá ya no se les llame "ingenieros", pero la predicción es que habrá 100 veces más personas creando código o haciéndolo crear por agentes que hoy

Claude Co-work — expansión para personas no ingenieras

  • Co-work empezó al ver que la gente instalaba Claude Code en la terminal para hacer cosas como declarar impuestos, es decir, usos que no eran de programación
    • Se usa para contabilidad, finanzas, legal, reservas de vuelos, compra de boletos para conciertos e incluso para comprar permisos de recolección de almejas en el estado de Washington
    • Los productos de código fueron casos donde ingenieros construyeron algo para sí mismos y luego resultó útil para otros, pero Co-work es un nuevo reto porque se está construyendo para el conjunto de personas no ingenieras
  • La capacidad de ejecutar tareas largas es una dirección clave
    • Hace alrededor de año y medio, por límites del modelo, Claude Code se descarrilaba después de solo 30 segundos y requería intervención
    • Ahora, cada noche, cientos o miles de agentes corren durante 5, 10 o 20 horas, y así es como hoy se hace ingeniería
    • Co-work irá en la misma dirección, aunque todavía no está claro qué tareas necesitarán ejecuciones tan largas
  • Si mejoran la memoria y la comprensión del usuario, avanzará hacia anticipar necesidades con antelación
    • Por ejemplo: detectar episodios pendientes de un pódcast y posibles invitados aún no contactados, hacer brainstorming de candidatos y dejar correos iniciales en la carpeta de borradores
    • La definición del trabajo puede dividirse entre una forma horizontal, como "diseñar todo", y una forma vertical, donde se completa un objetivo específico de principio a fin
    • Ejemplo vertical: Claude crea una función y luego la prueba, la fusiona y la despliega
  • Desde Opus 4.7, Claude se volvió más proactivo
    • Después de lanzar una función, programa por sí mismo un recordatorio para revisar el feedback de usuarios 12 horas después e intenta corregir bugs si los hay; eso gustó porque resuelve por adelantado cosas que una persona suele olvidar
  • Claude Mythos no ha sido revelado externamente para la mayoría, y la información pública disponible se centra sobre todo en su rendimiento en programación y ciberseguridad; el salto parece mayor que los avances habituales y especialmente fuerte en ciber y código

¿De quién es la responsabilidad por el reemplazo de empleos?

  • Esta transición mezcla efectos buenos y malos, y no se puede predecir con precisión ni el momento ni la proporción
    • Anthropic ocupa una posición singular porque puede convertirse en fuente de desempleo para ingenieros de software y otros perfiles
    • Como ingeniero, habla seguido con su equipo sobre una fuerte obligación moral de advertir sobre lo que viene y enseñar a usar estas herramientas para llevar a la gente con ellos
  • No es un problema que una sola empresa pueda resolver, ni sería deseable que lo resolviera una sola empresa, porque podría terminar en una mala solución
    • Es un tema que toda la sociedad debe discutir y debatir, y Anthropic contribuye con reportes económicos, debates de políticas y publicación de lo que observa
  • Una de las razones por las que Anthropic, siendo un laboratorio de seguridad, también crea productos es para que la gente pueda experimentarlos directamente, entenderlos y participar en la respuesta social; si la tecnología se mantiene cerrada, a nadie le resulta fácil formarse una opinión

Power users y la brecha de IA

  • Existe preocupación de que la brecha digital se convierta en brecha de IA, y hasta ahora los datos muestran que quienes mejor aprovechan la IA ya tienden a estar en los niveles altos de ingreso
    • En Anthropic existen algunos programas para ampliar el acceso, aunque no se especifican nombres ni métodos concretos
  • Quienes obtienen más valor suelen ser personas distintas de las que uno esperaría
    • En el hackathon de lanzamiento de Opus 4.7, los ganadores no fueron por lo general ingenieros profesionales, sino casos como un electricista, un médico o un carpintero creando apps; en el hackathon anterior de 4.6 apareció la misma tendencia
    • Los modelos ya alcanzaron un nivel de sofisticación en el que también los no especialistas los manejan bien
  • La clave para la adopción en grandes empresas es cambiar los procesos de trabajo y poner a Claude en el centro
    • Una forma que funciona es darle tokens a todo el mundo y permitir experimentación segura, para que las ideas salgan de personas inesperadas
    • Las mejores ideas no necesariamente vendrán del ingeniero senior, sino del contador en una esquina o alguien de GTM que armó un dashboard interno
    • No hay garantía de que quien hoy usa mejor la herramienta siga siendo quien mejor la use mañana, así que es importante que todo el mundo aprenda a usarla

Perspectiva para el próximo año

  • El próximo año habrá mucha confusión, y los grandes jugadores intentarán adaptarse; muchos lo lograrán
  • Algunos moats tradicionales de negocio se debilitarán y otros seguirán vigentes
    • Los efectos de red (más usuarios, más valor) seguirán existiendo al margen de la IA
    • Las economías de escala (menor costo marginal) también seguirán siendo una ventaja natural
    • En cambio, los costos de cambio se debilitan: si Claude puede moverte del vendor A al B, eso deja de ser un gran moat
    • Las empresas que dependían de moats en desaparición la pasarán mal, y muchas buscarán nuevos moats
  • Habrá una innovación muchísimo mayor de la esperada
    • Las ideas nuevas no saldrán de grandes corporaciones, sino de startups pequeñas de 1, 2 o 10 personas, y su número crecerá de forma explosiva
    • Caso de una startup de descubrimiento de materiales: plantea una narrativa que va de la edad de piedra y hierro a la era del silicio, y sostiene que encontrar nuevos materiales nos llevaría a la siguiente etapa; por eso explora con Claude moléculas y diseños posibles
    • Lo que antes era difícil incluso de financiar, ahora equipos pequeños pueden convertirlo en avances imposibles hace 20 años
    • Si alguien con dominio del área tiene un “ejército de Claude”, puede lograr mucho más de lo que lograría incluso con un ejército humano
  • Cherny automatizó la atención a usuarios en X y Threads, pero prefiere hacerlo él mismo
    • Trasladó el loop de Claude Code a una rutina que se ejecuta cada 30 minutos y recopila feedback mediante la API de Threads y la API de X
    • La interacción directa con usuarios es lo que más le gusta, e incluso el feedback de "no funciona" sirve como fuente para mejorar el producto
    • Claude Code tiene muchos defectos y está lejos del producto ideal, pero escuchar feedback y mejorar un poco cada día es la única manera de construir un buen producto

Aún no hay comentarios.

Aún no hay comentarios.