2 puntos por GN⁺ 3 시간 전 | Aún no hay comentarios. | Compartir por WhatsApp
  • A medida que la IA convierte la inteligencia (intelligence) en un recurso con precio, todos los niveles del mercado compiten por controlar quién fija ese precio
  • Los laboratorios de IA quieren que el uso pase por ellos, las aplicaciones intentan demostrar que pueden asignar la inteligencia mejor que los laboratorios, y los Estados quieren que se vuelva lo bastante barata como para convertirse en infraestructura nacional
  • El costo de la inteligencia ya no es una variable de entrada del software, sino un eje (axis) que reorganiza empresas, mercados y geopolítica
  • La razón por la que invertir en IA es distinto de invertir en software es que hay más variables, esas variables están acopladas (coupled) de forma desigual, y cada variable se descompone en subvariables que se mueven en su propia curva
  • Se trata de analizar un sistema en el que la propia ecuación se reescribe cada hora, y en el que si cualquier variable se mueve lo suficiente, cambia el significado de las demás: una reconfiguración continua

Por qué invertir en IA es distinto de invertir en software

  • En software, aunque hacer pattern matching era difícil, sí funcionaba, y el costo de distribución (distribution cost) determinaba la eficiencia de adquisición de clientes, mientras que el costo de cambio (switching cost) determinaba la retención y expansión
    • CAC payback, NDR, magic number y Rule of 40 son todos resultados derivados de esas dos fuerzas
  • La IA rompe eso por tres razones
    • Hay más variables en el sistema
    • Las variables están acopladas de manera desigual
    • Cada variable se descompone en subvariables que se mueven en su propia curva
  • Si se mueve cualquiera entre capability, cost, latency, deployment, regulation o talent, cambia el significado del resto; y cuando se resuelve una restricción, cambia cuál es la siguiente restricción importante

Lo que cambia cada variable

  • Las variables familiares de las que ya se habla son capability, cost y latency
  • Las variables más difíciles son los unlocks que salen de la investigación y el producto: es difícil modelar de antemano su naturaleza y profundidad, y la velocidad con que llegan sigue acelerándose
  • Restricciones que el software trataba como constantes fijas se convierten en decisiones estratégicas en IA: geopolitics, deployment y talent
  • Capability

    • Se descompone en reasoning, context, multimodality, tool use, planning, memory y controllability, y cada una se mueve con fuerza en su propia curva
      • context se expandió en 3 años de 4 mil tokens a más de 1 millón de tokens
      • reasoning evolucionó de truco de prompting a una clase de modelo independiente
    • Ha absorbido infraestructura como retrieval pipelines, output parsers y prompt scaffolds, que eran prótesis (prosthetics) usadas para compensar debilidades del modelo
    • Un modelo que apenas puede contener prompts y un modelo que puede contener una base de código o el historial de un cliente son productos distintos; las mejoras de desempeño no elevan por igual a todas las aplicaciones, sino que desplazan el cuello de botella (bottleneck)
  • Cost

    • La caída de costos no solo mejora márgenes: cambia quién puede competir
      • Flujos de trabajo que antes requerían una frontier API ahora migran a modelos open-weight baratos, modelos especializados ajustados (fine-tuned) o stacks con routing, y productos premium pasan a ser una commodity feature
    • DeepSeek muestra de manera aún más radical que un cambio en las expectativas de costo en la capa de modelos puede redirigir el pool de márgenes en las capas superiores
  • Latency

    • Se vuelve una variable cuando la IA pasa del prompting asíncrono a flujos de trabajo en tiempo real
      • Un modelo lento puede servir para redactar notas, pero se cae en sales call, support conversation, tutoring session o security response
    • En el momento en que hay una persona esperando del otro lado, latency deja de ser un detalle de desempeño y pasa a definir si un mercado puede existir
      • voice cruzó esa línea cuando llegaron juntos la calidad, el manejo de interrupciones y el precio de centavos por minuto
    • La caída de latency no solo acelera el mismo producto, sino que abre una nueva superficie (surface) de uso
  • Nuevas curvas

    • Hace 2 años no habrían entrado en la lista inference-time compute, task horizon y el hecho de que la propia IA sea un insumo de producción
    • Inference-time compute

      • Un dial donde usar 10 veces más cómputo produce mejores respuestas es un elemento realmente nuevo que no existía en el software anterior, y convierte el costo por resultado en una cuestión de elección
        • Una consulta de 10 segundos y una de 10 minutos sobre el mismo modelo son productos distintos con precios distintos, y el margen depende no del precio del modelo, sino del criterio del sistema
      • Esto es el contraataque de la capa de aplicación frente a los labs: mientras más absorben los frontier models la lógica del producto, más debe argumentar cada empresa que puede asignar mejor los tokens del cliente
      • El laboratorio tiene incentivos para expandir el uso; la aplicación, para gastar solo donde el resultado lo justifique
    • Task horizon

      • Si el dial de profundidad es inference-time compute, task horizon es el dial de longitud: cuánto tiempo puede operar la IA por sí sola antes de la intervención humana
        • La unidad pasa de la llamada al workflow
        • Los agentes operan durante horas, crean subagentes y consumen millones de tokens por ruta de decisión, por lo que el uso ya no es proporcional a un seat
      • Multiplicar longitud y profundidad produce la factura de tokens por la que preguntan todos los CFO de Fortune 500
    • La IA como insumo de su propia producción

      • La IA se usa para generar synthetic data, escribir código, crear evals y comprimir el ciclo de experimentación
        • Cada generación acorta el tiempo de construcción de la siguiente, volviendo la tasa de cambio endógena (endogenous)
      • Por esta recursividad, el ciclo de cambio ya se volvió más corto que el ciclo de fundraising, y la vida media de cualquier thesis se está reduciendo
  • Geopolitics

    • Aquí es donde la guerra se vuelve explícita, y China está siendo empujada estructuralmente hacia la eficiencia y la publicación open-weight
      • El acceso limitado a chips y la exclusión de partes del frontier stack hacen racional esa estrategia
    • EE. UU. todavía puede competir con frontier models open-weight, pero aún no ha producido la misma respuesta estructural
    • El software no requería entrenamientos de miles de millones de dólares, pero los frontier open weights necesitan compute financing, patient capital, release governance, serving infrastructure y herramientas para competir por talento
      • Algún grupo estadounidense tendrá que justificar ese costo de entrenamiento mediante federation o financial engineering
    • Los frontier labs, creyendo que la tecnología es riesgosa, promueven regulación basada en capability y se benefician cuando el acceso frontier queda controlado, auditado, medido y detrás de una API
    • DeepSeek no es solo la publicación de un modelo, sino un disparo en la guerra por decidir quién fija el precio de la inteligencia
  • Deployment

    • Sigue en disputa porque el valor no termina por asentarse por completo en la cloud
      • La inferencia se mueve al lugar más barato que no arruine el producto: frontier reasoning en la cloud, latency en el edge, privacidad y personalización on-device, y flujos que necesitan las tres cosas en híbrido
    • Como los modelos no solo almacenan datos sino que infieren el context, memory, documents, voice, code, behavior y enterprise permissions del usuario, la privacidad importa más que en SaaS
    • El lugar donde ocurre la inferencia determina quién se queda con el margen, quién posee el contexto y en quién confía el cliente
  • Talent

    • En SaaS, el talento era una variable de ejecución: un mejor equipo construía más rápido, vendía mejor y operaba con más disciplina
    • En IA, el talento es un insumo bruto (raw input) de producción: unos pocos investigadores pueden cambiar la architecture, la data mixture, el eval regime y la propia curva costo-capability
      • El equipo no solo puede ejecutar según el mercado: puede cambiar la forma del mercado
    • Ya no solo la calidad operativa, sino también el research taste se vuelve parte del activo

La amenaza ya no es el competidor

  • En SaaS, normalmente una empresa muere por otra empresa: un competidor con más capital, un equipo más rápido o un incumbente que expande su territorio
    • Una excepción era cuando una empresa construida sobre la plataforma de otro desaparecía sin competencia directa por cambios de precio o de términos
    • La IA convierte esa excepción en el caso por defecto (default)
  • La amenaza en IA es la migración de capas (layer migration): si capability, cost, latency, deployment, regulation o trust cambian lo suficiente, el trabajo se mueve
    • Puede moverse al modelo, a una alternativa open-weight, a la plataforma de datos del cliente, a un agent runtime o al propio dispositivo
  • Otra variable es la demanda: los compradores se mueven lento, pero no son ingenuos, y como conocen el costo del lock-in, ese arbitraje de tiempo se está cerrando

También se invierte la forma de construir empresas

  • Están desapareciendo los supuestos del pasado y el consejo tradicional de VC
    • Si SaaS vendía productividad y buen ambiente, la IA es cada vez más un negocio menos indulgente que vende resultados y servicios; para que el producto sea bueno, el resultado tiene que funcionar, y para que la empresa funcione, ese resultado debe producirse con suficiente eficiencia
  • La bifurcación entre Consumer y Enterprise

    • En consumer, basta con breadth: ser rápido, barato, ampliamente útil y tolerado cuando falla
    • En enterprise, el estándar es distinto: tiene que operar dentro de un workflow específico, incorporando el context, permissions, data y risk tolerance del cliente
      • Por eso un frontier model por sí solo no es un producto enterprise; el valor está en la capa de application, orchestration, services y proprietary data que vuelve útil al modelo dentro de la empresa
  • Distribution y Talent

    • El modelo de ayer puede habilitar un producto nuevo, así que una empresa puede reposicionarse el martes
      • Algunas empresas ya cambiaron el perfil de su fuerza de ventas hacia gente capaz de vender un objetivo que se mueve
      • En algunas empresas, empezar con un enfoque top-down funciona desde el inicio
  • Estructura económica

    • El services-as-software cambia la fijación de precios, y las alianzas con systems integrators aparecen años antes de lo que indicaba el playbook anterior
    • El mercado se divide: algunos inversionistas ven portafolios donde el producto se reconstruye sin parar y concluyen que el producto casi no importa y que el verdadero negocio son los servicios; otros sienten rechazo por cualquier cosa que parezca consultoría
    • La verdad más incómoda es que en IA product, services, deployment y distribution se están recombinando de forma distinta en cada empresa
  • Innovación del fundador

    • Un ICP estrecho, un solo wedge, construir despacio, contratar de forma predecible y retención impulsada por producto: nada de eso alcanza en un mercado donde las variables no se quedan quietas y los clientes no quieren point solutions
    • Lo que parece ganar es tener ciclos de retroalimentación rápidos, equipos pequeños con autoridad y la comodidad de reorganizarse según el cambio, en vez de seguir un plan hecho hace 6 meses

El desafío ahora es para fundadores y Estados

  • En IA, el valor no se captura una vez para luego defenderse: se reprecifica y reubica continuamente, y las variables son la manera de leer la dirección y velocidad de ese desplazamiento
    • Toda empresa de IA está sentada sobre una pila de supuestos, y las empresas sólidas saben frente a qué supuestos están long y frente a cuáles están short
  • Invertir y construir en IA se parece más a gestionar un trading book que a hacer due diligence sobre una empresa de software
    • Se está long en algunas curvas y short en otras, expuesto a correlaciones que pueden romperse en el momento más importante
  • Hay que elegir por qué variables apostar, saber qué variables pueden matarte y construir la empresa para recuperarte más rápido antes de que una apuesta equivocada se acumule de manera compuesta
  • Dimensión política

    • El gobierno de EE. UU. estaría mejor si pudiera manejar dos variables al mismo tiempo: controlar el frontier peligroso, pero sin hacer que la inteligencia sea tan cara que solo los labs cerrados y los países rivales puedan definir el futuro
    • El país que gane no será el que más regule ni el que más publique, sino el que encuentre cómo volver la inteligencia lo bastante segura como para confiar en ella y lo bastante barata como para que se difunda

Aún no hay comentarios.

Aún no hay comentarios.