¿Quién va a fijar el precio de la inteligencia?
(x.com/JayaGup10)- A medida que la IA convierte la inteligencia (
intelligence) en un recurso con precio, todos los niveles del mercado compiten por controlar quién fija ese precio - Los laboratorios de IA quieren que el uso pase por ellos, las aplicaciones intentan demostrar que pueden asignar la inteligencia mejor que los laboratorios, y los Estados quieren que se vuelva lo bastante barata como para convertirse en infraestructura nacional
- El costo de la inteligencia ya no es una variable de entrada del software, sino un eje (
axis) que reorganiza empresas, mercados y geopolítica - La razón por la que invertir en IA es distinto de invertir en software es que hay más variables, esas variables están acopladas (
coupled) de forma desigual, y cada variable se descompone en subvariables que se mueven en su propia curva - Se trata de analizar un sistema en el que la propia ecuación se reescribe cada hora, y en el que si cualquier variable se mueve lo suficiente, cambia el significado de las demás: una reconfiguración continua
Por qué invertir en IA es distinto de invertir en software
- En software, aunque hacer pattern matching era difícil, sí funcionaba, y el costo de distribución (
distribution cost) determinaba la eficiencia de adquisición de clientes, mientras que el costo de cambio (switching cost) determinaba la retención y expansión- CAC payback, NDR, magic number y Rule of 40 son todos resultados derivados de esas dos fuerzas
- La IA rompe eso por tres razones
- Hay más variables en el sistema
- Las variables están acopladas de manera desigual
- Cada variable se descompone en subvariables que se mueven en su propia curva
- Si se mueve cualquiera entre capability, cost, latency, deployment, regulation o talent, cambia el significado del resto; y cuando se resuelve una restricción, cambia cuál es la siguiente restricción importante
Lo que cambia cada variable
- Las variables familiares de las que ya se habla son capability, cost y latency
- Las variables más difíciles son los unlocks que salen de la investigación y el producto: es difícil modelar de antemano su naturaleza y profundidad, y la velocidad con que llegan sigue acelerándose
- Restricciones que el software trataba como constantes fijas se convierten en decisiones estratégicas en IA: geopolitics, deployment y talent
-
Capability
- Se descompone en reasoning, context, multimodality, tool use, planning, memory y controllability, y cada una se mueve con fuerza en su propia curva
- context se expandió en 3 años de 4 mil tokens a más de 1 millón de tokens
- reasoning evolucionó de truco de prompting a una clase de modelo independiente
- Ha absorbido infraestructura como retrieval pipelines, output parsers y prompt scaffolds, que eran prótesis (
prosthetics) usadas para compensar debilidades del modelo - Un modelo que apenas puede contener prompts y un modelo que puede contener una base de código o el historial de un cliente son productos distintos; las mejoras de desempeño no elevan por igual a todas las aplicaciones, sino que desplazan el cuello de botella (
bottleneck)
- Se descompone en reasoning, context, multimodality, tool use, planning, memory y controllability, y cada una se mueve con fuerza en su propia curva
-
Cost
- La caída de costos no solo mejora márgenes: cambia quién puede competir
- Flujos de trabajo que antes requerían una frontier API ahora migran a modelos open-weight baratos, modelos especializados ajustados (
fine-tuned) o stacks con routing, y productos premium pasan a ser una commodity feature
- Flujos de trabajo que antes requerían una frontier API ahora migran a modelos open-weight baratos, modelos especializados ajustados (
- DeepSeek muestra de manera aún más radical que un cambio en las expectativas de costo en la capa de modelos puede redirigir el pool de márgenes en las capas superiores
- La caída de costos no solo mejora márgenes: cambia quién puede competir
-
Latency
- Se vuelve una variable cuando la IA pasa del prompting asíncrono a flujos de trabajo en tiempo real
- Un modelo lento puede servir para redactar notas, pero se cae en sales call, support conversation, tutoring session o security response
- En el momento en que hay una persona esperando del otro lado, latency deja de ser un detalle de desempeño y pasa a definir si un mercado puede existir
- voice cruzó esa línea cuando llegaron juntos la calidad, el manejo de interrupciones y el precio de centavos por minuto
- La caída de latency no solo acelera el mismo producto, sino que abre una nueva superficie (
surface) de uso
- Se vuelve una variable cuando la IA pasa del prompting asíncrono a flujos de trabajo en tiempo real
-
Nuevas curvas
- Hace 2 años no habrían entrado en la lista inference-time compute, task horizon y el hecho de que la propia IA sea un insumo de producción
-
Inference-time compute
- Un dial donde usar 10 veces más cómputo produce mejores respuestas es un elemento realmente nuevo que no existía en el software anterior, y convierte el costo por resultado en una cuestión de elección
- Una consulta de 10 segundos y una de 10 minutos sobre el mismo modelo son productos distintos con precios distintos, y el margen depende no del precio del modelo, sino del criterio del sistema
- Esto es el contraataque de la capa de aplicación frente a los labs: mientras más absorben los frontier models la lógica del producto, más debe argumentar cada empresa que puede asignar mejor los tokens del cliente
- El laboratorio tiene incentivos para expandir el uso; la aplicación, para gastar solo donde el resultado lo justifique
- Un dial donde usar 10 veces más cómputo produce mejores respuestas es un elemento realmente nuevo que no existía en el software anterior, y convierte el costo por resultado en una cuestión de elección
-
Task horizon
- Si el dial de profundidad es inference-time compute, task horizon es el dial de longitud: cuánto tiempo puede operar la IA por sí sola antes de la intervención humana
- La unidad pasa de la llamada al workflow
- Los agentes operan durante horas, crean subagentes y consumen millones de tokens por ruta de decisión, por lo que el uso ya no es proporcional a un seat
- Multiplicar longitud y profundidad produce la factura de tokens por la que preguntan todos los CFO de Fortune 500
- Si el dial de profundidad es inference-time compute, task horizon es el dial de longitud: cuánto tiempo puede operar la IA por sí sola antes de la intervención humana
-
La IA como insumo de su propia producción
- La IA se usa para generar synthetic data, escribir código, crear evals y comprimir el ciclo de experimentación
- Cada generación acorta el tiempo de construcción de la siguiente, volviendo la tasa de cambio endógena (
endogenous)
- Cada generación acorta el tiempo de construcción de la siguiente, volviendo la tasa de cambio endógena (
- Por esta recursividad, el ciclo de cambio ya se volvió más corto que el ciclo de fundraising, y la vida media de cualquier thesis se está reduciendo
- La IA se usa para generar synthetic data, escribir código, crear evals y comprimir el ciclo de experimentación
-
Geopolitics
- Aquí es donde la guerra se vuelve explícita, y China está siendo empujada estructuralmente hacia la eficiencia y la publicación open-weight
- El acceso limitado a chips y la exclusión de partes del frontier stack hacen racional esa estrategia
- EE. UU. todavía puede competir con frontier models open-weight, pero aún no ha producido la misma respuesta estructural
- El software no requería entrenamientos de miles de millones de dólares, pero los frontier open weights necesitan compute financing, patient capital, release governance, serving infrastructure y herramientas para competir por talento
- Algún grupo estadounidense tendrá que justificar ese costo de entrenamiento mediante federation o financial engineering
- Los frontier labs, creyendo que la tecnología es riesgosa, promueven regulación basada en capability y se benefician cuando el acceso frontier queda controlado, auditado, medido y detrás de una API
- DeepSeek no es solo la publicación de un modelo, sino un disparo en la guerra por decidir quién fija el precio de la inteligencia
- Aquí es donde la guerra se vuelve explícita, y China está siendo empujada estructuralmente hacia la eficiencia y la publicación open-weight
-
Deployment
- Sigue en disputa porque el valor no termina por asentarse por completo en la cloud
- La inferencia se mueve al lugar más barato que no arruine el producto: frontier reasoning en la cloud, latency en el edge, privacidad y personalización on-device, y flujos que necesitan las tres cosas en híbrido
- Como los modelos no solo almacenan datos sino que infieren el context, memory, documents, voice, code, behavior y enterprise permissions del usuario, la privacidad importa más que en SaaS
- El lugar donde ocurre la inferencia determina quién se queda con el margen, quién posee el contexto y en quién confía el cliente
- Sigue en disputa porque el valor no termina por asentarse por completo en la cloud
-
Talent
- En SaaS, el talento era una variable de ejecución: un mejor equipo construía más rápido, vendía mejor y operaba con más disciplina
- En IA, el talento es un insumo bruto (
raw input) de producción: unos pocos investigadores pueden cambiar la architecture, la data mixture, el eval regime y la propia curva costo-capability- El equipo no solo puede ejecutar según el mercado: puede cambiar la forma del mercado
- Ya no solo la calidad operativa, sino también el research taste se vuelve parte del activo
La amenaza ya no es el competidor
- En SaaS, normalmente una empresa muere por otra empresa: un competidor con más capital, un equipo más rápido o un incumbente que expande su territorio
- Una excepción era cuando una empresa construida sobre la plataforma de otro desaparecía sin competencia directa por cambios de precio o de términos
- La IA convierte esa excepción en el caso por defecto (
default)
- La amenaza en IA es la migración de capas (
layer migration): si capability, cost, latency, deployment, regulation o trust cambian lo suficiente, el trabajo se mueve- Puede moverse al modelo, a una alternativa open-weight, a la plataforma de datos del cliente, a un agent runtime o al propio dispositivo
- Otra variable es la demanda: los compradores se mueven lento, pero no son ingenuos, y como conocen el costo del lock-in, ese arbitraje de tiempo se está cerrando
También se invierte la forma de construir empresas
- Están desapareciendo los supuestos del pasado y el consejo tradicional de VC
- Si SaaS vendía productividad y buen ambiente, la IA es cada vez más un negocio menos indulgente que vende resultados y servicios; para que el producto sea bueno, el resultado tiene que funcionar, y para que la empresa funcione, ese resultado debe producirse con suficiente eficiencia
-
La bifurcación entre Consumer y Enterprise
- En consumer, basta con breadth: ser rápido, barato, ampliamente útil y tolerado cuando falla
- En enterprise, el estándar es distinto: tiene que operar dentro de un workflow específico, incorporando el context, permissions, data y risk tolerance del cliente
- Por eso un frontier model por sí solo no es un producto enterprise; el valor está en la capa de application, orchestration, services y proprietary data que vuelve útil al modelo dentro de la empresa
-
Distribution y Talent
- El modelo de ayer puede habilitar un producto nuevo, así que una empresa puede reposicionarse el martes
- Algunas empresas ya cambiaron el perfil de su fuerza de ventas hacia gente capaz de vender un objetivo que se mueve
- En algunas empresas, empezar con un enfoque top-down funciona desde el inicio
- El modelo de ayer puede habilitar un producto nuevo, así que una empresa puede reposicionarse el martes
-
Estructura económica
- El services-as-software cambia la fijación de precios, y las alianzas con systems integrators aparecen años antes de lo que indicaba el playbook anterior
- El mercado se divide: algunos inversionistas ven portafolios donde el producto se reconstruye sin parar y concluyen que el producto casi no importa y que el verdadero negocio son los servicios; otros sienten rechazo por cualquier cosa que parezca consultoría
- La verdad más incómoda es que en IA product, services, deployment y distribution se están recombinando de forma distinta en cada empresa
-
Innovación del fundador
- Un ICP estrecho, un solo wedge, construir despacio, contratar de forma predecible y retención impulsada por producto: nada de eso alcanza en un mercado donde las variables no se quedan quietas y los clientes no quieren point solutions
- Lo que parece ganar es tener ciclos de retroalimentación rápidos, equipos pequeños con autoridad y la comodidad de reorganizarse según el cambio, en vez de seguir un plan hecho hace 6 meses
El desafío ahora es para fundadores y Estados
- En IA, el valor no se captura una vez para luego defenderse: se reprecifica y reubica continuamente, y las variables son la manera de leer la dirección y velocidad de ese desplazamiento
- Toda empresa de IA está sentada sobre una pila de supuestos, y las empresas sólidas saben frente a qué supuestos están long y frente a cuáles están short
- Invertir y construir en IA se parece más a gestionar un trading book que a hacer due diligence sobre una empresa de software
- Se está long en algunas curvas y short en otras, expuesto a correlaciones que pueden romperse en el momento más importante
- Hay que elegir por qué variables apostar, saber qué variables pueden matarte y construir la empresa para recuperarte más rápido antes de que una apuesta equivocada se acumule de manera compuesta
-
Dimensión política
- El gobierno de EE. UU. estaría mejor si pudiera manejar dos variables al mismo tiempo: controlar el frontier peligroso, pero sin hacer que la inteligencia sea tan cara que solo los labs cerrados y los países rivales puedan definir el futuro
- El país que gane no será el que más regule ni el que más publique, sino el que encuentre cómo volver la inteligencia lo bastante segura como para confiar en ella y lo bastante barata como para que se difunda
Aún no hay comentarios.