¿Quién va a fijar el precio de la inteligencia?

(x.com/JayaGup10)

2 puntos por GN⁺ 3 시간 전 | Aún no hay comentarios. | Compartir por WhatsApp

A medida que la IA convierte la inteligencia (intelligence) en un recurso con precio, todos los niveles del mercado compiten por controlar quién fija ese precio
Los laboratorios de IA quieren que el uso pase por ellos, las aplicaciones intentan demostrar que pueden asignar la inteligencia mejor que los laboratorios, y los Estados quieren que se vuelva lo bastante barata como para convertirse en infraestructura nacional
El costo de la inteligencia ya no es una variable de entrada del software, sino un eje (axis) que reorganiza empresas, mercados y geopolítica
La razón por la que invertir en IA es distinto de invertir en software es que hay más variables, esas variables están acopladas (coupled) de forma desigual, y cada variable se descompone en subvariables que se mueven en su propia curva
Se trata de analizar un sistema en el que la propia ecuación se reescribe cada hora, y en el que si cualquier variable se mueve lo suficiente, cambia el significado de las demás: una reconfiguración continua

Por qué invertir en IA es distinto de invertir en software

En software, aunque hacer pattern matching era difícil, sí funcionaba, y el costo de distribución (distribution cost) determinaba la eficiencia de adquisición de clientes, mientras que el costo de cambio (switching cost) determinaba la retención y expansión
- CAC payback, NDR, magic number y Rule of 40 son todos resultados derivados de esas dos fuerzas
La IA rompe eso por tres razones
- Hay más variables en el sistema
- Las variables están acopladas de manera desigual
- Cada variable se descompone en subvariables que se mueven en su propia curva
Si se mueve cualquiera entre capability, cost, latency, deployment, regulation o talent, cambia el significado del resto; y cuando se resuelve una restricción, cambia cuál es la siguiente restricción importante

Lo que cambia cada variable

Las variables familiares de las que ya se habla son capability, cost y latency
Las variables más difíciles son los unlocks que salen de la investigación y el producto: es difícil modelar de antemano su naturaleza y profundidad, y la velocidad con que llegan sigue acelerándose
Restricciones que el software trataba como constantes fijas se convierten en decisiones estratégicas en IA: geopolitics, deployment y talent
Capability
- Se descompone en reasoning, context, multimodality, tool use, planning, memory y controllability, y cada una se mueve con fuerza en su propia curva
  - context se expandió en 3 años de 4 mil tokens a más de 1 millón de tokens
  - reasoning evolucionó de truco de prompting a una clase de modelo independiente
- Ha absorbido infraestructura como retrieval pipelines, output parsers y prompt scaffolds, que eran prótesis (prosthetics) usadas para compensar debilidades del modelo
- Un modelo que apenas puede contener prompts y un modelo que puede contener una base de código o el historial de un cliente son productos distintos; las mejoras de desempeño no elevan por igual a todas las aplicaciones, sino que desplazan el cuello de botella (bottleneck)
Cost
- La caída de costos no solo mejora márgenes: cambia quién puede competir
  - Flujos de trabajo que antes requerían una frontier API ahora migran a modelos open-weight baratos, modelos especializados ajustados (fine-tuned) o stacks con routing, y productos premium pasan a ser una commodity feature
- DeepSeek muestra de manera aún más radical que un cambio en las expectativas de costo en la capa de modelos puede redirigir el pool de márgenes en las capas superiores
Latency
- Se vuelve una variable cuando la IA pasa del prompting asíncrono a flujos de trabajo en tiempo real
  - Un modelo lento puede servir para redactar notas, pero se cae en sales call, support conversation, tutoring session o security response
- En el momento en que hay una persona esperando del otro lado, latency deja de ser un detalle de desempeño y pasa a definir si un mercado puede existir
  - voice cruzó esa línea cuando llegaron juntos la calidad, el manejo de interrupciones y el precio de centavos por minuto
- La caída de latency no solo acelera el mismo producto, sino que abre una nueva superficie (surface) de uso
Nuevas curvas
- Hace 2 años no habrían entrado en la lista inference-time compute, task horizon y el hecho de que la propia IA sea un insumo de producción
- Inference-time compute
  - Un dial donde usar 10 veces más cómputo produce mejores respuestas es un elemento realmente nuevo que no existía en el software anterior, y convierte el costo por resultado en una cuestión de elección
    - Una consulta de 10 segundos y una de 10 minutos sobre el mismo modelo son productos distintos con precios distintos, y el margen depende no del precio del modelo, sino del criterio del sistema
  - Esto es el contraataque de la capa de aplicación frente a los labs: mientras más absorben los frontier models la lógica del producto, más debe argumentar cada empresa que puede asignar mejor los tokens del cliente
  - El laboratorio tiene incentivos para expandir el uso; la aplicación, para gastar solo donde el resultado lo justifique
- Task horizon
  - Si el dial de profundidad es inference-time compute, task horizon es el dial de longitud: cuánto tiempo puede operar la IA por sí sola antes de la intervención humana
    - La unidad pasa de la llamada al workflow
    - Los agentes operan durante horas, crean subagentes y consumen millones de tokens por ruta de decisión, por lo que el uso ya no es proporcional a un seat
  - Multiplicar longitud y profundidad produce la factura de tokens por la que preguntan todos los CFO de Fortune 500
- La IA como insumo de su propia producción
  - La IA se usa para generar synthetic data, escribir código, crear evals y comprimir el ciclo de experimentación
    - Cada generación acorta el tiempo de construcción de la siguiente, volviendo la tasa de cambio endógena (endogenous)
  - Por esta recursividad, el ciclo de cambio ya se volvió más corto que el ciclo de fundraising, y la vida media de cualquier thesis se está reduciendo
Geopolitics
- Aquí es donde la guerra se vuelve explícita, y China está siendo empujada estructuralmente hacia la eficiencia y la publicación open-weight
  - El acceso limitado a chips y la exclusión de partes del frontier stack hacen racional esa estrategia
- EE. UU. todavía puede competir con frontier models open-weight, pero aún no ha producido la misma respuesta estructural
- El software no requería entrenamientos de miles de millones de dólares, pero los frontier open weights necesitan compute financing, patient capital, release governance, serving infrastructure y herramientas para competir por talento
  - Algún grupo estadounidense tendrá que justificar ese costo de entrenamiento mediante federation o financial engineering
- Los frontier labs, creyendo que la tecnología es riesgosa, promueven regulación basada en capability y se benefician cuando el acceso frontier queda controlado, auditado, medido y detrás de una API
- DeepSeek no es solo la publicación de un modelo, sino un disparo en la guerra por decidir quién fija el precio de la inteligencia
Deployment
- Sigue en disputa porque el valor no termina por asentarse por completo en la cloud
  - La inferencia se mueve al lugar más barato que no arruine el producto: frontier reasoning en la cloud, latency en el edge, privacidad y personalización on-device, y flujos que necesitan las tres cosas en híbrido
- Como los modelos no solo almacenan datos sino que infieren el context, memory, documents, voice, code, behavior y enterprise permissions del usuario, la privacidad importa más que en SaaS
- El lugar donde ocurre la inferencia determina quién se queda con el margen, quién posee el contexto y en quién confía el cliente
Talent
- En SaaS, el talento era una variable de ejecución: un mejor equipo construía más rápido, vendía mejor y operaba con más disciplina
- En IA, el talento es un insumo bruto (raw input) de producción: unos pocos investigadores pueden cambiar la architecture, la data mixture, el eval regime y la propia curva costo-capability
  - El equipo no solo puede ejecutar según el mercado: puede cambiar la forma del mercado
- Ya no solo la calidad operativa, sino también el research taste se vuelve parte del activo

La amenaza ya no es el competidor

En SaaS, normalmente una empresa muere por otra empresa: un competidor con más capital, un equipo más rápido o un incumbente que expande su territorio
- Una excepción era cuando una empresa construida sobre la plataforma de otro desaparecía sin competencia directa por cambios de precio o de términos
- La IA convierte esa excepción en el caso por defecto (default)
La amenaza en IA es la migración de capas (layer migration): si capability, cost, latency, deployment, regulation o trust cambian lo suficiente, el trabajo se mueve
- Puede moverse al modelo, a una alternativa open-weight, a la plataforma de datos del cliente, a un agent runtime o al propio dispositivo
Otra variable es la demanda: los compradores se mueven lento, pero no son ingenuos, y como conocen el costo del lock-in, ese arbitraje de tiempo se está cerrando

También se invierte la forma de construir empresas

Están desapareciendo los supuestos del pasado y el consejo tradicional de VC
- Si SaaS vendía productividad y buen ambiente, la IA es cada vez más un negocio menos indulgente que vende resultados y servicios; para que el producto sea bueno, el resultado tiene que funcionar, y para que la empresa funcione, ese resultado debe producirse con suficiente eficiencia
La bifurcación entre Consumer y Enterprise
- En consumer, basta con breadth: ser rápido, barato, ampliamente útil y tolerado cuando falla
- En enterprise, el estándar es distinto: tiene que operar dentro de un workflow específico, incorporando el context, permissions, data y risk tolerance del cliente
  - Por eso un frontier model por sí solo no es un producto enterprise; el valor está en la capa de application, orchestration, services y proprietary data que vuelve útil al modelo dentro de la empresa
Distribution y Talent
- El modelo de ayer puede habilitar un producto nuevo, así que una empresa puede reposicionarse el martes
  - Algunas empresas ya cambiaron el perfil de su fuerza de ventas hacia gente capaz de vender un objetivo que se mueve
  - En algunas empresas, empezar con un enfoque top-down funciona desde el inicio
Estructura económica
- El services-as-software cambia la fijación de precios, y las alianzas con systems integrators aparecen años antes de lo que indicaba el playbook anterior
- El mercado se divide: algunos inversionistas ven portafolios donde el producto se reconstruye sin parar y concluyen que el producto casi no importa y que el verdadero negocio son los servicios; otros sienten rechazo por cualquier cosa que parezca consultoría
- La verdad más incómoda es que en IA product, services, deployment y distribution se están recombinando de forma distinta en cada empresa
Innovación del fundador
- Un ICP estrecho, un solo wedge, construir despacio, contratar de forma predecible y retención impulsada por producto: nada de eso alcanza en un mercado donde las variables no se quedan quietas y los clientes no quieren point solutions
- Lo que parece ganar es tener ciclos de retroalimentación rápidos, equipos pequeños con autoridad y la comodidad de reorganizarse según el cambio, en vez de seguir un plan hecho hace 6 meses

El desafío ahora es para fundadores y Estados

En IA, el valor no se captura una vez para luego defenderse: se reprecifica y reubica continuamente, y las variables son la manera de leer la dirección y velocidad de ese desplazamiento
- Toda empresa de IA está sentada sobre una pila de supuestos, y las empresas sólidas saben frente a qué supuestos están long y frente a cuáles están short
Invertir y construir en IA se parece más a gestionar un trading book que a hacer due diligence sobre una empresa de software
- Se está long en algunas curvas y short en otras, expuesto a correlaciones que pueden romperse en el momento más importante
Hay que elegir por qué variables apostar, saber qué variables pueden matarte y construir la empresa para recuperarte más rápido antes de que una apuesta equivocada se acumule de manera compuesta
Dimensión política
- El gobierno de EE. UU. estaría mejor si pudiera manejar dos variables al mismo tiempo: controlar el frontier peligroso, pero sin hacer que la inteligencia sea tan cara que solo los labs cerrados y los países rivales puedan definir el futuro
- El país que gane no será el que más regule ni el que más publique, sino el que encuentre cómo volver la inteligencia lo bastante segura como para confiar en ella y lo bastante barata como para que se difunda

¿Quién va a fijar el precio de la inteligencia?

Por qué invertir en IA es distinto de invertir en software

Lo que cambia cada variable

Capability

Cost

Latency

Nuevas curvas

Inference-time compute

Task horizon

La IA como insumo de su propia producción

Geopolitics

Deployment

Talent

La amenaza ya no es el competidor

También se invierte la forma de construir empresas

La bifurcación entre Consumer y Enterprise

Distribution y Talent

Estructura económica

Innovación del fundador

El desafío ahora es para fundadores y Estados

Dimensión política

Lecturas relacionadas

Aún no hay comentarios.