Por qué Physical AI está atrayendo atención ahora y qué la diferencia del pasado
(nextbigteng.substack.com)- La inversión de VC en el sector de Physical AI está aumentando de forma significativa, y una serie de eventos como NVIDIA GTC, Bessemer Robotics Day, la IPO de Unitree, la adquisición de Fauna Robotics por parte de Amazon y la aparición del humanoide de Figure en la Casa Blanca están generando momentum en la industria
- Aunque sigue presente el trauma de los fracasos de inversión en robótica del pasado, este ciclo es fundamentalmente distinto porque los catalizadores clave están actuando de forma compuesta y simultánea en paralelo, no de manera secuencial
- Con la aparición de modelos fundacionales especializados para el mundo físico, como los modelos de visión-lenguaje-acción, los modelos de conducción autónoma y los modelos de mundo, se abre la posibilidad de un "cerebro robótico" de propósito general
- El cuello de botella en la recolección de datos para entrenar robots se está aliviando gracias a avances en simulación, teleoperación y video egocéntrico, mientras convergen factores macro como la inferencia en el edge, la caída en costos de hardware y la escasez de mano de obra
- Tanto en big tech como en startups se está produciendo una gran migración de talento que recuerda a los primeros días del boom de los LLM, y el "momento ChatGPT" de Physical AI podría estar más cerca de lo esperado
Momentum actual de Physical AI
- La semana pasada apareció el robot Olaf en la keynote de NVIDIA GTC, y luego llegaron noticias sobre Bessemer Robotics Day y la IPO de Unitree
- En esa misma semana también llamaron la atención la adquisición de Fauna Robotics por parte de Amazon y la aparición del humanoide de Figure en la Casa Blanca
- El financiamiento de VC hacia el sector de Physical AI ha mostrado recientemente un aumento relevante, algo que puede confirmarse en un informe de Morgan Stanley (diciembre de 2025)
- En las predicciones para 2026, la competencia en Embodied AI podría generar resultados más intensos e importantes que la guerra de los LLM
Por qué esta vez es diferente: acción compuesta simultánea de catalizadores en paralelo
- La robótica no siempre ha sido una categoría "de moda", y muchos inversionistas todavía cargan con la experiencia de fracasos previos (scar tissue) de ciclos anteriores
- Un informe de Bessemer Venture Partners (noviembre de 2025) permite ver los altibajos de los ciclos pasados de inversión en robótica
- La diferencia clave ahora es que los catalizadores de Physical AI están acumulándose de forma compuesta en paralelo, no secuencialmente
- Esto está provocando una convergencia fundamentalmente distinta a cualquier momento anterior
Rápido avance de los modelos fundacionales para Physical AI
- Están surgiendo nuevos tipos de modelos de IA diseñados específicamente para el mundo físico
- Incluyen modelos de visión-lenguaje-acción (Vision-Language-Action), modelos de conducción autónoma y modelos de mundo
- Está empezando a formarse una capa de modelos fundacionales para robótica, con la posibilidad de crear un "cerebro robótico" capaz de pensar y razonar en múltiples tareas, entornos y factores de forma
- En comparación con enfoques frágiles basados en reglas o políticas entrenadas en dominios estrechos que no generalizan, esto representa una mejora de salto escalonado (step-function improvement)
Alivio del cuello de botella de datos
- Durante años, el factor limitante en la frontera de la robótica no fue la inteligencia, sino los datos
- Los datos necesarios para entrenar modelos robóticos —habilidades motoras, presión, manipulación, etc.— no pueden recolectarse de internet
- Los datos para Physical AI son no estructurados y multimodales, y recolectarlos en entornos reales es costoso y lento
- Esta limitación se está relajando gracias a los siguientes avances tecnológicos:
- Teleoperación escalable, enfoque de simulación primero, video egocéntrico, modelos de mundo y háptica
- Las técnicas y herramientas relacionadas están madurando rápidamente (ver material de Emily Yu de Boost VC)
- El problema de los datos no está completamente resuelto, pero ya no es una barrera imposible de superar como antes
Maduración oportuna de la infraestructura de inferencia
- La inteligencia robótica solo es útil si puede permitir acción en tiempo real
- Se han producido avances en inferencia en el edge (edge inference)
- Cómputo más eficiente capaz de ejecutar modelos complejos localmente y en tiempo real en el dispositivo
- En entornos donde la latencia y la conectividad son restricciones duras —como plantas de producción u obras de construcción— la acción inmediata es indispensable, por lo que este tipo de inferencia es clave para los sistemas de Physical AI
El hardware ya está listo para escalar y los costos están bajando
- Las mejoras de hardware, la comoditización y la caída de la curva de costos están haciendo económicamente viables robots escalables y versátiles
- Esto es una condición indispensable para convertir demos prometedores en productos realmente desplegables
Vientos macroeconómicos a favor
- Los cambios tecnológicos y un entorno macro favorable están convergiendo al mismo tiempo
- La escasez de mano de obra, la fragilidad de las cadenas de suministro y las presiones geopolíticas asociadas al reshoring están convirtiendo la automatización de una apuesta al futuro en una necesidad estratégica del presente
- La autonomía también se está volviendo mainstream en la percepción pública
- Desde vehículos autónomos en las calles hasta robots humanoides atendiendo clientes en restaurantes
Gran entrada de talento
- La señal más importante es el movimiento de talento
- Investigadores, desarrolladores y fundadores de big tech y startups están migrando hacia la robótica
- La escala de este movimiento recuerda al inicio del boom de los LLM (ver informe de Lazard de septiembre de 2025)
¿Cuándo llega el "momento ChatGPT"?
- Los avances recientes son notables, pero el debate central se ha desplazado al timing: ¿cuándo llegará el "momento ChatGPT" de Physical AI?
- Aún no se ha alcanzado una verdadera generalización (true generalizability) a gran escala en entornos reales
- Sin embargo, a medida que múltiples catalizadores actúan de forma compuesta en paralelo, la trayectoria que sugiere que el punto de inflexión podría estar más cerca de lo esperado se vuelve cada vez más clara
Aún no hay comentarios.