- La industria de la robótica se encuentra actualmente en una etapa equivalente a GPT-2.5, donde los modelos fundacionales ya muestran capacidades reales, pero la brecha entre los resultados de laboratorio y el despliegue en campo sigue siendo grande
- Bessemer considera conservadora incluso la proyección de un mercado de 38 mil millones de dólares en 2035, que Goldman Sachs elevó 6 veces en solo un año, y estima que solo el costo de los datos para robótica superará los 3 mil millones de dólares en toda la industria durante los próximos 2 años
- El 48% de los fundadores de startups de robótica en EE. UU. provienen de cuatro instituciones: Stanford, MIT, Berkeley y CMU, lo que acelerará una dinámica de concentración de talento donde el ganador se lo lleva todo
- La mediana de las Series A en robótica de defensa alcanza 105 millones de dólares, el doble que en empresas no defensivas, y se prevé que el primer IPO por encima de 50 mil millones de dólares en este sector surja aquí, con casos como la valuación de 60 mil millones de dólares de Anduril
- En los últimos 5 años, solo 42 empresas de robótica recibieron inversiones superiores a 30 millones de dólares, apenas una dieciochoava parte del nivel del software, lo que sugiere no una burbuja sino una subinversión estructural
Demanda estructural y perspectivas del mercado de la robótica
- La demanda de sustitución de mano de obra para trabajo físico repetitivo o entornos peligrosos sigue aumentando debido a los cambios demográficos en Estados Unidos, Europa, Japón y China
- Algunos analistas proyectan que el mercado de la robótica llegará a 38 mil millones de dólares para 2035, y Goldman Sachs elevó esa previsión 6 veces en solo un año
- Bessemer considera que incluso esa proyección es conservadora, tanto en velocidad como en escala
- Jeremy Levine, socio de Bessemer, afirmó: "En los próximos 10 a 20 años habrá 100,000 veces más robots que hoy en el planeta"
- Bessemer busca oportunidades de inversión en un momento en que la movilidad del talento, los avances tecnológicos y los vientos de cola estructurales se están acelerando al mismo tiempo, y su portafolio incluye Waymo, Mind Robotics, Foxglove, Breaker, Noda, Voxel51, DroneDeploy, Auterion, Perceptron y ANYbotics, entre otras
Pronóstico 1: el momento ChatGPT de la robótica se acerca, pero aún no ha llegado
- La industria de la robótica está en una fase equivalente a un momento GPT-2.5: los modelos fundacionales ya muestran capacidad práctica y comienzan a aparecer leyes de escalamiento, pero la brecha entre los demos de laboratorio y el despliegue en producción sigue siendo amplia
- El modelo π0 de Physical Intelligence logró doblar ropa con una destreza de nivel humano
- El paper EgoScale, publicado en febrero de 2026, demostró que el rendimiento de las políticas mejora de forma predecible según el volumen de datos de preentrenamiento, ofreciendo la primera evidencia sólida de que los modelos fundacionales para robótica siguen la misma curva de mejora basada en datos que los LLM
- Quedan dos preguntas clave sin resolver
- Cuántos datos se necesitan para cerrar la brecha entre el rendimiento de laboratorio y la confiabilidad de 99.9% que exige producción
- Cómo se verá exactamente el momento ChatGPT de la robótica cuando llegue
- A diferencia de un chatbot, la robótica no puede demostrar sus capacidades en una caja de texto; la evidencia será un robot que realice tareas complejas en entornos desconocidos sin intervención humana
- Áreas ya comercializadas: automatización de almacenes, asistencia quirúrgica, entrega de última milla e inspección industrial, donde sistemas especializados para entornos limitados ya están generando ingresos
- Armen Aghajanyan, CEO de Perceptron: "La clave de la robótica del mundo real no son mejores algoritmos de control, sino modelos fundacionales que entiendan el mundo físico; el control del robot es apenas una capa delgada encima"
Pronóstico 2: llegan las leyes de escalamiento — los datos son caros, el capital es el foso, y los world models podrían ser un atajo
- Los LLM pudieron aprovechar cientos de billones de tokens de texto de internet, pero en robótica no existe un corpus equivalente
- Se estima que los datos globales de manipulación robótica suman alrededor de 300 mil horas, frente a unas mil millones de horas de video en internet y 300 billones de tokens de texto, lo que deja una brecha estructural
- Bessemer estima que el costo total de datos para robótica en toda la industria superará los 3 mil millones de dólares en los próximos 2 años
- Incluye teleoperación, video egocéntrico, simulación y recolección de demostraciones físicas
- Los datos robóticos no se pueden scrapear ni comprar: hay que generarlos directamente para cada tarea y entorno
- Ian Glow, CEO de Zeromatter: "La teleoperación por sí sola no puede ser una estrategia de datos exitosa; hay que traer datos desde internet o simuladores mediante aprendizaje por refuerzo para conseguir la escala y diversidad necesarias"
- World models: redes neuronales que aprenden las leyes físicas a partir de video a escala de internet
- V-JEPA 2 de Meta, entrenado con más de un millón de horas de video, logró una tasa de éxito zero-shot de 80% en pick-and-place con un brazo robótico real usando solo 62 horas adicionales de datos robóticos
- Aun así, Cosmos de NVIDIA usó 10,000 GPUs H100 durante 3 meses para entrenarse, por lo que los world models también son un enfoque intensivo en capital
- Simulación y aprendizaje por refuerzo: la transición sim-to-real funciona bien para locomoción, pero en manipulación sigue siendo un problema de investigación abierto por la dificultad de modelar con fidelidad objetos blandos, telas y líquidos
- Brian Moore, CEO de Voxel51: "Lo que separa al liderazgo del humo en la IA física es la obsesión por la calidad de los datos; los malos datos no son ineficiencia, son un riesgo"
Pronóstico 3: la concentración de talento definirá rápidamente a los ganadores — no es un mercado donde triunfen 50 empresas
- Entre las empresas estadounidenses de robótica fundadas en los últimos 5 años y que levantaron más de 30 millones de dólares, 43% de los fundadores tiene doctorado
- De ellos, 48% proviene de cuatro instituciones: Stanford, MIT, Berkeley y CMU
- El 56% tiene al menos un cofundador con doctorado y el 43% tiene fundadores que vienen directamente de la academia
- El foso del talento genera un efecto compuesto en cadena: talento → capital → alianzas de datos → relaciones con clientes → datasets propietarios, formando una dinámica de ganador absoluto más rápido de lo que la mayoría espera
- En el mundo de los LLM, el open source (Llama, Mistral) democratizó el acceso a capacidades, pero en robótica, aunque crecen proyectos como LeRobot, Genesis e Isaac Lab, persiste la fricción física de que igual necesitas robots
- Los equipos con mayor profundidad técnica en sim-to-real, manipulación, locomoción y fusión de sensores están construyendo ventajas difíciles de replicar solo con lanzamientos open source
Pronóstico 4: las empresas full-stack capturarán valor a corto plazo — las empresas puras de modelos fundacionales tendrán que esperar
- En los LLM, un único endpoint de API como GPT-4 permitía a equipos de dos personas construir enseguida productos frontier de IA, pero en robótica se necesita recolección de datos por dominio, fine-tuning adaptado al entorno, integración de hardware e infraestructura operativa
- Hoy, el foso no está tanto en la arquitectura del modelo sino en pipelines de datos propietarios, experiencia de dominio, infraestructura de despliegue y relaciones con clientes que generen ciclos de retroalimentación
- La caída en los costos del hardware está acelerando esta dinámica
- Mike Winn, CEO de DroneDeploy: "Los robots terrestres para construcción bajaron de 100 mil dólares a menos de 15 mil por unidad, y los drones con docking de 200 mil a menos de 20 mil, así que ya estamos cruzando el umbral para escalar despliegues"
- El stack se divide en tres capas
- Capa de infraestructura: modelos fundacionales, world models
- Capa de aplicación: empresas full-stack con hardware propio (humanoides, sistemas industriales) + empresas full-stack que aplican IA sobre plataformas comerciales ya existentes
- El valor se concentra en la capa de aplicación porque la capa de infraestructura todavía no es lo suficientemente general como para soportar despliegues end-to-end de manera independiente
- Cuando mejoren los modelos fundacionales y madure la transición sim-to-real, llegará el momento API de la robótica, pero eso sería después de 2028; en la ventana actual, la integración vertical es donde se crea valor sostenible
- Adrian Macneil, CEO de Foxglove: "La ventaja decisiva en la IA física no está en la novedad del modelo sino en la calidad de la infraestructura de datos; a medida que los modelos convergen, ganarán las empresas con el flywheel de datos más fuerte"
Pronóstico 5: la robótica de defensa liderará el primer IPO de más de 50 mil millones de dólares en esta categoría
- La mediana de Series A en robótica de defensa llegó a 105 millones de dólares en 2025, más del doble de los 50 millones de dólares de las empresas no defensivas, y esa brecha se ha ampliado cada año desde 2021
- Anduril cerró en marzo de 2026 con una valuación de 60 mil millones de dólares, y Saronic levantó ese mismo mes una Series D de 1.75 mil millones de dólares para construcción naval autónoma
- Los ciclos de procurement en defensa son largos, pero predecibles; los contratos son grandes, tienen alta tasa de renovación y altos costos de cambio
- A diferencia de la robótica comercial, los compradores de defensa operan con una lógica distinta a la del ROI: el parámetro es el riesgo para la seguridad nacional
- La geopolítica amplifica esto: aproximadamente 90% de los robots humanoides vendidos en el mundo en 2025 fueron fabricados en China
- Los modelos de IA chinos van en promedio unos 7 meses detrás de los estadounidenses, pero esa brecha se sigue cerrando, y el gobierno de EE. UU. está empezando a tratar la robótica como una prioridad esencial de seguridad nacional
- En la dimensión dual-use, las empresas más resilientes no están construyendo sistemas armamentísticos de propósito único, sino plataformas autónomas, sistemas de percepción e infraestructura de toma de decisiones con aplicaciones comerciales
- Matthew Buffa, cofundador de Breaker: "Las empresas más interesantes no eligen entre defensa o comercial; construyen sistemas lo bastante capaces para cumplir requisitos de defensa y lo bastante innovadores para ser comercialmente valiosos"
Pronóstico 6: no hay burbuja en robótica — más bien, sigue entrando menos dinero del necesario
- En los últimos 5 años, 745 empresas de software recibieron inversiones superiores a 30 millones de dólares, frente a solo 42 en robótica, una diferencia de 18 veces
- Mientras tanto, el mercado base de la robótica es 30 veces mayor que el gasto global en software
- Incluso considerando la intensidad de capital de los negocios de hardware, sigue habiendo una subinversión estructural respecto a la oportunidad
- La mayoría de los analistas proyecta un crecimiento de 50 veces en la industria en la próxima década, pero Bessemer cree que incluso eso se limita a la automatización de workflows existentes y no incorpora las nuevas categorías de actividad económica que crearán los robots de propósito general
- No todas las empresas financiadas van a triunfar; algunas valuaciones están infladas y el capital se concentrará en unos pocos líderes
- Pero selectividad y escasez no son lo mismo: el nivel total de inversión en robótica sigue siendo muy inferior al tamaño de la oportunidad y al ritmo del avance tecnológico
- Ahora es la ventana para invertir en empresas clave, antes de que llegue el momento ChatGPT y antes de que se consolide del todo el talento; esperar evidencia del punto de inflexión significa perder la oportunidad
- Nikita Rudin, CEO de Flexion: "Dentro de 5 años, la mayoría de los robots desplegados en el mundo no serán fabricados por startups conocidas hoy, sino por empresas que todavía ni siquiera han empezado a construir robots, pero sí saben fabricarlos a gran escala"
Desafíos no resueltos y debates abiertos
- Brecha de confiabilidad: pasar de una tasa de éxito del 80% al 99.9% no es un problema lineal
- Hace falta un enfoque fundamentalmente distinto en áreas como sensado táctil, retroalimentación de fuerza y transición sim-to-real para manipulación
- Lisa Yan, CEO de Argus Systems: "Por experiencia en Waymo, el despliegue real se vuelve más difícil con el tiempo y expone problemas cada vez más especializados de curación de datos; cerrar la brecha entre 99% y 99.9% toma más tiempo de lo que la mayoría imagina"
- Problema del costo de inferencia: los world models y los grandes modelos visión-lenguaje-acción son caros de ejecutar en tiempo real
- Los modelos de texto pueden procesarse por lotes para miles de usuarios simultáneos sobre infraestructura compartida, pero los modelos de robótica deben generar el estado del entorno cada pocos milisegundos por robot, por lo que en la práctica requieren pipelines de GPU dedicados
- El costo de inferencia de los LLM cayó alrededor de 1,000 veces en 3 años; si la robótica seguirá una curva similar definirá la viabilidad comercial del enfoque basado en modelos fundacionales
- La interpretabilidad está emergiendo como la próxima capa de infraestructura
- Solo en el primer trimestre de 2026, entraron alrededor de 6 mil millones de dólares en 6 o 7 empresas de world models
- Mahesh Krishnamurthi, cofundador de Vayu Robotics: "A medida que la industria madura, la interpretabilidad se vuelve un requisito no negociable; hoy estos modelos son cajas negras, y esperamos una ola de startups construyendo herramientas para abrirlas"
- Open source vs. cerrado: en los LLM, el open source aceleró dramáticamente el desarrollo del ecosistema, pero no está claro si la misma dinámica aplicará en robótica, donde los datos físicos y la infraestructura de despliegue importan tanto como la arquitectura del modelo
- El open source probablemente comoditizará la arquitectura de modelos más rápido de lo esperado, pero las capas de datos y despliegue podrían seguir siendo propietarias durante bastante tiempo
- Las empresas que entiendan qué partes del stack abrir y cuáles proteger obtendrán ventaja estratégica
La coexistencia de dos verdades
- Brad Porter, CEO de Cobot: "El momento ChatGPT de la robótica llegará antes de lo que la mayoría cree y, cuando llegue, el tiempo de producción (robots reales, tareas reales, entornos reales) será el cuello de botella; las empresas optimizadas para despliegue, no para demos, se separarán de forma decisiva"
- Philipp Wu, cofundador de una startup stealth de robótica: "La línea de tiempo es mucho más larga de lo que la mayoría espera y la robótica de propósito general todavía está a más de 5 años"
- Estas dos visiones no se contradicen: describen dimensiones distintas. Porter habla del camino hacia el punto de inflexión; Wu, de qué tan lejos está realmente ese punto
- La implicación para los fundadores: desplegar de forma decisiva ahora, pero construir con el momento generalista en el horizonte
- El punto de inflexión se acerca; el talento se está moviendo, el hardware se está comoditizando y la infraestructura de datos se está construyendo, y las empresas que definirán la IA física de la próxima década se están fundando y financiando justo ahora
1 comentarios
Tengo curiosidad por saber qué empresas aparecerán.