- La industria de la robótica se encuentra actualmente en una etapa de nivel GPT-2.5, donde los modelos fundacionales ya muestran capacidades reales, pero la brecha entre los resultados de laboratorio y el despliegue en campo sigue siendo grande
- Incluso la proyección de un mercado de 38 mil millones de dólares en 2035, que Goldman Sachs elevó 6 veces en apenas un año, es vista por Bessemer como conservadora, y estima que solo el costo de datos para robótica superará los 3 mil millones de dólares en toda la industria durante los próximos 2 años
- El 48% de los fundadores de empresas de robótica en EE. UU. provienen de cuatro instituciones: Stanford, MIT, Berkeley y CMU, y esta concentración de talento acelerará una dinámica de ganador se lleva casi todo
- La mediana de las Series A en empresas de robótica de defensa alcanza 105 millones de dólares, el doble que en las no enfocadas en defensa, y se prevé que el primer IPO de más de 50 mil millones de dólares en este sector surja aquí, con referencias como la valuación de 60 mil millones de dólares de Anduril
- En los últimos 5 años, solo 42 empresas de robótica recibieron más de 30 millones de dólares de inversión, apenas una dieciochoava parte del nivel del software, lo que indica que la robótica no está en una burbuja sino en un estado de subinversión estructural
Demanda estructural y perspectivas de mercado de la robótica
- La demanda de sustitución de mano de obra para trabajo físico repetitivo o entornos peligrosos sigue aumentando por los cambios demográficos en Estados Unidos, Europa, Japón y China
- Algunos analistas predijeron que el mercado de la robótica alcanzará 38 mil millones de dólares para 2035, y Goldman Sachs elevó esa proyección 6 veces en solo un año
- Bessemer considera que incluso esa proyección es conservadora tanto en velocidad como en escala
- Jeremy Levine, socio de Bessemer, afirmó: "En los próximos 10 a 20 años habrá 100,000 veces más robots que hoy en la Tierra"
- Bessemer busca oportunidades de inversión en un momento en que la movilidad del talento, los avances tecnológicos y los vientos de cola estructurales se están acelerando al mismo tiempo, e incluye en su portafolio a Waymo, Mind Robotics, Foxglove, Breaker, Noda, Voxel51, DroneDeploy, Auterion, Perceptron, ANYbotics y otras
Predicción 1: el momento ChatGPT de la robótica se acerca, pero aún no ha llegado
- La industria de la robótica está en una fase equivalente a un momento GPT-2.5: los modelos fundacionales muestran capacidades sustanciales y empiezan a aparecer leyes de escalamiento, pero la brecha entre los demos de investigación y el despliegue en producción sigue siendo amplia
- El modelo π0 de Physical Intelligence logró doblar ropa con destreza a nivel humano
- El paper EgoScale, publicado en febrero de 2026, demostró que el rendimiento de las políticas mejora de forma predecible según la escala de los datos de preentrenamiento, ofreciendo la primera evidencia sólida de que los modelos fundacionales de robótica siguen la misma curva de mejora basada en datos que los LLM
- Existen dos preguntas clave aún sin resolver
- Cuántos datos se necesitan para cerrar la brecha entre el rendimiento en laboratorio y la fiabilidad del 99.9% que exige producción
- Cómo se verá exactamente el momento ChatGPT de la robótica cuando llegue
- A diferencia de un chatbot, no puede demostrar sus capacidades en una caja de texto; la prueba será un robot que ejecute tareas complejas en entornos desconocidos sin intervención humana
- Áreas ya comercializadas: sistemas especializados para entornos restringidos como automatización de almacenes, asistencia quirúrgica, entrega de última milla e inspección industrial, que ya generan ingresos
- Armen Aghajanyan, CEO de Perceptron: "La clave de la robótica del mundo real no son mejores algoritmos de control, sino modelos fundacionales que entiendan el mundo físico; el control del robot es apenas una capa delgada encima"
Predicción 2: llega la ley de escalamiento — los datos son caros, el capital es el foso, y los world models podrían ser un atajo
- Los LLM pudieron aprovechar cientos de billones de tokens de texto de internet, pero en robótica no existe un corpus equivalente
- Se estima que los datos globales de manipulación robótica suman unas 300,000 horas, frente a aproximadamente mil millones de horas de video en internet y 300 billones de tokens de texto, lo que refleja una brecha estructural
- Bessemer estima que, durante los próximos 2 años, el costo total de datos de robótica en toda la industria superará los 3 mil millones de dólares
- Incluye teleoperación, video egocéntrico, simulación y recopilación de demostraciones físicas
- Los datos de robots no se pueden scrapear ni comprar; deben generarse directamente por tarea y por entorno
- Ian Glow, CEO de Zeromatter: "La teleoperación por sí sola no puede ser una estrategia de datos exitosa; hay que traer datos mediante aprendizaje por refuerzo desde internet o desde simuladores para alcanzar la escala y diversidad necesarias"
- World models: redes neuronales que aprenden las leyes físicas a partir de video a escala de internet
- V-JEPA 2 de Meta, tras entrenarse con más de un millón de horas de video, logró una tasa de éxito zero-shot del 80% en pick-and-place con un brazo robótico real usando solo 62 horas adicionales de datos robóticos
- Aun así, Cosmos de NVIDIA usó 10,000 GPU H100 durante 3 meses para su entrenamiento, así que los world models también son un enfoque intensivo en capital
- Simulación y aprendizaje por refuerzo: la transición sim-to-real funciona bien en locomoción, pero en manipulación sigue siendo un reto de investigación no resuelto por problemas de fidelidad con objetos blandos, telas y líquidos
- Brian Moore, CEO de Voxel51: "Lo que separa a los líderes del humo en la IA física es la obsesión por la calidad de los datos; los malos datos no son una ineficiencia, son un riesgo"
Predicción 3: la concentración de talento decidirá rápido a los ganadores — no es un mercado donde triunfen 50 empresas
- Entre las empresas de robótica de EE. UU. fundadas en los últimos 5 años que recibieron más de 30 millones de dólares, el 43% de los fundadores tiene doctorado
- De ellos, el 48% proviene de cuatro instituciones: Stanford, MIT, Berkeley y CMU
- El 56% tiene al menos un cofundador con doctorado, y el 43% cuenta con fundadores provenientes directamente de la academia
- El foso de talento genera un efecto compuesto en cadena: talento → capital → alianzas de datos → relaciones con clientes → datasets propietarios, formando una estructura de ganador se lleva casi todo más rápido de lo que la mayoría espera
- En LLM, el open source (Llama, Mistral) democratizó el acceso a capacidades, pero en robótica, aunque crecen proyectos como LeRobot, Genesis e Isaac Lab, sigue existiendo la fricción física de que todavía se necesitan robots
- Los equipos con la mayor profundidad en sim-to-real, manipulación, locomoción y fusión de sensores están construyendo ventajas que no se replican fácilmente con un simple release open source
Predicción 4: las empresas full-stack capturarán valor en el corto plazo — las puras de modelos fundacionales tendrán que esperar
- En LLM, un solo endpoint API como GPT-4 permitía que incluso equipos de 2 personas construyeran de inmediato productos frontier de IA, pero en robótica se necesita recolección de datos por dominio, fine-tuning adaptado al entorno, integración de hardware e infraestructura operativa
- Hoy el foso no está tanto en la arquitectura del modelo como en pipelines de datos propietarios, especialización por dominio, infraestructura de despliegue y relaciones con clientes que generan loops de retroalimentación
- La caída de los costos de hardware está acelerando esta dinámica
- Mike Winn, CEO de DroneDeploy: "Los robots terrestres para construcción bajaron de 100,000 dólares a menos de 15,000 por unidad, y los drones con docking de 200,000 a menos de 20,000, así que estamos cruzando el umbral para escalar despliegues"
- El stack se divide en tres capas
- Capa de infraestructura: modelos fundacionales, world models
- Capa de aplicación: empresas full-stack con hardware propio (humanoides, sistemas industriales) + empresas full-stack que aplican IA sobre plataformas comerciales existentes
- El valor se concentra en la capa de aplicación porque la capa de infraestructura todavía no es lo suficientemente generalista como para soportar despliegues end-to-end por sí sola
- Cuando los modelos fundacionales mejoren y madure la transición sim-to-real, llegará el momento API de la robótica, pero eso será después de 2028; en la ventana actual, la integración vertical es donde se crea valor sostenible
- Adrian Macneil, CEO de Foxglove: "La ventaja decisiva en IA física no es la novedad del modelo, sino la calidad de la infraestructura de datos; a medida que los modelos converjan, ganarán las empresas con el flywheel de datos más fuerte"
Predicción 5: la robótica de defensa liderará el primer IPO de más de 50 mil millones de dólares de la categoría
- La mediana de Series A en empresas de robótica de defensa fue de 105 millones de dólares en 2025, más del doble de los 50 millones de dólares de las no enfocadas en defensa, y esta brecha se ha ampliado cada año desde 2021
- Anduril cerró en marzo de 2026 con una valuación de 60 mil millones de dólares, y Saronic levantó ese mismo mes una Serie D de 1,750 millones de dólares para construcción naval autónoma
- Los ciclos de compras de defensa son largos pero predecibles, con contratos grandes, altas tasas de renovación y costos de cambio significativos
- A diferencia de la robótica comercial, los compradores de defensa operan con un cálculo distinto: no el ROI, sino el riesgo para la seguridad nacional
- La geopolítica amplifica esto: alrededor del 90% de los robots humanoides vendidos a nivel mundial en 2025 fueron fabricados en China
- Los modelos de IA chinos están en promedio unos 7 meses detrás de los de EE. UU., pero esa brecha se está cerrando de forma constante, y el gobierno estadounidense ya empieza a tratar la robótica como una prioridad esencial de seguridad nacional
- En la dimensión dual-use, las empresas más defensivas no están construyendo sistemas de armas de propósito único, sino plataformas autónomas, sistemas de percepción e infraestructura de toma de decisiones con aplicaciones comerciales
- Matthew Buffa, cofundador de Breaker: "Las empresas más interesantes no eligen entre defensa o comercial; construyen sistemas lo bastante capaces para cumplir requisitos de defensa y a la vez lo bastante innovadores para ser comerciales"
Predicción 6: no hay burbuja en robótica — de hecho, sigue entrando muy poco dinero al sector
- En los últimos 5 años, hubo 745 empresas de software que recibieron más de 30 millones de dólares, frente a solo 42 de robótica, es decir, 18 veces menos
- Mientras tanto, el mercado base de la robótica es 30 veces mayor que el gasto mundial en software
- Incluso considerando que los negocios de hardware son intensivos en capital, el sector sigue en una situación de subinversión estructural frente a la magnitud de la oportunidad
- La mayoría de los analistas proyecta un crecimiento de 50 veces para la industria en los próximos 10 años, pero Bessemer cree que incluso eso se limita a la automatización de workflows existentes y no refleja las nuevas categorías de actividad económica que crearán los robots de propósito general
- No todas las empresas financiadas tendrán éxito, algunas valuaciones están infladas y el capital se concentrará en unos pocos líderes
- Pero selectividad y escasez no son lo mismo: el nivel total de inversión en robótica sigue muy por debajo de lo que justifican el tamaño de la oportunidad y la velocidad del avance técnico
- Ahora es la ventana para invertir en las empresas clave, antes de que llegue el momento ChatGPT y antes de que termine la consolidación del talento; esperar a tener prueba del punto de inflexión es perder la oportunidad
- Nikita Rudin, CEO de Flexion: "Dentro de 5 años, la mayoría de los robots desplegados en el mundo no serán fabricados por las startups conocidas hoy, sino por empresas que aún ni siquiera empezaron a construir robots, pero saben fabricarlos a gran escala"
Retos no resueltos y debates abiertos
- Brecha de fiabilidad: pasar de una tasa de éxito del 80% al 99.9% no es un problema lineal
- Requiere enfoques fundamentalmente distintos, como sensado táctil, force feedback y transición sim-to-real para manipulación
- Lisa Yan, CEO de Argus Systems: "Por experiencia en Waymo, el despliegue real se vuelve más difícil con el tiempo y revela problemas de curación de datos mucho más especializados; cerrar la brecha del 99% al 99.9% toma más tiempo de lo que la mayoría espera"
- Problema del costo de inferencia: los world models y los grandes modelos vision-language-action son costosos de ejecutar en tiempo real
- Los modelos de texto pueden atender por lotes a miles de usuarios simultáneos en infraestructura compartida, pero los modelos de robótica deben generar el estado del entorno cada pocos milisegundos por robot, por lo que en la práctica requieren pipelines de GPU dedicados
- El costo de inferencia de los LLM cayó unas 1,000 veces en 3 años, y si la robótica seguirá una curva similar determinará la viabilidad comercial del enfoque de modelos fundacionales
- La interpretabilidad está emergiendo como la próxima capa de infraestructura
- Solo en el primer trimestre de 2026 entraron alrededor de 6 mil millones de dólares a 6 o 7 empresas de world models
- Mahesh Krishnamurthi, cofundador de Vayu Robotics: "A medida que madure la industria, la interpretabilidad será un elemento no negociable; hoy estos modelos son cajas negras, y veremos una ola de startups construyendo herramientas para abrirlas"
- Open source vs. cerrado: en LLM el open source aceleró dramáticamente el desarrollo del ecosistema, pero aún no está claro si la misma dinámica aplicará en robótica, donde los datos físicos y la infraestructura de despliegue importan tanto como la arquitectura del modelo
- El open source probablemente comoditizará la arquitectura del modelo más rápido de lo esperado, pero la capa de datos y la de despliegue podrían seguir siendo propietarias durante bastante tiempo
- Las empresas que entiendan qué parte del stack abrir y cuál proteger obtendrán una ventaja estratégica
La coexistencia de dos verdades
- Brad Porter, CEO de Cobot: "El momento ChatGPT de la robótica llegará antes de lo que la mayoría piensa y, cuando llegue, el cuello de botella será el tiempo de producción (robots reales, tareas reales, entornos reales); las empresas que optimicen para despliegue, no para demos, se separarán de forma decisiva"
- Philipp Wu, cofundador de una empresa stealth de robótica: "Los tiempos serán mucho más largos de lo que la mayoría espera, y la robótica de propósito general todavía está a más de 5 años"
- Estas dos visiones no se contradicen, sino que describen dimensiones distintas: Porter habla del camino hacia el punto de inflexión, y Wu de qué tan lejos está realmente ese punto
- La implicación para los fundadores: desplegar de forma decisiva ahora, pero construir con el horizonte puesto en el momento generalista
- El punto de inflexión se acerca; el talento se está moviendo, el hardware se está comoditizando y la infraestructura de datos se está construyendo, y las empresas que definirán la IA física en la próxima década se están fundando y financiando justo ahora
1 comentarios
Tengo curiosidad por saber qué empresas aparecerán.