- Rodney Brooks, fundador de iRobot y exprofesor de robótica del MIT, ofrece una perspectiva realista sobre la exageración actual en los campos de la IA y la robótica
- Las expectativas sobre los robots humanoides están infladas, y la suposición de que los robots con forma humana pueden reproducir todas las capacidades humanas crea promesas engañosas
- Para abordar la complejidad de los entornos reales en autos autónomos, robots y más, se necesita mucho más tiempo que el que sugieren las demos vistosas; al igual que la revolución de la computadora e internet, también se espera que la revolución de la IA tome décadas
- Brooks está desarrollando actualmente carritos inteligentes para automatización de almacenes, y busca una robótica práctica que ayude al trabajo humano en lugar de reemplazar a las personas
- Subraya que la AGI (inteligencia artificial general) podría ser posible hasta dentro de 300 años, y que con el paradigma actual de cómputo quizá sea difícil implementar por completo la inteligencia humana
Trayectoria y filosofía de Brooks
- Rodney Brooks fue profesor de robótica en MIT y exdirector del Laboratorio de Ciencias de la Computación e Inteligencia Artificial del MIT
- Fundó tres empresas: iRobot (fabricante de Roomba), Rethink Robotics y la actual Robust.AI
- Nacido en Australia, creció en una familia de clase trabajadora, pero por su talento para las matemáticas desde pequeño le pusieron el apodo de “profesor”
- Tras leer en 1961 libros de biografías y de computación, intentó construir circuitos y computadoras, y así fue cultivando su pasión por los robots
- Sus empresas siempre se han diseñado para que los humanos mantengan el control, y los robots se enfoquen en ayudar a las personas
Proyecto actual: Robust.AI y el carrito inteligente
- Robust.AI está desarrollando Carta, un carrito inteligente para almacenes logísticos
- Los trabajadores de almacén caminan en promedio 30 mil pasos al día (unos 24 km), lo que implica una gran carga física
- Carta usa cámaras para ubicarse y ayuda al trabajador a encontrar la posición de los artículos necesarios, lo que reduce de forma drástica la distancia caminada
- Cuando el trabajador termina el picking, el carrito se mueve automáticamente al punto de carga y reemplaza una caminata de 400 pies
- El carrito está diseñado para que, en cuanto una persona tome la manija, el humano tenga el control inmediato
- Ofrece amplificación de fuerza para poder moverlo con muy poca fuerza, como si fuera Superman
- Cerca de escaleras no se aproxima por seguridad, y si un pasillo está bloqueado lo reporta al sistema central
- Se enfoca en una inteligencia simple pero confiable
- Reduce la carga cognitiva frente a las antiguas pistolas de escaneo de muñeca que emulaban tecnología de los años 80 y 90
- El objetivo es introducir robots en almacenes manuales de DHL (su cliente más grande) y Amazon, entre otros
- Este mercado es de 4 billones de dólares y se espera que dure décadas, pero como no es “sexy”, cuesta atraer inversión
La realidad y los límites de la robótica
Avance tecnológico y el problema de la larga cola
- Hoy el hardware, como la capacidad de procesamiento, sensores y motores, ha avanzado mucho
- Al usar motores hub de scooters eléctricos, se obtiene mejor desempeño a menor costo que hace 10 años
- Las GPU de Nvidia fueron creadas originalmente para gráficos, pero se descubrió por casualidad que eran adecuadas para el cómputo de redes neuronales
- Las GPU también son útiles para cálculos de visión como SLAM (localización y mapeo simultáneos)
- Pero la gente subestima el problema de la larga cola (long tail) de los entornos naturales
- Brooks escuchó por primera vez una conferencia sobre autos autónomos en 1979, y en 1990 ya se había logrado conducir por la Autobahn en Alemania
- Tras los autos autónomos de DARPA en 2007~2008, hubo predicciones de que “pronto los veríamos en todas partes”, pero tomó casi 20 años
- Incluso hoy solo operan en zonas geográficas pequeñas por la larga cola de todas las situaciones que pueden ocurrir
Demos vistosas vs. entornos reales
- Las demos vistosas no logran manejar el entorno real
- Incluso Waymo todavía requiere intervención humana
- Es escéptico sobre el sistema de taxis de Tesla: Elon Musk dijo que contrataría conductores de seguridad y conductores remotos
- A la tecnología le toma mucho tiempo encontrar su forma madura
- La PC tardó décadas desde MS-DOS hasta su forma actual, y el smartphone también desde Nokia y Palm hasta hoy
- La conducción autónoma también necesitará mucho tiempo para adoptarse
La historia de SLAM y su lección
- Cuando se publicó el paper de SLAM en 1985, Brooks no esperaba que en toda su vida llegara a existir algo al nivel actual de Waymo
- La idea inicial de loop closing era importante, pero su implementación era incompleta
- Un año después, otro investigador publicó un paper mejorado
- Durante todos los años 90 salieron cientos de papers de SLAM cada año, con mejoras graduales
- Solo en los últimos cinco años ha sido posible implementar SLAM con visión por computadora (antes se basaba en LIDAR)
- Lección: todo requiere muchísimo más trabajo de ingeniería del que se espera, y una tecnología debe esperar a que otras maduren
El hype de los robots humanoides
- Los robots con forma humana generan una promesa sobre lo que pueden hacer
- Roomba, al ser un pequeño disco que limpia el piso, no crea la expectativa de que también limpiará ventanas
- Pero la forma humana implica la promesa de que puede hacer todo lo que hace un humano
- Esa es la razón por la que los humanoides resultan atractivos, pero al final solo venden una promesa deslumbrante
- El problema de las manos robóticas
- Mucha gente se emociona con las manos robóticas, y empresas chinas también creen erróneamente que tienen destreza
- Pero no hay manera de reproducir todo lo que hace una mano humana, y no se debe asumir que la forma de cinco dedos es la óptima
- La estructura de cinco dedos es un accidente evolutivo de los primeros seres que salieron del mar a la tierra
- Las futuras herramientas con destreza podrían tener muchos tentáculos, como una anémona de mar
- Copiar al ser humano no es la solución óptima ni la más costo-efectiva
- La forma correcta de pensar en robots e IA no es juzgarlos solo por su apariencia
- Hay muchas cosas que siguen siendo difíciles con la tecnología actual, y el hype las ignora
Opiniones sobre IA y educación
IA generativa y la importancia de las preguntas
- La IA generativa implica un cambio de un sistema de valor basado en respuestas a uno basado en preguntas
- La capacidad de hacer la pregunta correcta distingue lo ordinario de lo sobresaliente
- En filosofía, arte, robótica e IA, quien sabe formular preguntas es alguien especial
- La IA generativa cuestiona ideas que llevaban mucho tiempo vigentes
- El argumento de la habitación china de John Searle: una computadora no puede tener conciencia humana
- Al poner texto en chino en ChatGPT y ver que responde en chino, Brooks lo evalúa diciendo: “apareció la habitación china”
- Es un reto a lo que entendemos por comprensión del lenguaje
- La IA generativa es una codificación de la manera en que interactuamos con la información
- Si alguien se lo hubiera explicado hace 15 años, habría dicho: “no hay forma de que eso funcione”
- El simple hecho de que funcione ya es sorprendente
Repensar el sistema educativo
- Deberíamos separar la formación profesional y la búsqueda intelectual, como en el sistema alemán
- Una licenciatura en gestión turística es formación profesional, no una búsqueda intelectual
- Alemania separó durante mucho tiempo la capacitación vocacional y las universidades de élite
- Problemas de la enseñanza de la historia
- Se limita a memorizar “pasó esto, pasó aquello”
- No enseña por qué pasó, ni qué ideas intelectuales lo impulsaron
- Incluso en MIT, los estudiantes solo entienden “ah, con razón enseñaban eso en aquella clase” después de construir algo real
- El periodismo es la mejor educación
- Permite aprender sobre microcontroladores, sistemas operativos embebidos, redes, switches y cómputo
- También enseña el impacto de la tecnología en personas reales y en el mundo real
- La universidad no logra dar ese vínculo
Escepticismo sobre la AGI y el paradigma computacional
La analogía de la alquimia de Newton
- Isaac Newton tuvo logros geniales como inventar el cálculo, formular la ley de la gravedad e investigar la óptica
- Pero dedicó más de la mitad de su vida a la alquimia (convertir plomo en oro)
- En ese momento todos creían que era un problema químico, pero en realidad era un problema de física nuclear
- Newton partía de un modelo base equivocado
- Cuando Elon Musk intenta poner un cohete en órbita, no puede lograrlo con un script en Python
- Hay que resolver problemas físicos como combustión eficiente, masa, flujo de líquidos y altas temperaturas
- Solo con cálculo no se puede mover físicamente un objeto
¿El cómputo es el paradigma correcto?
- Entre 1945 y 1965 surgieron cuatro campos
- neurociencia, IA, vida artificial y abiogénesis
- Todos adoptaron el cómputo como metáfora principal
- Pero ¿el cómputo es realmente lo que sucede en nuestro cerebro?
- La AGI podría no ser posible hasta dentro de 300 años
- Porque quizá estamos trabajando con el tipo equivocado de “material”
- Podríamos estar condenados al fracaso, como la alquimia de Newton
Los límites de la inteligencia humana
- Hay un problema con la suposición de un poder infinito de la inteligencia humana
- La orca es muy inteligente, cruel y capaz de resolver problemas
- Para atrapar focas en aguas poco profundas inclina su cuerpo 90 grados para esconder la aleta dorsal
- Pero nadie piensa que una orca vaya a construir una fundición y derretir metal
- Los humanos también podrían tener límites naturales, igual que las orcas
- Creemos que somos infinitamente inteligentes y que resolveremos todos los problemas con tecnología
- Pero también puede haber límites que estén fuera de nuestro alcance
El futuro de la manufactura y el cambio tecnológico
Manufactura china y cadena de suministro
- Brooks empezó a fabricar en China desde finales de los años 90
- Recientemente firmó con Foxconn para producir robots a gran escala
- Si se quiere producir a gran escala, China/Taiwán son indispensables
- La fortaleza de la manufactura china está en la cadena de suministro
- Las empresas manufactureras chinas también se están diversificando al construir cadenas de suministro en Malasia, Vietnam y otros países
- Dentro de 50 años, Nigeria será el centro de la innovación tecnológica
- Tendrá una gran proporción de la población mundial y muchos problemas por resolver
- Es la misma lógica por la que China se volvió una potencia económica: gran población y necesidad de resolver problemas
Impresión 3D y revolución manufacturera
- La impresión 3D podría liderar la manufactura
- Aún no, pero ya empezó a usarse en piezas mecánicas
- La neozelandesa Electron fabrica motores de cohete con impresión 3D (posible por ser productos de alto valor)
- Si la impresión 3D se vuelve masiva, la cadena de suministro cambiará para centrarse en materias primas
- La dinámica de suministro de componentes, que es la fortaleza de la manufactura china, se rompería por completo
- Al final, todo se imprimirá en 3D
- Así como en el tercer mundo la tecnología de la información y los sistemas de pago se adoptaron más rápido que en Estados Unidos, la impresión 3D también podría expandirse más rápido en el tercer mundo
La contradicción de los empleos manufactureros
- En un discurso de graduación en Brown University, Brooks hizo una pregunta
- “¿Hay algún padre que quiera que su hijo trabaje en una fábrica?” → nadie levantó la mano
- “¿Y alguien que quiera que trabaje en una empresa de tratamiento de aguas residuales?” → nadie
- Lamentar la pérdida de empleos manufactureros es hipócrita
- “No es para nosotros, es para la gente pobre”
- Caso de la nueva planta de BYD
- Una fábrica del tamaño de San Francisco emplea solo a 40 mil personas
- Todo lo demás son robots fabricados por BYD
- Ese es el futuro de la manufactura a gran escala
- Los “empleos manufactureros” de los que hablan los políticos serán muy distintos dentro de 25 años, considerando la revolución robótica y la impresión 3D
Otros avances tecnológicos
- Aplicar IA al desarrollo de materiales
- Permite predecir propiedades de materiales, sin necesidad de fabricarlos y probarlos uno por uno
- Se combinarán cambios en materiales, impresión 3D, robótica y muchas otras tecnologías
- No sabemos exactamente cómo será, pero sin duda será distinto
El ciclo de hype de la IA y el realismo
La repetición en la historia de la IA
- Brooks se define como un realista
- Ha vivido numerosos ciclos de hype en la IA
- Antes no eran tan populares entre el público, pero entre practicantes de IA había debates feroces y gritos
- Las redes neuronales dominan hoy, pero ya dominaron 4 o 5 veces en el pasado y luego colapsaron
- Algo más las reemplaza, y luego regresan
- Ejemplo de la IA basada en agentes
- De pronto todo el mundo empezó a lanzar IA basada en agentes
- Hace seis meses no existía → el marketing va por delante de la realidad
- El primer paper sobre IA agente lo publicó Oliver Selfridge en 1959
- Hubo varios sistemas basados en agentes, como SOAR, y cada vez que regresan vuelven mejorados
Inversión y desperdicio
- Se está inyectando una cantidad enorme de dinero, así que sí tendrá impacto
- Pero gran parte de ese dinero se desperdiciará
- Lado positivo: el caso de la sobreconstrucción de redes
- Las redes se sobreconstruyeron, pero eso permitió que Google pudiera desplegar red barata y ofrecer búsqueda
- Los data centers también se sobreconstruirán
- Tras el colapso del entrenamiento de modelos de IA generativa, habrá que pensar cómo usar esos data centers
- No será para minar Bitcoin, pero gente inteligente encontrará nuevos usos
- Alguien que hoy investiga en el anonimato y la pobreza terminará detonando el próximo boom
El papel de la computación cuántica
- En los próximos 10 años, las computadoras cuánticas efectivas se usarán para simular sistemas físicos
- Que superen ampliamente al cómputo clásico en tareas generales sigue siendo algo lejano
- Broma del pasado: “No sé cuándo llegarán las computadoras cuánticas, pero creo que funcionarán con fusión nuclear”
- Ahora los enfoques hacia la fusión nuclear se están diversificando
- Por un tiempo, las computadoras cuánticas se concentrarán en la simulación de sistemas físicos
Conclusión: optimismo realista
- No hay que juzgar solo por la apariencia
- Hoy hay muchísimas cosas muy difíciles de lograr con la tecnología actual
- El hype de la robótica y la IA ignora lo que todavía no entendemos bien
- Copiar al ser humano no es la solución óptima ni la más costo-efectiva
- Existe la convicción de que a los humanos nos irá bien en un mundo lleno de robots e IA
- El avance tecnológico toma mucho más tiempo de lo esperado, pero al final evolucionará en una dirección que mejore nuestra vida
1 comentarios
Comentarios de Hacker News
Una cita que de verdad me pareció muy impresionante: la forma física de un robot en sí misma promete “lo que este robot puede hacer”. Por ejemplo, como Roomba tiene forma de disco pequeño, uno espera que limpie el piso, y no que limpie ventanas. En cambio, un robot humanoide hace la promesa de que “puede hacer todo lo que un humano puede hacer”. Por eso resulta tan atractivo para la gente: está vendiendo una promesa enorme.
Siempre he pensado algo parecido sobre los modelos de lenguaje: la apariencia lingüística sugiere de inmediato “lo que este modelo puede hacer”. Clippy era un pequeño clip animado, así que nadie esperaba que escribiera una gran novela, pero sí que diera ayuda limitada. Pero cuando conversa en lenguaje humano, da la sensación de que “puede hacer todo lo que un humano puede hacer”, y eso se recibe como una promesa gigantesca.
La razón por la que todas las empresas persiguen robots humanoides es que ya construimos el mundo alrededor de ese “factor de forma”, y evolutivamente también estamos adaptados a él. Es un diseño completamente generalista. La razón por la que OpenAI persiguió los LLM es parecida. Al principio vendrán expectativas exageradas, pero desde la perspectiva de inversión sigo pensando que vale la pena intentar con ese factor de forma. Claro, siempre que sea viable.
Me dio risa la parte de “Brooks cree que Nigeria se convertirá en un centro económico y tecnológico solo por el tamaño de su población”. Me parece ridícula la suposición ingenua de que una población grande te convierte automáticamente en potencia económica. Soy crítico del Partido Comunista Chino por muchas razones, pero la gobernanza efectiva y eficiente que logró en los últimos 40 años no es algo que se pueda replicar fácilmente. Una buena administración pública sí que es un activo realmente escaso. Nigeria, como India, tiene mucha población pero no una gobernanza efectiva, así que la posibilidad de que esté tan bien administrada como China es cercana a cero.
No puedo estar de acuerdo con eso de que India tiene mucha población pero no buena gobernanza. Como indio, ver el cambio entre la independencia y ahora me parece un logro verdaderamente impresionante.
China está invirtiendo muchísimo en Nigeria, y su mayor acreedor es China. Así que el gobierno nigeriano quizá no sea tan distinto del Partido Comunista Chino.
Evolución del PIB per cápita de India
Estoy de acuerdo en lo de Nigeria, pero no en lo de India. Tengo entendido que el gobierno indio también cuenta con gente muy capaz. Y en África también existen países de rápido crecimiento, como Kenia.
Es casi igual a lo que Brooks publicó personalmente hace unos años. Hace poco también se discutió en HN. Ya hay muchas empresas que venden automated guided cart.<br>Al principio me parecían ridículos los robots humanoides, pero cambié de opinión al ver los precios. El Unitree G1 cuesta 22,000 dólares, más barato que un Toyota Corolla. Pensaba que sería hardware carísimo, al nivel de Boston Dynamics, pero ya está así de barato. Sigue siendo un producto inicial con poco volumen de producción, pero el precio va a seguir bajando, y llegará el día en que los robots humanoides sean más baratos que los autos.<br>Para tareas individuales, tienen muchos más grados de libertad de los necesarios, pero las ventajas de la reducción de costos por producción en masa y del reemplazo de piezas serán mucho mayores. Todavía queda pendiente el problema de la manipulación, pero con un precio tan razonable y hardware estandarizado, más gente va a poder intentarlo. Discusión anterior en HN
Aunque el Unitree G1 aparezca como de 22,000 dólares, he oído que si realmente quieres comprar en volumen, incluyendo hardware, herramientas y kit de desarrollo, termina costando entre 80,000 y 100,000 dólares por unidad. Y sí, lo de Brooks es una publicación reciente.
Nadie ha resuelto todavía el problema de la manipulación, sea cual sea el rango de precios. No es algo que se arregle solo con producción en masa.
Viendo esos precios, me pregunto cómo una empresa de robots de EE. UU. como Tesla podría competir con costos de fabricación tan bajos.
Esta persona es realmente impresionante. Quizá por ser de Boston, ha logrado sacar adelante dos startups de robótica, pero como sus ideas no son “sexys”, la realidad es que le cuesta conseguir inversión. Los inversionistas quieren certezas, pero si alguien ya tuvo dos éxitos grandes, yo pensaría que también tiene altas probabilidades de lograr un tercero.
Habiendo pasado por VC, yo no me creo el discurso de superficie. Creo que tú tienes razón. Los inversionistas sí quieren invertir, pero las condiciones que él pide son demasiado caras para ellos, por ejemplo 1 millón de dólares a una valuación de 2 millones, o 50% de participación. Con ese historial, cualquier inversionista querría entrarle a un deal así. Él también pensará que para hacer una tercera startup merece algo de ese nivel, y desde el lado del inversionista eso pesa bastante.
Tengo un conocido que es un fundador realmente silencioso, y en los últimos 20 años ha creado tres veces una empresa parecida, con casi el mismo concepto, y vendió las dos primeras. Si hay precedentes, el mercado de capitales les da mucha credibilidad como señal de éxito futuro.
Los VC quieren una historia nueva, o “hype”, más que una reputación glamorosa. De hecho, la reputación puede incluso jugar en contra. Prefieren la recompensa de encontrar una joya escondida, alguien que ellos mismos descubrieron.
iRobot perdió frente a competidores chinos, y Rethink fracasó al principio por su baja calidad, mientras que Universal hizo robots colaborativos mucho mejores. No le veo sentido a una nueva startup. Solo en Boston ya hay más de 10 startups de automatización de almacenes.
Hace falta definir “éxito”. iRobot fue líder de categoría y abrió un mercado nuevo, pero no parece haber sido rentable casi nunca. Ahora está perdiendo frente a productos chinos que cuestan la mitad y rinden el doble. De todos modos, sí hay que reconocerle que creó el mercado. De la segunda empresa solo encontré registro de una venta casi de “liquidación de piezas”. Esta startup nueva también es interesante, pero ya hay demasiados competidores en el mercado. Así que, para mí, esta persona nunca ha tenido un verdadero éxito y ahora está operando en un océano rojo.
Para que los robots humanoides tengan valor a gran escala, no hace falta que llegue AGI. La teleoperación está mucho más subestimada de lo que debería. A corto plazo, alguien en alguna parte del mundo va a controlar remotamente estos robots y hacer entregas y muchas otras tareas a un costo mucho menor.
Me pregunto si de verdad es algo deseable.
¿La teleoperación de verdad aumenta la eficiencia en algo más que reducir salarios?
“IA simple: cosas que hoy sí podemos implementar de forma confiable. No es sexy, pero es tecnología que facilita el trabajo de los trabajadores y los hace más eficientes”. Me parece un resumen perfecto.
Tengo experiencia dando clases grandes en MIT. Esta mañana tomé un Uber, y cuando le pregunté al conductor en qué calle estábamos, no tenía idea. Solo seguía el GPS. Si surge un problema, no se le ocurre resolverlo por su cuenta. Yo además vivo en una calle sin salida (
cul de sac), así que a Uber le cuesta encontrar la ruta. Incluso si trato de guiarlos por voz, los conductores ni siquiera leen los letreros de las calles. Solo vienen siguiendo el punto de destino y luego se quejan. El destino real, en términos de una vía accesible, está del otro lado. Un conductor incluso dio dos vueltas en la misma dirección equivocada y al final canceló. Los taxis no eran gran cosa, pero al menos los choferes tenían un mínimo de conocimiento local.Incluso un brazo robótico simple podría ser de gran ayuda en sectores como construcción o agricultura, que siguen poco industrializados en la mayoría de los países del mundo. Por ejemplo, en Europa la agricultura se está abandonando por la caída de la población y el envejecimiento. Para poner ladrillos no hace falta un humanoide, pero si el equipo fuera barato, también podría ayudar a aliviar la crisis de vivienda.<br>Además, aunque se puede lograr bastante con buen IT, sensores y algo de movimiento, las exigencias del entorno natural son tan variadas que una “plataforma única de propósito general” es imposible. Los humanos tampoco son especialmente eficientes, así que uno se pregunta para qué haría falta un humanoide. Lo que se necesita es una “plataforma robótica modular” respaldada por una gran empresa o por un sistema operativo.
El affordance que trae el carrito en sí reduce lo que el trabajador tiene que pensar. Si ves cómo son las cosas en campo, incluso en sistemas modernos siguen dándole a la gente una pantallita con software basado en caracteres de los años 80 o 90 en la muñeca, más una pistola escáner. En la práctica tienen que leer en pantalla qué número y qué tarea les toca hacer. Al final van a despedir a los trabajadores que saben descifrar texto, y solo van a necesitar unidades obedientes adaptadas al robot.
“Con promesas es fácil conseguir inversión, pero el negocio real es difícil porque tiene límites de crecimiento. Si no los conoces, puedes seguir inflando el sueño, pero mientras más claras se vuelven las limitaciones, más difícil se vuelve conseguir inversión de verdad.” Video relacionado en YouTube