Los límites de Leela Chess Zero
- Leela Chess Zero se convirtió en campeón mundial tras entrenar miles de millones de veces mediante autojuego
- Pero fue derrotado de forma aplastante por Stockfish
- Incluso al entrenar una red más grande, no pudo vencer a Stockfish
- Stockfish usó un modelo mucho más pequeño que Leela, pero ganó gracias a una mejor capacidad de búsqueda
Más reflexiones sobre la victoria de Stockfish
- Leela perdió su lugar como campeón mundial porque no buscaba bien
- Agregar capacidad de búsqueda a los LLM está cerca, pero no está recibiendo atención
- Los modelos fundacionales como GPT-4 no tienen capacidad de búsqueda
- Predomina la suposición de que se necesitan modelos más grandes para hacer posible la búsqueda, pero existen contraejemplos
- Según una investigación de DeepMind, el comportamiento de búsqueda emerge de forma natural en algoritmos de ajedrez
- Existen algoritmos de búsqueda eficientes, así que no hace falta esperar a que una búsqueda previa ineficiente emerja por accidente en modelos grandes
- Los modelos actuales ya son lo suficientemente grandes para hacer posible la búsqueda, e incluso podrían ser innecesariamente grandes
La búsqueda permite asignar recursos computacionales al dominio objetivo
- Supongamos que una farmacéutica quiere investigar nuevos medicamentos usando IA
- En un mundo donde la búsqueda con IA es posible, hay dos opciones
- Esperar hasta 2030 a que OpenAI lance un modelo 4 órdenes de magnitud mayor, o
- Usar desde hoy 4 órdenes de magnitud más recursos de cómputo para inferencia
- La farmacéutica preferiría la segunda opción
- A través de la búsqueda, sería posible aprovechar desde ahora capacidades de nivel ASI de 2030
Escenario de avance de la IA basado en búsqueda
- Se descubre que la búsqueda funciona en los modelos existentes
- Gobiernos o grandes laboratorios reconocen que pueden aplicar de inmediato la búsqueda a la investigación en IA o a la recopilación de información en el extranjero
- Como los recursos de cómputo para inferencia son limitados, su uso se restringe a seguridad o investigación en IA por parte de gobiernos o grandes laboratorios
- El avance de la IA impulsado por búsqueda lleva al descubrimiento de algoritmos de exploración y arquitecturas de modelo más eficientes
- La búsqueda no requiere más datos de entrenamiento, por lo que resuelve el problema de la "barrera de datos"
- La explosión de inteligencia comienza el próximo año, no en 2030
Posibilidad de aplicar búsqueda a la investigación de la propia IA
- Si la IA avanza lo suficiente como para poder investigarse a sí misma, se espera una dinámica de progreso acelerado
- Así como una farmacéutica podría investigar nuevos medicamentos sin esperar a GPT-8, los laboratorios de IA también podrían investigar IA sin esperar modelos más grandes
- Para reemplazar a investigadores humanos de IA, podría hacer falta eliminar más restricciones
- Pero se espera que incluso un chatbot simple con inteligencia de nivel GPT-8 sea suficiente para acelerar el avance de la IA
1 comentarios
Opinión de Hacker News
Resumen de comentarios de Hacker News