Sin algoritmos de nivel gran maestro para ajedrez
- Este repositorio ofrece una implementación del artículo "Sin algoritmos de nivel gran maestro para ajedrez"
- Los éxitos recientes del aprendizaje automático se deben principalmente a arquitecturas basadas en atención a gran escala y a conjuntos de datos de un tamaño sin precedentes
- Este artículo investiga el impacto del aprendizaje a gran escala para el ajedrez
- A diferencia de los motores de ajedrez tradicionales, no depende de heurísticas complejas ni de búsqueda explícita
- Se entrenó de forma supervisada un modelo Transformer con 270 millones de parámetros usando un conjunto de datos de 10 millones de partidas de ajedrez
- Se anotó cada tablero usando los valores de acción del motor Stockfish 16, generando aproximadamente 15 mil millones de puntos de datos
- El modelo más grande registró un Elo blitz de 2895 en Lichess contra humanos y resolvió acertijos de ajedrez difíciles incluso sin algoritmos de búsqueda explícita
- Superó a las redes de política y valor de AlphaZero (sin búsqueda) y a GPT-3.5-turbo-instruct
- A través de una investigación sistemática del tamaño del modelo y del conjunto de datos, muestra que un rendimiento fuerte en ajedrez solo aparece a suficiente escala
- Se realizaron experimentos extensivos sobre elecciones de diseño e hiperparámetros para validar los resultados
Resumen de GN⁺
- Este proyecto es una investigación importante que muestra que se puede lograr un alto rendimiento en ajedrez sin algoritmos de búsqueda tradicionales
- Explora nuevas posibilidades para los motores de ajedrez aprovechando conjuntos de datos a gran escala y modelos Transformer
- Muestra un mejor rendimiento en comparación con motores de ajedrez potentes ya existentes como AlphaZero
- Ofrece información interesante y útil para quienes están interesados en el ajedrez, y plantea nuevas posibilidades de aplicación del aprendizaje automático
- Proyectos con funciones similares incluyen AlphaZero y Leela Chess Zero
1 comentarios
Opiniones de Hacker News
Es difícil encontrar un oponente de ajedrez del nivel que el usuario quiere. La mayoría de los motores reducen la profundidad de búsqueda para bajar la dificultad, pero eso no es efectivo.
Un usuario dio una presentación sobre destilación de conocimiento relacionada con ajedrez, y explicó cómo destilar funciones complejas de búsqueda no lineal en un modelo transformador cuasilineal para entradas estándar como las del ajedrez.
Para quienes estén interesados en redes neuronales de ajedrez, se recomienda un repositorio de GitHub con código sencillo usando PyTorch y una arquitectura similar a la de las redes neuronales de ajedrez con mejor rendimiento actual.
Hay una entrada de blog que compara la red LC0 con la red transformadora de DeepMind.
El artículo "Grandmaster-Level Chess Without Search" enfatiza la importancia de una arquitectura basada en atención a gran escala y de los datasets, y entrena ajedrez con un modelo transformador de 270M parámetros.
El gran dataset sintético fue generado usando búsqueda tradicional, lo que equivale a codificar el árbol de búsqueda dentro del modelo transformador.
Matthew Sadler configuró Leela Zero para jugar de forma intuitiva, y eso permite realizar partidas de entrenamiento de manera efectiva incluso sin búsqueda.
Resolver el ajedrez genera un árbol demasiado grande, y hay dos enfoques para optimizarlo.
La cadena FEN se convierte en una cadena de longitud fija para codificar el estado del tablero, y se usa la notación UCI para almacenar las acciones.