2 puntos por GN⁺ 2024-10-19 | 1 comentarios | Compartir por WhatsApp

Sin algoritmos de nivel gran maestro para ajedrez

  • Este repositorio ofrece una implementación del artículo "Sin algoritmos de nivel gran maestro para ajedrez"
  • Los éxitos recientes del aprendizaje automático se deben principalmente a arquitecturas basadas en atención a gran escala y a conjuntos de datos de un tamaño sin precedentes
  • Este artículo investiga el impacto del aprendizaje a gran escala para el ajedrez
  • A diferencia de los motores de ajedrez tradicionales, no depende de heurísticas complejas ni de búsqueda explícita
  • Se entrenó de forma supervisada un modelo Transformer con 270 millones de parámetros usando un conjunto de datos de 10 millones de partidas de ajedrez
  • Se anotó cada tablero usando los valores de acción del motor Stockfish 16, generando aproximadamente 15 mil millones de puntos de datos
  • El modelo más grande registró un Elo blitz de 2895 en Lichess contra humanos y resolvió acertijos de ajedrez difíciles incluso sin algoritmos de búsqueda explícita
  • Superó a las redes de política y valor de AlphaZero (sin búsqueda) y a GPT-3.5-turbo-instruct
  • A través de una investigación sistemática del tamaño del modelo y del conjunto de datos, muestra que un rendimiento fuerte en ajedrez solo aparece a suficiente escala
  • Se realizaron experimentos extensivos sobre elecciones de diseño e hiperparámetros para validar los resultados

Resumen de GN⁺

  • Este proyecto es una investigación importante que muestra que se puede lograr un alto rendimiento en ajedrez sin algoritmos de búsqueda tradicionales
  • Explora nuevas posibilidades para los motores de ajedrez aprovechando conjuntos de datos a gran escala y modelos Transformer
  • Muestra un mejor rendimiento en comparación con motores de ajedrez potentes ya existentes como AlphaZero
  • Ofrece información interesante y útil para quienes están interesados en el ajedrez, y plantea nuevas posibilidades de aplicación del aprendizaje automático
  • Proyectos con funciones similares incluyen AlphaZero y Leela Chess Zero

1 comentarios

 
GN⁺ 2024-10-19
Opiniones de Hacker News
  • Es difícil encontrar un oponente de ajedrez del nivel que el usuario quiere. La mayoría de los motores reducen la profundidad de búsqueda para bajar la dificultad, pero eso no es efectivo.

    • Los usuarios quieren un oponente de computadora que se sienta como un jugador humano.
  • Un usuario dio una presentación sobre destilación de conocimiento relacionada con ajedrez, y explicó cómo destilar funciones complejas de búsqueda no lineal en un modelo transformador cuasilineal para entradas estándar como las del ajedrez.

  • Para quienes estén interesados en redes neuronales de ajedrez, se recomienda un repositorio de GitHub con código sencillo usando PyTorch y una arquitectura similar a la de las redes neuronales de ajedrez con mejor rendimiento actual.

  • Hay una entrada de blog que compara la red LC0 con la red transformadora de DeepMind.

  • El artículo "Grandmaster-Level Chess Without Search" enfatiza la importancia de una arquitectura basada en atención a gran escala y de los datasets, y entrena ajedrez con un modelo transformador de 270M parámetros.

    • Genera más de mil millones de puntos de datos usando el motor Stockfish 16, y alcanza un Elo blitz de 2895 contra humanos en Lichess.
    • Supera las redes de política y valor de AlphaZero.
  • El gran dataset sintético fue generado usando búsqueda tradicional, lo que equivale a codificar el árbol de búsqueda dentro del modelo transformador.

  • Matthew Sadler configuró Leela Zero para jugar de forma intuitiva, y eso permite realizar partidas de entrenamiento de manera efectiva incluso sin búsqueda.

  • Resolver el ajedrez genera un árbol demasiado grande, y hay dos enfoques para optimizarlo.

    • Aproximar el árbol y aproximar las anotaciones.
    • Es posible aproximar el árbol con datos de 270M palabras.
  • La cadena FEN se convierte en una cadena de longitud fija para codificar el estado del tablero, y se usa la notación UCI para almacenar las acciones.

    • Si hay que reescribir el tokenizador para cada variante del problema, entonces eso es solo programación.