- Meta AI desarrolló y publicó una inteligencia artificial que muestra capacidades a nivel humano en Diplomacy, el famoso juego de mesa de estrategia
- En la versión en línea de ese juego, alcanzó el 10% superior con una puntuación de más del doble que la de las personas
- Diplomacy había sido durante décadas un desafío imposible para la IA
- Dentro del juego, es necesario comprender las motivaciones y perspectivas de otras personas para elaborar planes complejos y ajustar estrategias
- Y también hay que comunicarse con ellas en lenguaje natural para lograr acuerdos y dar confianza sobre asociaciones y alianzas
- CICERO negocia tan bien que, en ocasiones, incluso fue preferido por encima de otros participantes humanos
- Si no detecta que otra persona está haciendo bluff o no entiende una acción agresiva, pierde rápidamente
- Además, si no habla como una persona real —por ejemplo, mostrando empatía, construyendo relaciones o hablando con conocimiento del juego—, los demás no querrán colaborar
- La clave de este logro fue desarrollar nuevas técnicas en la intersección de dos áreas completamente distintas de la IA
- El razonamiento estratégico (Strategic Reasoning) usado en cosas como AlphaGo y Pluribus
- El procesamiento de lenguaje natural (NLP) usado en cosas como GPT-3, BlenderBot 3, LaMDA y OPT-175B
- Por ejemplo, CICERO puede inferir que necesita el apoyo de cierto jugador hacia el final de la partida y luego diseñar una estrategia para ganarse su favor
- También se publicaron el código y el artículo
1 comentarios
Diplomacy es un juego de mesa que salió nada menos que en 1959, y en 2008 incluso tuvo una edición conmemorativa por su 50.º aniversario. Dentro del juego, cada jugador toma el papel de uno de los 7 países europeos de la era previa a la Primera Guerra Mundial (Reino Unido, Francia, Austria-Hungría, Alemania, Italia, Rusia y Turquía). La partida comienza en la primavera de 1901, y cada año se toman acciones en los turnos de primavera y otoño. Solo hay dos tipos de fuerzas: ejército y flota, y se puede elegir entre moverse a una región vecina (incluyendo atacar), apoyar a un aliado en una región vecina para atacar o defender, o mantenerse en la posición actual. Todas las unidades tienen la misma fuerza de ataque 1 y movimiento 1. Claro, los ejércitos solo pueden desplazarse por tierra, y las flotas permiten el transporte por mar (Convoy). Es decir, las acciones son exactamente 4: Hold/Move/Support/Convoy
En el mapa, que cubre toda Europa, hay un total de 34 centros de suministro (Supply Center) marcados con un asterisco, y ganas si tu país controla 18. Todos los países empiezan con 3 centros de suministro, excepto Rusia, que comienza con 4. Por eso, al inicio hay 12 vacíos. Cada país puede mantener tantas unidades como centros de suministro controle al final del turno de otoño. Las fuerzas iniciales varían según el país: algunos comienzan con 2 ejércitos y 1 flota, otros con 2 flotas y 1 ejército. Reino Unido, con superioridad naval, comienza con flotas en Londres y Edimburgo, y un ejército en Liverpool; Francia, por ejemplo, inicia con ejércitos en París y Marsella, y una flota en Brest. Por supuesto, Rusia empieza con ejércitos en Moscú y Varsovia, y flotas en Sebastopol y San Petersburgo. Las regiones se dividen en tres tipos: interior, mar y costa. El interior solo puede ser ocupado por ejércitos, el mar solo por flotas, y la costa por ejércitos o flotas.
El desarrollo del juego en sí es muy simple. No hay dados ni ningún otro elemento de azar; en cada turno, cada jugador debe conseguir la ayuda de los países vecinos mediante negociaciones diplomáticas para favorecer el movimiento de sus ejércitos. La diplomacia puede hacerse públicamente o en secreto. Como suele jugarse de forma asíncrona, a veces se establece un límite de tiempo. Luego, cada jugador entrega una "hoja de órdenes" con las acciones que tomarán sus unidades, y el máster las recopila y las procesa. Por eso también es posible jugar en el formato llamado Play By Mail, intercambiando contenido por correo. En otras palabras, cada quien entrega sus órdenes y luego se revelan al mismo tiempo. En cada hoja solo puede haber una orden por unidad. Por ejemplo, si Francia tiene 3 unidades, su hoja de órdenes sería: "A Par–Bur, A Mar–Spa, F Bre–Pic". Eso significa: "mover el ejército de Paris a Burgundy / mover el ejército de Marseilles a Spain, mover la flota de Brest a Picardy"
¿Y por qué funciona así? Porque todas las fuerzas tienen poder 1, pero en cada región solo puede haber exactamente 1 unidad, así que si se da una situación en la que 2 unidades intentan moverse al mismo lugar, esa acción se cancela. Lo que resuelve eso es el apoyo (Support) de tropas aliadas en regiones vecinas. Si una unidad atacante consigue suficiente apoyo y el número de fuerzas atacantes supera al de las fuerzas defensoras, entonces ocupa esa región. Así que, si quieres conseguir lo que buscas, tienes que negociar a fondo.
"Estoy pensando atacar Ucrania esta vez, ¿no me echarías una mano? Avancemos juntos hacia el oeste"
"¡No quiero!" / "¿Y yo qué gano con eso?"
En la práctica, es un juego donde de principio a fin todo consiste en interacciones diplomáticas que avanzan por medio de conversaciones, así que impresiona ver que una IA pueda jugarlo de verdad.