Inteligencias artificiales cooperan entre sí para derrotar humanos en el juego 'Quake III Arena'

La compañía DeepMind ha desarrollado una inteligencia artificial que coopera y aprende por sí sola a ganar en el Quake III Arena, venciendo a cualquier competencia humana.

Las inteligencias artificiales aprendieron a colaborar con sus compañeros de equipo en el asalto, tal como lo hacen los jugadores de carne y hueso.

La saga Terminator, del cineasta James Cameron, recrea un mundo en el que una inteligencia artificial (IA) llamada Skynet se rebela contra los humanos. La máquina aprende que para sobrevivir debe destruir a su creador, así que desata un infierno nuclear que inicia la era de las máquinas.

Por si acaso, los misiles nucleares están protegidos en el fondo de refugios desconectados de internet y controlados por ordenadores obsoletos, pero fiables. Sin embargo, quizás sorprenda que DeepMind, filial de Google, lleve años desarrollando una inteligencia artificial capaz de aprender, sin ingerencia humana, cómo alcanzar sus objetivos.

Ayer mismo, un estudio publicado en Science y elaborado por investigadores de la compañía mostró cómo una inteligencia artificial es capaz de vencer a jugadores expertos en un popular videojuego de disparos, el Quake III Arena, un logro nunca antes alcanzado por una máquina.

Los investigadores han creado un sistema basado en varias IAs, a las que han llamado «agentes». Cada uno aprende de forma independiente cómo jugar y lo conveniente que es cooperar para ganar. Solo necesitan una extensa base de datos con miles de partidas, un algoritmo de aprendizaje por refuerzo positivo y ver los píxeles que ocupa su propio campo visual.

Más «letal» que los jugadores humanos

Su objetivo es ganar cuantas más veces se pueda en una modalidad de juego en la que deben capturar la bandera del enemigo y evitar la captura de la propia. Para ello, las IAs disparan al rival para mandarlo a su base, aprenden a quedarse en el campamento contrario para hostigar a los oponentes o bien se mantienen cerca de sus aliados durante la batalla.

«Estos agentes aprenden tácticas similares a las que usan los humanos y forman equipo tanto con humanos como con otros agentes», ha explicado Max Jaderberg, director del trabajo.

Lo que hace que estos resultados sean tan emocionantes es que estos agentes perciben su entorno desde la perspectiva de primera persona, tal como lo haría un jugador humano

Los investigadores entrenaron a 30 agentes. Después de jugar 450.000 partidas, estos lucharon en un torneo en el que participaron 40 contrincantes humanos. Así, observaron que la máquina se impuso y logró capturar una media de 16 banderas más que el hombre, incluso cuando se aumentó su tiempo de reacción para ponerlo a la altura de los reflejos humanos.

Hasta ahora, las IAs de DeepMind, AlphaZero y AlphaGo, habían derrotado a los mejores jugadores de ajedrez, go y shogi, después de aprender por sí solas. Pero, dado que estos juegos se desenvuelven en entornos muy estables y con reglas bien establecidas, el próximo paso es introducir complejidad, incertidumbre y multitud de protagonistas.

Esquema de varias tácticas adoptadas por la IA para vencer en partidas en las que debía capturar la bandera del enemigo y evitar la toma de la propia.

De momento, otra IA, de nombre AlphaStar, ha derrotado a jugadores profesionales en el videojuego StarCraft II, mucho más dinámico e incierto que los anteriores. Sin embargo, lo cierto es que la máquina solo ha podido vencer sin incorporar el desconocimiento de la niebla de guerra, que le oculta a los jugadores la posición del enemigo. De momento, la máquina solo gana si sabe dónde está el rival.

Máquinas que aprenden solas

En esta ocasión, los científicos han demostrado el rendimiento de su IA en un entorno poblado por múltiples protagonistas, en el que los agentes han tenido que aprender de forma independiente, pero también cooperar para alcanzar el bien común.

Esto es fundamental, según los investigadores de DeepMind, para que la inteligencia artificial desempeñe tareas cada vez más complejas, sin necesidad de que haya que programar todas y cada una de las posibilidades ante las que se encontrarán.

«Nadie les ha dicho cómo jugar al juego o si han logrado vencer a su enemigo o no», ha dicho Jaderberg. «La belleza de este sistema de aprendizaje por refuerzo es que nunca sabes qué tipos de comportamientos emergerán en los agentes».

Al menos que sepamos, el objetivo de DeepMind no es destruir el mundo, sino desarrollar una inteligencia artificial capaz de lidiar con tareas complejas, como el diseño de medicamentos, materiales y aplicaciones biotecnológicas, para hacerlo un poco mejor. Lo que parece seguro es que el futuro nos traerá cosas que hoy no podemos ni imaginar.

Fuente: ABC. Edición: Gonzálo López Sánchez.