Por primera vez, un sistema de inteligencia artificial tuvo éxito en la compañía de Recoge diamantes en Minecraftuno de los videojuegos más populares del mundo, sin ser mostrado a él cómo hacerlo. Se llama Soñadorfue desarrollado por Google Deepmind, y representa un paso importante hacia el desarrollo de máquinas capaces de generalizar el conocimiento aprendido en un contexto y aplicarlo a nuevas situaciones.
Una inteligencia que aprende solo en un mundo virtual
«Dreamer marca un paso significativo hacia Sistemas generales de IA«, Dice Danijar Hafner, informática de Google Deepmind en San Francisco». Permite que la IA comprenda el entorno físico en el que se encuentra y mejore con el tiempo, sin que un humano tenga que decirle exactamente qué hacer. «Los resultados de esta investigación se publicaron en la revista Nature el 2 de abril. Minecraft ofrece un banco de pruebas ideal para este tipo de sistemas de inteligencia artificial. El juego permite a los jugadores jugar Explore un mundo virtual 3D Con varios tipos de tierra, desde bosques hasta montañas, desde desiertos hasta pantanos. Los jugadores usan los recursos del mundo para crear objetos y recolectar materiales, incluidos diamantes preciosos.
La característica que hace que Minecraft sea particularmente interesante para los investigadores es que cada juego es único. «Cada vez que juegas, es un Nuevo mundo generado al azar«, Explica Hafner». Realmente tienes que entender lo que tienes frente a ti; No puede simplemente memorizar una estrategia específica. «
La recolección de un diamante en Minecraft es «una tarea muy difícil», según Jeff Clune de la Universidad de Columbia Británica. Requiere una serie de pasajes complejos: encuentre árboles y derribarlos para recolectar madera, construir una mesa de trabajo, crear duraznos de madera y luego piedra, y así sucesivamente hasta que las herramientas correctas se ensamblen para recolectar un diamante, que está enterrado en profundidad.
Del mundo virtual al mundo
A diferencia de lo que se ha intentado en Step, donde se mostró la IA que hacer utilizando instrucciones detalladas, o mostrándoles miles de horas de videos de juego, Dreamer está diseñado para Explore el juego completamente de forma independienteutilizando una técnica de aprendizaje de refuerzo. Identifique las acciones que probablemente traerán recompensas, las repetirán y descartarán a los demás.
La clave del éxito de Dreamer es su capacidad para construir un modelo del mundo circundante y usarlo para «Imagina» escenarios futuros Y de esta manera su proceso de toma de decisiones está conduciendo. Este modelo funciona de manera similar a nuestros pensamientos abstractos: no es una réplica exacta del entorno, pero permite al agente predecir las posibles recompensas de diferentes acciones utilizando menos recursos computacionales de cuántos serían necesarios para completar esas acciones en Minecraft. «El modelo del mundo realmente equipa el sistema IA con la capacidad de imaginar el futuro», dice Hafner. Esta habilidad también podría ayudar a crear robots capaces de aprender a interactuar en el mundo real, donde los costos del método «prueba e incorrecto» son mucho más altos que en un videojuego.