Imagen del encabezado de la página

IV Congreso Internacional de Ingeniería Informática y Sistemas de Información

PARALELIZACIÓN EN APACHE SPARK DE Q-LEARNING UTILIZANDO EL ENFOQUE DE SISTEMA MULTIAGENTE

Lester Guerra Denis

Resumen

El aprendizaje por refuerzo es un tipo general del aprendizaje automático, que es diferenciado de otros tipos por la manera de definir la experiencia. Se distingue por su énfasis en el aprendizaje por parte del individuo y en la interacción directa con su entorno, sin depender de una supervisión ejemplar o modelos completos del entorno. Q-Learning, destacado algoritmo de aprendizaje reforzado, al enfrentarse a entornos complejos con un amplio espacio de estado y acción, requiere de mucho tiempo para alcanzar una solución óptima posible, debido a su característica de ser iterativo. A causa de esta problemática surge la necesidad de encontrar soluciones para acelerar el proceso de aprendizaje del algoritmo. La computación paralela resalta como una posible solución para este problema, por lo que se proponen dos soluciones paralelas del algoritmo, usando en ambas un enfoque de sistema multiagente y realizando variaciones en la manera de compartir la información de los agentes que componen el sistema. Se obtuvieron resultados positivos para ambos algoritmos, en el entorno GridWorld con distintas configuraciones de tamaño.


Palabras claves

aprendizaje por refuerzo; sistema multiagente; Q-learning; computacion paralela