Seleção de abstração espacial no Aprendizado por Reforço avaliando o processo de aprendizagem (2017)
- Authors:
- Autor USP: SILVA, CLEITON ALVES DA - EACH
- Unidade: EACH
- Subjects: INTELIGÊNCIA ARTIFICIAL; APRENDIZAGEM
- Keywords: Aprendizado por Reforço; Reinforcement Learning
- Language: Português
- Abstract: Agentes que utilizam técnicas de Aprendizado por Reforço (AR) buscam resolver problemas que envolvem decisões sequenciais em ambientes estocásticos sem conhecimento a priori. O processo de aprendizado desenvolvido pelo agente em geral é lento, visto que se concretiza por tentativa e erro e exige repetidas interações com cada estado do ambiente e como o estado do ambiente é representado por vários fatores, a quantidade de estados cresce exponencialmente de acordo com o número de variáveis de estado. Uma das técnicas para acelerar o processo de aprendizado é a generalização de conhecimento, que visa melhorar o processo de aprendizado, seja no mesmo problema por meio da abstração, ao explorar a similaridade entre estados semelhantes ou em diferentes problemas, ao transferir o conhecimento adquirido de um problema fonte para acelerar a aprendizagem em um problema alvo. Uma abstração considera partes do estado e, ainda que uma única não seja suficiente, é necessário descobrir qual combinação de abstrações pode atingir bons resultados. Nesta dissertação é proposto um método para seleção de abstração, considerando o processo de avaliação da aprendizagem durante o aprendizado. A contribuição é formalizada pela apresentação do algoritmo REPO, utilizado para selecionar e avaliar subconjuntos de abstrações... (Continua)(Continuação) O algoritmo é iterativo e a cada rodada avalia novos subconjuntos de abstrações, conferindo uma pontuação para cada uma das abstrações existentes no subconjunto e por fim, retorna o subconjunto com as abstrações melhores pontuadas. Experimentos com o simulador de futebol mostram que esse método é efetivo e consegue encontrar um subconjunto com uma quantidade menor de abstrações que represente o problema original, proporcionando melhoria em relação ao desempenho do agente em seu aprendizado
- Imprenta:
- Data da defesa: 14.06.2017
-
ABNT
SILVA, Cleiton Alves da. Seleção de abstração espacial no Aprendizado por Reforço avaliando o processo de aprendizagem. 2017. Dissertação (Mestrado) – Universidade de São Paulo, São Paulo, 2017. Disponível em: http://www.teses.usp.br/teses/disponiveis/100/100131/tde-08022018-102528/. Acesso em: 20 jan. 2026. -
APA
Silva, C. A. da. (2017). Seleção de abstração espacial no Aprendizado por Reforço avaliando o processo de aprendizagem (Dissertação (Mestrado). Universidade de São Paulo, São Paulo. Recuperado de http://www.teses.usp.br/teses/disponiveis/100/100131/tde-08022018-102528/ -
NLM
Silva CA da. Seleção de abstração espacial no Aprendizado por Reforço avaliando o processo de aprendizagem [Internet]. 2017 ;[citado 2026 jan. 20 ] Available from: http://www.teses.usp.br/teses/disponiveis/100/100131/tde-08022018-102528/ -
Vancouver
Silva CA da. Seleção de abstração espacial no Aprendizado por Reforço avaliando o processo de aprendizagem [Internet]. 2017 ;[citado 2026 jan. 20 ] Available from: http://www.teses.usp.br/teses/disponiveis/100/100131/tde-08022018-102528/
How to cite
A citação é gerada automaticamente e pode não estar totalmente de acordo com as normas
