Deep reinforcement learning for multi-domain task-oriented dialogue systems (2022)
- Authors:
- Autor USP: NISHIMOTO, BRUNO EIDI - EP
- Unidade: EP
- Sigla do Departamento: PCS
- Assunto: APRENDIZADO COMPUTACIONAL
- Agências de fomento:
- Language: Inglês
- Abstract: O sistema de diálogo (DS) é uma ideia antiga que remonta a 1966, quando o primeiro sistema desse tipo foi criado. O DS pode ser classificado em três categorias: perguntas & respostas, orientado à objetivo e socialbot. Os sistemas de diálogo orientados à objetivo são um campo muito relevante devido à diversidade de aplicações possíveis que podem alcançar. Por exemplo, ele pode resolver tarefas como comprar um ingresso de cinema, reservar um restaurante e fornecer atendimento ao cliente. Eles têm recebido cada vez mais atenção no processamento de linguagem natural. Embora a literatura apresente diversos estudos com foco na SD, ainda há muitas questões a serem cumpridas. A maioria deles está relacionada à gestão do diálogo, componente central do DS. A aprendizagem por reforço (RL) é uma abordagem que alcançou grande sucesso recentemente. No entanto, as coisas se tornam mais complexas quando o DS é estendido para configurações de vários domínios, ou seja, quando o DS precisa concluir várias tarefas em diferentes domínios para o usuário. Alguns problemas como adaptação de políticas e transferência de aprendizado surgem nesse novo cenário. O objetivo desta pesquisa é aprimorar técnicas recentes de uso de RL na gestão do diálogo. Apresentamos um aprendizado eficiente equilibrando exploração e explotação, e potencializando o uso do conhecimento especializado para orientar o agente. Propomos um método para lidar com ruído e erro na entrada do gerenciamento de diálogo e também fornecemos uma comparação básica entre RL e aprendizado supervisionado em conjuntos de dados reais e de brinquedo. Porém, apresentamos uma nova proposta para lidar com configurações multidomínio: o uso da técnica de dividir e conquistar e transferir aprendizado para diferentes domínios.
- Imprenta:
- Data da defesa: 08.11.2022
-
ABNT
NISHIMOTO, Bruno Eidi. Deep reinforcement learning for multi-domain task-oriented dialogue systems. 2022. Dissertação (Mestrado) – Universidade de São Paulo, São Paulo, 2022. Disponível em: https://www.teses.usp.br/teses/disponiveis/3/3141/tde-31032023-082212/. Acesso em: 12 fev. 2026. -
APA
Nishimoto, B. E. (2022). Deep reinforcement learning for multi-domain task-oriented dialogue systems (Dissertação (Mestrado). Universidade de São Paulo, São Paulo. Recuperado de https://www.teses.usp.br/teses/disponiveis/3/3141/tde-31032023-082212/ -
NLM
Nishimoto BE. Deep reinforcement learning for multi-domain task-oriented dialogue systems [Internet]. 2022 ;[citado 2026 fev. 12 ] Available from: https://www.teses.usp.br/teses/disponiveis/3/3141/tde-31032023-082212/ -
Vancouver
Nishimoto BE. Deep reinforcement learning for multi-domain task-oriented dialogue systems [Internet]. 2022 ;[citado 2026 fev. 12 ] Available from: https://www.teses.usp.br/teses/disponiveis/3/3141/tde-31032023-082212/
How to cite
A citação é gerada automaticamente e pode não estar totalmente de acordo com as normas
