Deep reinforcement learning for multi-domain task-oriented dialogue systems

Nishimoto, Bruno Eidi; Reali Costa, Anna Helena

Tese

Deep reinforcement learning for multi-domain task-oriented dialogue systems (2022)

Authors:
- Nishimoto, Bruno Eidi
- Reali Costa, Anna Helena (Orientador)
Autor USP: NISHIMOTO, BRUNO EIDI - EP
Unidade: EP
Sigla do Departamento: PCS
Assunto: APRENDIZADO COMPUTACIONAL
Agências de fomento:
- Financiamento FUSP
Language: Inglês
Abstract: O sistema de diálogo (DS) é uma ideia antiga que remonta a 1966, quando o primeiro sistema desse tipo foi criado. O DS pode ser classificado em três categorias: perguntas & respostas, orientado à objetivo e socialbot. Os sistemas de diálogo orientados à objetivo são um campo muito relevante devido à diversidade de aplicações possíveis que podem alcançar. Por exemplo, ele pode resolver tarefas como comprar um ingresso de cinema, reservar um restaurante e fornecer atendimento ao cliente. Eles têm recebido cada vez mais atenção no processamento de linguagem natural. Embora a literatura apresente diversos estudos com foco na SD, ainda há muitas questões a serem cumpridas. A maioria deles está relacionada à gestão do diálogo, componente central do DS. A aprendizagem por reforço (RL) é uma abordagem que alcançou grande sucesso recentemente. No entanto, as coisas se tornam mais complexas quando o DS é estendido para configurações de vários domínios, ou seja, quando o DS precisa concluir várias tarefas em diferentes domínios para o usuário. Alguns problemas como adaptação de políticas e transferência de aprendizado surgem nesse novo cenário. O objetivo desta pesquisa é aprimorar técnicas recentes de uso de RL na gestão do diálogo. Apresentamos um aprendizado eficiente equilibrando exploração e explotação, e potencializando o uso do conhecimento especializado para orientar o agente. Propomos um método para lidar com ruído e erro na entrada do gerenciamento de diálogo e também fornecemos uma comparação básica entre RL e aprendizado supervisionado em conjuntos de dados reais e de brinquedo. Porém, apresentamos uma nova proposta para lidar com configurações multidomínio: o uso da técnica de dividir e conquistar e transferir aprendizado para diferentes domínios.
Imprenta:
- Publisher place: São Paulo
- Date published: 2022
Data da defesa: 08.11.2022

How to cite

A citação é gerada automaticamente e pode não estar totalmente de acordo com as normas

ABNT

NISHIMOTO, Bruno Eidi. Deep reinforcement learning for multi-domain task-oriented dialogue systems. 2022. Dissertação (Mestrado) – Universidade de São Paulo, São Paulo, 2022. Disponível em: https://teses.usp.br/teses/disponiveis/3/3141/tde-31032023-082212/. Acesso em: 10 abr. 2026.
APA

Nishimoto, B. E. (2022). Deep reinforcement learning for multi-domain task-oriented dialogue systems (Dissertação (Mestrado). Universidade de São Paulo, São Paulo. Recuperado de https://teses.usp.br/teses/disponiveis/3/3141/tde-31032023-082212/
NLM

Nishimoto BE. Deep reinforcement learning for multi-domain task-oriented dialogue systems [Internet]. 2022 ;[citado 2026 abr. 10 ] Available from: https://teses.usp.br/teses/disponiveis/3/3141/tde-31032023-082212/
Vancouver

Nishimoto BE. Deep reinforcement learning for multi-domain task-oriented dialogue systems [Internet]. 2022 ;[citado 2026 abr. 10 ] Available from: https://teses.usp.br/teses/disponiveis/3/3141/tde-31032023-082212/

ReP

Exportar registro bibliográfico

Deep reinforcement learning for multi-domain task-oriented dialogue systems (2022)

How to cite

Últimas obras dos mesmos autores vinculados com a USP cadastradas na BDPI:

USP Schools

ReP

Exportar registro bibliográfico

Deep reinforcement learning for multi-domain task-oriented dialogue systems (2022)

How to cite

Últimas obras dos mesmos autores vinculados com a USP cadastradas na BDPI: