Exportar registro bibliográfico

Deep reinforcement learning for multi-domain task-oriented dialogue systems (2022)

  • Authors:
  • Autor USP: NISHIMOTO, BRUNO EIDI - EP
  • Unidade: EP
  • Sigla do Departamento: PCS
  • Assunto: APRENDIZADO COMPUTACIONAL
  • Agências de fomento:
  • Language: Inglês
  • Abstract: O sistema de diálogo (DS) é uma ideia antiga que remonta a 1966, quando o primeiro sistema desse tipo foi criado. O DS pode ser classificado em três categorias: perguntas & respostas, orientado à objetivo e socialbot. Os sistemas de diálogo orientados à objetivo são um campo muito relevante devido à diversidade de aplicações possíveis que podem alcançar. Por exemplo, ele pode resolver tarefas como comprar um ingresso de cinema, reservar um restaurante e fornecer atendimento ao cliente. Eles têm recebido cada vez mais atenção no processamento de linguagem natural. Embora a literatura apresente diversos estudos com foco na SD, ainda há muitas questões a serem cumpridas. A maioria deles está relacionada à gestão do diálogo, componente central do DS. A aprendizagem por reforço (RL) é uma abordagem que alcançou grande sucesso recentemente. No entanto, as coisas se tornam mais complexas quando o DS é estendido para configurações de vários domínios, ou seja, quando o DS precisa concluir várias tarefas em diferentes domínios para o usuário. Alguns problemas como adaptação de políticas e transferência de aprendizado surgem nesse novo cenário. O objetivo desta pesquisa é aprimorar técnicas recentes de uso de RL na gestão do diálogo. Apresentamos um aprendizado eficiente equilibrando exploração e explotação, e potencializando o uso do conhecimento especializado para orientar o agente. Propomos um método para lidar com ruído e erro na entrada do gerenciamento de diálogo e também fornecemos uma comparação básica entre RL e aprendizado supervisionado em conjuntos de dados reais e de brinquedo. Porém, apresentamos uma nova proposta para lidar com configurações multidomínio: o uso da técnica de dividir e conquistar e transferir aprendizado para diferentes domínios.
  • Imprenta:
  • Data da defesa: 08.11.2022
  • Acesso à fonte
    How to cite
    A citação é gerada automaticamente e pode não estar totalmente de acordo com as normas

    • ABNT

      NISHIMOTO, Bruno Eidi. Deep reinforcement learning for multi-domain task-oriented dialogue systems. 2022. Dissertação (Mestrado) – Universidade de São Paulo, São Paulo, 2022. Disponível em: https://www.teses.usp.br/teses/disponiveis/3/3141/tde-31032023-082212/. Acesso em: 12 fev. 2026.
    • APA

      Nishimoto, B. E. (2022). Deep reinforcement learning for multi-domain task-oriented dialogue systems (Dissertação (Mestrado). Universidade de São Paulo, São Paulo. Recuperado de https://www.teses.usp.br/teses/disponiveis/3/3141/tde-31032023-082212/
    • NLM

      Nishimoto BE. Deep reinforcement learning for multi-domain task-oriented dialogue systems [Internet]. 2022 ;[citado 2026 fev. 12 ] Available from: https://www.teses.usp.br/teses/disponiveis/3/3141/tde-31032023-082212/
    • Vancouver

      Nishimoto BE. Deep reinforcement learning for multi-domain task-oriented dialogue systems [Internet]. 2022 ;[citado 2026 fev. 12 ] Available from: https://www.teses.usp.br/teses/disponiveis/3/3141/tde-31032023-082212/


Digital Library of Intellectual Production of Universidade de São Paulo     2012 - 2026