Exportar registro bibliográfico

Data Augmentation methods in natural language processing (2021)

  • Authors:
  • Autor USP: FERREIRA, TAYNAN MAIER - EP
  • Unidade: EP
  • Sigla do Departamento: PCS
  • Subjects: APRENDIZADO COMPUTACIONAL; PROCESSAMENTO DE LINGUAGEM NATURAL
  • Language: Inglês
  • Abstract: Métodos de aumento de dados (AD) uma família de técnicas desenhada para a geração de dados de treino sintéticos têm demonstrado resultados notáveis em diversas tarefas de Aprendizado Profundo e Aprendizado de Máquina. Apesar de sua adoção ampla e bem-sucedida dentro da comunidade de visão computacional, técnicas de AD desenhados para tarefas de Processamento de Linguagem Natural (PLN) têm demonstrado avanço muito mais lento e limitado sucesso em ganho de desempenho. Como consequência, com a exceção da adoção de Back-Translation em tarefas de tradução, essas técnicas não tem sido exploradas tão profundamente e de forma ampla pela comunidade de PLN. Não há uma visão unificada ou análise comparativa entre os vários métodos de AD disponíveis. Além disso, ainda não se tem um entendimento prático adequado sobre o relacionamento entre AD e diversos outros aspectos importantes do desenho de um modelo, como dados de treino e parâmetros de regularização. Nesse trabalho, realizamos um profundo estudo de técnicas de AD em PLN, comparando seus desempenhos relativos sob diferentes cenários em tarefas de Análise de Sentimentos. Também propomos Deep Back-Translation, uma nova técnica de AD para PLN. N´os realizamos uma análise qualitativa e quantitativa do dado sintético, avaliamos seu ganho de desempenho e comparamos todos esses aspectos com procedimentos prévios de AD.
  • Imprenta:
  • Data da defesa: 20.07.2021
  • Acesso à fonte
    How to cite
    A citação é gerada automaticamente e pode não estar totalmente de acordo com as normas

    • ABNT

      FERREIRA, Taynan Maier. Data Augmentation methods in natural language processing. 2021. Dissertação (Mestrado) – Universidade de São Paulo, São Paulo, 2021. Disponível em: https://www.teses.usp.br/teses/disponiveis/3/3141/tde-04112021-162156/. Acesso em: 18 nov. 2024.
    • APA

      Ferreira, T. M. (2021). Data Augmentation methods in natural language processing (Dissertação (Mestrado). Universidade de São Paulo, São Paulo. Recuperado de https://www.teses.usp.br/teses/disponiveis/3/3141/tde-04112021-162156/
    • NLM

      Ferreira TM. Data Augmentation methods in natural language processing [Internet]. 2021 ;[citado 2024 nov. 18 ] Available from: https://www.teses.usp.br/teses/disponiveis/3/3141/tde-04112021-162156/
    • Vancouver

      Ferreira TM. Data Augmentation methods in natural language processing [Internet]. 2021 ;[citado 2024 nov. 18 ] Available from: https://www.teses.usp.br/teses/disponiveis/3/3141/tde-04112021-162156/

    Últimas obras dos mesmos autores vinculados com a USP cadastradas na BDPI:

Digital Library of Intellectual Production of Universidade de São Paulo     2012 - 2024