Exportar registro bibliográfico

Improved quantification under dataset shift (2018)

  • Authors:
  • Autor USP: VAZ, AFONSO FERNANDES - Interinstitucional de Pós-Graduação em Estatística
  • Unidade: Interinstitucional de Pós-Graduação em Estatística
  • Sigla do Departamento: SME
  • Subjects: APRENDIZADO COMPUTACIONAL; ESTATÍSTICA; ESTATÍSTICA E PROBABILIDADE
  • Keywords: Aprendizado de máquina; Data set shift; Machine learning; Mudança de domínio; Prior shift; Quantificação; Quantification
  • Agências de fomento:
  • Language: Inglês
  • Abstract: Muitas aplicações de aprendizado de máquina usam classificadores para determinar a prevalência da classe positiva em um conjunto de dados de interesse, uma tarefa denominada quantificação. Por exemplo, uma maneira ingênua de determinar qual a proporção de postagens positivas sobre um determinado protuto no Facebook sem ter resenhas rotuladas é (i) treinar um classificador baseado em resenhas do Google Shopping para prever se um usuário gosta de um produto qualquer, e então (ii) aplicar esse classificador às postagens do Facebook relacionados ao produtos de interesse. Infelizmente, é sabido que essa técnica de dois passos, denominada classificar e contar, falha por não levar em conta a mudança de domínio. Assim, várias melhorias vêm sendo feitas recentemente sob uma suposição denominada prior shift. Entretanto, estes métodos exploram a relação entre as covariáveis apenas via classificadores e nenhum deles aproveitam o fato de que, em algumas situações, podemos rotular algumas amostras do conjunto de dados de interesse. Além disso, a literatura carece de abordagens que possam lidar com uma população-alvo que varia com outra covariável; por exemplo: Como estimar precisamente como a proporção de novas postagens ou páginas web a favor de um candidato político varia com o tempo? Nós propomos novos métodos que preenchem essas lacunas importantes e os comparamos utilizando conjuntos de dados reais e similados. Finalmente, nós fornecemos uma análise teórica dos métodos propostos.
  • Imprenta:
  • Data da defesa: 17.05.2018
  • Acesso à fonte
    How to cite
    A citação é gerada automaticamente e pode não estar totalmente de acordo com as normas

    • ABNT

      VAZ, Afonso Fernandes. Improved quantification under dataset shift. 2018. Dissertação (Mestrado) – Universidade de São Paulo, São Carlos, 2018. Disponível em: http://www.teses.usp.br/teses/disponiveis/104/104131/tde-08082019-101051/. Acesso em: 08 jan. 2026.
    • APA

      Vaz, A. F. (2018). Improved quantification under dataset shift (Dissertação (Mestrado). Universidade de São Paulo, São Carlos. Recuperado de http://www.teses.usp.br/teses/disponiveis/104/104131/tde-08082019-101051/
    • NLM

      Vaz AF. Improved quantification under dataset shift [Internet]. 2018 ;[citado 2026 jan. 08 ] Available from: http://www.teses.usp.br/teses/disponiveis/104/104131/tde-08082019-101051/
    • Vancouver

      Vaz AF. Improved quantification under dataset shift [Internet]. 2018 ;[citado 2026 jan. 08 ] Available from: http://www.teses.usp.br/teses/disponiveis/104/104131/tde-08082019-101051/

    Últimas obras dos mesmos autores vinculados com a USP cadastradas na BDPI:

    Digital Library of Intellectual Production of Universidade de São Paulo     2012 - 2026