Improved quantification under dataset shift (2018)
- Authors:
- Autor USP: VAZ, AFONSO FERNANDES - Interinstitucional de Pós-Graduação em Estatística
- Unidade: Interinstitucional de Pós-Graduação em Estatística
- Sigla do Departamento: SME
- Subjects: APRENDIZADO COMPUTACIONAL; ESTATÍSTICA; ESTATÍSTICA E PROBABILIDADE
- Keywords: Aprendizado de máquina; Data set shift; Machine learning; Mudança de domínio; Prior shift; Quantificação; Quantification
- Agências de fomento:
- Language: Inglês
- Abstract: Muitas aplicações de aprendizado de máquina usam classificadores para determinar a prevalência da classe positiva em um conjunto de dados de interesse, uma tarefa denominada quantificação. Por exemplo, uma maneira ingênua de determinar qual a proporção de postagens positivas sobre um determinado protuto no Facebook sem ter resenhas rotuladas é (i) treinar um classificador baseado em resenhas do Google Shopping para prever se um usuário gosta de um produto qualquer, e então (ii) aplicar esse classificador às postagens do Facebook relacionados ao produtos de interesse. Infelizmente, é sabido que essa técnica de dois passos, denominada classificar e contar, falha por não levar em conta a mudança de domínio. Assim, várias melhorias vêm sendo feitas recentemente sob uma suposição denominada prior shift. Entretanto, estes métodos exploram a relação entre as covariáveis apenas via classificadores e nenhum deles aproveitam o fato de que, em algumas situações, podemos rotular algumas amostras do conjunto de dados de interesse. Além disso, a literatura carece de abordagens que possam lidar com uma população-alvo que varia com outra covariável; por exemplo: Como estimar precisamente como a proporção de novas postagens ou páginas web a favor de um candidato político varia com o tempo? Nós propomos novos métodos que preenchem essas lacunas importantes e os comparamos utilizando conjuntos de dados reais e similados. Finalmente, nós fornecemos uma análise teórica dos métodos propostos.
- Imprenta:
- Publisher place: São Carlos
- Date published: 2018
- Data da defesa: 17.05.2018
-
ABNT
VAZ, Afonso Fernandes. Improved quantification under dataset shift. 2018. Dissertação (Mestrado) – Universidade de São Paulo, São Carlos, 2018. Disponível em: http://www.teses.usp.br/teses/disponiveis/104/104131/tde-08082019-101051/. Acesso em: 08 jan. 2026. -
APA
Vaz, A. F. (2018). Improved quantification under dataset shift (Dissertação (Mestrado). Universidade de São Paulo, São Carlos. Recuperado de http://www.teses.usp.br/teses/disponiveis/104/104131/tde-08082019-101051/ -
NLM
Vaz AF. Improved quantification under dataset shift [Internet]. 2018 ;[citado 2026 jan. 08 ] Available from: http://www.teses.usp.br/teses/disponiveis/104/104131/tde-08082019-101051/ -
Vancouver
Vaz AF. Improved quantification under dataset shift [Internet]. 2018 ;[citado 2026 jan. 08 ] Available from: http://www.teses.usp.br/teses/disponiveis/104/104131/tde-08082019-101051/
How to cite
A citação é gerada automaticamente e pode não estar totalmente de acordo com as normas