Covariate shift adaptation and dataset shift decomposition in machine learning (2021)
- Authors:
- Autor USP: POLO, FELIPE MAIA - IME
- Unidade: IME
- Sigla do Departamento: MAE
- DOI: 10.11606/D.45.2021.tde-03022022-234955
- Assunto: APRENDIZADO COMPUTACIONAL
- Keywords: Adaptação de dominio; Concept drift; Covariate shift; Dataset shift; Dataset shift decomposition; Decomposição do dataset shift; Dimensionalidade; Dimensionality; Domain adaptation; Effective sample size; Machine searning
- Agências de fomento:
- Language: Inglês
- Abstract: No aprendizado supervisionado, muitas vezes temos acesso a uma amostra limitada, em tamanho ou qualidade (e.g., falta de rotulos), de dados da populacao/distribuicao de interesse, para a qual queremos criar modelos preditivos. No entanto, e possivel que tenhamos acesso pouco limitado a dados amostrados de outra populacao, mais ou menos parecida com a de interesse. Treinar modelos utilizando somente dados da populacao de interesse pode ser impossivel ou resultar em modelos sub-otimos, entao seria interessante utilizar os dados provenientes da outra populacao a fim de obter melhores resultados ou tornar o treinamento possivel. Nessas situacoes, como as distribuicoes de interesse e aquela que podemos amostrar com poucas restricoes sao diferentes, dizemos que ha dataset shift. Em situacoes de dataset shift, empregar tecnicas de adaptacao de dominio ao treinar modelos supervisionados e essencial para garantias teoricas de bons resultados na populacao de interesse. Os dois tipos de dataset shift que discutiremos neste trabalho sao covariate shift e concept drift/shift. Os objetivos principais deste trabalho sao: (i) revisar principais conceitos e metodos relacionados ao covariate shift e covariate shift adaptation; (ii) propor contribuicoes para a literatura de covariate shift adaptation, conectando conceitos presentes em discussoes atuais; (iii) propor a decomposicao do dataset Shift em covariate shift e concept drift/shift esperado como uma nova abordagem para melhorentendimento de situacoes em que lidamos com dataset shift
- Imprenta:
- Data da defesa: 15.10.2021
- Status:
- Artigo publicado em periódico de acesso aberto (Gold Open Access)
- Versão do Documento:
- Versão publicada (Published version)
- Acessar versão aberta:
-
ABNT
POLO, Felipe Maia. Covariate shift adaptation and dataset shift decomposition in machine learning. 2021. Dissertação (Mestrado) – Universidade de São Paulo, São Paulo, 2021. Disponível em: https://teses.usp.br/teses/disponiveis/45/45133/tde-03022022-234955/. Acesso em: 23 mar. 2026. -
APA
Polo, F. M. (2021). Covariate shift adaptation and dataset shift decomposition in machine learning (Dissertação (Mestrado). Universidade de São Paulo, São Paulo. Recuperado de https://teses.usp.br/teses/disponiveis/45/45133/tde-03022022-234955/ -
NLM
Polo FM. Covariate shift adaptation and dataset shift decomposition in machine learning [Internet]. 2021 ;[citado 2026 mar. 23 ] Available from: https://teses.usp.br/teses/disponiveis/45/45133/tde-03022022-234955/ -
Vancouver
Polo FM. Covariate shift adaptation and dataset shift decomposition in machine learning [Internet]. 2021 ;[citado 2026 mar. 23 ] Available from: https://teses.usp.br/teses/disponiveis/45/45133/tde-03022022-234955/
Informações sobre a disponibilidade de versões do artigo em acesso aberto coletadas automaticamente via oaDOI API (Unpaywall).
Por se tratar de integração com serviço externo, podem existir diferentes versões do trabalho (como preprints ou postprints), que podem diferir da versão publicada.
How to cite
A citação é gerada automaticamente e pode não estar totalmente de acordo com as normas
