Non-stationary and unpredictable data distributions in classification and quantification (2020)
- Authors:
- Autor USP: REIS, DENIS MOREIRA DOS - ICMC
- Unidade: ICMC
- Sigla do Departamento: SCC
- DOI: 10.11606/T.55.2020.tde-27072020-174834
- Subjects: ANÁLISE DE DADOS; APRENDIZADO COMPUTACIONAL; PROCESSAMENTO DE DADOS
- Keywords: Aprendizado com dados positivos e não- rotulados; Classificação; Classification; Concept drift; Dados não estacionários; Mudança de conceito; Nonstationary data; Positive and unlabeled learning; Quantificação; Quantification
- Agências de fomento:
- Language: Inglês
- Abstract: Nos últimos anos, é crescente a preocupação da academia com dados não estacionários. Por um lado, diferenças entre as distribuições dos dados disponíveis em laboratório, para treino e avaliação, e dos dados encontrados posteriormente, após implantação dos modelos para uso prático na aplicação, levam ao decréscimo de performance em diversas tarefas, como classificação. Por outro, em outras tarefas, como quantificação, há o interesse explícito em mensurar como a distribuição dos dados se altera ao longo do tempo. Em quaisquer casos, porém, é comum a existência de premissas que tornam as soluções disponíveis ao mesmo tempo possíveis em seus campos de estudo, e impráticas para aplicações reais. Esta tese de doutorado propõe soluções com premissas menos restritivas e/ou mais realistas, que possibilitem seu emprego em aplicações reais. Na área de detecção de mudança de conceito, são introduzidas técnicas de detecção não supervisionada que possibilitam classificação e quantificação sem a necessidade de requisitar rótulos verdadeiros após implantação do modelo. Em quantificação, é iniciada uma nova sub-área de pesquisa, one-class quantification. De forma similar à one-class classification, em one-class quantification não é assumida uma distribuição particular para a classe negativa, sendo considerada, portanto, imprevisível. Os resultados obtidos pela avaliação experimental empregada são promissores e demonstram a viabilidade de alternativas mais focadas em solucionar os problemasexistentes em aplicações do mundo real.
- Imprenta:
- Publisher place: São Carlos
- Date published: 2020
- Data da defesa: 08.04.2020
- Status:
- Artigo publicado em periódico de acesso aberto (Gold Open Access)
- Versão do Documento:
- Versão publicada (Published version)
- Acessar versão aberta:
-
ABNT
REIS, Denis Moreira dos. Non-stationary and unpredictable data distributions in classification and quantification. 2020. Tese (Doutorado) – Universidade de São Paulo, São Carlos, 2020. Disponível em: https://www.teses.usp.br/teses/disponiveis/55/55134/tde-27072020-174834/. Acesso em: 16 abr. 2026. -
APA
Reis, D. M. dos. (2020). Non-stationary and unpredictable data distributions in classification and quantification (Tese (Doutorado). Universidade de São Paulo, São Carlos. Recuperado de https://www.teses.usp.br/teses/disponiveis/55/55134/tde-27072020-174834/ -
NLM
Reis DM dos. Non-stationary and unpredictable data distributions in classification and quantification [Internet]. 2020 ;[citado 2026 abr. 16 ] Available from: https://www.teses.usp.br/teses/disponiveis/55/55134/tde-27072020-174834/ -
Vancouver
Reis DM dos. Non-stationary and unpredictable data distributions in classification and quantification [Internet]. 2020 ;[citado 2026 abr. 16 ] Available from: https://www.teses.usp.br/teses/disponiveis/55/55134/tde-27072020-174834/
Informações sobre a disponibilidade de versões do artigo em acesso aberto coletadas automaticamente via oaDOI API (Unpaywall).
Por se tratar de integração com serviço externo, podem existir diferentes versões do trabalho (como preprints ou postprints), que podem diferir da versão publicada.
How to cite
A citação é gerada automaticamente e pode não estar totalmente de acordo com as normas
