Imbalance-Robust Multi-Label Self-Adjusting kNN for data stream classification (2023)
- Authors:
- Autor USP: NICOLA, VICTOR GOMES DE OLIVEIRA MARTINS - EACH
- Unidade: EACH
- DOI: 10.11606/D.100.2023.tde-08022024-083949
- Subjects: APRENDIZADO COMPUTACIONAL; INTELIGÊNCIA ARTIFICIAL
- Keywords: Aprendizado multirrótulo; Class Imbalance; Classificação em fluxo de dados; Data Stream Classification; Desbalanceamento de classes; kNN; Multi-label Learning
- Language: Inglês
- Abstract: Na tarefa de classificação multirrótulo em fluxo de dados, instâncias que chegam em tempo real precisam ser associadas a múltiplos rótulos simultaneamente. Diversos métodos baseados no algoritmo de k vizinhos mais próximos foram propostos para resolver essa tarefa. No entanto, tais métodos enfrentam limitações quando lidam com fluxos de dados desbalanceados, um problema que tem recebido atenção limitada nos trabalhos existentes. Para abordar essa lacuna, o presente trabalho introduz o Imbalance-Robust Multi-Label Self-Adjusting kNN (IRMLSAkNN), projetado para lidar com o desbalanceamento de classes em fluxos de dados multirrotulados. O IRMLSAkNN é baseado no MLSAkNN e incorpora um ponto de corte dinâmico baseado na Taxa de Desbalanceamento Médio por Instância para seu mecanismo de punição e aplica a Média Geométrica como medida de avaliação para o mecanismo de autoajuste da janela. Essas adaptações significativamente melhoram a robustez do algoritmo para lidar com fluxos de dados desbalanceados. Foram conduzidos experimentos com 32 fluxos de dados para avaliar o desempenho do IRMLSAkNN contra quatro algoritmos baseados em k vizinhos mais próximos, considerados estado-da-arte para classificação multirrótulo em fluxos de dados usando medidas baseadas em acurácia e sensíveis ao desbalanceamento.Os resultados obtidos demonstram que o IRMLSAkNN supera seus competidores em diferentes níveis de desbalanceamento. Adicionalmente, o IRMLSAkNN se destaca por sua eficiência de tempo, tornando-o uma solução competitiva para a tarefa de classificação multirrótulo em fluxo de dados
- Imprenta:
- Data da defesa: 13.12.2023
- Este periódico é de acesso aberto
- Este artigo NÃO é de acesso aberto
-
ABNT
NICOLA, Victor Gomes de Oliveira Martins. Imbalance-Robust Multi-Label Self-Adjusting kNN for data stream classification. 2023. Dissertação (Mestrado) – Universidade de São Paulo, São Paulo, 2023. Disponível em: https://www.teses.usp.br/teses/disponiveis/100/100131/tde-08022024-083949/. Acesso em: 26 jan. 2026. -
APA
Nicola, V. G. de O. M. (2023). Imbalance-Robust Multi-Label Self-Adjusting kNN for data stream classification (Dissertação (Mestrado). Universidade de São Paulo, São Paulo. Recuperado de https://www.teses.usp.br/teses/disponiveis/100/100131/tde-08022024-083949/ -
NLM
Nicola VG de OM. Imbalance-Robust Multi-Label Self-Adjusting kNN for data stream classification [Internet]. 2023 ;[citado 2026 jan. 26 ] Available from: https://www.teses.usp.br/teses/disponiveis/100/100131/tde-08022024-083949/ -
Vancouver
Nicola VG de OM. Imbalance-Robust Multi-Label Self-Adjusting kNN for data stream classification [Internet]. 2023 ;[citado 2026 jan. 26 ] Available from: https://www.teses.usp.br/teses/disponiveis/100/100131/tde-08022024-083949/
Informações sobre o DOI: 10.11606/D.100.2023.tde-08022024-083949 (Fonte: oaDOI API)
How to cite
A citação é gerada automaticamente e pode não estar totalmente de acordo com as normas
