Técnicas para o problema de dados desbalanceados em classificação hierárquica (2015)
- Authors:
- Autor USP: BARELLA, VICTOR HUGO - ICMC
- Unidade: ICMC
- Sigla do Departamento: SCC
- Subjects: APRENDIZADO COMPUTACIONAL; MINERAÇÃO DE DADOS; ANÁLISE DE DADOS
- Keywords: Aprendizado supervisionado; Classificação hierárquica; Dados desbalanceados; Data imbalance; Desbalanceamento de dados; Hierarchical classification; Imbalanced data; Supervised learning
- Language: Português
- Abstract: Os recentes avanços da ciência e tecnologia viabilizaram o crescimento de dados em quantidade e disponibilidade. Junto com essa explosão de informações geradas, surge a necessidade de analisar dados para descobrir conhecimento novo e útil. Desse modo, áreas que visam extrair conhecimento e informações úteis de grandes conjuntos de dados se tornaram grandes oportunidades para o avanço de pesquisas, tal como o Aprendizado de Máquina (AM) e a Mineração de Dados (MD). Porém, existem algumas limitações que podem prejudicar a acurácia de alguns algoritmos tradicionais dessas áreas, por exemplo o desbalanceamento das amostras das classes de um conjunto de dados. Para mitigar tal problema, algumas alternativas têm sido alvos de pesquisas nos últimos anos, tal como o desenvolvimento de técnicas para o balanceamento artificial de dados, a modificação dos algoritmos e propostas de abordagens para dados desbalanceados. Uma área pouco explorada sob a visão do desbalanceamento de dados são os problemas de classificação hierárquica, em que as classes são organizadas em hierarquias, normalmente na forma de àrvore ou DAG (Direct Acyclic Graph). O objetivo deste trabalho foi investigar as limitações e maneiras de minimizar os efeitos de dados desbalanceados em problemas de classificação hierárquica. Os experimentos realizados mostram que é necessário levar em consideração as características das classes hierárquicas para a aplicação (ou não) de técnicas para tratar problemas dadosdesbalanceados em classificação hierárquica
- Imprenta:
- Publisher place: São Carlos
- Date published: 2015
- Data da defesa: 24.07.2015
-
ABNT
BARELLA, Victor Hugo. Técnicas para o problema de dados desbalanceados em classificação hierárquica. 2015. Dissertação (Mestrado) – Universidade de São Paulo, São Carlos, 2015. Disponível em: http://www.teses.usp.br/teses/disponiveis/55/55134/tde-06012016-145045/. Acesso em: 19 nov. 2024. -
APA
Barella, V. H. (2015). Técnicas para o problema de dados desbalanceados em classificação hierárquica (Dissertação (Mestrado). Universidade de São Paulo, São Carlos. Recuperado de http://www.teses.usp.br/teses/disponiveis/55/55134/tde-06012016-145045/ -
NLM
Barella VH. Técnicas para o problema de dados desbalanceados em classificação hierárquica [Internet]. 2015 ;[citado 2024 nov. 19 ] Available from: http://www.teses.usp.br/teses/disponiveis/55/55134/tde-06012016-145045/ -
Vancouver
Barella VH. Técnicas para o problema de dados desbalanceados em classificação hierárquica [Internet]. 2015 ;[citado 2024 nov. 19 ] Available from: http://www.teses.usp.br/teses/disponiveis/55/55134/tde-06012016-145045/ - Imbalanced classification tasks: measuring data complexity and recommending techniques
- The influence of sampling on imbalanced data classification
- Simulating complexity measures on imbalanced datasets
- Assessing the data complexity of imbalanced datasets
- A visual methodology to assess spatial graph vertex ordering algorithms
- CityHub: a library for urban data integration
How to cite
A citação é gerada automaticamente e pode não estar totalmente de acordo com as normas