Contributions to the mixed data clustering problem: from a conceptual codification and classification proposal to the usage of optimization methods (2021)
- Authors:
- Autor USP: FRÓES, NÁDIA JUNQUEIRA MARTARELLI - EESC
- Unidade: EESC
- Sigla do Departamento: SEP
- DOI: 10.11606/T.18.2021.tde-16112021-121737
- Subjects: REVISÃO SISTEMÁTICA; LITERATURA; ALGORITMOS NUMÉRICOS
- Keywords: Agrupamento de dados mistos; Balanceamento de atributos; Ponderação de atributos; Representação padrão
- Agências de fomento:
- Language: Inglês
- Abstract: As técnicas de mineração de dados têm ganhado destaque nos últimos anos devido sua ampla gama de aplicações. Dentre tais técnicas, está o agrupamento de dados, o qual identifica grupos em conjuntos de dados não rotulados. Diante da necessidade de descrever as características do fenômeno estudado com mais detalhes por meio do uso de atributos numéricos e categóricos, o desenvolvimento da técnica de agrupamento de dados passou a contemplar o estudo do agrupamento de dados mistos. Embora promissor, este novo ramo de estudo ainda é recente na literatura. Dessa forma, esta tese visa contribuir com o avanço da técnica de agrupamento de dados mistos, por meio de quatro objetivos, que são: propor uma representação padrão para documentos publicados no campo de descoberta do conhecimento, realizar uma revisão sistemática da literatura que forneça uma visão abrangente desta temática e também detalhada dos documentos selecionados; realizar a modelagem da meta-heurística Biased Random-Key Genetic Algorithm (BRKGA) para propor uma solução para o problema do balanceamento de atributos em algoritmos de agrupamento de dados mistos baseados em distância; e realizar a modelagem e hibridização das meta-heurísticas: Evolutionary Clustering Search, Iterated Local Search e BRKGA, para propor uma solução para o problema de ponderação de atributos em um algoritmo de agrupamento de dados mistos baseado em modelo. Como resultados, obteve-se uma proposta de ideia inicial para a representação padrão euma revisão sistemática da literatura com uma análise bibliométrica e individual de 160 documentos resultantes da seleção feita para o estudo. Além disso, as meta-heurísticas propostas obtiveram os melhores desempenhos na maioria dos 476 conjuntos de dados simulados, os quais contemplaram diversas características, como dados gerados por meio de distribuição normal e lognormal, balanceamento e desbalanceamento de atributos numéricos e categóricos com relação a quantidade de cada tipo de atributo no conjunto de dados, sobreposição de atributos em diferentes níveis, entre outras. Portanto, conclui-se que esta tese alcançou seus objetivos, contribuindo para o avanço da técnica de agrupamento de dados mistos
- Imprenta:
- Publisher place: São Carlos
- Date published: 2021
- Data da defesa: 16.07.2021
- Este periódico é de acesso aberto
- Este artigo é de acesso aberto
- URL de acesso aberto
- Cor do Acesso Aberto: gold
- Licença: cc-by-nc-sa
-
ABNT
FRÓES, Nádia Junqueira Martarelli. Contributions to the mixed data clustering problem: from a conceptual codification and classification proposal to the usage of optimization methods. 2021. Tese (Doutorado) – Universidade de São Paulo, São Carlos, 2021. Disponível em: https://www.teses.usp.br/teses/disponiveis/18/18156/tde-16112021-121737/. Acesso em: 12 nov. 2024. -
APA
Fróes, N. J. M. (2021). Contributions to the mixed data clustering problem: from a conceptual codification and classification proposal to the usage of optimization methods (Tese (Doutorado). Universidade de São Paulo, São Carlos. Recuperado de https://www.teses.usp.br/teses/disponiveis/18/18156/tde-16112021-121737/ -
NLM
Fróes NJM. Contributions to the mixed data clustering problem: from a conceptual codification and classification proposal to the usage of optimization methods [Internet]. 2021 ;[citado 2024 nov. 12 ] Available from: https://www.teses.usp.br/teses/disponiveis/18/18156/tde-16112021-121737/ -
Vancouver
Fróes NJM. Contributions to the mixed data clustering problem: from a conceptual codification and classification proposal to the usage of optimization methods [Internet]. 2021 ;[citado 2024 nov. 12 ] Available from: https://www.teses.usp.br/teses/disponiveis/18/18156/tde-16112021-121737/ - Seleção de atributos em agrupamento de dados utilizando algoritmos evolutivos
- High-performing heuristics to minimize flowtime in no-idle permutation flowshop
- Uma abordagem construtiva do algoritmo genético para a seleção de atributos no agrupamento de dados
- How have high-impact scientific studies designing their experiments on mixed data clustering? A systematic map to guide better choices
- Socioeconomic class Of brazilian cities for health, education and employment & income IFDM: a clustering data analysis
Informações sobre o DOI: 10.11606/T.18.2021.tde-16112021-121737 (Fonte: oaDOI API)
How to cite
A citação é gerada automaticamente e pode não estar totalmente de acordo com as normas