Exportar registro bibliográfico


Metrics:

Contributions to the mixed data clustering problem: from a conceptual codification and classification proposal to the usage of optimization methods (2021)

  • Authors:
  • Autor USP: FRÓES, NÁDIA JUNQUEIRA MARTARELLI - EESC
  • Unidade: EESC
  • Sigla do Departamento: SEP
  • DOI: 10.11606/T.18.2021.tde-16112021-121737
  • Subjects: REVISÃO SISTEMÁTICA; LITERATURA; ALGORITMOS NUMÉRICOS
  • Keywords: Agrupamento de dados mistos; Balanceamento de atributos; Ponderação de atributos; Representação padrão
  • Agências de fomento:
  • Language: Inglês
  • Abstract: As técnicas de mineração de dados têm ganhado destaque nos últimos anos devido sua ampla gama de aplicações. Dentre tais técnicas, está o agrupamento de dados, o qual identifica grupos em conjuntos de dados não rotulados. Diante da necessidade de descrever as características do fenômeno estudado com mais detalhes por meio do uso de atributos numéricos e categóricos, o desenvolvimento da técnica de agrupamento de dados passou a contemplar o estudo do agrupamento de dados mistos. Embora promissor, este novo ramo de estudo ainda é recente na literatura. Dessa forma, esta tese visa contribuir com o avanço da técnica de agrupamento de dados mistos, por meio de quatro objetivos, que são: propor uma representação padrão para documentos publicados no campo de descoberta do conhecimento, realizar uma revisão sistemática da literatura que forneça uma visão abrangente desta temática e também detalhada dos documentos selecionados; realizar a modelagem da meta-heurística Biased Random-Key Genetic Algorithm (BRKGA) para propor uma solução para o problema do balanceamento de atributos em algoritmos de agrupamento de dados mistos baseados em distância; e realizar a modelagem e hibridização das meta-heurísticas: Evolutionary Clustering Search, Iterated Local Search e BRKGA, para propor uma solução para o problema de ponderação de atributos em um algoritmo de agrupamento de dados mistos baseado em modelo. Como resultados, obteve-se uma proposta de ideia inicial para a representação padrão euma revisão sistemática da literatura com uma análise bibliométrica e individual de 160 documentos resultantes da seleção feita para o estudo. Além disso, as meta-heurísticas propostas obtiveram os melhores desempenhos na maioria dos 476 conjuntos de dados simulados, os quais contemplaram diversas características, como dados gerados por meio de distribuição normal e lognormal, balanceamento e desbalanceamento de atributos numéricos e categóricos com relação a quantidade de cada tipo de atributo no conjunto de dados, sobreposição de atributos em diferentes níveis, entre outras. Portanto, conclui-se que esta tese alcançou seus objetivos, contribuindo para o avanço da técnica de agrupamento de dados mistos
  • Imprenta:
  • Data da defesa: 16.07.2021
  • Acesso à fonteAcesso à fonteDOI
    Informações sobre o DOI: 10.11606/T.18.2021.tde-16112021-121737 (Fonte: oaDOI API)
    • Este periódico é de acesso aberto
    • Este artigo é de acesso aberto
    • URL de acesso aberto
    • Cor do Acesso Aberto: gold
    • Licença: cc-by-nc-sa

    How to cite
    A citação é gerada automaticamente e pode não estar totalmente de acordo com as normas

    • ABNT

      FRÓES, Nádia Junqueira Martarelli. Contributions to the mixed data clustering problem: from a conceptual codification and classification proposal to the usage of optimization methods. 2021. Tese (Doutorado) – Universidade de São Paulo, São Carlos, 2021. Disponível em: https://www.teses.usp.br/teses/disponiveis/18/18156/tde-16112021-121737/. Acesso em: 12 nov. 2024.
    • APA

      Fróes, N. J. M. (2021). Contributions to the mixed data clustering problem: from a conceptual codification and classification proposal to the usage of optimization methods (Tese (Doutorado). Universidade de São Paulo, São Carlos. Recuperado de https://www.teses.usp.br/teses/disponiveis/18/18156/tde-16112021-121737/
    • NLM

      Fróes NJM. Contributions to the mixed data clustering problem: from a conceptual codification and classification proposal to the usage of optimization methods [Internet]. 2021 ;[citado 2024 nov. 12 ] Available from: https://www.teses.usp.br/teses/disponiveis/18/18156/tde-16112021-121737/
    • Vancouver

      Fróes NJM. Contributions to the mixed data clustering problem: from a conceptual codification and classification proposal to the usage of optimization methods [Internet]. 2021 ;[citado 2024 nov. 12 ] Available from: https://www.teses.usp.br/teses/disponiveis/18/18156/tde-16112021-121737/


Digital Library of Intellectual Production of Universidade de São Paulo     2012 - 2024