Análise do número de grupos em bases de dados incompletas utilizando agrupamentos nebulosos e reamostragem bootstrap (2008)
- Authors:
- Autor USP: MILAGRE, SELMA TEREZINHA - EESC
- Unidade: EESC
- Sigla do Departamento: SEL
- Subjects: FUZZY (INTELIGÊNCIA ARTIFICIAL); REAMOSTRAGEM BOOTSTRAP
- Language: Português
- Abstract: A técnica de agrupamento de dados é amplamente utilizada em análise exploratória, a qual é freqüentemente necessária em diversas áreas de pesquisa tais como medicina, biologia e estatística, para avaliar potenciais hipóteses a serem utilizadas em estudos subseqüentes. Em bases de dados reais, a ocorrência de dados incompletos, nos quais os valores de um ou mais atributos do dado são desconhecidos, é bastante comum. Este trabalho apresenta um método capaz de identificar o número de grupos presentes em bases de dados incompletas, utilizando a combinação das técnicas de agrupamentos nebulosos e reamostragem bootstrap. A qualidade da classificação é baseada em medidas de comparação tradicionais como F1, classificação cruzada, Hubert e outras. Os estudos foram feitos em oito bases de dados. As quatro primeiras são bases de dados artificiais, a quinta e a sexta são a wine e iris. A sétima e oitava bases são formadas por uma coleção brasileira de 119 estirpes de Bradyrhizobium. Para avaliar toda informação sem introduzir estimativas, fez-se a modificação do algoritmo Fuzzy C-Means (FCM) utilizando-se um vetor de índices de atributos, os quais indicam onde o valot de um atributo é observado ou não, modificando-se então, os cálculos do centro e distância ao centro. As simulações foram feitas de 2 até 8 grupos utilizando-se 100 sub-amostras. Os percentuais de valores faltando utilizados foram 2%, 5%, 10%, 20% e 30%. Os resultados deste trabalho demonstraram que nossométodo é capaz de identificar partições relevantes, até em presença de altos índices de dados incompletos, sem a necessidade de se fazer nenhuma suposição sobre a base de dados. As medidas Hubert e índice randômico ajustado encontraram os melhores resultados experimentais
- Imprenta:
- Publisher place: São Carlos
- Date published: 2008
- Data da defesa: 18.07.2008
-
ABNT
MILAGRE, Selma Terezinha. Análise do número de grupos em bases de dados incompletas utilizando agrupamentos nebulosos e reamostragem bootstrap. 2008. Tese (Doutorado) – Universidade de São Paulo, São Carlos, 2008. Disponível em: http://www.teses.usp.br/teses/disponiveis/18/18153/tde-04032009-150315/. Acesso em: 11 fev. 2026. -
APA
Milagre, S. T. (2008). Análise do número de grupos em bases de dados incompletas utilizando agrupamentos nebulosos e reamostragem bootstrap (Tese (Doutorado). Universidade de São Paulo, São Carlos. Recuperado de http://www.teses.usp.br/teses/disponiveis/18/18153/tde-04032009-150315/ -
NLM
Milagre ST. Análise do número de grupos em bases de dados incompletas utilizando agrupamentos nebulosos e reamostragem bootstrap [Internet]. 2008 ;[citado 2026 fev. 11 ] Available from: http://www.teses.usp.br/teses/disponiveis/18/18153/tde-04032009-150315/ -
Vancouver
Milagre ST. Análise do número de grupos em bases de dados incompletas utilizando agrupamentos nebulosos e reamostragem bootstrap [Internet]. 2008 ;[citado 2026 fev. 11 ] Available from: http://www.teses.usp.br/teses/disponiveis/18/18153/tde-04032009-150315/
How to cite
A citação é gerada automaticamente e pode não estar totalmente de acordo com as normas
