Exportar registro bibliográfico

Robust outlier labeling rules for light-tailed and heavy-tailed Data (2019)

  • Authors:
  • Autor USP: SILVA, KELLY CRISTINA RAMOS DA - ICMC
  • Unidade: ICMC
  • Sigla do Departamento: SCC
  • Subjects: VALORES ATÍPICOS; AVALIAÇÃO DE DESEMPENHO
  • Keywords: Assimetria ou peso da cauda; Erro de rotulação; Evaluation measure; Medida de avaliação; Métodos robustos; Outlier rules; Outside rate; Regras robustas; Robust methods; Skewness or tail heaviness
  • Agências de fomento:
  • Language: Inglês
  • Abstract: As regras de outlier são usadas para detectar outlier em dados univariados. Uma regra de outlier comumente usada é baseada em uma ferramenta gráfica para análise univariada de dados, denominada boxplot. No entanto, é bem conhecido que o boxplot apresenta um desempenho significativamente inferior para distribuições assimétricas, em comparação com o caso simétrico. Para superar essa deficiência, uma regra de outlier conhecida como boxplot ajustado foi proposta na literatura. O boxplot ajustado é uma modificação do boxplot clássico, incorporando nele uma medida de assimetria. Embora o boxplot ajustado tenha resultado em uma versão melhorada, se comparada ao boxplot clássico, ele tem a desvantagem de ser uma regra não flexível o suficiente para permitir a pré-especificação de um erro nominal de rotulação. Além disso, o boxplot ajustado pode apresentar, para algumas situações, um custo computacional significativamente maior se comparado ao boxplot clássico, já que a sua complexidade computacional é O(nlogn), enquanto o boxplot clássico é O(n): A fim de abordar essas questões, esta tese propõe uma abordagem mais formal para deduzir regras de outlier que produzim regras que exibem um desempenho geral melhor do que o do boxplot ajustado, especialmente à medida que o nível de contaminação aumenta. Além disso, essas regras propostas têm as vantagens de serem mais flexíveis e possuírem menor custo computacional do que o boxplot ajustado. Além disso, é mostrado que o boxplot clássico emuitas de suas modificações ou variações são unificadas pelo mesmo conceito introduzido por esta tese: contraste de quartis. O problema com as regras de outlier baseadas em contraste de quartis, bem como o boxplot ajustado, reside no fato de que elas são mais adequadas para dados unimodais simétricos e assimétricos do que para dados com cauda pesada. Para dados de cauda pesada, foi proposto na literatura uma regra de outlier conhecida como boxplot generalizado. O principal problema com o boxplot generalizado está no fato de ele ser muito instável, já que um único outlier pode afetar drasticamente seu desempenho. Para resolver esse problema, a tese usa a abordagem contraste de quartis para deduzir uma regra de outlier sensível ao peso da cauda. As análises experimentais mostram que a regra de outlier sensível ao peso da cauda proposta pela tese realmente apresenta um desempenho mais estável do que o boxplot generalizado. A avaliação de desempenho de regras de outlier é um problema por si só. Portanto, para medir o desempenho de regras outlier, a tese apresenta a GME, uma medida que se mostrou mais eficaz para avaliar o desempenho de regras de outlier do que as medidas tradicionais envolvendo apenas taxa de falsos positivos e taxa de falsos negativos.
  • Imprenta:
  • Data da defesa: 01.02.2019
  • Acesso à fonte
    How to cite
    A citação é gerada automaticamente e pode não estar totalmente de acordo com as normas

    • ABNT

      SILVA, Kelly Cristina Ramos da. Robust outlier labeling rules for light-tailed and heavy-tailed Data. 2019. Tese (Doutorado) – Universidade de São Paulo, São Carlos, 2019. Disponível em: http://www.teses.usp.br/teses/disponiveis/55/55134/tde-29042019-145141/. Acesso em: 07 out. 2024.
    • APA

      Silva, K. C. R. da. (2019). Robust outlier labeling rules for light-tailed and heavy-tailed Data (Tese (Doutorado). Universidade de São Paulo, São Carlos. Recuperado de http://www.teses.usp.br/teses/disponiveis/55/55134/tde-29042019-145141/
    • NLM

      Silva KCR da. Robust outlier labeling rules for light-tailed and heavy-tailed Data [Internet]. 2019 ;[citado 2024 out. 07 ] Available from: http://www.teses.usp.br/teses/disponiveis/55/55134/tde-29042019-145141/
    • Vancouver

      Silva KCR da. Robust outlier labeling rules for light-tailed and heavy-tailed Data [Internet]. 2019 ;[citado 2024 out. 07 ] Available from: http://www.teses.usp.br/teses/disponiveis/55/55134/tde-29042019-145141/


Digital Library of Intellectual Production of Universidade de São Paulo     2012 - 2024