Método otimizado para predição da relevância de variáveis e redução de dimensionalidade pautado pela abordagem de seleção Wrapper (2024)
- Authors:
- Autor USP: ANDRADE, CÁSSIO ANTONIO - ICMC
- Unidade: ICMC
- Sigla do Departamento: SME
- DOI: 10.11606/D.55.2024.tde-15012025-113931
- Subjects: SOFTWARES; PROCESSAMENTO DE DADOS; MINERAÇÃO DE DADOS; APRENDIZADO COMPUTACIONAL; INTELIGÊNCIA ARTIFICIAL
- Keywords: Dimensionality reduction; Feature selection; Predição de relevância; Redução de dimensionalidade; Relevance prediction; Seleção de variáveis; Wrapper
- Language: Português
- Abstract: Mesmo com os avanços em Big Data Analytics e Deep Learning, problemas clássicos de préprocessamento de dados na Estatística e no Aprendizado de Máquina, especialmente os oriundos de conjuntos de dados pequenos, continuam proeminentes. A seleção de variáveis é uma etapa crucial para derivar modelos preditivos robustos e eficientes. Remover previamente variáveis redundantes, irrelevantes e ruidosas melhora a capacidade de generalização dos modelos e reduz o tempo de treinamento e implementação em ambiente de produção. Um conjunto menor de variáveis também facilita a explicabilidade dos modelos, promovendo a chamada inteligência artificial explicável e minimizando os recursos humanos, tecnológicos e/ou econômicos envolvidos na coleta de dados. Entre as abordagens clássicas de seleção de variáveis, a Wrapper é frequentemente a mais eficiente no desempenho de generalização para um modelo destino, mas é também a mais custosa computacionalmente. Estudos recentes têm visado métodos alternativos com melhores desempenhos preditivos e viabilidade computacional para seleção por Wrappers. No entanto, eles geralmente estão focados em meta-heurísticas mais eficientes, pré-filtragem ou uma combinação de ambas. Este trabalho propõe um novo método, uma abordagem inédita ao problema de seleção que visa prever as variáveis relevantes de anotações resultantes da seleção pela abordagem Wrapper para um modelo de regressão logística. Em vez de utilizar meta-heurísticas dispendiosas, são empregadosdescritores do conjunto de dados e de suas variáveis para treinamento de um modelo de predição de relevância. O modelo preditivo de relevâncias alcançou, em média, 64% de acurácia e 78% de sensibilidade, com uma redução de 30% na dimensionalidade média calculada para os 54 conjuntos de dados utilizados. Comparado com a própria abordagem Wrapper, o desempenho da regressão logística com as variáveis selecionadas pelo método proposto foi similar para 80% dos conjuntos avaliados. Em dois outros conjuntos altamente restritivos à execução da seleção por Wrapper (busca exaustiva), o método proposto reduziu substancialmente a dimensionalidade (33,33% e 56,25%), sem perdas nas acurácias médias. Os resultados indicam que o método proposto é promissor para seleção de variáveis relevantes e redução de dimensionalidade, com baixo custo computacional e sem perdas significativas no desempenho preditivo.
- Imprenta:
- Publisher place: São Carlos
- Date published: 2024
- Data da defesa: 23.10.2024
- Este periódico é de acesso aberto
- Este artigo é de acesso aberto
- URL de acesso aberto
- Cor do Acesso Aberto: gold
- Licença: cc-by-nc-sa
-
ABNT
ANDRADE, Cássio Antonio. Método otimizado para predição da relevância de variáveis e redução de dimensionalidade pautado pela abordagem de seleção Wrapper. 2024. Dissertação (Mestrado) – Universidade de São Paulo, São Carlos, 2024. Disponível em: https://www.teses.usp.br/teses/disponiveis/55/55137/tde-15012025-113931/. Acesso em: 27 dez. 2025. -
APA
Andrade, C. A. (2024). Método otimizado para predição da relevância de variáveis e redução de dimensionalidade pautado pela abordagem de seleção Wrapper (Dissertação (Mestrado). Universidade de São Paulo, São Carlos. Recuperado de https://www.teses.usp.br/teses/disponiveis/55/55137/tde-15012025-113931/ -
NLM
Andrade CA. Método otimizado para predição da relevância de variáveis e redução de dimensionalidade pautado pela abordagem de seleção Wrapper [Internet]. 2024 ;[citado 2025 dez. 27 ] Available from: https://www.teses.usp.br/teses/disponiveis/55/55137/tde-15012025-113931/ -
Vancouver
Andrade CA. Método otimizado para predição da relevância de variáveis e redução de dimensionalidade pautado pela abordagem de seleção Wrapper [Internet]. 2024 ;[citado 2025 dez. 27 ] Available from: https://www.teses.usp.br/teses/disponiveis/55/55137/tde-15012025-113931/ - Abordagem baseada na seleção Wrapper para identificação da relevância de variáveis e redução de dimensionalidade
- Inteligência artificial e ciência de dados para o desenvolvimento da agricultura inteligente
- Técnicas de visualização da informação aplicadas à produção de petróleo no Brasil
- Modelo de previsão da qualidade do petróleo produzido no Brasil
Informações sobre o DOI: 10.11606/D.55.2024.tde-15012025-113931 (Fonte: oaDOI API)
How to cite
A citação é gerada automaticamente e pode não estar totalmente de acordo com as normas
