Random Forest interpretability - explaining classification models and multivariate data through logic rules visualizations (2021)
- Authors:
- Autor USP: POPOLIN NETO, MÁRIO - ICMC
- Unidade: ICMC
- Sigla do Departamento: SCC
- DOI: 10.11606/T.55.2021.tde-03032022-105725
- Subjects: VISÃO COMPUTACIONAL; MINERAÇÃO DE DADOS; APRENDIZADO COMPUTACIONAL; TEORIA DA DECISÃO
- Keywords: Classification Models Interpretability and Models and Multivariate Data Explanations; Intepretailidade de modelos de classificação e Explicações de modelos e de dados multivariados; Logic Rules Visualization; Random Forest; Random forest; Visualização de regras lógicas
- Language: Inglês
- Abstract: Modelos de classificação possuem imenso potencial e futuro ubíquo, considerando o vasto número de tarefas preditivas em diferentes domínios onde estes modelos são aplicáveis. A interpretabilidade dos modelos pode ser tão importante quanto a performance, fornecendo explicações globais e locais para interpretar os conhecimentos adquiridos e auditar decisões. Além da capacidade preditiva, modelos de classificação podem ser aplicados como ferramentas descritivas, onde intepretabilidade envolve explicações de dados. Regras lógicas vêm sendo amplamente utilizadas em soluções para interpretabilidade e Decision Trees são reconhecidas pela geração de regras lógicas consistentes. A abordagem Random Forest conjunto de Decision Trees tem sido amplamente adotada devido a sua habilidade em produzir resultados precisos e manipular conjuntos de dados multivariados. Entretanto, a intepretabilidade de modelos Random Forest enfrenta o desafio de gerir um número considerável de regras. Baseado na visualização de regras lógicas em uma metáfora visual em formato de matriz, esta tese de doutorado resulta em métodos de Visual Analytics para a intepretabilidade de modelos Random Forest, suportando explicações de modelos e de dados cobrindo propósitos preditivos e descritivos. Para explicações de modelos (preditivo), ExMatrix dispõe regras lógicas a formar representações visuais globais e locais, fornecendo visões gerais e análises de decisões. Explicações globais podem revelar o conhecimentoaprendido pelo modelo a partir de um conjunto de dados rotulados, enquanto explicações locais focam na classificação de uma instância de dados em particular. Para explicações de dados (descritivo), VAX processa regras lógicas resultando na visualização de regras descritivas para insights automáticos dos dados. Explicações de dados permitem a identificação e a interpretação visual de padrões em conjuntos de dados multivariados. Qualquer problema representado por um conjunto de dados rotulados é um potencial caso de uso para os métodos propostos. O método ExMatrix foi aplicado em química analítica e o método VAX empregado em conjuntos de dados reais para análises de dados multivariados. A principal contribuição desta tese de doutorado reside em métodos de Visual Analytics suportando a interpretabilidade de Random Forest para propósitos preditivos e descritivos em explicações de modelo e de dados.
- Imprenta:
- Publisher place: São Carlos
- Date published: 2021
- Data da defesa: 15.12.2021
- Este periódico é de acesso aberto
- Este artigo é de acesso aberto
- URL de acesso aberto
- Cor do Acesso Aberto: gold
- Licença: cc-by-nc-sa
-
ABNT
POPOLIN NETO, Mário. Random Forest interpretability - explaining classification models and multivariate data through logic rules visualizations. 2021. Tese (Doutorado) – Universidade de São Paulo, São Carlos, 2021. Disponível em: https://www.teses.usp.br/teses/disponiveis/55/55134/tde-03032022-105725/. Acesso em: 08 maio 2025. -
APA
Popolin Neto, M. (2021). Random Forest interpretability - explaining classification models and multivariate data through logic rules visualizations (Tese (Doutorado). Universidade de São Paulo, São Carlos. Recuperado de https://www.teses.usp.br/teses/disponiveis/55/55134/tde-03032022-105725/ -
NLM
Popolin Neto M. Random Forest interpretability - explaining classification models and multivariate data through logic rules visualizations [Internet]. 2021 ;[citado 2025 maio 08 ] Available from: https://www.teses.usp.br/teses/disponiveis/55/55134/tde-03032022-105725/ -
Vancouver
Popolin Neto M. Random Forest interpretability - explaining classification models and multivariate data through logic rules visualizations [Internet]. 2021 ;[citado 2025 maio 08 ] Available from: https://www.teses.usp.br/teses/disponiveis/55/55134/tde-03032022-105725/ - Random forest similarity maps: a scalable visual representation for global and local interpretation
- Explainable matrix: visualization for global and local interpretability of random forest classification ensembles
- Investigating band gap directness using machine learning
- Multidimensional calibration spaces in Staphylococcus Aureus detection using chitosan-based genosensors and electronic tongue
- Explainable machine learning to unveil detection mechanisms with au nanoisland-based surface-enhanced raman scattering for SARS-CoV-2 antigen detection
- Learning from machine learning: the case of band-gap directness in semiconductors
- Machine learning used to create a multidimensional calibration space for sensing and biosensing data
- Direct detection of SARS-CoV-2 antigen based on surface-enhanced Raman scattering (SERS) using machine learning
- Detection of Staphylococcus aureus in milk samples using impedance spectroscopy and data processing with information visualization techniques and multidimensional calibration space
- Microfluidic E-tongue to diagnose bovine mastitis with milk samples using machine learning with decision tree models
Informações sobre o DOI: 10.11606/T.55.2021.tde-03032022-105725 (Fonte: oaDOI API)
How to cite
A citação é gerada automaticamente e pode não estar totalmente de acordo com as normas