Modelos Lomax assimétricos: uma nova abordagem para a classificação de dados binários desbalanceados (2023)
- Authors:
- Autor USP: REIS, LETICIA FERREIRA MURÇA - INTER:ICMC-UFSCAR
- Unidade: INTER:ICMC-UFSCAR
- Sigla do Departamento: SME
- DOI: 10.11606/D.104.2023.tde-28082023-201136
- Subjects: APRENDIZADO COMPUTACIONAL; INFERÊNCIA ESTATÍSTICA; INFERÊNCIA BAYESIANA; SOFTWARE ESTATÍSTICO PARA MICROCOMPUTADORES; DISTRIBUIÇÕES (PROBABILIDADE)
- Keywords: Asymmetric links; Bayesian estimation; Binary regression; Dados desbalanceados; Distribuição Lomax; Estimação Bayesiana; Imbalanced data; Links assimétricos; Lomax distribution; Regressão binária
- Agências de fomento:
- Language: Português
- Abstract: A expressão dados binários desbalanceados refere-se a um conjunto de dados em que uma das classes apresenta significativamente menos observações do que a outra. Isso prejudica a performance tanto de algoritmos de aprendizado de máquina como de modelos estatísticos, visto que a maioria dessas ferramentas supõe que os dados apresentam a mesma proporção de observações nas duas categorias. Para lidar com esse desafio, vários autores sugerem o uso de funções de ligação assimétricas na regressão binária, em detrimento das conhecidas funções de ligação simétricas: logit e probit. Assim, é possível não só melhorar a performance preditiva do modelo, como também reduzir o viés na estimação de parâmetros e de probabilidades. Portanto, este trabalho tem como objetivo apresentar novas funções de ligação assimétricas geradas a partir de transformações da distribuição Lomax. As funções propostas possuem assimetria comprovada e podem ser facilmente implementadas em softwares estatísticos. Além disso, o estudo de simulações aponta que as funções de ligação propostas neste trabalho podem performar melhor que o link logístico em diversos cenários de desbalanceamento. O uso dessas funções também se mostrou promissor na modelagem de dados reais, visto que neste trabalho obteve melhores métricas que as funções de ligação clássicas em duas aplicações.
- Imprenta:
- Publisher place: São Carlos
- Date published: 2023
- Data da defesa: 17.05.2023
- Este periódico é de acesso aberto
- Este artigo é de acesso aberto
- URL de acesso aberto
- Cor do Acesso Aberto: gold
- Licença: cc-by-nc-sa
-
ABNT
REIS, Leticia Ferreira Murça. Modelos Lomax assimétricos: uma nova abordagem para a classificação de dados binários desbalanceados. 2023. Dissertação (Mestrado) – Universidade de São Paulo, São Carlos, 2023. Disponível em: https://www.teses.usp.br/teses/disponiveis/104/104131/tde-28082023-201136/. Acesso em: 10 nov. 2024. -
APA
Reis, L. F. M. (2023). Modelos Lomax assimétricos: uma nova abordagem para a classificação de dados binários desbalanceados (Dissertação (Mestrado). Universidade de São Paulo, São Carlos. Recuperado de https://www.teses.usp.br/teses/disponiveis/104/104131/tde-28082023-201136/ -
NLM
Reis LFM. Modelos Lomax assimétricos: uma nova abordagem para a classificação de dados binários desbalanceados [Internet]. 2023 ;[citado 2024 nov. 10 ] Available from: https://www.teses.usp.br/teses/disponiveis/104/104131/tde-28082023-201136/ -
Vancouver
Reis LFM. Modelos Lomax assimétricos: uma nova abordagem para a classificação de dados binários desbalanceados [Internet]. 2023 ;[citado 2024 nov. 10 ] Available from: https://www.teses.usp.br/teses/disponiveis/104/104131/tde-28082023-201136/
Informações sobre o DOI: 10.11606/D.104.2023.tde-28082023-201136 (Fonte: oaDOI API)
How to cite
A citação é gerada automaticamente e pode não estar totalmente de acordo com as normas