Métodos preditivos computacionalmente eficientes baseados em floresta aleatória (2024)
- Authors:
- Autor USP: SANTOS, TIAGO MENDONÇA DOS - IME
- Unidade: IME
- Sigla do Departamento: MAE
- DOI: 10.11606/T.45.2024.tde-01052024-164427
- Subjects: APRENDIZADO COMPUTACIONAL; REGRESSÃO LINEAR; TEORIA DA DECISÃO
- Keywords: Aprendizado de máquina; Floresta aleatória; Machine learning; Non-parametric regression; Quantile regression; Random forest; Regressão nãoparamétrica; Regressão quantílica
- Language: Português
- Abstract: Nas últimas duas ou três décadas, testemunhamos uma revolução nos modelos preditivos, sendo dois fatores críticos nesse cenário: o desempenho computacional e o desempenho preditivo. O desempenho computacional refere-se à velocidade com que um modelo é ajustado numa base de dados e faz previsões para novas observações, enquanto o desempenho preditivo refere-se à precisão de tais previsões. Nesta tese, apresento dois estimadores para esperança condicional e regressão quantílica. Esses estimadores, denominados DiNo (Dissimilarity with Nodes) e RanBu (Random Bushes), são inspirados nas técnicas de vizinhos mais próximos e métodos de kernel de suavização. O estimador DiNo utiliza uma nova medida de dissimilaridade baseada nas distâncias entre os nós das Árvores de uma Floresta Aleatória. Já o estimador RanBu considera a proporção de Árvores da Floresta Aleatória em que as observações pertençam ao mesmo nó terminal. A avaliação desses métodos é conduzida em três cenários de dados simulados. Os resultados indicam que o estimador RanBu supera a Floresta Aleatória padrão em desempenho computacional e preditivo em todos os cenários com variáveis de ruído, tanto para esperança condicional quanto para regressão quantílica. Já o estimador DiNo, na presença de ruído, apresenta melhor desempenho preditivo que a Floresta Aleatória padrão na maioria dos cenários. Além da análise em dados simulados, estendo a avaliação para 25 conjuntos de dados encontrados na literatura de modelospreditivos. Os resultados destacam a competitividade dos métodos propostos em relação a abordagens tradicionais, como Boosting e a Floresta Aleatória padrão. Os dois métodos propostos incorporam um hiperparâmetro h que regula o peso de cada observação na previsão. Embora a escolha padrão de h seja razoavelmente boa, há espaço para melhorias, especialmente através do ajuste fino adaptado a cada conjunto de dados. Um ponto notável é o desempenho computacional excepcional do método RanBu, que, em alguns casos, demanda menos de 5% do tempo necessário para a execução da Floresta Aleatória. Em cenários de esperança condicional e regressão quantílica, o estimador RanBu demonstra uma eficiência computacional crescente em relação à Floresta Aleatória conforme o tamanho do conjunto de treinamento aumenta. Este fenômeno destaca o potencial do estimador RanBu em lidar eficientemente com grandes conjuntos de dados, uma característica valiosa em aplicações práticas
- Imprenta:
- Data da defesa: 07.03.2024
- Este periódico é de acesso aberto
- Este artigo NÃO é de acesso aberto
-
ABNT
SANTOS, Tiago Mendonça dos. Métodos preditivos computacionalmente eficientes baseados em floresta aleatória. 2024. Tese (Doutorado) – Universidade de São Paulo, São Paulo, 2024. Disponível em: https://www.teses.usp.br/teses/disponiveis/45/45133/tde-01052024-164427/. Acesso em: 10 out. 2024. -
APA
Santos, T. M. dos. (2024). Métodos preditivos computacionalmente eficientes baseados em floresta aleatória (Tese (Doutorado). Universidade de São Paulo, São Paulo. Recuperado de https://www.teses.usp.br/teses/disponiveis/45/45133/tde-01052024-164427/ -
NLM
Santos TM dos. Métodos preditivos computacionalmente eficientes baseados em floresta aleatória [Internet]. 2024 ;[citado 2024 out. 10 ] Available from: https://www.teses.usp.br/teses/disponiveis/45/45133/tde-01052024-164427/ -
Vancouver
Santos TM dos. Métodos preditivos computacionalmente eficientes baseados em floresta aleatória [Internet]. 2024 ;[citado 2024 out. 10 ] Available from: https://www.teses.usp.br/teses/disponiveis/45/45133/tde-01052024-164427/ - Avaliação do desempenho de modelos preditivos no contexto de análise de sobrevivência
- Relatório de análise estatística sobre o projeto " análise dos resultados obtidos com o uso de espectrofotômetro digital intraoral, de duas porcelanas dentais sob diferentes tratamentos superficiais"
- Relatório de análise estatística sobre o projeto "análise do perfil dos funcionários da USP encaminhados para o serviço de fisioterapia do HU com diagnóstico de DORT"
Informações sobre o DOI: 10.11606/T.45.2024.tde-01052024-164427 (Fonte: oaDOI API)
How to cite
A citação é gerada automaticamente e pode não estar totalmente de acordo com as normas