Exportar registro bibliográfico


Metrics:

Métodos preditivos computacionalmente eficientes baseados em floresta aleatória (2024)

  • Authors:
  • Autor USP: SANTOS, TIAGO MENDONÇA DOS - IME
  • Unidade: IME
  • Sigla do Departamento: MAE
  • DOI: 10.11606/T.45.2024.tde-01052024-164427
  • Subjects: APRENDIZADO COMPUTACIONAL; REGRESSÃO LINEAR; TEORIA DA DECISÃO
  • Keywords: Aprendizado de máquina; Floresta aleatória; Machine learning; Non-parametric regression; Quantile regression; Random forest; Regressão nãoparamétrica; Regressão quantílica
  • Language: Português
  • Abstract: Nas últimas duas ou três décadas, testemunhamos uma revolução nos modelos preditivos, sendo dois fatores críticos nesse cenário: o desempenho computacional e o desempenho preditivo. O desempenho computacional refere-se à velocidade com que um modelo é ajustado numa base de dados e faz previsões para novas observações, enquanto o desempenho preditivo refere-se à precisão de tais previsões. Nesta tese, apresento dois estimadores para esperança condicional e regressão quantílica. Esses estimadores, denominados DiNo (Dissimilarity with Nodes) e RanBu (Random Bushes), são inspirados nas técnicas de vizinhos mais próximos e métodos de kernel de suavização. O estimador DiNo utiliza uma nova medida de dissimilaridade baseada nas distâncias entre os nós das Árvores de uma Floresta Aleatória. Já o estimador RanBu considera a proporção de Árvores da Floresta Aleatória em que as observações pertençam ao mesmo nó terminal. A avaliação desses métodos é conduzida em três cenários de dados simulados. Os resultados indicam que o estimador RanBu supera a Floresta Aleatória padrão em desempenho computacional e preditivo em todos os cenários com variáveis de ruído, tanto para esperança condicional quanto para regressão quantílica. Já o estimador DiNo, na presença de ruído, apresenta melhor desempenho preditivo que a Floresta Aleatória padrão na maioria dos cenários. Além da análise em dados simulados, estendo a avaliação para 25 conjuntos de dados encontrados na literatura de modelospreditivos. Os resultados destacam a competitividade dos métodos propostos em relação a abordagens tradicionais, como Boosting e a Floresta Aleatória padrão. Os dois métodos propostos incorporam um hiperparâmetro h que regula o peso de cada observação na previsão. Embora a escolha padrão de h seja razoavelmente boa, há espaço para melhorias, especialmente através do ajuste fino adaptado a cada conjunto de dados. Um ponto notável é o desempenho computacional excepcional do método RanBu, que, em alguns casos, demanda menos de 5% do tempo necessário para a execução da Floresta Aleatória. Em cenários de esperança condicional e regressão quantílica, o estimador RanBu demonstra uma eficiência computacional crescente em relação à Floresta Aleatória conforme o tamanho do conjunto de treinamento aumenta. Este fenômeno destaca o potencial do estimador RanBu em lidar eficientemente com grandes conjuntos de dados, uma característica valiosa em aplicações práticas
  • Imprenta:
  • Data da defesa: 07.03.2024
  • Acesso à fonteAcesso à fonteDOI
    Informações sobre o DOI: 10.11606/T.45.2024.tde-01052024-164427 (Fonte: oaDOI API)
    • Este periódico é de acesso aberto
    • Este artigo NÃO é de acesso aberto

    How to cite
    A citação é gerada automaticamente e pode não estar totalmente de acordo com as normas

    • ABNT

      SANTOS, Tiago Mendonça dos. Métodos preditivos computacionalmente eficientes baseados em floresta aleatória. 2024. Tese (Doutorado) – Universidade de São Paulo, São Paulo, 2024. Disponível em: https://www.teses.usp.br/teses/disponiveis/45/45133/tde-01052024-164427/. Acesso em: 10 out. 2024.
    • APA

      Santos, T. M. dos. (2024). Métodos preditivos computacionalmente eficientes baseados em floresta aleatória (Tese (Doutorado). Universidade de São Paulo, São Paulo. Recuperado de https://www.teses.usp.br/teses/disponiveis/45/45133/tde-01052024-164427/
    • NLM

      Santos TM dos. Métodos preditivos computacionalmente eficientes baseados em floresta aleatória [Internet]. 2024 ;[citado 2024 out. 10 ] Available from: https://www.teses.usp.br/teses/disponiveis/45/45133/tde-01052024-164427/
    • Vancouver

      Santos TM dos. Métodos preditivos computacionalmente eficientes baseados em floresta aleatória [Internet]. 2024 ;[citado 2024 out. 10 ] Available from: https://www.teses.usp.br/teses/disponiveis/45/45133/tde-01052024-164427/


Digital Library of Intellectual Production of Universidade de São Paulo     2012 - 2024