Exportar registro bibliográfico

Visual analytics for machine learning - computing and leveraging decision boundary maps (2020)

  • Authors:
  • Autor USP: RODRIGUES, FRANCISCO CAIO MAIA - IME
  • Unidade: IME
  • Sigla do Departamento: MAC
  • Assunto: APRENDIZADO COMPUTACIONAL
  • Keywords: Aprendizado de máquina; Dimensionality reduction; Machine learning; Redução de dimensionalidade; Visual analytics; Visualização de dados
  • Agências de fomento:
  • Language: Inglês
  • Abstract: Modelos de aprendizado de máquina chamados classificadores constroem fronteiras de decisão que particionam um certo espaço de dados em um conjunto de regiões, associando-as a um rótulo. Entender a estrutura e forma de tais fronteiras de decisão pode ser de grande ajuda no uso prático de tais classificadores, respondendo, por exemplo, questões sobre como espera-se que certo modelo se comporte em uma região vazia do espaço. Além disso, tal entendimento pode ajudar a dar ideias que levem a melhoria do treino de um certo modelo, por exemplo através da indicação de \\emph mais dados de treino poderiam ser coletados. Nessa tese, propomos e exploramos métodos de visualização para a criação e o uso de modelos visuais das fronteiras de decisão inferidas por classificaores de aprendizado de máquina. Atualmente, métodos utilizados para visualizar o comportamento de um classificador treinado em um certo conjunto de dados fazem uso scatterplot, colorindo os pontos de acordo com a classe atribuida pelo modelo. Nesta tese, propomos uma técnica baseada em imagens para aprimorar tais visualizações. Nosso método amostra o espaço 2D de uma projeção, codificando nas cores dos pixels aspectos relevantes de um classificador treinado, como a maioria dos rótulos naquela região, o grau de confusão e a densidade de amostras, criando uma imagem densa das fronteiras inferidas em espaços de alta dimensão. O método proposto é simples de implementar, funciona para qualquer classificador e possui apenasdois parâmetros intuitivos. Demonstramos o uso da técnica proposta em diferentes datasets de alta dimensionalidade, classificadores, projeções diretas e inversas. No nosso conhecimento, nosso trabalho é o primeiro capaz de criar tais visualizações explícitas das fronteiras de classificadores, para qualquer dataset e classificador, sem necessidade do conhecimento do funcionamento de detalhes internos dos modelos. Baseado nas descrições visuais das fronteiras de decisão, nós desenvolvemos um workflow de visual analytics e uma ferramenta gráfica que permite aos usuários realizarem a rotulagem interativa de amostras. Mostramos ainda que o nosso método proposto de visualização é capaz de ajudar em cenários de rotulação, como é o caso de aprendizado ativo
  • Imprenta:
  • Data da defesa: 09.11.2020
  • Acesso à fonte
    How to cite
    A citação é gerada automaticamente e pode não estar totalmente de acordo com as normas

    • ABNT

      RODRIGUES, Francisco Caio Maia. Visual analytics for machine learning - computing and leveraging decision boundary maps. 2020. Tese (Doutorado) – Universidade de São Paulo, São Paulo, 2020. Disponível em: https://www.teses.usp.br/teses/disponiveis/45/45134/tde-27112020-071803/. Acesso em: 26 abr. 2024.
    • APA

      Rodrigues, F. C. M. (2020). Visual analytics for machine learning - computing and leveraging decision boundary maps (Tese (Doutorado). Universidade de São Paulo, São Paulo. Recuperado de https://www.teses.usp.br/teses/disponiveis/45/45134/tde-27112020-071803/
    • NLM

      Rodrigues FCM. Visual analytics for machine learning - computing and leveraging decision boundary maps [Internet]. 2020 ;[citado 2024 abr. 26 ] Available from: https://www.teses.usp.br/teses/disponiveis/45/45134/tde-27112020-071803/
    • Vancouver

      Rodrigues FCM. Visual analytics for machine learning - computing and leveraging decision boundary maps [Internet]. 2020 ;[citado 2024 abr. 26 ] Available from: https://www.teses.usp.br/teses/disponiveis/45/45134/tde-27112020-071803/


Digital Library of Intellectual Production of Universidade de São Paulo     2012 - 2024