Exportar registro bibliográfico

Classificação de fluxo de dados não estacionários com aplicação em sensores identificadores de insetos (2016)

  • Authors:
  • Autor USP: SOUZA, VINICIUS MOURÃO ALVES DE - ICMC
  • Unidade: ICMC
  • Sigla do Departamento: SCC
  • Subjects: APRENDIZADO COMPUTACIONAL; MINERAÇÃO DE DADOS; SENSORES ÓPTICOS
  • Keywords: Automatic insect identification; Classificação; Classification; Data streams; Fluxo de dados; Latência; Latency; Optical sensor; Sensor óptico; Fluxo de dados
  • Language: Português
  • Abstract: Diversas aplicações são responsáveis por gerar dados ao longo do tempo de maneira contínua, ordenada e ininterrupta em um ambiente dinâmico, denominados fluxo de dados. Entre possíveis tarefas que podem ser realizadas com estes dados, classificação é uma das mais proeminentes. Devido à natureza não estacionária do ambiente responsável por gerar os dados, as características que descrevem os conceitos das classes do problema de classificação podem se alterar ao longo do tempo. Por isso, classificadores de fluxo de dados requerem constantes atualizações em seus modelos para que a taxa de acerto se mantenha estável ao longo do tempo. Na etapa de atualização a maior parte das abordagens considera que, após a predição de cada exemplo, o seu rótulo correto é imediatamente disponibilizado sem qualquer atraso de tempo (latência nula). Devido aos altos custos do processo de rotulação, os rótulos corretos nem sempre podem ser obtidos para a maior parte dos dados ou são obtidos após um considerável atraso de tempo. No caso mais desafiador, encontram-se as aplicações em que após a etapa de classificação dos exemplos, os seus respectivos rótulos corretos nunca são disponibilizados para o algoritmo, caso chamado de latência extrema. Neste cenário, não é possível o uso de abordagens tradicionais, sendo necessário o desenvolvimento de novos métodos que sejam capazes de manter um modelo de classificação atualizado mesmo na ausência de dados rotulados. Nesta tese, além de discutir o problema delatência na tarefa de classificação de fluxo de dados não estacionários, negligenciado por boa parte da literatura, também são propostos dois algoritmos denominados SCARGC e MClassification para o cenário de latência extrema. Ambas as propostas se baseiam no uso de técnicas de agrupamento para a adaptação à  mudanças de maneira não supervisionada. Os algoritmos propostos são intuitivos, simples e apresentam resultados superiores ou equivalentes a outros algoritmos da literatura em avaliações com dados sintéticos e reais, tanto em termos de acurácia de classificação como em tempo computacional. Aléem de buscar o avanço no estado-da-arte na área de aprendizado em fluxo de dados, este trabalho também apresenta contribuições para uma importante aplicação tecnológica com impacto social e na saúde pública. Especificamente, explorou-se um sensor óptico para a identificação automática de espécies de insetos a partir da análise de informações provenientes do batimento de asas dos insetos. Para a descrição dos dados, foi verificado que os coeficientes Mel-cepstrais apresentaram os melhores resultados entre as diferentes técnicas de processamento digital de sinais avaliadas. Este sensor é um exemplo concreto de aplicação responsável por gerar um fluxo de dados em que é necessário realizar classificações em tempo real. Durante a etapa de classificação, este sensor exige a adaptação a possíveis variações em condições ambientais, responsáveis por alterar o comportamento dos insetos aosignificativas nas condições ambientais, foi possível obter uma acurácia de classificação próxima de 90%, no cenário com múltiplas classes e, cerca de 95% para a identificação da espécie Aedes aegypti, considerando o treinamento com uma única classe. No cenário com mudanças significativas nos dados, foi possível obter 91% de acurácia em um problema com 5 classes e 96% para a classificação de insetos vetores de importantes doenças como dengue e zika vírus.
  • Imprenta:
  • Data da defesa: 23.05.2016
  • Acesso à fonte
    How to cite
    A citação é gerada automaticamente e pode não estar totalmente de acordo com as normas

    • ABNT

      SOUZA, Vinicius Mourão Alves de; BATISTA, Gustavo Enrique de Almeida Prado Alves; GAMA, João Manuel Portela da. Classificação de fluxo de dados não estacionários com aplicação em sensores identificadores de insetos. 2016.Universidade de São Paulo, São Carlos, 2016. Disponível em: < http://www.teses.usp.br/teses/disponiveis/55/55134/tde-13122016-113648/ >.
    • APA

      Souza, V. M. A. de, Batista, G. E. de A. P. A., & Gama, J. M. P. da. (2016). Classificação de fluxo de dados não estacionários com aplicação em sensores identificadores de insetos. Universidade de São Paulo, São Carlos. Recuperado de http://www.teses.usp.br/teses/disponiveis/55/55134/tde-13122016-113648/
    • NLM

      Souza VMA de, Batista GE de APA, Gama JMP da. Classificação de fluxo de dados não estacionários com aplicação em sensores identificadores de insetos [Internet]. 2016 ;Available from: http://www.teses.usp.br/teses/disponiveis/55/55134/tde-13122016-113648/
    • Vancouver

      Souza VMA de, Batista GE de APA, Gama JMP da. Classificação de fluxo de dados não estacionários com aplicação em sensores identificadores de insetos [Internet]. 2016 ;Available from: http://www.teses.usp.br/teses/disponiveis/55/55134/tde-13122016-113648/

    Últimas obras dos mesmos autores vinculados com a USP cadastradas na BDPI:

Digital Library of Intellectual Production of Universidade de São Paulo     2012 - 2021