Hierarchical classification on batch and streaming data with applications to entomology (2022)
- Authors:
- Autor USP: PARMEZAN, ANTONIO RAFAEL SABINO - ICMC
- Unidade: ICMC
- Sigla do Departamento: SCC
- DOI: 10.11606/T.55.2022.tde-03102022-171351
- Subjects: APRENDIZADO COMPUTACIONAL; HETEROGENEIDADE; MINERAÇÃO DE DADOS; CONTROLE DE INSETOS
- Keywords: Aprendizado em lote; Batch learning; Classificação hierárquica; Concept drift; Data stream; Fluxo de dados; Hierarchical classification; Machine learning; Mudança de conceito
- Agências de fomento:
- Language: Inglês
- Abstract: Os algoritmos de aprendizado de máquina supervisionado tradicionais conduzem a classificação de dados de maneira plana, ou seja, buscam associar cada exemplo a uma classe pertencente a um conjunto finito, desprovido de dependências estruturais e normalmente pequeno, de classes. No entanto, existem problemas mais desafiadores nos quais as classes podem ser divididas ou agrupadas em subclasses ou superclasses, respectivamente. Essa dependência estrutural entre classes demanda a aplicação de métodos preparados para lidar com a classificação hierárquica. Um algoritmo para classificação hierárquica considera as informações estruturais embutidas na hierarquia de classes e as usa para decompor o espaço de atributos do problema original em subproblemas com menos classes. Tal decomposição reduz a complexidade da função de classificação enquanto aprimora o desempenho preditivo. Esta tese avança o estado da arte ao propor novos algoritmos para classificação hierárquica considerando dois paradigmas de aprendizado: (i) lote, onde o aprendizado ocorre offline a partir de uma amostra de exemplos de tamanho fixo (idealmente) proveniente de uma distribuição de probabilidade estacionária. Cada observação dentro da amostra é independente e identicamente distribuída; e (ii) fluxo contínuo, em que o aprendizado é realizado online a partir de uma sequência ordenada de exemplos usualmente ilimitada que é disponibilizada, em várias taxas de atualização e sem intervenção humana, por sistemas oudispositivos. Devido à natureza não-estacionária do ambiente no qual estão inseridas, as características que compõem os exemplos de um fluxo contínuo podem variar no decorrer do tempo. Nesse contexto, as principais contribuições desta tese incluem: (i) o estudo mais extenso e abrangente já feito para entender o impacto das condições climáticas-ambientais nas frequências de batimento de asas de abelhas e vespas. Do ponto de vista prático, o trabalho constrói componentes-base para a classificação (hierárquica) (online) de insetos voadores; (ii) um método que combina abordagens locais para obter de forma rápida e eficiente um modelo de decisão hierárquica que representa fielmente o cenário de identificação de gêneros musicais. A abordagem também é validada em dados de himenópteros; (iii) um processo de referência que utiliza sensores ópticos e classificadores hierárquicos para identificar insetos voadores polinizadores em condições naturais de campo. Os resultados obtidos forneceram respostas à dez questões de pesquisa; (iv) o primeiro algoritmo para classificação hierárquica de fluxos de dados. Ele baseia-se em vizinhos mais próximos e funciona de maneira incremental; (v) um framework e (vi) uma coleção de métodos para rotulagem hierárquica de dados.em fluxo contínuo.
- Imprenta:
- Publisher place: São Carlos
- Date published: 2022
- Data da defesa: 25.02.2022
- Este periódico é de acesso aberto
- Este artigo é de acesso aberto
- URL de acesso aberto
- Cor do Acesso Aberto: gold
- Licença: cc-by-nc-sa
-
ABNT
PARMEZAN, Antonio Rafael Sabino. Hierarchical classification on batch and streaming data with applications to entomology. 2022. Tese (Doutorado) – Universidade de São Paulo, São Carlos, 2022. Disponível em: https://www.teses.usp.br/teses/disponiveis/55/55134/tde-03102022-171351/. Acesso em: 30 dez. 2025. -
APA
Parmezan, A. R. S. (2022). Hierarchical classification on batch and streaming data with applications to entomology (Tese (Doutorado). Universidade de São Paulo, São Carlos. Recuperado de https://www.teses.usp.br/teses/disponiveis/55/55134/tde-03102022-171351/ -
NLM
Parmezan ARS. Hierarchical classification on batch and streaming data with applications to entomology [Internet]. 2022 ;[citado 2025 dez. 30 ] Available from: https://www.teses.usp.br/teses/disponiveis/55/55134/tde-03102022-171351/ -
Vancouver
Parmezan ARS. Hierarchical classification on batch and streaming data with applications to entomology [Internet]. 2022 ;[citado 2025 dez. 30 ] Available from: https://www.teses.usp.br/teses/disponiveis/55/55134/tde-03102022-171351/ - Predição de séries temporais por similaridade
- Automatic recommendation of feature selection algorithms based on dataset characteristics
- Hierarchical classification of pollinating flying insects under changing environments
- Fine-tuning pre-trained neural networks for medical image classification in small clinical datasets
- Time series prediction via similarity search: exploring invariances, distance measures and ensemble functions
- A video indexing and retrieval computational prototype based on transcribed speech
- Changes in the wing-beat frequency of bees and wasps depending on environmental conditions: a study with optical sensors
- Efficient unsupervised drift detector for fast and high-dimensional data streams
- A graph-based spatial cross-validation approach for assessing models learned with selected features to understand election results
- Geographic context-based stacking learning for election prediction from socio-economic data
Informações sobre o DOI: 10.11606/T.55.2022.tde-03102022-171351 (Fonte: oaDOI API)
How to cite
A citação é gerada automaticamente e pode não estar totalmente de acordo com as normas