Text Representation through Multimodal Variational Autoencoder for One-Class Learning (2022)
- Authors:
- Autor USP: GÔLO, MARCOS PAULO SILVA - ICMC
- Unidade: ICMC
- Sigla do Departamento: SCC
- DOI: 10.11606/D.55.2022.tde-23052022-150550
- Subjects: APRENDIZADO COMPUTACIONAL; INTELIGÊNCIA ARTIFICIAL; MINERAÇÃO DE DADOS; ANÁLISE DE TEXTO
- Keywords: Classificação de textos; Multimodal variational autoencoder; One class learning; Text classification; Variational autoencoders multimodais
- Agências de fomento:
- Language: Inglês
- Abstract: A classificação automática de textos tem se tornado cada vez mais relevante tanto para fins aca- dêmicos quanto empresariais. Tradicionalmente, essa classificação é realizada pelo aprendizado de máquina multi-classe, o qual necessita de rotulação prévia dos textos de todas as classes do problema. Essa abordagem pode falhar quando não se tem um conhecimento bem definido das classes do problema, além de exigir um grande esforço na rotulação de exemplos de treinamento para cada classe. Uma abordagem conhecida como One-Class Learning (OCL) pode sanar essas limitações, uma vez que seu treinamento é realizado somente com exemplos rotulados de uma classe de interesse, diminuindo assim o esforço de rotulação do usuário e tornando a classificação mais apropriada para aplicações envolvendo domínio aberto. O OCL é mais desafi- ador devido à falta de contra-exemplos para o treinamento do modelo. Portanto, OCL requer representações textuais mais robustas. Por outro lado, a maioria dos estudos usa representações unimodais, mesmo que diferentes domínios contenham outros tipos de informações que podem ser interpretados como modalidades distintas para dados textuais. Nesse sentido, foi proposto o Multimodal Variational Autoencoder (MVAE). O MVAE é um método multimodal que aprende uma nova representação a partir da fusão das modalidades distintas, capturando de forma mais adequada às características da classe de interesse. O MVAE foi explorado com as modalidades de representaçõessemânticas e sintáticas, informações de densidade, linguísticas e espaciais. Além disso, o MVAE é baseado em um Variational Autoencoder que é considerado um dos estados-da-arte para aprendizado de representações. Por fim, as principais contribuições desta dissertação são: (i) um método multimodal para representar textos no cenário de OCL; (ii) detec- ção de notícias falsas por meio de representações geradas pelo MVAE; (iii) aplicação do MVAE para representar revisões de app no filtro de revisões de app relevantes; e (iv) sensoriamento de eventos representados pelo MVAE.
- Imprenta:
- Publisher place: São Carlos
- Date published: 2022
- Data da defesa: 17.02.2022
- Este periódico é de acesso aberto
- Este artigo NÃO é de acesso aberto
-
ABNT
GÔLO, Marcos Paulo Silva. Text Representation through Multimodal Variational Autoencoder for One-Class Learning. 2022. Dissertação (Mestrado) – Universidade de São Paulo, São Carlos, 2022. Disponível em: https://www.teses.usp.br/teses/disponiveis/55/55134/tde-23052022-150550/. Acesso em: 21 fev. 2026. -
APA
Gôlo, M. P. S. (2022). Text Representation through Multimodal Variational Autoencoder for One-Class Learning (Dissertação (Mestrado). Universidade de São Paulo, São Carlos. Recuperado de https://www.teses.usp.br/teses/disponiveis/55/55134/tde-23052022-150550/ -
NLM
Gôlo MPS. Text Representation through Multimodal Variational Autoencoder for One-Class Learning [Internet]. 2022 ;[citado 2026 fev. 21 ] Available from: https://www.teses.usp.br/teses/disponiveis/55/55134/tde-23052022-150550/ -
Vancouver
Gôlo MPS. Text Representation through Multimodal Variational Autoencoder for One-Class Learning [Internet]. 2022 ;[citado 2026 fev. 21 ] Available from: https://www.teses.usp.br/teses/disponiveis/55/55134/tde-23052022-150550/ - Proceedings of the first International TEXT2SPARQL Challenge
- Preface of the First International TEXT2SPARQL Challenge (TEXT2SPARQL’25) [Prefácio]
- Improving natural product knowledge extraction from academic literature with enhanced PDF text extraction and large language models
- Tracking free-ranging pantaneiro sheep during extreme drought in the Pantanal through precision technologies
- Text representation through multimodal variational autoencoder for one-class learning
- One-class learning for data stream through graph neural networks
- On the use of large language models to detect brazilian politics fake news
- Triple-VAE: a triple variational autoencoder to represent events in one-class event detection
- Learning to sense from events via semantic variational autoencoder
- Text representation through multimodal variational autoencoder for one-class learning
Informações sobre o DOI: 10.11606/D.55.2022.tde-23052022-150550 (Fonte: oaDOI API)
How to cite
A citação é gerada automaticamente e pode não estar totalmente de acordo com as normas
