Categorização de produtos em e-commerce: avaliação do método Argmax para classificação de descrições curtas em português (2024)
- Authors:
- Autor USP: DARÚ, GILSILEY HENRIQUE - ICMC
- Unidade: ICMC
- Sigla do Departamento: SME
- DOI: 10.11606/D.55.2024.tde-07012025-171839
- Subjects: APRENDIZADO COMPUTACIONAL; PROCESSAMENTO DE LINGUAGEM NATURAL; COMÉRCIO ELETRÔNICO; ANÁLISE DE TEXTO; RECUPERAÇÃO DA INFORMAÇÃO
- Keywords: Classificação de texto; Descrição do produto; Frequência de termos; Frequência inversa de documentos; Inverse document frequency; Sacola de palavras; Short text
- Language: Português
- Abstract: A crescente demanda por sistemas automatizados de classificação de produtos em plataformas de e-commerce impulsionou a busca por soluções eficientes para a categorização de produtos, especialmente em português. Este estudo investiga a adaptação de técnicas de recuperação da informação clássicas sacola de palavras, TF, e TF-IDF para a tarefa de classificar descrições curtas de produtos. A pesquisa avalia diferentes estratégias de pré-processamento e tokenização, incluindo a análise do impacto da normalização L2. Os resultados demonstraram que métodos simples de recuperação da informação, quando combinados com pré-processamento adequado e otimização de parâmetros, podem alcançar desempenho significativamente superior. Para avaliar abrangentemente o desempenho e a robustez dos modelos, foram propostas novas métricas Índice de Eficiência Geral (IEG) e Índice de Eficiência Geral Estabilizado (IEGE). Essas métricas combinam a acurácia e o F1-score macro, oferecendo uma avaliação mais completa do desempenho, especialmente em cenários de desbalanceamento de classes. Este trabalho contribui com insights valiosos para o desenvolvimento de sistemas de categorização de produtos mais eficientes em plataformas de e-commerce em português.
- Imprenta:
- Publisher place: São Carlos
- Date published: 2024
- Data da defesa: 23.09.2024
- Este periódico é de acesso aberto
- Este artigo é de acesso aberto
- URL de acesso aberto
- Cor do Acesso Aberto: gold
- Licença: cc-by-nc-sa
-
ABNT
DARÚ, Gilsiley Henrique. Categorização de produtos em e-commerce: avaliação do método Argmax para classificação de descrições curtas em português. 2024. Dissertação (Mestrado) – Universidade de São Paulo, São Carlos, 2024. . Acesso em: 26 dez. 2025. -
APA
Darú, G. H. (2024). Categorização de produtos em e-commerce: avaliação do método Argmax para classificação de descrições curtas em português (Dissertação (Mestrado). Universidade de São Paulo, São Carlos. -
NLM
Darú GH. Categorização de produtos em e-commerce: avaliação do método Argmax para classificação de descrições curtas em português. 2024 ;[citado 2025 dez. 26 ] -
Vancouver
Darú GH. Categorização de produtos em e-commerce: avaliação do método Argmax para classificação de descrições curtas em português. 2024 ;[citado 2025 dez. 26 ] - Short text classification applied to item description: some methods evaluation
- Encontrando perfis de consumidores a partir da redução de dimensionalidade por componentes principais
- Um método para comparar palavras entre categorias utilizando word2vec e redução de dimensionalidade no problema de categorização de produtos pela descrição
- Automatic Identification of Fake News in Portuguese
- Automatic identification of fake news written in the portuguese language spoken in Brazil
Informações sobre o DOI: 10.11606/D.55.2024.tde-07012025-171839 (Fonte: oaDOI API)
How to cite
A citação é gerada automaticamente e pode não estar totalmente de acordo com as normas
