MaSTA: a text-based machine learning approach for systems-of-systems in the big data context (2019)
- Authors:
- Autor USP: BIANCHI, THIAGO - ICMC
- Unidade: ICMC
- Sigla do Departamento: SSC
- Subjects: APRENDIZADO COMPUTACIONAL; BIG DATA; SISTEMAS OPERACIONAIS; ARQUITETURA DE SOFTWARE; ARQUITETURA ORIENTADA A SERVIÇOS
- Keywords: Classificação de texto; Machine learning; Naive Bayes; Naive Bayes; Sistema-de-sistemas; System-of-systems; Text classification
- Language: Inglês
- Abstract: Sistemas-de-sistemas (SoS) conquistaram um status muito importante na indústria e na academia como uma resposta à crescente complexidade dos sistemas intensivos de software. SoS são particulares no sentido de que suas capacidades transcendem a mera soma das capacidades de seus diversos constituintes independentes. Paralelamente, o crescimento atual na quantidade de dados coletados em diferentes formatos é impressionante e impõe um desafio considerável para pesquisadores e profissionais, caracterizando consequentemente o contexto de Big Data. Nesse cenário, técnicas de Aprendizado de Máquina têm sido cada vez mais exploradas para analisar e extrair conhecimento relevante de tais dados. SoS também têm gerado uma grande quantidade de dados e informações de texto e, em muitas situações, os usuários do SoS precisam registrar manualmente textos críticos não estruturados, por exemplo, ordens de serviço e solicitações de serviço, e também precisam mapeá-los para informações estruturadas. Além disso, essas tarefas são repetitivas, demoradas, e até mesmo propensas a erros. O principal objetivo desta Tese é apresentar o MaSTA, uma abordagem composta por um método de classificação inovador para inferir classificadores a partir de grandes coleções de texto e um método de avaliação que mensura os níveis de confiabilidade e desempenho desses classificadores. Para avaliar a eficácia do MaSTA, nós conduzimos um experimento com um SoS comercial utilizado por grandes empresas que nosforneceram quatro conjuntos de dados contendo quase um milhão de registros relacionados com três tarefas de classificação. Como resultado, esse experimento indicou que o MaSTA é capaz de classificar automaticamente os documentos e também melhorar a assertividade do usuário através da redução da lista de possíveis classificações. Além disso, esse experimento indicou que o MaSTA é uma solução escalável para os cenários de Big Data, nos quais as coleções de documentos têm centenas de milhares (até milhões) de documentos, até mesmo produzidos por diferentes constituintes de um SoS.
- Imprenta:
- Publisher place: São Carlos
- Date published: 2019
- Data da defesa: 11.04.2019
-
ABNT
BIANCHI, Thiago. MaSTA: a text-based machine learning approach for systems-of-systems in the big data context. 2019. Tese (Doutorado) – Universidade de São Paulo, São Carlos, 2019. Disponível em: http://www.teses.usp.br/teses/disponiveis/55/55134/tde-11092019-144236/. Acesso em: 29 dez. 2025. -
APA
Bianchi, T. (2019). MaSTA: a text-based machine learning approach for systems-of-systems in the big data context (Tese (Doutorado). Universidade de São Paulo, São Carlos. Recuperado de http://www.teses.usp.br/teses/disponiveis/55/55134/tde-11092019-144236/ -
NLM
Bianchi T. MaSTA: a text-based machine learning approach for systems-of-systems in the big data context [Internet]. 2019 ;[citado 2025 dez. 29 ] Available from: http://www.teses.usp.br/teses/disponiveis/55/55134/tde-11092019-144236/ -
Vancouver
Bianchi T. MaSTA: a text-based machine learning approach for systems-of-systems in the big data context [Internet]. 2019 ;[citado 2025 dez. 29 ] Available from: http://www.teses.usp.br/teses/disponiveis/55/55134/tde-11092019-144236/
How to cite
A citação é gerada automaticamente e pode não estar totalmente de acordo com as normas
