Employing syntactical dependency and a mesoscopic scale to model books' narratives through recurrence networks (2023)
- Authors:
- Autor USP: SOUZA, BÁRBARA CORTES E - ICMC
- Unidade: ICMC
- Sigla do Departamento: SCC
- DOI: 10.11606/D.55.2023.tde-02042024-162451
- Subjects: REDES COMPLEXAS; PROCESSAMENTO DE LINGUAGEM NATURAL; PROCESSAMENTO DE TEXTO; ANÁLISE DE TEXTO
- Keywords: Complex networks; Dependência sintática; Escala mesoscópica; Mesoscopic scale; NLP; Recurrence networks; Redes de recorrência; Syntactical dependency
- Agências de fomento:
- Language: Inglês
- Abstract: Nos últimos anos, a ciência tem sido fortemente influenciada pelo contínuo aumento no volume de informações disponíveis à pesquisa. Especificamente, o crescimento da quantidade de dados textuais desempenhou um papel fundamental no desenvolvimento e na apresentação de novas metodologias para abordar desafios na área de processamento de textos. Diversas abordagens inovadoras têm surgido, com enfoque em diferentes componentes da linguística, como léxico, sintaxe e semântica. O Processamento de Linguagem Natural, por exemplo, é um campo multidisciplinar que aborda a interação entre linguagens naturais e computadores. Alguns exemplos de problemas dessa área são: detecção de tópicos, classificação de textos, estilometria, sumarização automática, entre outros. Dado que linguagens naturais são consideradas sistemas complexos, é apropriado que sejam representadas por redes complexas, para auxiliar na resolução desses diferentes tipos de problemas. Um conhecido método de modelagem de textos é a rede de adjacência de palavras, na qual cada nó mapeia uma palavra do texto e arestas são criadas entre termos que ocorrem em sequência no texto. Neste projeto de Mestrado, no entanto, o foco é em uma escala mesoscópica mais abrangente, visando a capturar o contexto geral da narrativa. Nessa metodologia, um nó se refere a uma sequência de parágrafos do texto, e arestas são criadas entre os mais similares. Adicionalmente, uma análise de dependência sintática é aplicada para aumentar o nível deinformatividade e, portanto, obter uma performance superior em capturar o contexto semântico de um texto. Finalmente, é possível extrair medidas de rede significativas para sua caracterização, incluindo acessibilidade, simetria e a proposta Assinatura de Recorrência, como forma de capturar as propriedades topológicas que refletem o contexto narrativo. Diversas validações de método foram executadas, incluindo uma comparação com outras medidas de rede triviais, dois experimentos para diferenciar entre textos reais e randomizados e entre diferentes gêneros literários, e, finalmente, uma comparação do método proposto com outras abordagens mais ortodoxas na literatura: redes de co-ocorrência e doc2vec.
- Imprenta:
- Publisher place: São Carlos
- Date published: 2023
- Data da defesa: 05.12.2023
- Este periódico é de acesso aberto
- Este artigo NÃO é de acesso aberto
-
ABNT
SOUZA, Bárbara Côrtes e. Employing syntactical dependency and a mesoscopic scale to model books' narratives through recurrence networks. 2023. Dissertação (Mestrado) – Universidade de São Paulo, São Carlos, 2023. Disponível em: https://www.teses.usp.br/teses/disponiveis/55/55134/tde-02042024-162451/. Acesso em: 20 fev. 2026. -
APA
Souza, B. C. e. (2023). Employing syntactical dependency and a mesoscopic scale to model books' narratives through recurrence networks (Dissertação (Mestrado). Universidade de São Paulo, São Carlos. Recuperado de https://www.teses.usp.br/teses/disponiveis/55/55134/tde-02042024-162451/ -
NLM
Souza BC e. Employing syntactical dependency and a mesoscopic scale to model books' narratives through recurrence networks [Internet]. 2023 ;[citado 2026 fev. 20 ] Available from: https://www.teses.usp.br/teses/disponiveis/55/55134/tde-02042024-162451/ -
Vancouver
Souza BC e. Employing syntactical dependency and a mesoscopic scale to model books' narratives through recurrence networks [Internet]. 2023 ;[citado 2026 fev. 20 ] Available from: https://www.teses.usp.br/teses/disponiveis/55/55134/tde-02042024-162451/
Informações sobre o DOI: 10.11606/D.55.2023.tde-02042024-162451 (Fonte: oaDOI API)
How to cite
A citação é gerada automaticamente e pode não estar totalmente de acordo com as normas
