Modelo Hierárquico Bayesiano Não Paramétrico Aplicado em Modelagem de Tópicos (2024)
- Authors:
- Autor USP: CUNHA, ROBSON ORTZ OLIVEIRA - Interinstitucional de Pós-Graduação em Estatística
- Unidade: Interinstitucional de Pós-Graduação em Estatística
- Sigla do Departamento: SME
- DOI: 10.11606/D.104.2024.tde-03042024-080044
- Subjects: ESTATÍSTICA E PROBABILIDADE; CORPUS; PROCESSAMENTO DE LINGUAGEM NATURAL; ANÁLISE DE DADOS; INFERÊNCIA NÃO PARAMÉTRICA; ESTATÍSTICA PARA INTELIGÊNCIA ARTIFICIAL; ESTATÍSTICA
- Keywords: Hierarchical Dirichlet process; Jurimetria; Jurimetry; Modelagem de tópicos textuais; Modelo não paramétrico Bayesiano; Non-parametric Bayesian model; Processo hierárquico de Dirichlet; Topic modeling
- Language: Português
- Abstract: Dada a crescente necessidade e importância da análise de dados textuais no ramo da inteligência artificial, modelos que possam compreender melhor a linguagem humana e lidar com dados não estruturados têm ganhado cada vez mais relevância. Neste trabalho, desenvolvemos um estudo sobre o Processo Hierárquico de Dirichlet (HDP) na modelagem de tópicos textuais explorando seus aspectos práticos ao aplicá-lo em um conjunto de dados (corpus) de processos jurídicos, compostos por três tipos de procedimentos distintos. Discorremos sobre as principais propriedades do HDP, sobre a ótica Bayesiana, assumindo que os dados sejam oriundos de uma distribuição de probabilidade Multinomial, baseados no modelo de representação textual de bag-of-words, comumente utilizado em processamento de linguagem natural. Procedemos ainda com algumas técnicas de pré-processamento textual, que resultaram em documentos (dados) mais parcimoniosos, e com estudo de simulação para verificar a performance do modelo. Ao fim do trabalho, apresentamos os resultados das aplicações realizadas e discutimos sobre a problemática da análise de dados em jurimetria.
- Imprenta:
- Publisher place: São Carlos
- Date published: 2024
- Data da defesa: 19.02.2024
- Este periódico é de acesso aberto
- Este artigo é de acesso aberto
- URL de acesso aberto
- Cor do Acesso Aberto: gold
- Licença: cc-by-nc-sa
-
ABNT
CUNHA, Robson Ortz Oliveira. Modelo Hierárquico Bayesiano Não Paramétrico Aplicado em Modelagem de Tópicos. 2024. Dissertação (Mestrado) – Universidade de São Paulo, São Carlos, 2024. Disponível em: https://www.teses.usp.br/teses/disponiveis/104/104131/tde-03042024-080044/. Acesso em: 08 jan. 2026. -
APA
Cunha, R. O. O. (2024). Modelo Hierárquico Bayesiano Não Paramétrico Aplicado em Modelagem de Tópicos (Dissertação (Mestrado). Universidade de São Paulo, São Carlos. Recuperado de https://www.teses.usp.br/teses/disponiveis/104/104131/tde-03042024-080044/ -
NLM
Cunha ROO. Modelo Hierárquico Bayesiano Não Paramétrico Aplicado em Modelagem de Tópicos [Internet]. 2024 ;[citado 2026 jan. 08 ] Available from: https://www.teses.usp.br/teses/disponiveis/104/104131/tde-03042024-080044/ -
Vancouver
Cunha ROO. Modelo Hierárquico Bayesiano Não Paramétrico Aplicado em Modelagem de Tópicos [Internet]. 2024 ;[citado 2026 jan. 08 ] Available from: https://www.teses.usp.br/teses/disponiveis/104/104131/tde-03042024-080044/
Informações sobre o DOI: 10.11606/D.104.2024.tde-03042024-080044 (Fonte: oaDOI API)
How to cite
A citação é gerada automaticamente e pode não estar totalmente de acordo com as normas
