Predição de polaridade negativa em relatórios de auditoria utilizando dados socioeconômicos (2020)
- Authors:
- Autor USP: BRUSCATO, LUCAS PEINADO - IME
- Unidade: IME
- Sigla do Departamento: MAE
- Assunto: ESTATISTICA
- Keywords: Dados socioeconômicos; Linear regression; Natural language processing; Processamento de linguagem natural; Random forest; Regressão linear; Socioeconomic data; Web scraper; Xgboost
- Language: Português
- Abstract: A corrupção no Brasil afeta diretamente o bem-estar dos cidadãos ao diminuir os investimentos públicos na saúde, na educação, em infraestrutura, segurança, habitação, entre outros direitos essenciais à vida. A democratização da internet e a evolução da ciência de dados nos permitiu avaliar a relação de irregularidades administrativas, no caso deste trabalho palavras negativas, e mudanças em indicadores sociais sobre municípios. Desenvolvemos um algoritmo (web scraper) que automatiza a captura dos relatórios da auditoria da CGU e analisamos a polaridade das palavras presentes nos relatórios separadamente. Obtivemos os dados socioeconômicos no censo do IBGE em dois períodos e criamos modelos de aprendizado de máquina para predição do percentual de polaridade negativa por município baseado nos dados do IBGE. Para se avaliar a qualidade de um modelo complexo é importante ter um modelo simples como parâmetro de desempenho base, realizamos o treinamento de três modelos (regressão linear, random forest e xgboost) sobre a base de dados criada. As principais contribuições deste trabalho foram a extração automatizada dos dados governamentais, encontrar evidência estatística da relação entre os dados dos relatórios e dos dados socioeconômicos de fontes distintas e modelos de aprendizado de máquina funcionais para o problema proposto
- Imprenta:
- Data da defesa: 18.02.2020
-
ABNT
BRUSCATO, Lucas Peinado. Predição de polaridade negativa em relatórios de auditoria utilizando dados socioeconômicos. 2020. Dissertação (Mestrado) – Universidade de São Paulo, São Paulo, 2020. Disponível em: https://www.teses.usp.br/teses/disponiveis/45/45133/tde-12032020-055952/. Acesso em: 28 mar. 2024. -
APA
Bruscato, L. P. (2020). Predição de polaridade negativa em relatórios de auditoria utilizando dados socioeconômicos (Dissertação (Mestrado). Universidade de São Paulo, São Paulo. Recuperado de https://www.teses.usp.br/teses/disponiveis/45/45133/tde-12032020-055952/ -
NLM
Bruscato LP. Predição de polaridade negativa em relatórios de auditoria utilizando dados socioeconômicos [Internet]. 2020 ;[citado 2024 mar. 28 ] Available from: https://www.teses.usp.br/teses/disponiveis/45/45133/tde-12032020-055952/ -
Vancouver
Bruscato LP. Predição de polaridade negativa em relatórios de auditoria utilizando dados socioeconômicos [Internet]. 2020 ;[citado 2024 mar. 28 ] Available from: https://www.teses.usp.br/teses/disponiveis/45/45133/tde-12032020-055952/
How to cite
A citação é gerada automaticamente e pode não estar totalmente de acordo com as normas