Learning beyond the spatial autocorrelation structure: A machine learning- based approach to discovering new patterns and relationships in the context of spatially contextualized modeling of voting behavior (2023)
- Authors:
- Autor USP: SILVA, TIAGO PINHO DA - ICMC
- Unidade: ICMC
- DOI: 10.11606/T.55.2023.tde-15012024-174102
- Subjects: APRENDIZADO COMPUTACIONAL; COMPORTAMENTO ELEITORAL
- Keywords: Autocorrelação espacial; Dependência espacial; Electoral behavior modeling; Electoral geography; Ensemble learning; Erro de predição; Geografia eleitoral; Machine learning; Metaaprendizagem; Metalearning; Modelagem de dados espaciais; Modelos de ensemble; Particionamento de dados espaciais; Prediction error; Preferential voting; Semivariogram; Semivariograma; Spatial autocorrelation; Spatial data modeling; Spatial data partitioning; Spatial dependence; Votação preferencial; Voting behavior
- Agências de fomento:
- Language: Inglês
- Abstract: As eleições são um pilar fundamental das sociedades democráticas, proporcionando aos cidadãos meios para eleger os seus representantes e moldar a direção de governos. No entanto, nos últimos anos, houve um aumento na preocupação com a integridade dos processos eleitorais em todo o mundo, com alegações de fraude e crescente polarização. Para compreender melhor o eleitorado e os fatores que influenciam suas escolhas, um número crescente de pesquisadores se voltaram para a modelagem do comportamento eleitoral, que lança luz sobre fenômenos políticos como a polarização e os contextos demográficos e socioeconômicos que moldam a natureza do eleitorado. A literatura sobre modelagem de comportamento eleitoral pode ser amplamente dividida em duas áreas principais: ciência política, que argumenta que apenas fatores individuais explicam o comportamento eleitoral usando principalmente dados de pesquisas eleitorais; e geografia eleitoral, que afirma que fatores contextuais, como localização, desempenham um papel crucial na determinação do comportamento eleitoral usando conjuntos de dados com informações agregadas espacialmente, como dados do censo. A ciência política tornou-se a abordagem dominante devido ao aumento da qualidade dos dados coletados nas pesquisas, mas a disponibilidade pública de tais dados é limitada e cara. Em contraste, os dados do censo, que fornecem informações detalhadas sobre as características socioeconômicas e demográficas de uma população, são disponibilizadospublicamente por agências governamentais. No entanto, apesar de seu potencial para fornecer informações abrangentes e perspicazes sobre o eleitorado, esses tipos de dados são subutilizados na modelagem do comportamento eleitoral, principalmente devido às limitações dos principais métodos de modelagem do eleitorado em lidar com dados de alta dimensão e identificar relações não lineares. Para lidar com essas limitações, tem havido uma tendência crescente na utilização de métodos de aprendizado de máquina que podem lidar melhor com alta dimensionalidade e modelar relações não lineares. No entanto, a maioria desses trabalhos negligencia as características espaciais dos dados. Esta tese defende a importância de incorporar informações de dependência espacial no pipeline de aprendizado de máquina para a tarefa de modelagem do comportamento eleitoral usando dados do censo. O pipeline de aprendizado de máquina tradicional pode exibir viés em relação a modelos que aprendem a estrutura de autocorrelação espacial, dificultando a descoberta de novos padrões fora da estrutura de autocorrelação, o que contradiz o objetivo principal de identificar novos padrões. Nesta tese, o impacto da dependência espacial na tarefa de modelagem do comportamento eleitoral é estudado, e adaptações ao pipeline tradicional de aprendizado de máquina são propostas, desenvolvidas e avaliadas. Nesse sentido, propomos duas técnicas de validação cruzada espacial que levam em consideração os aspectos espaciais dosdados e fornecem cenários para a avaliação de modelos de aprendizado de máquina sem a influência da dependência espacial. Além disso, propomos uma abordagem de aprendizado de máquina baseada em stacking para modelar os dados com base em contextos geográficos e identificar relações locais e globais para entender os resultados das eleições. Os resultados desta tese indicam que as abordagens propostas são adequadas para a tarefa de modelagem espacialmente contextualizada do comportamento eleitoral. As técnicas de validação foram capazes de fornecer cenários mais realistas e menos tendenciosos quando comparadas às abordagens existentes na literatura, e a abordagem de aprendizado de máquina superou o estado da arte na literatura e forneceu resultados interpretáveis. No geral, esta pesquisa avança o estado da arte em modelagem de comportamento eleitoral e fornece uma nova metodologia na área, abrindo caminho para novas abordagens de aprendizado de máquina para ajudar a entender os resultados das eleições.
- Imprenta:
- Publisher place: São Carlos
- Date published: 2023
- Data da defesa: 22.08.2023
- Status:
- Artigo publicado em periódico de acesso aberto (Gold Open Access)
- Versão do Documento:
- Versão publicada (Published version)
- Acessar versão aberta:
-
ABNT
SILVA, Tiago Pinho da. Learning beyond the spatial autocorrelation structure: A machine learning- based approach to discovering new patterns and relationships in the context of spatially contextualized modeling of voting behavior. 2023. Tese (Doutorado) – Universidade de São Paulo, São Carlos, 2023. Disponível em: https://teses.usp.br/teses/disponiveis/55/55134/tde-15012024-174102/. Acesso em: 01 abr. 2026. -
APA
Silva, T. P. da. (2023). Learning beyond the spatial autocorrelation structure: A machine learning- based approach to discovering new patterns and relationships in the context of spatially contextualized modeling of voting behavior (Tese (Doutorado). Universidade de São Paulo, São Carlos. Recuperado de https://teses.usp.br/teses/disponiveis/55/55134/tde-15012024-174102/ -
NLM
Silva TP da. Learning beyond the spatial autocorrelation structure: A machine learning- based approach to discovering new patterns and relationships in the context of spatially contextualized modeling of voting behavior [Internet]. 2023 ;[citado 2026 abr. 01 ] Available from: https://teses.usp.br/teses/disponiveis/55/55134/tde-15012024-174102/ -
Vancouver
Silva TP da. Learning beyond the spatial autocorrelation structure: A machine learning- based approach to discovering new patterns and relationships in the context of spatially contextualized modeling of voting behavior [Internet]. 2023 ;[citado 2026 abr. 01 ] Available from: https://teses.usp.br/teses/disponiveis/55/55134/tde-15012024-174102/ - A fuzzy approach for classification and novelty detection in data streams under intermediate latency
- Possibilistic approach for novelty detection in data streams
- Geographic context-based stacking learning for election prediction from socio-economic data
- A graph-based spatial cross-validation approach for assessing models learned with selected features to understand election results
- Brazilian presidential elections: analysing voting patterns in time and space using a simple data science pipeline
- Evaluating vector representations from user's reviews in a recommendation task
Informações sobre a disponibilidade de versões do artigo em acesso aberto coletadas automaticamente via oaDOI API (Unpaywall).
Por se tratar de integração com serviço externo, podem existir diferentes versões do trabalho (como preprints ou postprints), que podem diferir da versão publicada.
How to cite
A citação é gerada automaticamente e pode não estar totalmente de acordo com as normas
