Otimização de gastos aplicados com cibersegurança por meio de aprendizado por reforço

Nogueira, Rafael Sander; Terada, Routo

Tese

Otimização de gastos aplicados com cibersegurança por meio de aprendizado por reforço (2025)

Authors:
- Nogueira, Rafael Sander
- Terada, Routo (Orientador)
Autor USP: NOGUEIRA, RAFAEL SANDER - IME
Unidade: IME
Sigla do Departamento: MAC
DOI: 10.11606/D.45.2025.tde-20012026-225010
Subjects: APRENDIZADO COMPUTACIONAL; ANÁLISE DE RISCO NO DESENVOLVIMENTO DE SOFTWARE; GESTÃO DA SEGURANÇA EM SISTEMAS COMPUTACIONAIS
Keywords: Aprendizado de máquina; Aprendizado por reforço; Cibersegurança; Cyber-security; Gestão de riscos; Machine learning; Q-learning; Reinforcement learning; Risk management
Language: Português
Abstract: Ataques cibernéticos têm impactado a sociedade de forma cada vez mais significativa, seja em situações em que são utilizados como armas em conflitos geopolíticos, como o conflito entre Israel e o Irã, seja como um instrumento utilizado por organizações criminosas para executar roubos milionários, como o ciberataque perpetrado contra o sistema financeiro brasileiro em 2025. Com isso, o tema de cibersegurança ganha cada vez mais visibilidade diante das organizações. Em resposta a esse fenômeno, elas procuram incorporar controles aos seus processos a fim de mitigar a probabilidade de ocorrência e impacto de ciberataques. Contudo, a complexidade do ambiente de tecnologia das entidades, aliada à alta capacidade e incentivos que atacantes, conhecidos como hackers, têm em perpetrar ciberataques, faz com que a seleção dos controles a serem aplicados seja um desafio. Adicionalmente, a quantidade de recursos financeiros disponíveis para gasto com controles de cibersegurança é limitada, acrescentando mais uma dificuldade a essa priorização.Por outro lado, com objetivo de superar o desafio mencionado, técnicas de aprendizado de máquina são comumente empregadas com sucesso. Diante desse cenário, este estudo propõe uma solução que utiliza o algoritmo de aprendizado por reforço Q-learning, para determinação de um conjunto ótimo de controles a serem implementados, limitado por um orçamento. Essa abordagem conta com o desenvolvimento de um ambiente com base em ataques reais, sobre o qual oagente Q-learning irá explorar. Durante esse processo, o agente visa selecionar controles de cibersegurança com menor custo, maior capacidade de mitigação dos riscos mais relevantes e que podem impactar ativos de maior criticidade. Além disso, a abordagem apresenta uma forma de avaliação de sua efetividade, por meio da utilização dos indicadores denominados Vulnerabilidade Global e Vulnerabilidade Específica, ambos desenvolvidos neste estudo. Os experimentos realizados foram positivos, ao apresentarem como resultado uma melhora de até 96% da Vulnerabilidade Global, quando comparado com a seleção de controles realizada de forma randômica. Ademais, a solução foi capaz de selecionar um conjunto de controles, o qual leva a uma menor probabilidade de ocorrência dos 40 ataques que compõem o ambiente de aprendizado, quando comparado aos resultados apresentados pela seleção randômica. Todos os valores apurados foram estatisticamente validados, por meio do teste estatístico t pareado, com um nível de confiança de 95%. Esses resultados endossam que a solução proposta é efetiva e possui capacidade de ser aplicada em cenários reais
Imprenta:
- Publisher place: São Paulo
- Date published: 2025
Data da defesa: 27.11.2025

Informações sobre o DOI: 10.11606/D.45.2025.tde-20012026-225010 (Fonte: oaDOI API)

Este periódico é de acesso aberto
Este artigo NÃO é de acesso aberto

How to cite

A citação é gerada automaticamente e pode não estar totalmente de acordo com as normas

ABNT

NOGUEIRA, Rafael Sander. Otimização de gastos aplicados com cibersegurança por meio de aprendizado por reforço. 2025. Dissertação (Mestrado) – Universidade de São Paulo, São Paulo, 2025. Disponível em: https://www.teses.usp.br/teses/disponiveis/45/45134/tde-20012026-225010/. Acesso em: 27 jan. 2026.
APA

Nogueira, R. S. (2025). Otimização de gastos aplicados com cibersegurança por meio de aprendizado por reforço (Dissertação (Mestrado). Universidade de São Paulo, São Paulo. Recuperado de https://www.teses.usp.br/teses/disponiveis/45/45134/tde-20012026-225010/
NLM

Nogueira RS. Otimização de gastos aplicados com cibersegurança por meio de aprendizado por reforço [Internet]. 2025 ;[citado 2026 jan. 27 ] Available from: https://www.teses.usp.br/teses/disponiveis/45/45134/tde-20012026-225010/
Vancouver

Nogueira RS. Otimização de gastos aplicados com cibersegurança por meio de aprendizado por reforço [Internet]. 2025 ;[citado 2026 jan. 27 ] Available from: https://www.teses.usp.br/teses/disponiveis/45/45134/tde-20012026-225010/

ReP

Exportar registro bibliográfico

Otimização de gastos aplicados com cibersegurança por meio de aprendizado por reforço (2025)

How to cite

Últimas obras dos mesmos autores vinculados com a USP cadastradas na BDPI:

USP Schools

ReP

Exportar registro bibliográfico

Otimização de gastos aplicados com cibersegurança por meio de aprendizado por reforço (2025)

How to cite

Últimas obras dos mesmos autores vinculados com a USP cadastradas na BDPI: