Reinforcement learning applied to vessel navigation in fast-time simulations.

Andrade, José Amendola Netto; Tannuri, Eduardo Aoun; Cozman, Fabio Gagliardi

Tese

Reinforcement learning applied to vessel navigation in fast-time simulations. (2020)

Autores:
Autor USP: ANDRADE, JOSÉ AMENDOLA NETTO - EP
Unidade: EP
Sigla do Departamento: PMR
Assuntos: SIMULAÇÃO; APRENDIZADO COMPUTACIONAL; PORTOS; NAVIOS
Agências de fomento:
- Financiamento CNPq
Idioma: Inglês
Resumo: Simulações em tempo acelerado têm se provado uma ferramenta essencial para engenharia marítima, não somente para projeto de navios, mas também para detectar pontos críticos e possíveis gargalos em projetos de portos. Contudo, tais simulações não são realizadas por pilotos profissionais e isso pode se tornar uma tarefa complexa com resultados não tão fiéis à realidade. Tais questões podem apresentar uma oportunidade para introduzir Aprendizado por Reforço no domínio marítimo. Esse trabalho propõe uma solução baseada em Aprendizagem por Reforço que é capaz de gerar de forma automática trajetórias de navios em águas restritas sob o efeito de forças ambientais. O agente aprende interagindo com o simulador e recebendo sinais de reforço. Ele também provê comandos discretos em intervalos discretos de tempo para emular as limitações presentes na pilotagem humana. O método avalia a versão distribuída de dois algoritmos no estado da arte em aprendizado por reforço. Ele lida com segmentos de canais como episódios separados e inclui informação de curvatura para ações antecipatórias. Experimentos foram conduzidos considerando cenários realistas com canais estreitos e curvos onde a incidência de vento e corrente variam ao longo da trajetória. O caráter inovador do trabalho se dá pelo fato de que a solução proposta não requer qualquer conhecimento prévio dos modelos dinâmicos ou de caminhos pré-definidos para serem seguidos pelo navio. Isso pode impactar as simulações em tempo acelerado exigindo menos esforço humano na obtenção das trajetórias. O método adotado utiliza uma representação simples e pode ser aplicado a quaisquer canais que respeitem as regulamentações técnicas locais.
Imprenta:
- Local: São Paulo
- Data de publicação: 2020
Data da defesa: 02.10.2020

Como citar

A citação é gerada automaticamente e pode não estar totalmente de acordo com as normas

ABNT

ANDRADE, José Amendola Netto. Reinforcement learning applied to vessel navigation in fast-time simulations. 2020. Dissertação (Mestrado) – Universidade de São Paulo, São Paulo, 2020. Disponível em: https://www.teses.usp.br/teses/disponiveis/3/3152/tde-04052021-085708/. Acesso em: 26 abr. 2025.
APA

Andrade, J. A. N. (2020). Reinforcement learning applied to vessel navigation in fast-time simulations. (Dissertação (Mestrado). Universidade de São Paulo, São Paulo. Recuperado de https://www.teses.usp.br/teses/disponiveis/3/3152/tde-04052021-085708/
NLM

Andrade JAN. Reinforcement learning applied to vessel navigation in fast-time simulations. [Internet]. 2020 ;[citado 2025 abr. 26 ] Available from: https://www.teses.usp.br/teses/disponiveis/3/3152/tde-04052021-085708/
Vancouver

Andrade JAN. Reinforcement learning applied to vessel navigation in fast-time simulations. [Internet]. 2020 ;[citado 2025 abr. 26 ] Available from: https://www.teses.usp.br/teses/disponiveis/3/3152/tde-04052021-085708/

ReP

Exportar registro bibliográfico

Reinforcement learning applied to vessel navigation in fast-time simulations. (2020)

Como citar

Últimas obras dos mesmos autores vinculados com a USP cadastradas na BDPI:

Unidades USP

ReP

Exportar registro bibliográfico

Reinforcement learning applied to vessel navigation in fast-time simulations. (2020)

Como citar

Últimas obras dos mesmos autores vinculados com a USP cadastradas na BDPI: