Reinforcement learning applied to vessel navigation in fast-time simulations. (2020)
- Authors:
- Autor USP: ANDRADE, JOSÉ AMENDOLA NETTO - EP
- Unidade: EP
- Sigla do Departamento: PMR
- Subjects: SIMULAÇÃO; APRENDIZADO COMPUTACIONAL; PORTOS; NAVIOS
- Agências de fomento:
- Language: Inglês
- Abstract: Simulações em tempo acelerado têm se provado uma ferramenta essencial para engenharia marítima, não somente para projeto de navios, mas também para detectar pontos críticos e possíveis gargalos em projetos de portos. Contudo, tais simulações não são realizadas por pilotos profissionais e isso pode se tornar uma tarefa complexa com resultados não tão fiéis à realidade. Tais questões podem apresentar uma oportunidade para introduzir Aprendizado por Reforço no domínio marítimo. Esse trabalho propõe uma solução baseada em Aprendizagem por Reforço que é capaz de gerar de forma automática trajetórias de navios em águas restritas sob o efeito de forças ambientais. O agente aprende interagindo com o simulador e recebendo sinais de reforço. Ele também provê comandos discretos em intervalos discretos de tempo para emular as limitações presentes na pilotagem humana. O método avalia a versão distribuída de dois algoritmos no estado da arte em aprendizado por reforço. Ele lida com segmentos de canais como episódios separados e inclui informação de curvatura para ações antecipatórias. Experimentos foram conduzidos considerando cenários realistas com canais estreitos e curvos onde a incidência de vento e corrente variam ao longo da trajetória. O caráter inovador do trabalho se dá pelo fato de que a solução proposta não requer qualquer conhecimento prévio dos modelos dinâmicos ou de caminhos pré-definidos para serem seguidos pelo navio. Isso pode impactar as simulações em tempo acelerado exigindo menos esforço humano na obtenção das trajetórias. O método adotado utiliza uma representação simples e pode ser aplicado a quaisquer canais que respeitem as regulamentações técnicas locais.
- Imprenta:
- Data da defesa: 02.10.2020
-
ABNT
ANDRADE, José Amendola Netto. Reinforcement learning applied to vessel navigation in fast-time simulations. 2020. Dissertação (Mestrado) – Universidade de São Paulo, São Paulo, 2020. Disponível em: https://www.teses.usp.br/teses/disponiveis/3/3152/tde-04052021-085708/. Acesso em: 14 nov. 2024. -
APA
Andrade, J. A. N. (2020). Reinforcement learning applied to vessel navigation in fast-time simulations. (Dissertação (Mestrado). Universidade de São Paulo, São Paulo. Recuperado de https://www.teses.usp.br/teses/disponiveis/3/3152/tde-04052021-085708/ -
NLM
Andrade JAN. Reinforcement learning applied to vessel navigation in fast-time simulations. [Internet]. 2020 ;[citado 2024 nov. 14 ] Available from: https://www.teses.usp.br/teses/disponiveis/3/3152/tde-04052021-085708/ -
Vancouver
Andrade JAN. Reinforcement learning applied to vessel navigation in fast-time simulations. [Internet]. 2020 ;[citado 2024 nov. 14 ] Available from: https://www.teses.usp.br/teses/disponiveis/3/3152/tde-04052021-085708/
How to cite
A citação é gerada automaticamente e pode não estar totalmente de acordo com as normas