Leitura de planilhas de xadrez manuscritas usando redes neurais com mecanismos de atenção (2021)
- Authors:
- Autor USP: HAYASHI, SERGIO YUJI - IME
- Unidade: IME
- Sigla do Departamento: MAC
- DOI: 10.11606/D.45.2021.tde-14012022-204025
- Subjects: REDES NEURAIS; APRENDIZADO COMPUTACIONAL; XADREZ
- Keywords: Attention mechanism; Convolutional neural network; Handwritten text recognition; Mecanismo de atenção; Neural network; Reconhecimento de texto escrito a mão; Recurrent neural network; Rede convolucional; Rede neural recorrente
- Language: Português
- Abstract: O reconhecimento de texto manuscrito continua sendo um problema em aberto, objeto de intensa pesquisa na área de aprendizado de máquina. Neste projeto focamos numa categoria específica de problema nesta área, a leitura automática de planilhas de xadrez. Planilhas de xadrez contém anotações de lances de jogos escritos à mão pelos próprios jogadores num formato chamado de notação algébrica. Em comparação com um texto tradicional em linguagem natural, planilhas de xadrez são formulários de formato fixo, seu conteúdo textual é restrito a um vocabulário reduzido e a escrita em geral não é totalmente cursiva. Mesmo assim, elas ainda apresentam uma alta variabilidade de estilos de escrita à mão, tornando a sua leitura um problema suficientemente complexo. O objetivo deste trabalho é o treinamento ponta a ponta de uma rede neural para a leitura destas planilhas, em cenários com uma quantidade limitada de dados. A rede neural deverá receber a imagem de uma planilha e produzir em sua saída a sequência de lances que estão escritos na planilha. Além do reconhecimento da escrita propriamente, a rede deverá aprender a ordem correta de leitura. Por se tratar de um problema para o qual não encontramos trabalhos na literatura da área, o método utilizado consistiu na criação de um conjunto de dados e uma ampla investigação experimental utilizando uma rede neural recorrente com mecanismo de atenção. Identificamos três subtarefas subjacentes ao problema: (1) o aprendizado do modelo delinguagem, relacionado com a previsibilidade dos lances, (2) o alinhamento entre a entrada e a saída, e (3) o reconhecimento da escrita propriamente. Constatamos que essas tarefas possuem distintos graus de dificuldade e que existem alguns fatores que são críticos no aprendizado delas. Mais do que isso, constatamos também que uma combinação adequada desses fatores é fundamental para um treinamento ponta a ponta bem sucedido. Um modelo básico foi avaliado quanto ao reconhecimento dos 16 primeiros lances e alcançou acurácia de 65,78% em termos de lances corretamente reconhecidos
- Imprenta:
- Data da defesa: 20.12.2021
- Este periódico é de acesso aberto
- Este artigo NÃO é de acesso aberto
-
ABNT
HAYASHI, Sergio Yuji. Leitura de planilhas de xadrez manuscritas usando redes neurais com mecanismos de atenção. 2021. Dissertação (Mestrado) – Universidade de São Paulo, São Paulo, 2021. Disponível em: https://www.teses.usp.br/teses/disponiveis/45/45134/tde-14012022-204025/. Acesso em: 01 mar. 2026. -
APA
Hayashi, S. Y. (2021). Leitura de planilhas de xadrez manuscritas usando redes neurais com mecanismos de atenção (Dissertação (Mestrado). Universidade de São Paulo, São Paulo. Recuperado de https://www.teses.usp.br/teses/disponiveis/45/45134/tde-14012022-204025/ -
NLM
Hayashi SY. Leitura de planilhas de xadrez manuscritas usando redes neurais com mecanismos de atenção [Internet]. 2021 ;[citado 2026 mar. 01 ] Available from: https://www.teses.usp.br/teses/disponiveis/45/45134/tde-14012022-204025/ -
Vancouver
Hayashi SY. Leitura de planilhas de xadrez manuscritas usando redes neurais com mecanismos de atenção [Internet]. 2021 ;[citado 2026 mar. 01 ] Available from: https://www.teses.usp.br/teses/disponiveis/45/45134/tde-14012022-204025/
Informações sobre o DOI: 10.11606/D.45.2021.tde-14012022-204025 (Fonte: oaDOI API)
How to cite
A citação é gerada automaticamente e pode não estar totalmente de acordo com as normas
