Vector representation of texts applied to prediction models (2020)
- Authors:
- Autor USP: STERN, DEBORAH BASSI - Interinstitucional de Pós-Graduação em Estatística
- Unidade: Interinstitucional de Pós-Graduação em Estatística
- Sigla do Departamento: SME
- Subjects: PROCESSAMENTO DE LINGUAGEM NATURAL; REDES NEURAIS; PREDIÇÃO; SINTAXE E SEMÂNTICA DA LINGUAGEM NATURAL; SEMÂNTICA DA PALAVRA; ESTATÍSTICA DESCRITIVA
- Keywords: Natural language processing; Neural networks; Prediction models; Representação vetorial de palavras; WordVectors
- Agências de fomento:
- Language: Inglês
- Abstract: Processamento de linguagem natural sofreu uma grande mudança com o tempo. Abordagens estatísticas passaram a ganhar atenção apenas recentemente. O modelo word2vec é uma destas. Ele é uma rede neural rasa desenhada para ajustar representações vetoriais de palavras segundo seus valores semânticos e sintáticos. As representações de palavras obtidas por este método são o estado da arte. Este método tem muitas aplicações, como permitir o ajuste de modelos preditivos baseadas em textos. Na literatura é comum um texto ser representado pela média das representações vetorias das palavras que o compõem. O vetor resultante é então incluído como variável explicativa no modelo. Nesta dissertação propomos a obtenção de mais informação sobre o texto através de outras estatísticas descritivas além da média, como outros momentos e quantis. A melhora dos modelos preditivos é estudada com dados reais.
- Imprenta:
- Publisher place: São Carlos
- Date published: 2020
- Data da defesa: 09.03.2020
-
ABNT
STERN, Deborah Bassi. Vector representation of texts applied to prediction models. 2020. Dissertação (Mestrado) – Universidade de São Paulo, São Carlos, 2020. Disponível em: https://www.teses.usp.br/teses/disponiveis/104/104131/tde-10062020-102333/. Acesso em: 28 dez. 2025. -
APA
Stern, D. B. (2020). Vector representation of texts applied to prediction models (Dissertação (Mestrado). Universidade de São Paulo, São Carlos. Recuperado de https://www.teses.usp.br/teses/disponiveis/104/104131/tde-10062020-102333/ -
NLM
Stern DB. Vector representation of texts applied to prediction models [Internet]. 2020 ;[citado 2025 dez. 28 ] Available from: https://www.teses.usp.br/teses/disponiveis/104/104131/tde-10062020-102333/ -
Vancouver
Stern DB. Vector representation of texts applied to prediction models [Internet]. 2020 ;[citado 2025 dez. 28 ] Available from: https://www.teses.usp.br/teses/disponiveis/104/104131/tde-10062020-102333/ - Relatório de análise estatística sobre o projeto "equivalência entre as avaliações realizadas por professores e alunos da Pós-Graduação"
- Relatório de análise estatística sobre o projeto "associação entre os achados clínicos e os achados histopatológicos encontrados nas valvas cardíacas excisadas cirurgicamente de pacientes com endocardite infecciosa"
How to cite
A citação é gerada automaticamente e pode não estar totalmente de acordo com as normas