Unsupervised natural language processing in the identification of patients with suspected COVID-19 infection (2023)
- Authors:
- USP affiliated authors: PAZIN FILHO, ANTONIO - FMRP ; SILVA, RILDO PINTO DA - FMRP
- Unidade: FMRP
- DOI: 10.1590/0102-311XPT243722
- Subjects: COVID-19; PROCESSAMENTO DE LINGUAGEM NATURAL; ATENÇÃO À SAÚDE; SELEÇÃO DE PACIENTES; INSTITUIÇÕES PRIVADAS DE SAÚDE; ASSISTÊNCIA MÉDICA
- Keywords: Natural language processing; Health care; Selection criteria; Procesamiento de lenguaje natural; Atención a la salud; Criterios de seleción de pacientes; Instituciones privadas de salud
- Language: Inglês
- Abstract: Os pacientes com síndrome pós-COVID-19 se beneficiam de programas de promoção de saúde e sua rápida identificação é importante para a utilização custo efetiva desses programas. Técnicas tradicionais de identificação têm fraco desempenho, especialmente em pandemias. Portanto, foi realizado um estudo observacional descritivo utilizando 105.008 autorizações prévias pagas por operadora privada de saúde com aplicação de método não supervisionado de processamento de linguagem natural por modelagem de tópicos para identificação de pacientes suspeitos de infecção por COVID-19. Foram gerados seis modelos: três utilizando o algoritmo BERTopic e três modelos Word2Vec. O modelo BERTopic cria automaticamente grupos de doenças. Já no modelo Word2Vec, para definição dos tópicos relacionados a COVID-19, foi necessária análise manual dos 100 primeiros casos de cada tópico. O modelo BERTopic com mais de 1.000 autorizações por tópico sem tratamento de palavras selecionou pacientes mais graves – custo médio por autorizações prévias paga de BRL 10.206 e gasto total de BRL 20,3 milhões (5,4%) em 1.987 autorizações prévias (1,9%). Teve 70% de acerto comparado à análise humana e 20% de casos com potencial interesse, todos passíveis de análise para inclusão em programa de promoção à saúde. Teve perda importante de casos quando comparado ao modelo tradicional de pesquisa com linguagem estruturada e identificou outros grupos de doenças – ortopédicas, mentais e câncer. O modelo BERTopic serviu como método exploratório a ser utilizado na rotulagem de casos e posterior aplicação em modelos supervisionados. A identificação automática de outras doenças levanta questionamentos éticos sobre o tratamento de informações em saúde por aprendizado de máquina
- Imprenta:
- Publisher place: Rio de Janeiro
- Date published: 2023
- Source:
- Título: Cadernos de Saúde Pública
- ISSN: 1678-4464
- Volume/Número/Paginação/Ano: v. 39, n. 11, art. e00243722, p. 1-28, 2023
- Este periódico é de acesso aberto
- Este artigo NÃO é de acesso aberto
-
ABNT
SILVA, Rildo Pinto da e POLLETTINI, Juliana Tarossi e PAZIN FILHO, Antônio. Unsupervised natural language processing in the identification of patients with suspected COVID-19 infection. Cadernos de Saúde Pública, v. 39, n. 11, p. 1-28, 2023Tradução . . Disponível em: https://doi.org/10.1590/0102-311XPT243722. Acesso em: 03 mar. 2026. -
APA
Silva, R. P. da, Pollettini, J. T., & Pazin Filho, A. (2023). Unsupervised natural language processing in the identification of patients with suspected COVID-19 infection. Cadernos de Saúde Pública, 39( 11), 1-28. doi:10.1590/0102-311XPT243722 -
NLM
Silva RP da, Pollettini JT, Pazin Filho A. Unsupervised natural language processing in the identification of patients with suspected COVID-19 infection [Internet]. Cadernos de Saúde Pública. 2023 ; 39( 11): 1-28.[citado 2026 mar. 03 ] Available from: https://doi.org/10.1590/0102-311XPT243722 -
Vancouver
Silva RP da, Pollettini JT, Pazin Filho A. Unsupervised natural language processing in the identification of patients with suspected COVID-19 infection [Internet]. Cadernos de Saúde Pública. 2023 ; 39( 11): 1-28.[citado 2026 mar. 03 ] Available from: https://doi.org/10.1590/0102-311XPT243722 - Anonimização de textos médicos com processamento de linguagem natural
- Taxa e custos médicos diretos de cesáreas em beneficiárias da saúde suplementar no estado de São Paulo, Brasil: 2015 a 2021
- Mineração de dados aplicada na base de internação da saúde suplementar do estado de São Paulo: estudo de caso da via de parto
- Princípios de prescrição médica hospitalar para estudantes de medicina
- Gestão de recursos em terapia intensiva: aplicação de um sistema de informação para organização da fila
- Heart failure disease management program experience in 4,545 heart failure admissions to a community hospital
- Prognostic value of MMP-9 -1562 C/T gene polymorphism in patients with sepsis
- Reversal of refractory severe lactic acidosis by thiamine replacement
- Análise do impacto orçamentário causado pela implantação de assinatura digital no Hospital das Clínicas da Faculdade de Medicina de Ribeirão Preto da Universidade de São Paulo
- HC ampliará Unidade de Emergência.[Entrevista a Luís Ribeiro]
Informações sobre o DOI: 10.1590/0102-311XPT243722 (Fonte: oaDOI API)
Download do texto completo
| Tipo | Nome | Link | |
|---|---|---|---|
| 003201696.pdf | Direct link |
How to cite
A citação é gerada automaticamente e pode não estar totalmente de acordo com as normas
