Exportar registro bibliográfico


Metrics:

Analysis and classification of human microbiomes: detection of bioindicators and optimization through machine learning (2025)

  • Authors:
  • Autor USP: KASMANAS, JONAS COELHO - ICMC
  • Unidade: ICMC
  • Sigla do Departamento: SME
  • DOI: 10.11606/T.55.2025.tde-13082025-104726
  • Subjects: ANÁLISE DE DADOS; BIOINFORMÁTICA; GENOMAS; BANCO DE DADOS; HOMEOSTASE; BANCO DE DADOS; DIETA
  • Keywords: Banco de dados metagenômico; Diet; Genome recovery; Human microbiome; MAGs; MAGs; Metagenomic database; Metagenômica; Metagenomics; Microbioma humano; Recuperação do genoma
  • Agências de fomento:
  • Language: Inglês
  • Abstract: Nossa compreensão dos microrganismos associados aos seres humanos evoluiu drasticamente desde que Theodor Escherich documentou pela primeira vez a Escherichia coli na flora intestinal de crianças saudáveis. Hoje, reconhecemos esses microrganismos como contribuintes essenciais para a homeostase humana. Entre as técnicas que surgiram para estudar esses microrganismos, a metagenômica permitiu o sequenciamento de todo o DNA em amostras ambientais sem a necessidade de cultivo. Particularmente, a recuperação de metagenome-assembled genomes (MAGs) permite a investigação direta de organismos não cultivados anteriormente, preservando seu contexto ambiental. A metagenômica resolvida por genoma permite a conexão do potencial funcional a microrganismos específicos, capturando adaptações genômicas sutis a contextos ecológicos específicos e fornecendo uma abordagem poderosa para identificar bioindicadores precisos com implicações para a epidemiologia, descoberta de medicamentos e medicina personalizada, por exemplo. No entanto, apesar desses avanços, a transformação de dados metagenômicos em percepções biológicas continua sendo um desafio. As inconsistências de metadados dificultam a seleção sistemática de amostras, a recuperação do genoma exige pipelines computacionais complexos e a natureza altamente dimensional dos dados metagenômicos complica a análise comparativa. Esta tese aborda esses desafios por meio de estruturas computacionais integradas que preenchem a lacuna crítica entre ageração exponencial de dados e as descobertas científicas, ao mesmo tempo em que avançam nossa compreensão da composição e da função do microbioma humano. Primeiro, desenvolvemos o HumanMetagenomeDB, um banco de dados com curadoria de metadados padronizados de 69.822 amostras de metagenoma humano em repositórios públicos. Esse recurso permitiu a seleção sistemática de amostras com base em características do hospedeiro, condições médicas e parâmetros técnicos, abordando uma barreira crítica para estudos comparativos em larga escala. Ele também revelou vieses geográficos significativos na amostragem do microbioma e lacunas na cobertura de doenças, destacando áreas que exigem foco adicional de pesquisa. Com base nesse fundamento, criamos o MuDoGeR (Multi-Domain Genome Recovery), um pipeline simplificado e reproduzível para a recuperação de genomas em escala, reduzindo as barreiras técnicas para não bioinformatas. Para garantir resultados confiáveis para estudos centrados no genoma, realizamos uma avaliação sistemática usando comunidades simuladas que revelaram fatores críticos que influenciam o sucesso da recuperação do genoma. Essa análise estabeleceu uma profundidade de sequenciamento ideal de 60 milhões de leituras e demonstrou que os métodos atuais podem atingir uma precisão de até 92%, destacando limitações específicas na recuperação de espécies estreitamente relacionadas. Expandindo os recursos de recuperação do genoma e para simplificar a análise genômica comparativa,desenvolvemos o gSpreadComp. Em particular, o gSpreadComp se concentra na análise de genes de resistência antimicrobiana (ARGs do inglês antimicrobial resistance genes) e fatores de virulência (VFs do inglês virulence factors). O gSpreadComp revelou que, embora os padrões gerais de resistência fossem semelhantes entre as dietas, surgiram diferenças específicas, como o aumento da resistência à tetraciclina em onívoros e a resistência elevada à bacitracina em veganos. Notavelmente, as dietas veganas e vegetarianas mostraram um potencial significativamente maior para a transferência horizontal de genes mediada por plasmídeos. O foco do gSpreadComp é orientar os pesquisadores na geração de hipóteses testáveis. O ponto culminante desse trabalho é uma abordagem para a seleção de recursos biologicamente interpretáveis que combina a redução de dimensionalidade baseada em autoencoder com o agrupamento de densidade para codificar o potencial funcional dos MAGs. Ao desenvolver essa abordagem, também reunimos uma coleção abrangente de 514.932 MAGs procarióticos do microbioma humano, representando 6.763 espécies bacterianas e 31 espécies de arqueas. A plataforma interativa resultante, orientada por AutoML, permite que os pesquisadores explorem os padrões do microbioma, gerem hipóteses e selecionem MAGs relevantes para uma investigação mais aprofundada. Naturalmente, as estruturas e os bancos de dados desenvolvidos aqui contribuem para transformar dados metagenômicos em percepçõesbiológicas. No entanto, a evolução em direção a uma aplicação mais integrativa e translacional de dados metagenômicos é um desafio.
  • Imprenta:
  • Data da defesa: 08.07.2025
  • Acesso à fonteAcesso à fonteDOI
    Informações sobre o DOI: 10.11606/T.55.2025.tde-13082025-104726 (Fonte: oaDOI API)
    • Este periódico é de acesso aberto
    • Este artigo é de acesso aberto
    • URL de acesso aberto
    • Cor do Acesso Aberto: gold
    • Licença: cc-by-nc-sa

    How to cite
    A citação é gerada automaticamente e pode não estar totalmente de acordo com as normas

    • ABNT

      KASMANAS, Jonas Coelho e ROCHA, Ulisses Nunes da. Analysis and classification of human microbiomes: detection of bioindicators and optimization through machine learning. 2025. Tese (Doutorado) – Universidade de São Paulo, São Carlos, 2025. Disponível em: https://www.teses.usp.br/teses/disponiveis/55/55134/tde-13082025-104726/. Acesso em: 29 dez. 2025.
    • APA

      Kasmanas, J. C., & Rocha, U. N. da. (2025). Analysis and classification of human microbiomes: detection of bioindicators and optimization through machine learning (Tese (Doutorado). Universidade de São Paulo, São Carlos. Recuperado de https://www.teses.usp.br/teses/disponiveis/55/55134/tde-13082025-104726/
    • NLM

      Kasmanas JC, Rocha UN da. Analysis and classification of human microbiomes: detection of bioindicators and optimization through machine learning [Internet]. 2025 ;[citado 2025 dez. 29 ] Available from: https://www.teses.usp.br/teses/disponiveis/55/55134/tde-13082025-104726/
    • Vancouver

      Kasmanas JC, Rocha UN da. Analysis and classification of human microbiomes: detection of bioindicators and optimization through machine learning [Internet]. 2025 ;[citado 2025 dez. 29 ] Available from: https://www.teses.usp.br/teses/disponiveis/55/55134/tde-13082025-104726/


Digital Library of Intellectual Production of Universidade de São Paulo     2012 - 2025