Exploration of non-coding RNA in complex microbial communities with machine learning (2024)
- Authors:
- Autor USP: SANTOS, ANDERSON PAULO AVILA - ICMC
- Unidade: ICMC
- Sigla do Departamento: SME
- DOI: 10.11606/T.55.2024.tde-19082024-091042
- Subjects: APRENDIZADO COMPUTACIONAL; RNA; METADADOS; BIOGEOGRAFIA; BIOINFORMÁTICA
- Keywords: Análise de ncRNA; Aprendizado profundo; Aprendizado profundo híbrido; Classificação de ncRNA; Deep learning; Feature selection; Hybrid deep learning; Metadata; Metagenômica; Metagenomics; ncRNA analysis; ncRNA classification; Seleção de características
- Language: Inglês
- Abstract: Com a ascensão das tecnologias de alto rendimento, uma nova era na análise de sistemas biológicos complexos foi inaugurada, empregando técnicas avançadas de aprendizado de máquina para desvendar as interações intrincadas dentro da biologia de sistemas. Esta pesquisa concentra- se especialmente na análise de dados metagenômicos e na classificação de RNA não codificante (ncRNA), elementos cruciais para entender os mecanismos regulatórios em diversos processos biológicos. Foram desenvolvidos dois bancos de dados de metadados especializados, o MarineMetage- nomeDB e o AnimalAssociatedMetagenomeDB, para aprimorar a pesquisa em biogeografia microbiana e funções microbianas associadas a animais, abordando os desafios frequentemente encontrados devido a metadados mal anotados em repositórios públicos. Essas plataformas facilitam a identificação e utilização de conjuntos de dados metagenômicos de maneira mais eficaz e precisa. Um aspecto central do estudo é a implementação do BioDeepFuse, uma inovação no campo do aprendizado de máquina que integra técnicas de aprendizado profundo e extração de característi- cas para aprimorar a classificação de sequências de ncRNA. Este método demonstrou melhorias significativas na precisão da classificação de ncRNA, validado contra conjuntos de dados de referência e amostras reais, reforçando sua utilidade em aplicações práticas. A pesquisa também enfatiza a importância de abordagens integrativas para análises multi-ômicas, combinando extensosconjuntos de dados com técnicas sofisticadas de aprendizado de máquina. Esta abordagem permite uma compreensão mais profunda das comunidades microbianas com- plexas e promove a adoção de práticas que garantem a acessibilidade e reutilização dos dados, alinhadas aos princípios FAIR. Por fim, temos uma plataforma web que oferece acesso a uma vasta coleção de sequências de ncRNA preditas, facilitando o processo de análise de sequên- cias de ácidos nucleicos. Essa ferramenta ajuda a superar barreiras tradicionais em pesquisa computacional, promovendo um ambiente de pesquisa mais conectado e inclusivo.
- Imprenta:
- Publisher place: São Carlos
- Date published: 2024
- Data da defesa: 10.06.2024
- Este periódico é de acesso aberto
- Este artigo é de acesso aberto
- URL de acesso aberto
- Cor do Acesso Aberto: gold
- Licença: cc-by-nc-sa
-
ABNT
SANTOS, Anderson Paulo Avila. Exploration of non-coding RNA in complex microbial communities with machine learning. 2024. Tese (Doutorado) – Universidade de São Paulo, São Carlos, 2024. Disponível em: https://www.teses.usp.br/teses/disponiveis/55/55134/tde-19082024-091042/. Acesso em: 29 dez. 2025. -
APA
Santos, A. P. A. (2024). Exploration of non-coding RNA in complex microbial communities with machine learning (Tese (Doutorado). Universidade de São Paulo, São Carlos. Recuperado de https://www.teses.usp.br/teses/disponiveis/55/55134/tde-19082024-091042/ -
NLM
Santos APA. Exploration of non-coding RNA in complex microbial communities with machine learning [Internet]. 2024 ;[citado 2025 dez. 29 ] Available from: https://www.teses.usp.br/teses/disponiveis/55/55134/tde-19082024-091042/ -
Vancouver
Santos APA. Exploration of non-coding RNA in complex microbial communities with machine learning [Internet]. 2024 ;[citado 2025 dez. 29 ] Available from: https://www.teses.usp.br/teses/disponiveis/55/55134/tde-19082024-091042/ - Knowledge tracing unplugged: from data collection to model deployment
- The AnimalAssociatedMetagenomeDB reveals a bias towards livestock and developed countries and blind spots in functional-potential studies of animal-associated microbiomes
- MarineMetagenomeDB: a public repository for curated and standardized metadata for marine metagenomes
- BioDeepfuse: a hybrid deep learning approach with integrated feature extraction techniques for enhanced non-coding RNA classification
- BioAutoML: automated feature engineering and metalearning to predict noncoding RNAs in bacteria
- Information theory for biological sequence classification: a novel feature extraction technique based on Tsallis entropy
- Feature importance analysis of non-coding DNA/RNA sequences based on machine learning approaches
- Personalization improves gamification: evidence from a mixed-methods study
- Gamification works, but how and to whom?: An experimental study in the context of programming lessons
Informações sobre o DOI: 10.11606/T.55.2024.tde-19082024-091042 (Fonte: oaDOI API)
How to cite
A citação é gerada automaticamente e pode não estar totalmente de acordo com as normas
