Integração de dados transcriptômicos e metabolômicos de cana-de-açúcar (Saccharum spp.) por métodos de machine learning para predição fenotípica (2024)
- Authors:
- Autor USP: PATRÍCIO, ANDRÉ LUÍS - ESALQ
- Unidade: ESALQ
- Sigla do Departamento: LGN
- DOI: 10.11606/D.11.2024.tde-02082024-092421
- Subjects: APRENDIZADO COMPUTACIONAL; CANA-DE-AÇÚCAR; EXPRESSÃO GÊNICA; FENÓTIPOS; METABOLÔMICA; TRANSCRIÇÃO GÊNICA
- Agências de fomento:
- Language: Português
- Abstract: A cana-de-açúcar, uma gramínea poliploide, é crucial na conversão de energia solar em energia química e na produção de açúcar e bioetanol. Seu melhoramento tem focado em aumentar a sacarose e a eficiência de moagem. As variedades modernas originam-se de cruzamentos entre S. officinarum e S. spontaneum, e têm um genoma complexo, poliploide e aneuploide. Tecnologias ômicas, como transcriptômica e metabolômica, são fundamentais para entender mecanismos biológicos e aprimorar as cultivares. A integração de dados dessas tecnologias ajuda a identificar genes chave para características desejáveis. Técnicas de Machine Learning (ML), como Random Forest (RF), Support Vector Machines (SVM), e Multilayer Perceptron (MLP), são promissoras na integração de dados multi-ômicos, auxiliando na criação de modelos preditivos. No experimento realizado na Sugar Research Burdekin Station, Queensland, em agosto de 2017, 24 cultivares híbridas foram plantadas e neste trabalho foram avaliados o transcriptoma e metaboloma. Amostras foram coletadas em 2018, analisadas para medir sólidos solúveis e açúcar total recuperável, e submetidas a RNA-seq. Na análise metabolômica, 73 metabólitos foram mensurados e analisados com o MetaboAnalyst 4.0. Para aprendizado de máquinas, testaram-se RF, SVM, e MLP. O MLP teve o maior poder preditivo. Em seguida, o método de integração de gradientes foi usado para identificar a importância dos genes em relação a cada metabólito. Finalmente, a análise de enriquecimentoutilizou o pacote GSEApy analisando termos de Gene Ontology para identificar padrões significativos. A análise de metabólitos agrupados permitiu uma compreensão aprofundada dos genes e vias metabólicas essenciais, relacionados a fotossíntese, incluindo plastoglobulos e plastídeos, clorofila nos complexos de captação de luz, a importância da membrana tilacoide e da membrana interna do cloroplasto e fixação de carbono em organismos fotossintéticos. Esses termos abrangem aspectos da fotossíntese C4 e a resposta da cana-de-açúcar a diferentes intensidades de luz. Também foram encontrados genes e vias metabólicas relacionadas ao apoplasto como metabolismo de frutose e manose, metabolismo de galactose e a via da glicólise e gluconeogênese. Além disso, os resultados apontaram para a significativa relação entre os genes identificados e processos vitais, como o metabolismo de nitrogênio e carbono, e síntese e armazenamento de sacarose. A síntese de pectina, o metabolismo de galactose e vias relacionadas à produção de fenilpropanoides demonstram que o modelo capturou informações importantes sobre a parede celular, bem como lignificação, demonstrando o potencial dessas descobertas para futuras aplicações no melhoramento de cultivares. O estudo demonstrou êxito no uso de aprendizado de máquinas, especificamente o Perceptron de multicamadas, para integrar dados de transcriptômica e metabolômica, revelando processos cruciais para o desenvolvimento da cana-de-açúcar e identificandocaracterísticas com potencial de melhoramento agronômico
- Imprenta:
- Publisher place: Piracicaba
- Date published: 2024
- Data da defesa: 24.04.2024
- Status:
- Artigo possui versão em acesso aberto em repositório (Green Open Access)
- Versão do Documento:
- Versão submetida (Pré-print)
- Acessar versão aberta:
-
ABNT
PATRÍCIO, André Luís. Integração de dados transcriptômicos e metabolômicos de cana-de-açúcar (Saccharum spp.) por métodos de machine learning para predição fenotípica. 2024. Dissertação (Mestrado) – Universidade de São Paulo, Piracicaba, 2024. Disponível em: https://teses.usp.br/teses/disponiveis/11/11137/tde-02082024-092421/. Acesso em: 12 abr. 2026. -
APA
Patrício, A. L. (2024). Integração de dados transcriptômicos e metabolômicos de cana-de-açúcar (Saccharum spp.) por métodos de machine learning para predição fenotípica (Dissertação (Mestrado). Universidade de São Paulo, Piracicaba. Recuperado de https://teses.usp.br/teses/disponiveis/11/11137/tde-02082024-092421/ -
NLM
Patrício AL. Integração de dados transcriptômicos e metabolômicos de cana-de-açúcar (Saccharum spp.) por métodos de machine learning para predição fenotípica [Internet]. 2024 ;[citado 2026 abr. 12 ] Available from: https://teses.usp.br/teses/disponiveis/11/11137/tde-02082024-092421/ -
Vancouver
Patrício AL. Integração de dados transcriptômicos e metabolômicos de cana-de-açúcar (Saccharum spp.) por métodos de machine learning para predição fenotípica [Internet]. 2024 ;[citado 2026 abr. 12 ] Available from: https://teses.usp.br/teses/disponiveis/11/11137/tde-02082024-092421/
Informações sobre a disponibilidade de versões do artigo em acesso aberto coletadas automaticamente via oaDOI API (Unpaywall).
Por se tratar de integração com serviço externo, podem existir diferentes versões do trabalho (como preprints ou postprints), que podem diferir da versão publicada.
How to cite
A citação é gerada automaticamente e pode não estar totalmente de acordo com as normas
