Exportar registro bibliográfico


Metrics:

Identificação de genes novos de Drosophila utilizando machine learning (2022)

  • Authors:
  • Autor USP: GOLDSTEIN, GABRIEL NASSAR REICH - IB
  • Unidade: IB
  • Sigla do Departamento: BIO
  • DOI: 10.11606/T.41.2022.tde-09062022-181940
  • Subjects: GENES; GENOMAS; APRENDIZADO COMPUTACIONAL; DROSOPHILA
  • Keywords: Aprendizado de máquina; Genes novos; Genomas; Genomes; Machine learning; New genes; Transcriptomas; Transcriptomes
  • Agências de fomento:
  • Language: Português
  • Abstract: Genes novos são definidos por sua presença em um táxon e ausência em táxons irmãos. Estes genes possuem grande importância biológica e estão envolvidos em processos de alta pressão seletiva, sendo expressos em tecidos como cérebro e testículo. Há uma variedade de mecanismos genéticos que podem levar à geração de genes novos, como duplicações e retrotransposições por exemplo, mas a maioria dos genes novos é derivada de duplicações. As funções exatas destes genes nos organismos ainda estão sendo estudadas, mas alguns trabalhos já mostraram relação com resolução de conflitos sexuais, por exemplo. Apesar disto, existem uma série de características biológicas que são sabidamente diferentes entre genes novos e antigos. Um exemplo disso é o perfil de expressão destes grupos, já que genes novos se expressam majoritariamente na gametogênese masculina e genes antigos são expressos de maneira generalista. O principal método de datação de genes para identificação de genes novos utiliza sintenia, que é o fenômeno de conservação da ordem e conteúdo gênico de uma região no genoma que ocorre em espécies relacionadas, e parcimônia ao comparar genomas de espécies relacionadas para datar todos os genes de uma espécie focal. Apesar da precisão do método, ele é extremamente dependente da montagem e anotação do genoma de interesse, o que limita sua aplicação para espécies modelo que tem uma anotação manual e curada.Com estes fatos em mente, propomos neste trabalho um método de identificação de genes novos que utiliza informações biológicas para separar genes novos de antigos através do uso de machine learning. Os algoritmos de machine learning são aqueles capazes de mudar com experiência e são capazes de identificar padrões complexos e identificar classes a partir de uma diversidade de informações. Com isso, treinamos um modelo com o algoritmo de random forest na espécie modelo Drosophila melanogaster e obtivemos 0.508 de precision e 0.718 de recall com dados que geramos. Além disso, identificamos os 1523 genes novos de D. pseudoobscura utilizando o método já existente para que possamos utilizar esta espécie como segundo ponto de controle do nosso método.
  • Imprenta:
  • Data da defesa: 05.04.2022
  • Acesso à fonteAcesso à fonteDOI
    Informações sobre o DOI: 10.11606/T.41.2022.tde-09062022-181940 (Fonte: oaDOI API)
    • Este periódico é de acesso aberto
    • Este artigo é de acesso aberto
    • URL de acesso aberto
    • Cor do Acesso Aberto: gold
    • Licença: cc-by-nc-sa

    How to cite
    A citação é gerada automaticamente e pode não estar totalmente de acordo com as normas

    • ABNT

      GOLDSTEIN, Gabriel Nassar Reich. Identificação de genes novos de Drosophila utilizando machine learning. 2022. Tese (Doutorado) – Universidade de São Paulo, São Paulo, 2022. Disponível em: https://www.teses.usp.br/teses/disponiveis/41/41131/tde-09062022-181940/. Acesso em: 04 out. 2024.
    • APA

      Goldstein, G. N. R. (2022). Identificação de genes novos de Drosophila utilizando machine learning (Tese (Doutorado). Universidade de São Paulo, São Paulo. Recuperado de https://www.teses.usp.br/teses/disponiveis/41/41131/tde-09062022-181940/
    • NLM

      Goldstein GNR. Identificação de genes novos de Drosophila utilizando machine learning [Internet]. 2022 ;[citado 2024 out. 04 ] Available from: https://www.teses.usp.br/teses/disponiveis/41/41131/tde-09062022-181940/
    • Vancouver

      Goldstein GNR. Identificação de genes novos de Drosophila utilizando machine learning [Internet]. 2022 ;[citado 2024 out. 04 ] Available from: https://www.teses.usp.br/teses/disponiveis/41/41131/tde-09062022-181940/

    Últimas obras dos mesmos autores vinculados com a USP cadastradas na BDPI:

Digital Library of Intellectual Production of Universidade de São Paulo     2012 - 2024