Exportar registro bibliográfico


Métricas:

Análise de dependência entre posições de bases de sequências motivos de fatores de transcrição aplicada à comparação de modelos baseados em Position Weight Matrix e Gramática Regular Estocástica (2021)

  • Autores:
  • Autor USP: LAVEZZO, GUILHERME MIURA - BIOINFORMÁTICA
  • Unidade: BIOINFORMÁTICA
  • DOI: 10.11606/D.95.2021.tde-18012022-104802
  • Assuntos: REGULAÇÃO GÊNICA; FATORES DE TRANSCRIÇÃO; DNA
  • Palavras-chave do autor: ChIP-seq; Gramáticas Regulares Estocásticas; Position Weight Matrix; Position Weighted Matrix; Predição in silico; Prediction in silico; Stios de ligação de fatores de transcrição; Stochastic regular grammars (SRG); Transcription Factor Binding Sites
  • Agências de fomento:
  • Idioma: Português
  • Resumo: Para elucidar os mecanismos de regulação transcricional, é essencial determinar acuradamente a interação entre DNA e fatores de transcrição (FT). Embora FTs mantenham certa especificidade em reconhecer sequências curtas de DNA, os stios de ligação de fatores de transcrição (SLFT) são sequências degeneradas. Técnicas experimentais high throughput in vivo, como ChIP-seq, ainda que muito utilizadas, identificam regiões de 100-600 pares de bases (pb), enquanto FTs geralmente se ligam a sequências de 6-15 pb. Por outro lado, técnicas experimentais in vitro, apesar de avaliarem a interação FT-DNA com maior resolução, não correspondem às condições fisiológicas em que ocorrem a regulação transcricional. O padrão de reconhecimento de DNA mais provável que interage com um FT, ou seja o motivo do FT, precisa ser descoberto a partir de sequências maiores de DNA, obtidas experimentalmente e em grande volume. Existem diversos algoritmos que se encarregam de descobrir motivos, porém esses algoritmos divergem em considerar ou não dependência entre bases, questão essa ainda em aberto na comunidade cientfica. Com o motivo descoberto, geralmente deseja-se obter representações do mesmo ao longo de genoma ou região genômica de interesse e, para isso, é necessário um modelo preditor de SLFTs. Existem também diversos modelos computacionais que procuram predizer SLFTs de tamanhos exatos. No entanto, devido ao curto tamanho dos stios, tais modelos tendem a produzir muitos falsos positivos,dificultando uma interpretação biológica acurada do contexto biológico. Além disso, nenhum modelo preditor excede os demais em todos os casos, tornando a escolha de um melhor modelo caso-especfica para cada FT de interesse. Considerando as diversas combinações entre o tipo de experimento e o algoritmo de descoberta de motivos, a tarefa de escolher o melhor modelo preditor de SLFTs não é trivial. O modelo mais utilizado para predição de SLFT são PWMs (Position Weight Matrix ), que assumem independência entre as bases do stio, o que pode não ser verdadeiro para determinados fatores de transcrição. Gramáticas regulares estocásticas (GRE) são uma alternativa às PWMs, pois são modelos que conseguem capturar uma relação de dependência entre posições de bases. Considerando esse problema, foi possvel escolher pelo modelo PWM ou GRE baseando-se apenas no conjunto amostral de SLFTs obtidos e em novas medidas de dependências propostas. Com o cálculo dessas medidas, foi possível criar uma regra de decisão, via árvore de decisão, que opte pelo melhor modelo de maneira que garanta seu desempenho
  • Imprenta:
  • Data da defesa: 20.12.2021
  • Acesso à fonteAcesso à fonteDOI
    Informações sobre o DOI: 10.11606/D.95.2021.tde-18012022-104802 (Fonte: oaDOI API)
    • Este periódico é de acesso aberto
    • Este artigo é de acesso aberto
    • URL de acesso aberto
    • Cor do Acesso Aberto: gold
    • Licença: cc-by-nc-sa

    Como citar
    A citação é gerada automaticamente e pode não estar totalmente de acordo com as normas

    • ABNT

      LAVEZZO, Guilherme Miura. Análise de dependência entre posições de bases de sequências motivos de fatores de transcrição aplicada à comparação de modelos baseados em Position Weight Matrix e Gramática Regular Estocástica. 2021. Dissertação (Mestrado) – Universidade de São Paulo, São Paulo, 2021. Disponível em: https://www.teses.usp.br/teses/disponiveis/95/95131/tde-18012022-104802/. Acesso em: 29 set. 2024.
    • APA

      Lavezzo, G. M. (2021). Análise de dependência entre posições de bases de sequências motivos de fatores de transcrição aplicada à comparação de modelos baseados em Position Weight Matrix e Gramática Regular Estocástica (Dissertação (Mestrado). Universidade de São Paulo, São Paulo. Recuperado de https://www.teses.usp.br/teses/disponiveis/95/95131/tde-18012022-104802/
    • NLM

      Lavezzo GM. Análise de dependência entre posições de bases de sequências motivos de fatores de transcrição aplicada à comparação de modelos baseados em Position Weight Matrix e Gramática Regular Estocástica [Internet]. 2021 ;[citado 2024 set. 29 ] Available from: https://www.teses.usp.br/teses/disponiveis/95/95131/tde-18012022-104802/
    • Vancouver

      Lavezzo GM. Análise de dependência entre posições de bases de sequências motivos de fatores de transcrição aplicada à comparação de modelos baseados em Position Weight Matrix e Gramática Regular Estocástica [Internet]. 2021 ;[citado 2024 set. 29 ] Available from: https://www.teses.usp.br/teses/disponiveis/95/95131/tde-18012022-104802/

    Últimas obras dos mesmos autores vinculados com a USP cadastradas na BDPI:

Biblioteca Digital de Produção Intelectual da Universidade de São Paulo     2012 - 2024