Biologia computacional aplicada para a análise de dados em larga escala (2013)
- Authors:
- Autor USP: OLIVEIRA, DANIELE YUMI SUNAGA DE - IB
- Unidade: IB
- Sigla do Departamento: BIO
- Subjects: EXPRESSÃO GÊNICA; BIOINFORMÁTICA; ANÁLISE DE DADOS
- Keywords: Dados em larga escala; Gene expression; Genome sequences; High-throughput data; Sequências genômicas
- Language: Português
- Abstract: A enorme quantidade de dados que vem sendo gerada por tecnologias modernas de biologia representam um grande desafio para áreas como a bioinformática. Há uma série de programas disponíveis para a análise destes dados, mas que nem sempre são compreendidos o suficiente para serem corretamente aplicados, ou ainda, há problemas que requerem o desenvolvimento de novas soluções. Neste trabalho, nós apresentamos a análise de dados de duas das principais fontes de dados em larga escala: microarrays e sequenciamento. Na primeira, avaliamos se a estatística do método Rank Products (RP) é adequada para a identificação de genes diferencialmente expressos em estudos de doenças complexas, cujo uma das características é a heterogeneidade genética entre indivíduos com o mesmo fenótipo. Na segunda, desenvolvemos uma ferramenta chamada hunT para buscar por genes alvos do fator de transcrição T - um importante marcador de mesoderma com papel chave no desenvolvimento de vertebrados -, através da identificação de sítios de ligação para o T em suas sequências reguladoras. O desempenho do RP foi testado usando dados simulados e dados reais de um estudo de fissura lábio-palatina não-sindrômica, de autismo e também de um estudo que avalia o efeito da privação do sono em humanos. Nossos resultados mostraram que o RP é uma solução eficiente para detectar genes consistentemente desregulados em somente um subgrupo de pacientes, que esta habilidade é mantida com poucas amostras, mas que o seu desempenhoé prejudicado quando são analisados poucos genes. Obtivemos fortes evidências biológicas da eficiência do método nos estudos com dados reais através da identificação de genes e vias previamente associados às doenças e da validação de novos genes candidatos através da técnica de PCR quantitativo em tempo real. Já o programa hunT identificou 4.602 genes de camundongo com o sítio de ligação para o domínio do T, sendo alguns deles já demonstrados experimentalmente. Identificamos 32 destes genes com expressão alterada em um estudo onde avaliamos o transcriptoma da diferenciação in vitro de células tronco embrionárias de camundongo para mesoderma, sugerindo a participação destes genes neste processo sendo regulados pelo T
- Imprenta:
- Data da defesa: 16.04.2013
-
ABNT
OLIVEIRA, Daniele Yumi Sunaga de. Biologia computacional aplicada para a análise de dados em larga escala. 2013. Tese (Doutorado) – Universidade de São Paulo, São Paulo, 2013. Disponível em: http://www.teses.usp.br/teses/disponiveis/41/41131/tde-28082013-094721/. Acesso em: 16 set. 2024. -
APA
Oliveira, D. Y. S. de. (2013). Biologia computacional aplicada para a análise de dados em larga escala (Tese (Doutorado). Universidade de São Paulo, São Paulo. Recuperado de http://www.teses.usp.br/teses/disponiveis/41/41131/tde-28082013-094721/ -
NLM
Oliveira DYS de. Biologia computacional aplicada para a análise de dados em larga escala [Internet]. 2013 ;[citado 2024 set. 16 ] Available from: http://www.teses.usp.br/teses/disponiveis/41/41131/tde-28082013-094721/ -
Vancouver
Oliveira DYS de. Biologia computacional aplicada para a análise de dados em larga escala [Internet]. 2013 ;[citado 2024 set. 16 ] Available from: http://www.teses.usp.br/teses/disponiveis/41/41131/tde-28082013-094721/
How to cite
A citação é gerada automaticamente e pode não estar totalmente de acordo com as normas