Modelo de avaliação de conjuntos de dados científicos por meio da dimensão de veracidade dos dados (2018)
- Authors:
- Autor USP: BATISTA, ANDRÉ FILIPE DE MORAES - EP
- Unidade: EP
- Sigla do Departamento: PCS
- Subjects: BIG DATA; ANÁLISE DE DADOS; DADOS CINÉTICOS
- Language: Português
- Abstract: A ciência é uma organização social: grupos de colaboração independentes trabalham para gerar conhecimento como um bem público. A credibilidade dos trabalhos científicos está enraizada nas evidências que os suportam, as quais incluem a metodologia aplicada, os dados adquiridos e os processos para execução dos experimentos, da análise de dados e da interpretação dos resultados obtidos. O dilúvio de dados sob o qual a atual ciência está inserida revoluciona a forma como as pesquisas são realizadas, resultando em um novo paradigma de ciência baseada em dados. Sob tal paradigma, novas atividades são inseridas no método científico de modo a organizar o processo de geração, curadoria e publicação de dados, beneficiando a comunidade científica com o reuso de conjuntos de dados científicos e a reprodutibilidade de experimentos. Nesse contexto, novas abordagens para a resolução de problemas estão sendo apresentadas, obtendo resultados que antes eram considerados de relevante dificuldade, bem como possibilitando a geração de novos conhecimentos. Diversos portais estão disponibilizando conjuntos de dados resultantes de pesquisas científicas. Todavia, tais portais pouco abordam o contexto sobre os quais os conjuntos de dados foram criados, dificultando a compreensão sobre os dados e abrindo espaço para o uso indevido ou uma interpretação errônea. Poucas são as literaturas que abordam essa problemática, deixando o foco para outros temas que lidam com o volume, a variedade e a velocidade dos dados. Essa pesquisa objetivou definir um modelo de avaliação de conjuntos de dados científicos, por meio da construção de um perfil de aplicação, o qual padroniza a descrição de conjuntos de dados científicos. Essa padronização da descrição é baseada no conceito de dimensão de Veracidade dos dados, definido ao longo da pesquisa, epermite o desenvolvimento de métricas que formam o índice de veracidade de conjuntos de dados científicos. Tal índice busca refletir o nível de detalhamento de um conjunto de dados, com base no uso dos elementos de descrição, que facilitarão o reuso dos dados e a reprodutibilidade dos experimentos científicos. O índice possui duas dimensões: a dimensão intrínseca aos dados, a qual pode ser utilizada como critério de admissão de conjunto de dados em portais de publicação de dados; e a dimensão social, mensurando a adequabilidade de um conjunto de dados para uso em uma área de pesquisa ou de aplicação, por meio da avaliação da comunidade científica. Para o modelo de avaliação proposto, um estudo de caso foi desenvolvido, descrevendo um conjunto de dados proveniente de um projeto científico internacional, o projeto GoAmazon, de modo a validar o modelo proposto entre os pares, demonstrando o potencial da solução no apoio ao reuso dos dados, podendo ser incorporado em portais de dados científicos.
- Imprenta:
- Data da defesa: 06.11.2018
-
ABNT
BATISTA, André Filipe de Moraes. Modelo de avaliação de conjuntos de dados científicos por meio da dimensão de veracidade dos dados. 2018. Tese (Doutorado) – Universidade de São Paulo, São Paulo, 2018. Disponível em: http://www.teses.usp.br/teses/disponiveis/3/3141/tde-04022019-100307/. Acesso em: 27 dez. 2025. -
APA
Batista, A. F. de M. (2018). Modelo de avaliação de conjuntos de dados científicos por meio da dimensão de veracidade dos dados (Tese (Doutorado). Universidade de São Paulo, São Paulo. Recuperado de http://www.teses.usp.br/teses/disponiveis/3/3141/tde-04022019-100307/ -
NLM
Batista AF de M. Modelo de avaliação de conjuntos de dados científicos por meio da dimensão de veracidade dos dados [Internet]. 2018 ;[citado 2025 dez. 27 ] Available from: http://www.teses.usp.br/teses/disponiveis/3/3141/tde-04022019-100307/ -
Vancouver
Batista AF de M. Modelo de avaliação de conjuntos de dados científicos por meio da dimensão de veracidade dos dados [Internet]. 2018 ;[citado 2025 dez. 27 ] Available from: http://www.teses.usp.br/teses/disponiveis/3/3141/tde-04022019-100307/ - Predictors of tooth loss: A machine learning approach
- Physician preference for receiving machine learning predictive results: A cross-sectional multicentric study
- Data leakage in health outcomes prediction with machine learning
- Neonatal mortality prediction with routinely collected data: a machine learning approach
- A multipurpose machine learning approach to predict COVID-19 negative prognosis in São Paulo, Brazil
- Data-driven decision making for the screening of cognitive impairment in primary care: a machine learning approach using data from the ELSA-Brasil study
- Cause-specific mortality prediction in older residents of São Paulo, Brazil: a machine learning approach
How to cite
A citação é gerada automaticamente e pode não estar totalmente de acordo com as normas
