Semi-supervised learning approaches with applications in Medicinal Chemistry (2019)
- Autor:
- Autor USP: GERTRUDES, JADSON CASTRO - ICMC
- Unidade: ICMC
- Sigla do Departamento: SCC
- Subjects: BIG DATA; FRAMEWORKS; QUÍMICA MÉDICA; APRENDIZADO COMPUTACIONAL; ESTRUTURA QUÍMICA
- Keywords: Agrupamento baseado em densidade; Agrupamento semissupervisionado; Análise de relação entre estrutura química e atividade biológica; Classificação semissupervisionada; Density- based clustering; Semi-supervised classification; Semi-supervised clustering; Structure-activity relationship
- Agências de fomento:
- Language: Inglês
- Abstract: O aprendizado semissupervisionado obteve, no decorrer do tempo, cada vez mais significância na área de big data, uma vez que a lacuna entre a abundância de dados não rotulados coletados de forma rápida e barada e a escassez de dados rotulados que são trabalhosos e caros de obter, está aumentando drasticamente. No presente documento, apresentamos uma visão unificada dos algoritmos de agrupamento baseados em densidade. Depois, utilizamos essa visão unificada para construção de uma ponte entre as áreas de agrupamento e classificação semissupervisionadas. Mostramos que existem relações entre algoritmos de agrupamento baseados em densidade e a abordagem baseada em grafos para classificação transdutiva. Essas relações são então usadas como base para um novo framework de classificação semissupervisionada com base em algoritmos baseados em densidade. Assim, definimos um novo framework que pode ser dividido em pequenos blocos de construção, com base nos algoritmos baseado em densidade. Essa estrutura é eficiente, eficaz e também estatisticamente sólida. Também generalizamos o framework HDBSCAN* para que ele também pudesse realizar agrupamento semissupervisionado utilizando diretamente qualquer fração de dados rotulados que possam estar disponíveis, ao invés de um conjunto de restrições. Resultados experimentais em uma grande coleção de base de dados mostram as vantagens da abordagem proposta tanto para classificação semissupervisionada quanto para o agrupamento semissupervisionado.Além disso, avaliamos os algoritmos de aprendizado semissupervisionados para determinar as relações entre a estrutura química e a atividade biológica em conjuntos de dados da área de Química Medicinal. Os conjuntos de dados avaliados nesta área são caracterizados por um baixo número de exemplos rotulados, alta dimensionalidade e, em alguns casos, não possuem uma relação clara entre estrutura química e atividade biológica, o que dificulta a aplicação de técnicas aprendizado supervisionado. Após implementação e validação das abordagens semissupervisionadas, verificamos que os mesmos podem ser uma boa opção para análise de dados em Química Medicinal.
- Imprenta:
- Publisher place: São Carlos
- Date published: 2019
- Data da defesa: 20.05.2019
-
ABNT
GERTRUDES, Jadson Castro. Semi-supervised learning approaches with applications in Medicinal Chemistry. 2019. Tese (Doutorado) – Universidade de São Paulo, São Carlos, 2019. Disponível em: http://www.teses.usp.br/teses/disponiveis/55/55134/tde-22082019-105334/. Acesso em: 03 mar. 2026. -
APA
Gertrudes, J. C. (2019). Semi-supervised learning approaches with applications in Medicinal Chemistry (Tese (Doutorado). Universidade de São Paulo, São Carlos. Recuperado de http://www.teses.usp.br/teses/disponiveis/55/55134/tde-22082019-105334/ -
NLM
Gertrudes JC. Semi-supervised learning approaches with applications in Medicinal Chemistry [Internet]. 2019 ;[citado 2026 mar. 03 ] Available from: http://www.teses.usp.br/teses/disponiveis/55/55134/tde-22082019-105334/ -
Vancouver
Gertrudes JC. Semi-supervised learning approaches with applications in Medicinal Chemistry [Internet]. 2019 ;[citado 2026 mar. 03 ] Available from: http://www.teses.usp.br/teses/disponiveis/55/55134/tde-22082019-105334/
How to cite
A citação é gerada automaticamente e pode não estar totalmente de acordo com as normas