Classificadores baseados em vetores de suporte gerados a partir de dados rotulados e não-rotulados (2006)
- Authors:
- Autor USP: OLIVEIRA, CLAYTON SILVA - EP
- Unidade: EP
- Sigla do Departamento: PMR
- Subjects: APRENDIZADO COMPUTACIONAL; INTELIGÊNCIA ARTIFICIAL; ALGORITMOS
- Language: Português
- Abstract: Treinamento semi-supervisionado é uma metodologia de aprendizado de máquina que conjuga características de treinamento supervisionado e não-supervisionado. Ela se baseia no uso de bases semi-rotuladas (bases contendo dados rotulados e não-rotulados) para o treinamento de classificadores. A adição de dados não-rotulados, mais baratos e geralmente disponíveis em maior quantidade do que os dados rotulados, pode aumentar o desempenho e/ou baratear o custo de treinamento desses classificadores (a partir da diminuição da quantidade de dados rotulados necessários). Esta dissertação analisa duas estratégias para se executar treinamento semi-supervisionado, especificamente em Support Vector Machines (SVMs): formas direta e indireta. A estratégia direta é atualmente mais conhecida e estudada, e permite o uso de dados rotulados e não-rotulados, ao mesmo tempo, em tarefas de aprendizagem de classificadores. Entretanto, a inclusão de muitos dados não-rotulados pode tornar o treinamento demasiadamente lento. Já a estratégia indireta é mais recente, sendo capaz de agregar os benefícios do treinamento semi-supervisionado direto com tempos menores para o aprendizado de classificadores. Esta opção utiliza os dados não-rotulados para pré-processar a base de dados previamente à tarefa de aprendizagem do classificador, permitindo, por exemplo, a filtragem de eventuais ruídos e a reescrita da base em espaços de variáveis mais convenientes. Dentro do escopo daforma indireta, está a principal contribuição dessa dissertação: idealização, implementação e análise do algoritmo split learning. Foram obtidos ótimos resultados com esse algoritmo, que se mostrou eficiente em treinar SVMs de melhor desempenho e em períodos menores a partir de bases semi-rotuladas
- Imprenta:
- Data da defesa: 30.03.2006
-
ABNT
OLIVEIRA, Clayton Silva. Classificadores baseados em vetores de suporte gerados a partir de dados rotulados e não-rotulados. 2006. Dissertação (Mestrado) – Universidade de São Paulo, São Paulo, 2006. Disponível em: http://www.teses.usp.br/teses/disponiveis/3/3152/tde-22072007-192518/. Acesso em: 15 out. 2024. -
APA
Oliveira, C. S. (2006). Classificadores baseados em vetores de suporte gerados a partir de dados rotulados e não-rotulados (Dissertação (Mestrado). Universidade de São Paulo, São Paulo. Recuperado de http://www.teses.usp.br/teses/disponiveis/3/3152/tde-22072007-192518/ -
NLM
Oliveira CS. Classificadores baseados em vetores de suporte gerados a partir de dados rotulados e não-rotulados [Internet]. 2006 ;[citado 2024 out. 15 ] Available from: http://www.teses.usp.br/teses/disponiveis/3/3152/tde-22072007-192518/ -
Vancouver
Oliveira CS. Classificadores baseados em vetores de suporte gerados a partir de dados rotulados e não-rotulados [Internet]. 2006 ;[citado 2024 out. 15 ] Available from: http://www.teses.usp.br/teses/disponiveis/3/3152/tde-22072007-192518/
How to cite
A citação é gerada automaticamente e pode não estar totalmente de acordo com as normas