Extração automática de conhecimento por múltiplos indutores: José Augusto Baranauskas

Baranauskas, José Augusto; Monard, Maria Carolina

Tese

Extração automática de conhecimento por múltiplos indutores: José Augusto Baranauskas (2001)

Authors:
- Baranauskas, José Augusto
- Monard, Maria Carolina (Orientador)
Autor USP: BARANAUSKAS, JOSÉ AUGUSTO - ICMC
Unidade: ICMC
Sigla do Departamento: SCE
Subjects: APRENDIZADO COMPUTACIONAL; INTELIGÊNCIA ARTIFICIAL
Language: Português
Abstract: Nesta tese são investigados três problemas básicos em aprendizado supervisionado: seleção de atributos, composição de atributos e combinação de classificadores simbólicos. A seleção de atributos é uma atividade de pré-processamento de dados que seleciona um subconjunto de atributos do conjunto original de exemplos. Existem, basicamente, três abordagens que são empregadas para a seleção de atributos: embutida, filtro e wrapper; as duas últimas pesquisadas neste trabalho. Os experimentos realizados, utilizando diversos indutores e conjuntos de exemplos, para avaliar as abordagens filtro e wrapper nos permitem concluir que o uso de filtros deve ser considerado antes de se cogitar a utilização de wrappers,no caso de existirem muitos atributos para descrever os exemplos. Sob a perspectiva de compreensibilidade do conhecimento induzido, a análise sobre o impacto da seleção de atributos em um classificador simbólico mostrou um aumento do número de regras e do número de condições por regra. A composição de atributos, também conhecida como indução construtiva, é outra atividade de pré-processamento de dados. Dentre as várias abordagens de composição de atributos (guiadapor dados, por hipótese, por conhecimento e multi-estratégia), nesta tese é proposta uma metodologia para composição de atributos guiada pelo conhecimento. Os resultados dos experimentos realizados utilizando a metodologia proposta mostram que, mesmo com o auxílio do usuário/especialista, édifícil construir atributos derivados que sejam realmente relevantes para aprender o conceito embutido nos conjuntos de exemplos analisados de repositórios (naturais), os quais, muitas vezes, já foram pré-processados. Esse fato foi confirmado, por um trabalho posterior, com dados do mundo real, no qual a metodologia proposta mostrou seu potencial. A combinação de classificadores, simbólicos ou não, é uma atividade de mineração de dados. ) Na realidade, uma das preocupações do Aprendizado de Máquina simbólico é que os classificadores induzidos devem ser fáceis de serem compreendidos pelos seres humanos. Para isso, deve-se escolher o indutor com bias mais adequado para cada tipo de situação, já que pesquisas mostraram que não existe o 'melhor' indutor para todos os domínios. Aliada a essa escolha, é possível fazer uso de vários classificadores, combinando-os num único classificador final, formando um ensemble. Os ensembles possuem a tendência de melhorar o desempenho na classificação de exemplos não vistos durante o processo de aprendizado. Entretanto, o emprego de ensembles dificulta a compreensão humana sobre o comportamento no classificador final, já que ele deixa de ser simbólico, mesmo assumindo que cada classificador individual que o compõe seja simbólico. Na realidade, a combinação de classificadores simbólicos - provenientes de diferentes indutores - em um classificador final também simbólico é um tópico novo de pesquisa, ainda com poucosresultados divulgados. Com o objetivo de preencher essa lacuna, é proposto e desenvolvido neste trabalho o sistema XRULER. Para isso, inicialmente foi definido o formato padrão de regras PBM, o qual fornece uma perspectiva unificada sob a qual todo classificador simbólico poder ser convertido e analisado. Dentre outros componentes, o sistema XRULER possui um algoritmo de cobertura que pode ser aplicado ao conjunto de regras induzidas por diversos indutores para se obter um classificador simbólico final. Nos experimentos realizados com o sistema XRULER os resultados obtidos mostraram aumento da precisão e redução do número de regras. Isso pode ser considerado um avanço no sentido de uma maior compreensibilidade por seres humanos do conjunto final de regras
Imprenta:
- Publisher place: São Carlos
- Date published: 2001
Data da defesa: 09.08.2001

How to cite

A citação é gerada automaticamente e pode não estar totalmente de acordo com as normas

ABNT

BARANAUSKAS, José Augusto. Extração automática de conhecimento por múltiplos indutores: José Augusto Baranauskas. 2001. Tese (Doutorado) – Universidade de São Paulo, São Carlos, 2001. Disponível em: http://www.teses.usp.br/teses/disponiveis/55/55134/tde-08102001-112806/. Acesso em: 28 dez. 2025.
APA

Baranauskas, J. A. (2001). Extração automática de conhecimento por múltiplos indutores: José Augusto Baranauskas (Tese (Doutorado). Universidade de São Paulo, São Carlos. Recuperado de http://www.teses.usp.br/teses/disponiveis/55/55134/tde-08102001-112806/
NLM

Baranauskas JA. Extração automática de conhecimento por múltiplos indutores: José Augusto Baranauskas [Internet]. 2001 ;[citado 2025 dez. 28 ] Available from: http://www.teses.usp.br/teses/disponiveis/55/55134/tde-08102001-112806/
Vancouver

Baranauskas JA. Extração automática de conhecimento por múltiplos indutores: José Augusto Baranauskas [Internet]. 2001 ;[citado 2025 dez. 28 ] Available from: http://www.teses.usp.br/teses/disponiveis/55/55134/tde-08102001-112806/

ReP

Exportar registro bibliográfico

Extração automática de conhecimento por múltiplos indutores: José Augusto Baranauskas (2001)

How to cite

Últimas obras dos mesmos autores vinculados com a USP cadastradas na BDPI:

USP Schools

ReP

Exportar registro bibliográfico

Extração automática de conhecimento por múltiplos indutores: José Augusto Baranauskas (2001)

How to cite

Últimas obras dos mesmos autores vinculados com a USP cadastradas na BDPI: