Extração automática de conhecimento por múltiplos indutores: José Augusto Baranauskas (2001)
- Authors:
- Autor USP: BARANAUSKAS, JOSÉ AUGUSTO - ICMC
- Unidade: ICMC
- Sigla do Departamento: SCE
- Subjects: APRENDIZADO COMPUTACIONAL; INTELIGÊNCIA ARTIFICIAL
- Language: Português
- Abstract: Nesta tese são investigados três problemas básicos em aprendizado supervisionado: seleção de atributos, composição de atributos e combinação de classificadores simbólicos. A seleção de atributos é uma atividade de pré-processamento de dados que seleciona um subconjunto de atributos do conjunto original de exemplos. Existem, basicamente, três abordagens que são empregadas para a seleção de atributos: embutida, filtro e wrapper; as duas últimas pesquisadas neste trabalho. Os experimentos realizados, utilizando diversos indutores e conjuntos de exemplos, para avaliar as abordagens filtro e wrapper nos permitem concluir que o uso de filtros deve ser considerado antes de se cogitar a utilização de wrappers,no caso de existirem muitos atributos para descrever os exemplos. Sob a perspectiva de compreensibilidade do conhecimento induzido, a análise sobre o impacto da seleção de atributos em um classificador simbólico mostrou um aumento do número de regras e do número de condições por regra. A composição de atributos, também conhecida como indução construtiva, é outra atividade de pré-processamento de dados. Dentre as várias abordagens de composição de atributos (guiadapor dados, por hipótese, por conhecimento e multi-estratégia), nesta tese é proposta uma metodologia para composição de atributos guiada pelo conhecimento. Os resultados dos experimentos realizados utilizando a metodologia proposta mostram que, mesmo com o auxílio do usuário/especialista, édifícil construir atributos derivados que sejam realmente relevantes para aprender o conceito embutido nos conjuntos de exemplos analisados de repositórios (naturais), os quais, muitas vezes, já foram pré-processados. Esse fato foi confirmado, por um trabalho posterior, com dados do mundo real, no qual a metodologia proposta mostrou seu potencial. A combinação de classificadores, simbólicos ou não, é uma atividade de mineração de dados. ) Na realidade, uma das preocupações do Aprendizado de Máquina simbólico é que os classificadores induzidos devem ser fáceis de serem compreendidos pelos seres humanos. Para isso, deve-se escolher o indutor com bias mais adequado para cada tipo de situação, já que pesquisas mostraram que não existe o 'melhor' indutor para todos os domínios. Aliada a essa escolha, é possível fazer uso de vários classificadores, combinando-os num único classificador final, formando um ensemble. Os ensembles possuem a tendência de melhorar o desempenho na classificação de exemplos não vistos durante o processo de aprendizado. Entretanto, o emprego de ensembles dificulta a compreensão humana sobre o comportamento no classificador final, já que ele deixa de ser simbólico, mesmo assumindo que cada classificador individual que o compõe seja simbólico. Na realidade, a combinação de classificadores simbólicos - provenientes de diferentes indutores - em um classificador final também simbólico é um tópico novo de pesquisa, ainda com poucosresultados divulgados. Com o objetivo de preencher essa lacuna, é proposto e desenvolvido neste trabalho o sistema XRULER. Para isso, inicialmente foi definido o formato padrão de regras PBM, o qual fornece uma perspectiva unificada sob a qual todo classificador simbólico poder ser convertido e analisado. Dentre outros componentes, o sistema XRULER possui um algoritmo de cobertura que pode ser aplicado ao conjunto de regras induzidas por diversos indutores para se obter um classificador simbólico final. Nos experimentos realizados com o sistema XRULER os resultados obtidos mostraram aumento da precisão e redução do número de regras. Isso pode ser considerado um avanço no sentido de uma maior compreensibilidade por seres humanos do conjunto final de regras
- Imprenta:
- Publisher place: São Carlos
- Date published: 2001
- Data da defesa: 09.08.2001
-
ABNT
BARANAUSKAS, José Augusto. Extração automática de conhecimento por múltiplos indutores: José Augusto Baranauskas. 2001. Tese (Doutorado) – Universidade de São Paulo, São Carlos, 2001. Disponível em: http://www.teses.usp.br/teses/disponiveis/55/55134/tde-08102001-112806/. Acesso em: 24 abr. 2024. -
APA
Baranauskas, J. A. (2001). Extração automática de conhecimento por múltiplos indutores: José Augusto Baranauskas (Tese (Doutorado). Universidade de São Paulo, São Carlos. Recuperado de http://www.teses.usp.br/teses/disponiveis/55/55134/tde-08102001-112806/ -
NLM
Baranauskas JA. Extração automática de conhecimento por múltiplos indutores: José Augusto Baranauskas [Internet]. 2001 ;[citado 2024 abr. 24 ] Available from: http://www.teses.usp.br/teses/disponiveis/55/55134/tde-08102001-112806/ -
Vancouver
Baranauskas JA. Extração automática de conhecimento por múltiplos indutores: José Augusto Baranauskas [Internet]. 2001 ;[citado 2024 abr. 24 ] Available from: http://www.teses.usp.br/teses/disponiveis/55/55134/tde-08102001-112806/ - Extração de conhecimento utilizando aprendizado de máquina
- An adaptation of binary relevance for multi-label classification applied to functional genomics
- An iterative decision tree threshold filter
- Evaluation of stacking on biomedical data
- How many tress in a random forest
- Root attribute behavior within a random forest
- Sistema baseado em conhecimento para auxiliar no processo de alocacao de rins
- Uma avaliação de dados de expressão gênica em leucemias agudas utilizando árvores de decisão
- Avaliação do algoritmo de Stacking em dados biomédicos
- Analysis of decision tree pruning using windowing in medical datasets with different class distributions
How to cite
A citação é gerada automaticamente e pode não estar totalmente de acordo com as normas