Exportar registro bibliográfico

Extração automática de conhecimento por múltiplos indutores: José Augusto Baranauskas (2001)

  • Authors:
  • Autor USP: BARANAUSKAS, JOSÉ AUGUSTO - ICMC
  • Unidade: ICMC
  • Sigla do Departamento: SCE
  • Subjects: APRENDIZADO COMPUTACIONAL; INTELIGÊNCIA ARTIFICIAL
  • Language: Português
  • Abstract: Nesta tese são investigados três problemas básicos em aprendizado supervisionado: seleção de atributos, composição de atributos e combinação de classificadores simbólicos. A seleção de atributos é uma atividade de pré-processamento de dados que seleciona um subconjunto de atributos do conjunto original de exemplos. Existem, basicamente, três abordagens que são empregadas para a seleção de atributos: embutida, filtro e wrapper; as duas últimas pesquisadas neste trabalho. Os experimentos realizados, utilizando diversos indutores e conjuntos de exemplos, para avaliar as abordagens filtro e wrapper nos permitem concluir que o uso de filtros deve ser considerado antes de se cogitar a utilização de wrappers,no caso de existirem muitos atributos para descrever os exemplos. Sob a perspectiva de compreensibilidade do conhecimento induzido, a análise sobre o impacto da seleção de atributos em um classificador simbólico mostrou um aumento do número de regras e do número de condições por regra. A composição de atributos, também conhecida como indução construtiva, é outra atividade de pré-processamento de dados. Dentre as várias abordagens de composição de atributos (guiadapor dados, por hipótese, por conhecimento e multi-estratégia), nesta tese é proposta uma metodologia para composição de atributos guiada pelo conhecimento. Os resultados dos experimentos realizados utilizando a metodologia proposta mostram que, mesmo com o auxílio do usuário/especialista, édifícil construir atributos derivados que sejam realmente relevantes para aprender o conceito embutido nos conjuntos de exemplos analisados de repositórios (naturais), os quais, muitas vezes, já foram pré-processados. Esse fato foi confirmado, por um trabalho posterior, com dados do mundo real, no qual a metodologia proposta mostrou seu potencial. A combinação de classificadores, simbólicos ou não, é uma atividade de mineração de dados. ) Na realidade, uma das preocupações do Aprendizado de Máquina simbólico é que os classificadores induzidos devem ser fáceis de serem compreendidos pelos seres humanos. Para isso, deve-se escolher o indutor com bias mais adequado para cada tipo de situação, já que pesquisas mostraram que não existe o 'melhor' indutor para todos os domínios. Aliada a essa escolha, é possível fazer uso de vários classificadores, combinando-os num único classificador final, formando um ensemble. Os ensembles possuem a tendência de melhorar o desempenho na classificação de exemplos não vistos durante o processo de aprendizado. Entretanto, o emprego de ensembles dificulta a compreensão humana sobre o comportamento no classificador final, já que ele deixa de ser simbólico, mesmo assumindo que cada classificador individual que o compõe seja simbólico. Na realidade, a combinação de classificadores simbólicos - provenientes de diferentes indutores - em um classificador final também simbólico é um tópico novo de pesquisa, ainda com poucosresultados divulgados. Com o objetivo de preencher essa lacuna, é proposto e desenvolvido neste trabalho o sistema XRULER. Para isso, inicialmente foi definido o formato padrão de regras PBM, o qual fornece uma perspectiva unificada sob a qual todo classificador simbólico poder ser convertido e analisado. Dentre outros componentes, o sistema XRULER possui um algoritmo de cobertura que pode ser aplicado ao conjunto de regras induzidas por diversos indutores para se obter um classificador simbólico final. Nos experimentos realizados com o sistema XRULER os resultados obtidos mostraram aumento da precisão e redução do número de regras. Isso pode ser considerado um avanço no sentido de uma maior compreensibilidade por seres humanos do conjunto final de regras
  • Imprenta:
  • Data da defesa: 09.08.2001
  • Acesso à fonte
    How to cite
    A citação é gerada automaticamente e pode não estar totalmente de acordo com as normas

    • ABNT

      BARANAUSKAS, José Augusto. Extração automática de conhecimento por múltiplos indutores: José Augusto Baranauskas. 2001. Tese (Doutorado) – Universidade de São Paulo, São Carlos, 2001. Disponível em: http://www.teses.usp.br/teses/disponiveis/55/55134/tde-08102001-112806/. Acesso em: 24 abr. 2024.
    • APA

      Baranauskas, J. A. (2001). Extração automática de conhecimento por múltiplos indutores: José Augusto Baranauskas (Tese (Doutorado). Universidade de São Paulo, São Carlos. Recuperado de http://www.teses.usp.br/teses/disponiveis/55/55134/tde-08102001-112806/
    • NLM

      Baranauskas JA. Extração automática de conhecimento por múltiplos indutores: José Augusto Baranauskas [Internet]. 2001 ;[citado 2024 abr. 24 ] Available from: http://www.teses.usp.br/teses/disponiveis/55/55134/tde-08102001-112806/
    • Vancouver

      Baranauskas JA. Extração automática de conhecimento por múltiplos indutores: José Augusto Baranauskas [Internet]. 2001 ;[citado 2024 abr. 24 ] Available from: http://www.teses.usp.br/teses/disponiveis/55/55134/tde-08102001-112806/


Digital Library of Intellectual Production of Universidade de São Paulo     2012 - 2024