Exportar registro bibliográfico

Uma comparação da aplicação de métodos computacionais de classificação de dados aplicados ao consumo de cinema no Brasil (2017)

  • Authors:
  • Autor USP: NIEUWENHOFF, NATHALIA - EACH
  • Unidade: EACH
  • Subjects: MINERAÇÃO DE DADOS; CINEMA; RECONHECIMENTO DE PADRÕES
  • Keywords: Algoritmos de classificação; Bens de informação; Classification algorithm
  • Language: Português
  • Abstract: As técnicas computacionais de aprendizagem de máquina para classificação ou categorização de dados estão sendo cada vez mais utilizadas no contexto de extração de informações ou padrões em bases de dados volumosas em variadas áreas de aplicação. Em paralelo, a aplicação destes métodos computacionais para identificação de padrões, bem como a classificação de dados relacionados ao consumo dos bens de informação é considerada uma tarefa complexa, visto que tais padrões de decisão do consumo estão relacionados com as preferências dos indivíduos e dependem de uma composição de características individuais, variáveis culturais, econômicas e sociais segregadas e agrupadas, além de ser um tópico pouco explorado no mercado brasileiro. Neste contexto, este trabalho realizou o estudo experimental a partir da aplicação do processo de Descoberta do conhecimento (KDD), o que inclui as etapas de seleção e Mineração de Dados, para um problema de classificação binária, indivíduos brasileiros que consomem e não consomem um bem de informação, filmes em salas de cinema, a partir dos dados obtidos na Pesquisa de Orçamento Familiar (POF) 2008-2009, pelo Instituto Brasileiro de Geografia e Estatística (IBGE). O estudo experimental resultou em uma análise comparativa da aplicação de duas técnicas de aprendizagem de máquina para classificação de dados, baseadas em aprendizado supervisionado, sendo estas Naïve Bayes (NB) e Support Vector Machine (SVM). (continua)(continuação) Inicialmente, a revisão sistemática realizada com o objetivo de identificar estudos relacionados a aplicação de técnicas computacionais de aprendizado de máquina para classificação e identificação de padrões de consumo indica que a utilização destas técnicas neste contexto não é um tópico de pesquisa maduro e desenvolvido, visto que não foi abordado em nenhum dos trabalhos estudados. Os resultados obtidos a partir da análise comparativa realizada entre os algoritmos sugerem que a escolha dos algoritmos de aprendizagem de máquina para Classificação de Dados está diretamente relacionada a fatores como: (i) importância das classes para o problema a ser estudado; (ii) balanceamento entre as classes; (iii) universo de atributos a serem considerados em relação a quantidade e grau de importância destes para o classificador. Adicionalmente, os atributos selecionados pelo algoritmo de seleção de variáveis Information Gain sugerem que a decisão de consumo de cultura, mais especificamente do bem de informação, filmes em cinema, está fortemente relacionada a aspectos dos indivíduos relacionados a renda, nível de educação, bem como suas preferências por bens culturais
  • Imprenta:
  • Data da defesa: 13.04.2017
  • Acesso à fonte
    How to cite
    A citação é gerada automaticamente e pode não estar totalmente de acordo com as normas

    • ABNT

      NIEUWENHOFF, Nathalia; NISHIJIMA, Marislei. Uma comparação da aplicação de métodos computacionais de classificação de dados aplicados ao consumo de cinema no Brasil. 2017.Universidade de São Paulo, São Paulo, 2017. Disponível em: < http://www.teses.usp.br/teses/disponiveis/100/100131/tde-01062017-085136/ >.
    • APA

      Nieuwenhoff, N., & Nishijima, M. (2017). Uma comparação da aplicação de métodos computacionais de classificação de dados aplicados ao consumo de cinema no Brasil. Universidade de São Paulo, São Paulo. Recuperado de http://www.teses.usp.br/teses/disponiveis/100/100131/tde-01062017-085136/
    • NLM

      Nieuwenhoff N, Nishijima M. Uma comparação da aplicação de métodos computacionais de classificação de dados aplicados ao consumo de cinema no Brasil [Internet]. 2017 ;Available from: http://www.teses.usp.br/teses/disponiveis/100/100131/tde-01062017-085136/
    • Vancouver

      Nieuwenhoff N, Nishijima M. Uma comparação da aplicação de métodos computacionais de classificação de dados aplicados ao consumo de cinema no Brasil [Internet]. 2017 ;Available from: http://www.teses.usp.br/teses/disponiveis/100/100131/tde-01062017-085136/

    Últimas obras dos mesmos autores vinculados com a USP cadastradas na BDPI:

Digital Library of Intellectual Production of Universidade de São Paulo     2012 - 2020