Discretização e geração de gráficos de dados em aprendizado de máquina (2006)
- Authors:
- Autor USP: VOLTOLINI, RICHARDSON FLORIANI - ICMC
- Unidade: ICMC
- Sigla do Departamento: SCC
- Subjects: APRENDIZADO COMPUTACIONAL; MINERAÇÃO DE DADOS
- Language: Português
- Abstract: A elevada quantidade e variedade de informações adquirida e armazenada em meio eletrônico e a incapacidade humana de analizá-las, têm motivado o desenvolvimento da área de Mineracão de Dados - MD - que busca, de maneira semi-automática, extrair conhecimento novo e útil de grandes bases de dados. Uma das fases do processo de MD é o pré-processamento dessas bases de dados. O pré-processamento de dados tem como alguns de seus principais objetivos possibilitar que o usuário do processo obtenha maior compreensão dos dados utilizados, bem como tornar os dados mais adequados para as próximas fases do processo de MD. Uma técnica que busca auxiliar no primeiro objetivo citado é a geracão de gráficos de dados, a qual consiste na representação gráfica dos registros (exemplos) de uma base de dados. Existem diversos métodos de geracão de gráficos, cada qual com suas características e objetivos. Ainda na fase de pré-processamento, de modo a tornar os dados brutos mais adequados para as demais fases do processo de MD, diversas técnicas podem ser aplicadas, promovendo transformações nesses dados. Uma delas é a discretização de dados, que transforma um atributo contínuo da base de dados em um atributo discreto. Neste trabalho são abordados alguns métodos de geração de gráficos e de discretização de dados freqüentemente utilizados pela comunidade. Com relação aos métodos de geração de gráficos, foi projetado e implementado o sistema DISCOVERGRAPHICS que provê interfaces para a geraçãode gráficos de dados. As diferentes interfaces criadas permitem a utilização do sistema por usuários avançados, leigos e por outros sistemas computacionais. Com relação ao segundo assunto abordado neste trabalho, discretização de dados, foram considerados diversos métodos de discretização supervisionados e não-supervisionados, freqüentemente utilizados pela comunidade, e foi proposto um novo método ) não-supervisionado denominado K-MeansR. Esses métodos foram comparados entre sí por meio da realização de experimentos e analise estatística dos resultados, considerando-se diversas medidas para realizar a avaliação. Os resultados obtidos indicam que o método proposto supera vários dos métodos de discretização considerados
- Imprenta:
- Publisher place: São Carlos
- Date published: 2006
- Data da defesa: 17.11.2006
-
ABNT
VOLTOLINI, Richardson Floriani. Discretização e geração de gráficos de dados em aprendizado de máquina. 2006. Dissertação (Mestrado) – Universidade de São Paulo, São Carlos, 2006. Disponível em: http://www.teses.usp.br/teses/disponiveis/55/55134/tde-24012007-144841/. Acesso em: 06 out. 2024. -
APA
Voltolini, R. F. (2006). Discretização e geração de gráficos de dados em aprendizado de máquina (Dissertação (Mestrado). Universidade de São Paulo, São Carlos. Recuperado de http://www.teses.usp.br/teses/disponiveis/55/55134/tde-24012007-144841/ -
NLM
Voltolini RF. Discretização e geração de gráficos de dados em aprendizado de máquina [Internet]. 2006 ;[citado 2024 out. 06 ] Available from: http://www.teses.usp.br/teses/disponiveis/55/55134/tde-24012007-144841/ -
Vancouver
Voltolini RF. Discretização e geração de gráficos de dados em aprendizado de máquina [Internet]. 2006 ;[citado 2024 out. 06 ] Available from: http://www.teses.usp.br/teses/disponiveis/55/55134/tde-24012007-144841/
How to cite
A citação é gerada automaticamente e pode não estar totalmente de acordo com as normas