Predição de séries temporais por similaridade (2016)
- Authors:
- Autor USP: PARMEZAN, ANTONIO RAFAEL SABINO - ICMC
- Unidade: ICMC
- Sigla do Departamento: SCC
- Subjects: APRENDIZADO COMPUTACIONAL; ANÁLISE DE SÉRIES TEMPORAIS; MINERAÇÃO DE DADOS
- Keywords: Data mining; Machine learning; Métodos baseados em similaridade; Predição de séries temporais; Similarity-based methods; Time series prediction
- Language: Português
- Abstract: Um dos maiores desafios em Mineração de Dados é a integração da informação temporal ao seu processo. Esse fato tem desafiado profissionais de diferentes domínios de aplicação e recebido investimentos consideráveis da comunidade científica e empresarial. No contexto de predição de Séries Temporais, os investimentos se concentram no subsídio de pesquisas destinadas à adaptação dos métodos convencionais de Aprendizado de Máquina para a análise de dados na qual o tempo constitui um fator importante. À vista disso, neste trabalho é proposta uma nova extensão do algoritmo de Aprendizado de Máquina k-Nearest Neighbors (kNN) para predição de Séries Temporais, intitulado de kNN - Time Series Prediction with Invariances (kNN-TSPI ). O algoritmo concebido difere da versão convencional pela incorporação de três técnicas para obtenção de invariância à amplitude e deslocamento, invariância à complexidade e tratamento de casamentos triviais. Como demonstrado ao longo desta dissertação de mestrado, o uso simultâneo dessas técnicas proporciona ao kNN-TSPI uma melhor correspondência entre as subsequências de dados e a consulta de referência. Os resultados de uma das avaliações empíricas mais extensas, imparciais e compreensáveis já conduzidas no tema de predição de Séries Temporais evidenciaram, a partir do confronto de dez métodos de projeção, que o algoritmo kNN-TSPI, além de ser conveniente para a predição automática de dados a curto prazo, é competitivo com os métodos estatísticosestado-da-arte ARIMA e SARIMA. Por mais que o modelo SARIMA tenha atingido uma precisão relativamente superior a do método baseado em similaridade, o kNN-TSPI é consideravelmente mais simples de ajustar. A comparação objetiva e subjetiva entre algoritmos estatísticos e de Aprendizado de Máquina para a projeção de dados temporais vem a suprir uma importante lacuna na literatura, a qual foi identificada por meio de uma revisão sistemática seguida de uma meta-análise das publicações selecionadas. Os 95 conjuntos de dados empregados nos experimentos computacionais juntamente com todas as projeções analisadas em termos de Erro Quadrático Médio, coeficiente U de Theil e taxa de acerto Prediction Of Change In Direction encontram-se disponíveis no portal Web ICMC-USP Time Series Prediction Repository. A presente pesquisa abrange também contribuições e resultados significativos em relação às propriedades inerentes é predição baseada em similaridade, sobretudo do ponto de vista prático. Os protocolos experimentais delineados e as diversas conclusões obtidas poderão ser usados como referência para guiar o processo de escolha de modelos, configuração de parâmetros e aplicação dos algoritmos de Inteligência Artificial para predição de Séries Temporais.
- Imprenta:
- Publisher place: São Carlos
- Date published: 2016
- Data da defesa: 07.04.2016
-
ABNT
PARMEZAN, Antonio Rafael Sabino. Predição de séries temporais por similaridade. 2016. Dissertação (Mestrado) – Universidade de São Paulo, São Carlos, 2016. Disponível em: http://www.teses.usp.br/teses/disponiveis/55/55134/tde-21112016-150659/. Acesso em: 24 abr. 2024. -
APA
Parmezan, A. R. S. (2016). Predição de séries temporais por similaridade (Dissertação (Mestrado). Universidade de São Paulo, São Carlos. Recuperado de http://www.teses.usp.br/teses/disponiveis/55/55134/tde-21112016-150659/ -
NLM
Parmezan ARS. Predição de séries temporais por similaridade [Internet]. 2016 ;[citado 2024 abr. 24 ] Available from: http://www.teses.usp.br/teses/disponiveis/55/55134/tde-21112016-150659/ -
Vancouver
Parmezan ARS. Predição de séries temporais por similaridade [Internet]. 2016 ;[citado 2024 abr. 24 ] Available from: http://www.teses.usp.br/teses/disponiveis/55/55134/tde-21112016-150659/ - Fine-tuning pre-trained neural networks for medical image classification in small clinical datasets
- Changes in the wing-beat frequency of bees and wasps depending on environmental conditions: a study with optical sensors
- Efficient unsupervised drift detector for fast and high-dimensional data streams
- Hierarchical classification on batch and streaming data with applications to entomology
- Time series prediction via similarity search: exploring invariances, distance measures and ensemble functions
- A video indexing and retrieval computational prototype based on transcribed speech
- Hierarchical classification of pollinating flying insects under changing environments
- Automatic recommendation of feature selection algorithms based on dataset characteristics
- Geographic context-based stacking learning for election prediction from socio-economic data
- A graph-based spatial cross-validation approach for assessing models learned with selected features to understand election results
How to cite
A citação é gerada automaticamente e pode não estar totalmente de acordo com as normas