Large scale similarity-based time series mining (2017)
- Authors:
- Autor USP: SILVA, DIEGO FURTADO - ICMC
- Unidade: ICMC
- Sigla do Departamento: SCC
- Subjects: MINERAÇÃO DE DADOS; ANÁLISE DE SÉRIES TEMPORAIS; APRENDIZADO COMPUTACIONAL
- Keywords: Data mining; Dynamic Time Warping; Dynamic Time Warping; Medidas de similaridade; Similarity measuresProveniente da Base Teses Digitais da USP; Time series
- Language: Inglês
- Abstract: Séries temporais são ubíquas no dia-a-dia do ser humano. Dados organizados no tempo são gerados em uma infinidade de domínios de aplicação, como medicina, biologia, economia e processamento de sinais. Devido ao grande interesse nesse tipo de dados, diversos métodos de mineração de dados temporais foram propostos nas últimas décadas. Muitos desses métodos possuem uma característica em comum: em seu núcleo, há uma função de (dis)similaridade utilizada para comparar as séries. Dynamic Time Warping (DTW) é indiscutivelmente a medida de distância mais relevante na análise de séries temporais. A principal dificuldade em se utilizar a DTW é seu alto custo computacional. Ao mesmo tempo, algumas tarefas de mineração de séries temporais, como descoberta de motifs, requerem um alto número de cálculos de distância. Essas tarefas despendem um grande tempo de execução, mesmo utilizando-se medidas de distância menos custosas, como a distância Euclidiana. Esta tese se concentra no desenvolvimento de algoritmos eficientes que permitem a análise de dados temporais em larga escala, utilizando métodos baseados em similaridade. As contribuições desta tese têm implicações em variadas tarefas de mineração de dados, como classificação, agrupamento e descoberta de padrões frequentes. Especificamente, as principais contribuições desta tese são: (i) um algoritmo para acelerar o cálculo exato da distância DTW e sua incorporação ao processo de busca por similaridade; (ii) um novo algoritmo baseado emDTW para prover invariância a prefixos e sufixos espúrios no cálculo da distância; (iii) uma representação de similaridade musical com implicações em diferentes tarefas de mineração de dados musicais e um algoritmo eficiente para computá-la; (iv) um método eficiente e anytime para encontrar motifs e discords baseado na medida DTW invariante a prefixos e sufixos.
- Imprenta:
- Publisher place: São Carlos
- Date published: 2017
- Data da defesa: 25.09.2017
-
ABNT
SILVA, Diego Furtado. Large scale similarity-based time series mining. 2017. Tese (Doutorado) – Universidade de São Paulo, São Carlos, 2017. Disponível em: http://www.teses.usp.br/teses/disponiveis/55/55134/tde-07122017-161346/. Acesso em: 23 abr. 2024. -
APA
Silva, D. F. (2017). Large scale similarity-based time series mining (Tese (Doutorado). Universidade de São Paulo, São Carlos. Recuperado de http://www.teses.usp.br/teses/disponiveis/55/55134/tde-07122017-161346/ -
NLM
Silva DF. Large scale similarity-based time series mining [Internet]. 2017 ;[citado 2024 abr. 23 ] Available from: http://www.teses.usp.br/teses/disponiveis/55/55134/tde-07122017-161346/ -
Vancouver
Silva DF. Large scale similarity-based time series mining [Internet]. 2017 ;[citado 2024 abr. 23 ] Available from: http://www.teses.usp.br/teses/disponiveis/55/55134/tde-07122017-161346/ - Classificação de séries temporais por similaridade e extração de atributos com aplicação na identificação automática de insetos
- Noisy self-training with data augmentations for offensive and hate speech detection tasks
- A new time series framework for forest fire risk forecasting and classification
- Large-scale similarity-based time series mining
- Hemoglobin estimation from smartphone-based photoplethysmography with small data
How to cite
A citação é gerada automaticamente e pode não estar totalmente de acordo com as normas