2009KDD-Time Series Shapelets: A

2022-05-06  本文已影响0人  Caucher

标题:时间序列“小形状”:数据挖掘的新原型

ABSTRACT

1. INTRODUCTION

2. RELATED WORK AND BACKGROUND

3. FINDING THE SHAPELET

3.1 Brute-Force Algorithm

最简单的寻找shapelet的方法就是暴力遍历:

  1. 找出数据集中序列的所有子序列;
  2. 每个子序列依次作为shapelet候选子序列进行检验;
  3. 检验时首先计算Candidate和数据集中所有序列的距离,获得距离直方图;
  4. 根据这个距离直方图找一个最优分割点,返回该情况下的信息增益。

3.2 Subsequence Distance Early Abandon

距离计算可以剪枝,即如果当前的部分欧式距离已经超过BSF,那么直接放弃掉。

3.3 Admissible Entropy Pruning

candidate检验也可以利用上界来进行剪枝。假设现在根据某个candidate做了一半的距离直方图,那么信息增益的上界就是把剩下的一半,一半(总量的1/4)放给距离0,一半放给距离最大值+1,此时信息增益是理论最大的。
如果这个上界的信息增益也不如BSF,那么直接进入下一个candidate。

上一篇 下一篇

猜你喜欢

热点阅读