图解kmp算法-通俗易懂kmp算法

2019-10-18  本文已影响0人  MrBryan

最近研究了一下kmp算法(Knuth-Morris-Pratt),百度了好多帖子,看的稀里糊涂。为了自己可以简单理解(还有最重要的next数组),也为了自己以后忘记的话不用再满世界百度,索性将自己的理解记录下来

用途

KMP算法,具体谁发明的就不说了,它主要的用途就是查找字符串,查找字符串"ab"(目标字符串)在字符串"abc"(待查找字符串)中出现的位置。换句话说,就是查找字符串"abc"是否包含字符串"ab",如果包含,返回包含的起始位置
如下两个字符串:

str = "dabxabxababxabwabxad" (待查找字符串)
ptr = "abxabwabxad" (目标字符串)

需要计算str中是否含有ptr,如果有,返回str中出现的起始位置,如果没有,返回-1
通过肉眼观察我们发现,str中是包含ptr的
dabxabxababxabwabxad,ptr是在str中第9位(下标从0开始)开始出现的,那么返回的结果就是9

实现

先看一下go的实现代码(只是为了方便才用go实现,使用map生成的next数组效率很低)

func main() {
    str := "dabxabxababxabwabxad"
    ptr := "abxabwabxad"
    i := kmp(str, ptr)
    fmt.Println(i)
}

func next(findStr string, num int) (next map[int]int) {
    k := 0
    next = make(map[int]int, num)
    next[0] = k
    for i := 1; i < num; i++ {
        for k > 0 && findStr[k] != findStr[i] {
            k = next[k-1]
        }
        if findStr[k] == findStr[i] {
            k++
        }
        next[i] = k
    }
    return next
}

func kmp(str string, findStr string) int {
    strL := len(str)
    findStrL := len(findStr)
    k := 0
    nextArr := next(findStr, findStrL)
    for i := 0; i < strL; i++ {
        for k > 0 && findStr[k] != str[i] {
            k = nextArr[k-1]
        }
        if findStr[k] == str[i] {
            k++
        }
        if k == findStrL {
            return i - k + 1
        }
    }
    return -1
}

算法由两部分组成
1、计算ptr每一位及之前的字符串中,前缀和后缀公共部分的最大长度的next数组
2、匹配ptr和str,当ptr失配时,利用next数组,实现ptr的最大后移,从而避免不必要的匹配,减少匹配次数
by smoke_zl

计算next数组

前缀和后缀公共部分的最大长度

一个字符串ababa,他的前缀是可以是a,ab,aba,abab(不包含最后一位),后缀是a,ba,aba,baba(不包含第一位)
前缀后缀公共部分就是aaba,公共部分最大就是aba,公共部分的最大长度就是3

next数组

next数组是ptr每一位及之前的字符串中,前缀和后缀公共部分的最大长度的集合
比如ptr字符串的长度是11(abxabwabxad),那么next数组就有11个元素

下面用图文来解释,next函数是如何计算next数组的值的
image

上图第一行,左边i值为ptr下标的值,中间是ptr字符串的每一位,右边是对应的next[i]值,从 i = 0 开始,分析每一行的计算过程

k := 0
next[0] = k

匹配字符串

第一部分利用next函数得到了next数组,下一步执行kmp函数,对ptr和str进行匹配,并当ptr和str失配时,利用next数组,进行最大位移,由于kmp函数和next函数差不多,这里就不详细讲了,直接上图

image

参考:
http://www.ruanyifeng.com/blog/2013/05/Knuth%E2%80%93Morris%E2%80%93Pratt_algorithm.html
https://blog.csdn.net/qq_30974369/article/details/74276186

上一篇下一篇

猜你喜欢

热点阅读