程序员

串匹配算法

2018-03-26  本文已影响12人  知识学者

问题:给定二个字符串S和T,在主串S中查找子串T的过程称之为字符串匹配问题(string matching,也称之为模式匹配)。在文本处理系统,操作系统,编译系统,数据库系统以及internet信息检索中,串匹配是使用最频繁操作。

有蛮力法,即BF(暴力匹配算法,和KMP算法。

我只会bf算法,kmp还是有问题。

思路

从主串S开始的一个字符串和子串T的第一个字符串进行比较,若相等,则比较二者的后续字符;若不相等,则主串S的第二个字符和子串T的第一个字符进行比较,重复上述过程,若T中的字符全部匹配完,则说明本次匹配成功,若S中字符全部比较完毕,则匹配失败。

#include<iostream>
#include<time.h>
using namespace std;
int  bfstring(char k[],char s[]);
int main()
{

    char k[]="abcabcacb";
    char s[]="abcac";

    clock_t start,finish;
        int index;

double duration;

start= clock();

for(int z=0; z<1000000; z++)   //扩大匹配时间
{


 index=bfstring(k,s);


}

finish=clock();

duration=(double)(finish-start)/CLOCKS_PER_SEC;

printf("time=%lf seconds\n",duration);


    if(index==0)
  cout<<"匹配失败"<<endl;
    else
  cout<<"本次匹配的开始位置:"<<index<<endl;

return 0;
}

//k为主串,S为字串。
int  bfstring(char k[],char s[])
{
    int i=0,j=0;
    int index=0;
   while(k[i]!='\0'&&s[j]!='\0')    
   {
       
        if(k[i]==s[j])
        {
            i++;
            j++;
        }
        else{
         index++;
         j=0;    
         i=index;
        }

   }

   if(s[j]=='\0')
    return index+1;  //返回本次匹配的开始位置。
   return 0;

}

结果

time=0.074000 seconds
本次匹配的开始位置:4
Press any key to continue

kmp算法。

主要是寻找next的值。


#include<iostream>
#include<time.h>
using namespace std;
int  kmp(char k[],char s[]);
void getNext(char s[],int next[]);
int main()
{

    char k[]="abcabcacb";
    char s[]="abcac";

    clock_t start,finish;
        int index;

double duration;

start= clock();

for(int z=0; z<1000000; z++)   //扩大匹配时间
{


 index=kmp(k,s);


}

finish=clock();

duration=(double)(finish-start)/CLOCKS_PER_SEC;

printf("time=%lf seconds\n",duration);


    if(index==0)
  cout<<"匹配失败"<<endl;
    else
  cout<<"本次匹配的开始位置:"<<index<<endl;

return 0;
}

//k为主串,S为字串。
int  kmp(char k[],char s[])
{
    int i=0,j=0;
    int next[100];
    getNext(s,next);
   while(k[i]!='\0'&&s[j]!='\0')    
   {
       
        if(k[i]==s[j])
        {
            i++;
            j++;
        }
        else{
         j=next[j];
         if(j==-1)
         {
          i++;
          j++;  
         }
        }
   }

   if(s[j]=='\0')
    return i-strlen(s)+1;  //返回本次匹配的开始位置。
   return 0;

}

void getNext(char s[],int next[])
{

 int i,j,len;
 next[0]=-1;
 for(j=1; s[j]!='\0'; j++)  //依次求next[j]
 {
       // 相等的子串最大长度为j-1
  for(len=j-1; len>=1; len--) 
  {
     //依次比较 S[0]~S[len-1]与S[j-len]~s[j-1]
      for(i=0; i<len; i++) 
    if(s[i]!=s[j-len+i])  
        break;
    if(i==len)
    {
        next[j]=len;
        break;
    }


  }

 if(len<1)  //其它情况无相等字符串
 next[j]=0;

 }

}

结果

time=0.135000 seconds
本次匹配的开始位置:4
Press any key to continue
上一篇 下一篇

猜你喜欢

热点阅读