KMP算法

KMP算法的讲解

B站有一个视频讲的非常好,在这里放一下

KMP算法:

字符串匹配。给你两个字符串,寻找其中一个字符串是否包含另一个字符串,如果包含,返回包含的起始位置。

一般匹配字符串时,我们从目标字符串str(假设长度为n)的第一个下标选取和ptr长度(长度为m)一样的子字符串进行比较,如果一样,就返回开始处的下标值,不一样,选取str下一个下标,同样选取长度为n的字符串进行比较,直到str的末尾(实际比较时,下标移动到n-m)。这样的时间复杂度是O(n*m)。

KMP算法:可以实现复杂度为O(m+n)

 

算法的代码

#include<cstdio>
#include<cstring>
#include<cctype>
#include<string>
#include<set>
#include<iostream>
#include<stack>
#include<cmath>
#include<queue>
#include<vector>
#include<algorithm>
#define mem(a,b) memset(a,b,sizeof(a))
#define inf 0x3f3f3f3f
#define mod 10000007
#define debug() puts("what the fuck!!!")
#define N 10200
#define ll longlong
using namespace std;
vector<int> get_next(string pat)
{
    int m = pat.size();
    vector<int> next(m);
    for(int i = 1, k = 0; i < m; i++)
    {
        while(k > 0 && pat[k] != pat[i])
        {
            k = next[k - 1];
        }
        if(pat[i] == pat[k])
        {
            next[i] = ++k;
        }
        else
        {
            next[i] = k;
        }
    }
    return next;
}
void KMP(string str,string pat)
{
    int n = str.size();
    int m = pat.size();
    vector<int> next = get_next(pat);
    for(int i = 0, k = 0; i < n; i++)
    {
        while(k > 0 && pat[k] != str[i])
        {
            k = next[k - 1];
        }
        if(str[i] == pat[k])
        {
            k++;
        }
        if(k == m)
        {
            cout << i - m + 1 << "\n";
            k = next[k - 1];
        }
    }
}
int main()
{
     string str = "bacbababadababacambabacaddababacasdsd";
     string ptr = "ababaca";
     KMP(str,ptr);
    return 0;
}

kuangbin的KMP模板:

/*
pku3461(Oulipo), hdu1711(Number Sequence)
这个模板 字符串是从0开始的
Next数组是从1开始的


*/
#include <iostream>
#include <cstring>
using namespace std;

const int N = 1000002;
int nxt[N];
char S[N], T[N];
int slen, tlen;

void getNext()
{
    int j, k;
    j = 0; k = -1; nxt[0] = -1;
    while(j < tlen)
        if(k == -1 || T[j] == T[k])
            nxt[++j] = ++k;
        else
            k = nxt[k];

}
/*
返回模式串T在主串S中首次出现的位置
返回的位置是从0开始的。
*/
int KMP_Index()
{
    int i = 0, j = 0;
    getNext();

    while(i < slen && j < tlen)
    {
        if(j == -1 || S[i] == T[j])
        {
            i++; j++;
        }
        else
            j = nxt[j];
    }
    if(j == tlen)
        return i - tlen;
    else
        return -1;
}
/*
返回模式串在主串S中出现的次数
*/
int KMP_Count()
{
    int ans = 0;
    int i, j = 0;

    if(slen == 1 && tlen == 1)
    {
        if(S[0] == T[0])
            return 1;
        else
            return 0;
    }
    getNext();
    for(i = 0; i < slen; i++)
    {
        while(j > 0 && S[i] != T[j])
            j = nxt[j];
        if(S[i] == T[j])
            j++;
        if(j == tlen)
        {
            ans++;
            j = nxt[j];
        }
    }
    return ans;
}
int main()
{

    int TT;
    int i, cc;
    cin>>TT;
    while(TT--)
    {
        cin>>S>>T;
        slen = strlen(S);
        tlen = strlen(T);
        cout<<"模式串T在主串S中首次出现的位置是: "<<KMP_Index()<<endl;
        cout<<"模式串T在主串S中出现的次数为: "<<KMP_Count()<<endl;
    }
    return 0;
}
/*
test case
aaaaaa a
abcd d
aabaa b
*/

 

点赞

发表评论

电子邮件地址不会被公开。 必填项已用*标注