KMP字符串
程序员文章站
2022-07-14 08:07:58
...
题目链接:https://www.acwing.com/problem/content/833/
题意:给定一个模式串S,以及一个模板串P,所有字符串中只包含大小写英文字母以及阿拉伯数字。
模板串P在模式串S中多次作为子串出现。
求出模板串P在模式串S中所有出现的位置的起始下标。
输入格式
第一行输入整数N,表示字符串P的长度。
第二行输入字符串P。
第三行输入整数M,表示字符串S的长度。
第四行输入字符串S。
数据范围
1≤N≤1e4
1≤M≤1e5
输入样例:
3
aba
5
ababa
输出样例:
0 2
思路:一般暴力做法两重循环时间复杂度就至少是O(n²)的,而其实很多地方都有重复,便可以用到kmp算法优化一下。
对于模板数组p我们开一个next数组来统计它前缀子串与后缀子串相同的最大值,例如:
所以每次移动的时候只需要找到相应的next关系便可以了(相当于每次在j的位置匹配不成功,便找到模板的最大前缀后缀匹配度ne[ j ],那么下一次p和s就可以在j的前面ne[ j ]个位置再重新开始便可。),时间复杂度一下就降到了O(2 * m)了。
代码实现:
#include<iostream>
using namespace std;
const int N = 1e5 + 5, M = 1e6 + 5;
//n是模板p的长度,m是模式串s的长度
int n, m;
char p[N], s[M];
int ne[N];
int main()
{
cin >> n >> p + 1 >> m >> s + 1;
//求next的过程
for(int i = 2, j = 0; i <= n; i ++ ){
while(j && p[i] != p[j + 1]) j = ne[j];
if(p[i] == p[j + 1]) j ++ ;
ne[i] = j;
}
//kmp匹配过程
for(int i = 1, j = 0; i<=m; i ++ ){
//如果匹配不成功就退一步再匹配
while(j && s[i] !=p[j + 1]) j = ne[j];
if(s[i] == p[j + 1]) j ++ ;
if(j == n){
cout << i - n << " ";
j = ne[j];
}
}
return 0;
}
上一篇: js动态修改页面标题
下一篇: C11