AC自动机+模板+hdu 3065
AC自动机目前只做了三道只是板子题的题:学长训练赛的,那也得记下来呀,以后多做题吧。。。
对AC自动机的理解:ac自动机其实就是一种多模匹配算法,下面是我对多模匹配的理解,与多模与之对于的是单模,单模就是给你一个单词,然后给你一个字符串,问你这个单词是否在这个字符串中出现过(匹配),这个问题可以用kmp算法在比较高效的效率上完成这个任务。那么现在我们换个问题,给你很多个单词,然后给你一段字符串,问你有多少个单词在这个字符串中出现过,当然我们暴力做,用每一个单词对字符串做kmp,这样虽然理论上可行,但是时间复杂度非常之高,当单词的个数比较多并且字符串很长的情况下不能有效的解决这个问题,所以这时候就要用到我们的ac自动机算法了。
如果想搞懂AC自动机的话,一定要会kmp和字典树,起码得理解;
学长推荐了一个视频:b站的搜ac自动机就出来了;
下面是模板吧,反正我这三道题都是用这个板子改出来的:
hdu 3065
病毒侵袭持续中
Time Limit: 2000/1000 MS (Java/Others) Memory Limit: 32768/32768 K (Java/Others)
Total Submission(s): 16343 Accepted Submission(s): 5527
Problem Description
小t非常感谢大家帮忙解决了他的上一个问题。然而病毒侵袭持续中。在小t的不懈努力下,他发现了网路中的“万恶之源”。这是一个庞大的病毒网站,他有着好多好多的病毒,但是这个网站包含的病毒很奇怪,这些病毒的特征码很短,而且只包含“英文大写字符”。当然小t好想好想为民除害,但是小t从来不打没有准备的战争。知己知彼,百战不殆,小t首先要做的是知道这个病毒网站特征:包含多少不同的病毒,每种病毒出现了多少次。大家能再帮帮他吗?
Input
第一行,一个整数N(1<=N<=1000),表示病毒特征码的个数。
接下来N行,每行表示一个病毒特征码,特征码字符串长度在1—50之间,并且只包含“英文大写字符”。任意两个病毒特征码,不会完全相同。
在这之后一行,表示“万恶之源”网站源码,源码字符串长度在2000000之内。字符串中字符都是ASCII码可见字符(不包括回车)。
Output
按以下格式每行一个,输出每个病毒出现次数。未出现的病毒不需要输出。
病毒特征码: 出现次数
冒号后有一个空格,按病毒特征码的输入顺序进行输出。
Sample Input
3
AA
BB
CC
ooxxCC%dAAAoen….END
Sample Output
AA: 2
CC: 1
Hint
Hit:
题目描述中没有被提及的所有情况都应该进行考虑。比如两个病毒特征码可能有相互包含或者有重叠的特征码段。
计数策略也可一定程度上从Sample中推测。
Source
2009 Multi-University Training Contest 16 - Host by NIT
Recommend
lcy
Statistic | Submit | Discuss | Note
代码:
#include<cstdio>
#include<iostream>
#include<algorithm>
#include<cstring>
#include<cmath>
#include<queue>
using namespace std;
#define son_num 27
#define maxn 2000005
char str[1001][55];
char web[maxn];
struct node
{
int code;
int terminal;
node *fail;
node *next[son_num];
node()
{
fail=NULL;
code=0;
terminal=0;
memset(next,NULL,sizeof(next));
}
};
int bns[1005];
void insert(node *root,char *str,int x)
{
node *p=root;
int i=0,index;
while(str[i])
{
index=str[i]-'A';
if(p->next[index]==NULL)
p->next[index]=new node();
p=p->next[index];
i++;
}
p->code=x;
p->terminal++;
}
void build_fail(node *root)
{
queue<node*>que;
root->fail=NULL;
que.push(root);
while(!que.empty())
{
node *temp=que.front();
que.pop();
node *p=NULL;
for(int i=0; i<son_num; i++)
{
if(temp->next[i]!=NULL)
{
if(temp==root) temp->next[i]->fail=root;
else
{
p=temp->fail;
while(p!=NULL)
{
if(p->next[i]!=NULL)
{
temp->next[i]->fail=p->next[i];
break;
}
p=p->fail;
}
if(p==NULL)
temp->next[i]->fail=root;
}
que.push(temp->next[i]);
}
}
}
}
void query(node *root,char *str)
{
int i=0,cnt=0,index,len,num=0;
len=strlen(str);
node *p=root;
while(str[i])
{
if(str[i]<'A'||str[i]>'Z')
{
p=root;
}
else
{
index=str[i]-'A';
while(p->next[index]==NULL&&p!=root)
p=p->fail;
p=p->next[index];
if(p==NULL) p=root;
node *temp=p;
while(temp!=root&&temp->code)
{
bns[temp->code]+=temp->terminal;
temp=temp->fail;
}
}
i++;
}
}
int main()
{
int n;
while(~scanf("%d",&n))
{
memset(bns,0,sizeof(bns));
node *root=new node();
for(int i=1; i<=n; i++)
{
scanf("%s",str[i]);
insert(root,str[i],i);
}
build_fail(root);
scanf("%s",web);
query(root,web);
for(int i=1; i<=n; i++)
{
if(bns[i]!=0)
{
printf("%s: %d\n",str[i],bns[i]);
}
}
}
}
目前为止我能做的题只有板子题,就是根据题意加个变量计数啥的,然后总是会出现超内存问题,所以next[]数组的大小以及变量的个数一定要控制好;
还有AC自动机我说一下自己的理解吧,就是把所有模式串(病毒串)建成一个字典树,然后再写一个建立fail指针的函数,(fail指针的介绍这篇博客说的很明白,怕以后忘记,记下来吧,虽然代码样式和我的不一样,链接)然后就是对主串进行查询,查询的套路也差不多,可能以后做题会发现更多的其他的类型吧。。。
fighting!!!没有谁是不可超越的!!
上一篇: 在vue.js中导出Excel表格
下一篇: JNI函数调用流程,基本数据类型