欢迎您访问程序员文章站本站旨在为大家提供分享程序员计算机编程知识!
您现在的位置是: 首页  >  IT编程

CodeForces 1313E Concatenation with intersection

程序员文章站 2022-03-25 17:41:44
"洛谷题目页面传送门" & "CodeForces题目页面传送门" 给定$3$个字符串$a,b,c,|a|=|b|=n,|c|=m$,求满足以下全部条件的有序区间对$([l1,r1],[l2,r2])$的个数: 1. $[l1,r1]\cap[l2,r2]\neq\varnothing$; 1. $ ......

洛谷题目页面传送门 & codeforces题目页面传送门

给定\(3\)个字符串\(a,b,c,|a|=|b|=n,|c|=m\),求满足以下全部条件的有序区间对\(([l1,r1],[l2,r2])\)的个数:

  1. \([l1,r1]\cap[l2,r2]\neq\varnothing\)
  2. \(a_{l1\sim r1}+b_{l2\sim r2}=c\)

\(n\in\left[1,5\times10^5\right],m\in[2,2n]\)

\(c\)\(a,b\)各一个子串拼接而成,不难想到两面夹击——从\(a_{l1}\)往后与\(c\)的前缀匹配、从\(b_{r2}\)往前与\(c\)的后缀匹配。于是我们可以预处理出\(2\)个数组\(lcp:lcp_i=\max\limits_{a_{i\sim i+j-1}=c_{1\sim j}}\{j\},lcs:lcs_i=\max\limits_{b_{i-j+1\sim i}=c_{m-j+1\sim m}}\{j\}\),对\(c+\texttt!+a,c^\mathrm r+\texttt!+b^\mathrm r\)\(2\)个字符串各跑一遍z算法即可。

假设我们已经固定住了\(l1,r2\)。设从\(l1\)往后延伸了\(x\)位,从\(r2\)往前自然就延伸了\(m-x\)位,于是\(r1=l1+x-1,l2=r2-m+x+1\)

考虑满足题目中的条件\(1\)的充要条件。满足条件\(1\)当且仅当\([l1,r1]\cap[l2,r2]=[l1,l1+x-1]\cap[r2-m+x+1,r2]=[\max(l1,r2-m+x+1),\min(l1+x-1,r2)]\neq\varnothing\),即\(\max(l1,r2-m+x+1)\leq\min(l1+x-1,r2)\),即\(\begin{cases}l1\leq l1+x-1\\l1\leq r2\\r2-m+x+1\leq l1+x-1\\r2-m+x+1\leq r2\end{cases}\),即\(\begin{cases}x\in[1,m-1]\\r2\in[l1,l1+m-2]\end{cases}\)

再考虑满足条件\(2\)的充要条件。满足条件\(2\)当且仅当\(\begin{cases}x\leq lcp_{l1}\\m-x\leq lcs_{r2}\end{cases}\),即\(x\in[m-lcs_{r2},lcp_{l1}]\)

综上,若已知\(l1,r2,x\),那么满足题目中的所有条件当且仅当\(\begin{cases}r2\in[l1,l1+m-2]\\x\in[\max(1,m-lcs_{r2}),\min(m-1,lcp_{l1})]\end{cases}\)。显然\(\forall l1\in[1,n],\forall r2\in[l1,\min(n,l1+m-2)]\)\(r2\)对答案贡献为\(\max(1,\min(m-1,lcp_{l1})-\max(1,m-lcs_{r2})+1)\)。这里面有个\(\max\),比较讨厌,我们把它分成\(\min(m-1,lcp_{l1})-\max(1,m-lcs_{r2})+1\geq1\)\(\min(m-1,lcp_{l1})-\max(1,m-lcs_{r2})+1<1\)\(2\)种情况。对于后者,显然贡献为\(0\),无需考虑;对于前者,即\(\max(1,m-lcs_{r2})\leq \min(m-1,lcp_{l1})\),贡献为\(\min(m-1,lcp_{l1})-\max(1,m-lcs_{r2})+1\)

所以答案显然为\(\sum\limits_{l1=1}^n\sum\limits_{r2\in[l1,\min(n,l1+m-2)],\max(1,m-lcs_{r2})\leq\min(m-1,lcp_{l1})}(\min(m-1,lcp_{l1})-\max(1,m-lcs_{r2})+1)\)。由于当\(l1\)单调递增时,\(r2\)所在区间的左端点和右端点也同时单调递增,我们可以用two-pointers维护。不妨在值域上建一个bit,然后从左往右枚举\(l1\),每次添加、删除各\(0\sim1\)\(\max(1,m-lcs_{r2})\)。答案中的求和式可以分成分别关于\(l1,r2\)\(2\)部分\(\min(m-1,lcp_{l1})+1,-\max(1,m-lcs_{r2})\),对\(2\)部分分别求和,显然bit不仅要实现值域上的区间求和,还要实现值域上的区间计数。枚举到每个\(l1\),设添加、删除完\(\max(1,m-lcs_{r2})\)后,值域上的区间\([1,\min(m-1,lcp_{l1})]\)内求和的结果为\(sum\),计数的结果为\(cnt\),则对答案的贡献是\(cnt\cdot(\min(m-1,lcp_{l1})+1)+sum\)。哦对了,别忘了在\(l1=1\)的时候把\(\forall r2\in[1,\min(n,m-1)],\max(1,m-lcs_{r2})\)全部添加到bit里哦!

\(\forall r2\in[1,n]\)\(\max(1,m-lcs_{r2})\)最多会被添加、删除各\(1\)次,每次\(\mathrm o(\log_2m)\),所以复杂度\(\mathrm o(n\log_2m)\)。再加上之前\(\mathrm o(n+m)\)的z算法,总复杂度\(\mathrm o(m+n\log_2m)\)

上代码!

#include<bits/stdc++.h>
using namespace std;
#define int long long//答案会爆int 
int lowbit(int x){return x&-x;} 
const int n=500000,m=1000000;
int n/*|a|=|b|*/,m/*|c|*/; 
char a[n+5],b[n+5],c[m+5];//3个字符串 
int lcp[n+1],lcs[n+1];//lcp[i],lcs[i]各表示从a,b的第i位开始向后、向前最多能与c的前缀、后缀匹配的位数 
int s;//|d|
char d[n+m+5];//临时字符串 
void con(char x[],char y[]){//令d=x+'!'+y 
    s=0;
    for(int i=1;i<=m;i++)d[++s]=x[i];
    d[++s]='!';
    for(int i=1;i<=n;i++)d[++s]=y[i];
}
int z[n+m+2];//z数组 
void z_init(){//z算法 
    z[1]=s;
    int zl=0,zr=0;
    for(int i=2;i<=s;i++)
        if(zr<i){
            z[i]=0;
            while(i+z[i]<=s&&d[i+z[i]]==d[1+z[i]])z[i]++;
            if(z[i])zl=i,zr=i+z[i]-1;
        }
        else if(i+z[i-zl+1]<=zr)z[i]=z[i-zl+1];
        else{
            z[i]=zr-i+1;
            while(i+z[i]<=s&&d[i+z[i]]==d[1+z[i]])z[i]++;
            zl=i;zr=i+z[i]-1;
        }
}
struct bitree{//bit 
    int sum[m+1]/*和*/,cnt[m+1]/*计数*/;
    void init(){
        memset(sum,0,sizeof(sum));
        memset(cnt,0,sizeof(cnt));
    }
    void add(int v){//添加 
        int x=v;
        while(x<=n)sum[x]-=v,cnt[x]++,x+=lowbit(x);
    }
    void del(int v){//删除 
        int x=v;
        while(x<=n)sum[x]+=v,cnt[x]--,x+=lowbit(x);
    }
    int sum(int x){//求前缀和 
        int res=0;
        while(x)res+=sum[x],x-=lowbit(x);
        return res;
    }
    int cnt(int x){//求前缀计数 
        int res=0;
        while(x)res+=cnt[x],x-=lowbit(x);
        return res;
    }
}bit;
signed main(){
    scanf("%lld%lld%s%s%s",&n,&m,a+1,b+1,c+1);
    con(c,a);
    z_init();
    for(int i=1;i<=n;i++)lcp[i]=z[m+1+i];//求lcp 
    reverse(b+1,b+n+1);reverse(c+1,c+m+1);con(c,b);
    z_init();
    for(int i=1;i<=n;i++)lcs[i]=z[m+1+(n-i+1)];//求lcs 
//  for(int i=1;i<=n;i++)printf("%lld %lld\n",lcp[i],lcs[i]);
    int ans=0;
    bit.init();
    for(int i=1;i<=min(n,m-1);i++)bit.add(max(1ll,m-lcs[i]));//在l1=1时预先添加r2 in [1,min(n,m-1)]
    for(int i=1;i<=n;i++){
        if(i>1)bit.del(max(1ll,m-lcs[i-1]))/*删除r2=i-1*/,i+m-2<=n&&(bit.add(max(1ll,m-lcs[i+m-2])),0)/*添加r2=i+m-2*/;
        ans+=(min(m-1,lcp[i])+1)*bit.cnt(min(m-1,lcp[i]))+bit.sum(min(m-1,lcp[i]));//贡献答案 
//      cout<<ans<<"\n";
    }
    cout<<ans;
    return 0;
}

最后说句闲话,你们知道为什么这题难度这么高吗?

因为这场比赛的d非常难