欢迎您访问程序员文章站本站旨在为大家提供分享程序员计算机编程知识!
您现在的位置是: 首页

小学生数学题 - 用第一类斯特林数解决自然数幂求和这个标签真长

程序员文章站 2024-02-24 14:39:34
...

题目和标签都是假的。
题目大意:给定p, k, n,求:
(i=1n1i)mod  pk
保证有解,pkn1018, p105p是奇素数。
例如,当p=3, k=1, n=6的时候,尽管1316都没有意义,但是他们的和是12,就可以计算。
题解:来一波充斥着神奇的推导。

f(n,k)=(i=1n1i)mod  pk

g(n,k)=(i=1,i mod p0n1i)mod  pk

显然有:
f(n,k)=(g(n,k)+f(np,k+1)p)mod  pk

考虑g怎么求:
g(n,k)=(i=1,i mod p0n1i)mod  pk

我们假定i=bp+a, a[1,p)
g(n,k)=(a=1p1b=0nap1a+bp)mod  pk

g(n,k)=(a=1p11ab=0nap11+bpa)mod  pk

我们注意到:
11z=izi

那么令
z=bpa

并代入上式,得到:
g(n,k)=(a=1p11ab=0napi=0k1(bpa)i)mod  pk

这里内层的i之所以枚举到k1是由于当ki时在对pk取模结果是0。
继续化简,将i放到外层枚举:
g(n,k)=(i=0k1(p)ia=1p11ai+1b=0napbi)mod  pk

g(n,k)=(i=0k1(p)ia=1p11ai+1Si(nap))mod  pk

其中Sk(n)表示从0到n的k次幂和,我们推导这个。注意到因为a(0,p)所以nap最小值和最大值之差不会超过1。
我们知道xk_可以用带符号第一类斯特林数展开,即:
xk_=i=1ks(k,i)xi

那么我们把i=k的那一项单独拿出来,就会知道:
xk=xk_i=1k1s(k,i)xi

因此:
Sk(n)=x=0nxk=x=0n(xk_i=1k1s(k,i)xi)

我们注意到:
x=0nxk_=x=0n(xk)k!=1k!x=kn(xk)=1k!(n+1k+1)=(n+1)k+1_k+1

最后一步的转化可以显然的归纳证明是对的。
而:
x=0ni=1k1s(k,i)xi=i=1k1s(k,i)x=0nxi=i=1k1s(k,i)Si(n)

因此:
Sk(n)=(n+1)k+1_k+1i=1k1s(k,i)Si(n)

这样Si(n)(i=0...k)就可以在O(k2)时间内求出。
前面的下降幂下面的除数不能直接逆元算,要特判。
乘法取模不能直接乘,可能会爆炸longlong,因此我开了__int128。
在算g函数的时候需要预处理幂和,这样复杂度显然就是O(pklgpn)的了。

#include<iostream>
#include<cstring>
#include<cstdio>
#include<algorithm>
#include<assert.h>
#define lint long long
#define MAXK 200
#define MAXP 100010
#define debug(x) cerr<<#x<<"="<<x
#define sp <<" "
#define ln <<endl
using namespace std;
lint s[MAXK][MAXK],pk[MAXK],ivk[MAXP][MAXK];
inline lint tms(lint x,lint y,lint k) { return (__int128)x*y%pk[k]; }
inline lint fast_pow(lint x,lint k,lint qk)
{
    lint ans=1ll;
    for(;k;k>>=1,x=tms(x,x,qk))
        if(k&1ll) ans=tms(ans,x,qk);
    return ans;
}
inline lint prelude_stirling(lint n,lint k)
{
    s[1][1]=1;
    for(lint i=2;i<=n;i++)
        for(lint j=1;j<=i;j++)
            s[i][j]=(tms(s[i-1][j],i-1,k)+s[i-1][j-1])%pk[k];
    for(lint i=1;i<=n;i++)
        for(lint j=1;j<=i;j++)
            if((i+j)&1) s[i][j]=(pk[k]-s[i][j])%pk[k];
    return 0ll;
}
lint sk1[MAXK],sk2[MAXK];
lint getS(lint k,lint n,lint qk,lint *sk)
{
    memset(sk,0,sizeof(lint)*(k+1)),sk[0]=(n+1)%pk[qk];
    if(n<=0||k==0) return 0;
    if(n&1) sk[1]=tms((n+1)/2,n,qk);
    else sk[1]=tms(n/2,n+1,qk);
    for(lint i=2;i<=k;i++)
    {
        if(n-i+1<=0) sk[i]=0;
        else{
            sk[i]=1;lint nc=1;
            for(lint j=n+1;j>=n-i+1;j--)
                if(j%(i+1)==0&&nc) sk[i]=tms(sk[i],j/(i+1),qk),nc=0;
                else sk[i]=tms(sk[i],j,qk);
        }
        for(lint j=1;j<i;j++)
        {
            sk[i]=(sk[i]-tms(sk[j],s[i][j]%pk[qk],qk))%pk[qk];
            if(sk[i]<0) sk[i]+=pk[qk];
        }
    }
    return 0ll;
}
lint G(lint n,lint k)
{
    lint ans=0ll,r=n%pk[1];
    getS(k-1,n/pk[1]-1,k,sk1),getS(k-1,n/pk[1],k,sk2);
    for(lint i=0;i<k;i++)
    {
        lint pi=pk[i],s=0ll;if(i&1) pi=(pk[k]-pi)%pk[k];
        for(lint a=1;a<=min(pk[1]-1,n);a++)
            if(a<=r) s=(s+tms(ivk[a][i+1]%pk[k],sk2[i],k))%pk[k];
            else s=(s+tms(ivk[a][i+1]%pk[k],sk1[i],k))%pk[k];
        ans=(ans+tms(pi,s,k))%pk[k];
    }
    return ans;
}
lint F(lint n,lint k) { return n?(G(n,k)+F(n/pk[1],k+1)/pk[1])%pk[k]:0; }
int main()
{
    lint p,k,n;scanf("%lld%lld%lld",&p,&k,&n);
    lint qk=k,ns=n;while(ns) ns/=p,k++;
    for(lint i=pk[0]=1;i<=k;i++) pk[i]=pk[i-1]*p;
    prelude_stirling(k,k);
    for(lint i=1;i<p;i++)
    {
        ivk[i][0]=1,ivk[i][1]=fast_pow(i,pk[k]-pk[k-1]-1,k);
        for(lint j=2;j<=k;j++) ivk[i][j]=tms(ivk[i][j-1],ivk[i][1],k);
    }
    return !printf("%lld\n",F(n,qk));
}