设 \(f_i(s)\) 表示 \(s\) 是否有长度为 \(i\) 的 \(\text{border}\),其取值为 \(0\) 或 \(1\),不可贵答案为:c++
若 \(s\) 有长度为 \(i\) 的 \(\text{border}\),则其有长度为 \(n-i\) 的周期,所以将 \(f_i(s)\) 的定义改成周期,答案的式子不变。当 \(s\) 有周期 \(i,j\) 时,考虑将必定相同的位置连边,若获得 \(cnt\) 个连通块,则有:git
式子的含义就是连通块第一个点的字符随便选,其余点要和该连通块第一个点的字符相同。spa
当 \(i+j \leqslant n\) 时,由于有周期 \(i\),造成了模 \(i\) 意义下的剩余系,因而只需考虑前 \(i\) 个点,由于前 \(i\) 个点都能向后连一条长度为 \(j\) 的边,所以获得 \(\gcd(i,j)\) 个连通块。当 \(i+j>n\) 时,只有前 \(n-j\) 个点能向后连边,每连一条边都有可能使连通块个数减一,但当连边造成环时,连通块个数就不变,得连通块个数为 \(i+j-n\) 加上环的个数,不可贵到环的个数为 \(\max(n-j-(i-\gcd(i,j)),0)\)。code
整理后代入答案的式子得:get
枚举 \(i+j\) 和 \(\gcd(i,j)\) 得:it
设 \(l=\max(1,\frac{s}{g}-\left\lfloor \frac{n-1}{g}\right\rfloor),r=\min(\left\lfloor\frac{n-1}{g}\right\rfloor,\frac{s}{g}-1)\),反演得:class
注意到:gc
所以直接用推得的式子计算的复杂度为 \(O(n\log^2n)\)。im
#include<bits/stdc++.h> #define maxn 200010 #define p 1000000007 using namespace std; typedef long long ll; template<typename T> inline void read(T &x) { x=0;char c=getchar();bool flag=false; while(!isdigit(c)){if(c=='-')flag=true;c=getchar();} while(isdigit(c)){x=(x<<1)+(x<<3)+(c^48);c=getchar();} if(flag)x=-x; } int n,k,tot; ll ans; int pri[maxn]; ll mu[maxn],pw[maxn]; bool tag[maxn]; vector<int> ve[maxn]; ll inv(ll x) { ll v=1,y=p-2; while(y) { if(y&1) v=v*x%p; x=x*x%p,y>>=1; } return v; } void init(int n) { mu[1]=pw[0]=1; for(int i=1;i<=n;++i) pw[i]=pw[i-1]*k%p; for(int i=2;i<=n;++i) { if(!tag[i]) mu[pri[++tot]=i]=p-1; for(int j=1;j<=tot;++j) { int k=i*pri[j]; if(k>n) break; tag[k]=true; if(i%pri[j]) mu[k]=p-mu[i]; else break; } } for(int i=1;i<=n;++i) for(int j=i;j<=n;j+=i) ve[j].push_back(i); } ll calc(int lim,int sum) { if(lim<=0||sum<=1) return 0; ll l=max(1,sum-lim),r=min(lim,sum-1),v=0; if(l>r) return 0; for(int i=0;i<ve[sum].size();++i) { int d=ve[sum][i]; v=(v+mu[d]*(r/d-(l-1)/d)%p)%p; } return v; } int main() { read(n),read(k),init(2*n); for(int s=2;s<=2*n-2;++s) { for(int i=0;i<ve[s].size();++i) { int g=ve[s][i]; ans=(ans+calc((n-1)/g,s/g)*pw[max(s-n,g)]%p)%p; } } printf("%lld",ans*inv(pw[n])%p); return 0; }