[NOI2014] 字符串(题解)

发布时间 2023-10-13 08:19:55作者: 逆行伐仙

字符串(题解)

题目描述

近日,园长发现动物园中好吃懒做的动物越来越多了。例如企鹅,只会卖萌向游客要吃的。为了整治动物园的不良风气,让动物们凭自己的真才实学向游客要吃的,园长决定开设算法班,让动物们学习算法。

一句话题意:我们会处理kmp算法中的fail[]数组,来记录[1, i ]的真前后缀的最大值。现要求求解num[]数组,用来记录[1,i ]的不重合(长度<=½)的前后缀个数。需要输出(num[1]+1)(num[2]+1)(num[3]+1)……(num[l]+1).

输入格式

第 1 行仅包含一个正整数 n,表示测试数据的组数。

随后 n行,每行描述一组测试数据。每组测试数据仅含有一个字符串 S,S 的定义详见题目描述。

数据保证 S 中仅含小写字母。输入文件中不会包含多余的空行,行末不会存在多余的空格。

输出格式

包含 n 行,每行输出答案对1e9+7取模的结果。

样例

输入数据 1

3
aaaaa
ab
abcababc

Copy

输出数据 1

36
1
32

Copy

数据规模与约定

多组数据:t<=5,n<=1e6

思路

我想着先用普通的KMP算法求出fail[]数组,最后在每一位时向前跳fail[],只要跳到 ½·i 的位置就将

答案 +1 ,最后再将答案累乘。

然后觉得算法太劣了,所以就记录了sum[]数组,用来记录 [1, i ]的所有真前后缀的匹配个数,再求

fail[]就可以用:sum[i]=sum[j]+1 递推求出。

但是如果给你1e6个a,程序会被卡到接近n方,直接爆掉。所以想到 j 再跳 fail[] 时,可以限定 j 的

范围,让 j 一直保持在 ½·i 的位置,这样想计算时,每次 j 跳的次数不超过两次(均摊)。

AC代码

#include<bits/stdc++.h>
#define SIZE 100
#define mod 1000000007
#define ri register int
using namespace std;
char buf[SIZE],*p1=buf,*p2=buf;
inline int gc(){return (p1==p2)&&(p2=(p1=buf)+fread(buf,1,SIZE,stdin),p1==p2)?EOF:*p1++;}
const int N=1e6+2;
int n,ne[N],sum[N];
long long ans;
char a[N];
int main(){
cin>>n;
while(n--){
int l=0;char ch;
ans=1;sum[0]=0; sum[1]=1;
memset(ne,0,sizeof(ne));
while(!islower(ch=gc()));
while(islower(ch)){a[++l]=ch;ch=gc();}
for(ri i=2,j;i<=l;++i){
j=ne[i-1];
while(j&&a[j+1]!=a[i]) j=ne[j];
if(a[j+1]==a[i]) j++;
ne[i]=j;sum[i]=sum[j]+1;
}for(ri i=2,j=0;i<=l;++i){
while(j&&a[j+1]!=a[i]) j=ne[j];
if(a[j+1]==a[i]) j++;
while(j>(i>>1)) j=ne[j];
ans=(ans*1ll*(sum[j]+1))%mod;
}
printf("%lld\n",ans);
}
return 0;
}