AcWing 138. 兔子与兔子 字符串Hash

本文介绍了一种使用字符串哈希技术来快速判断两个DNA序列是否相同的算法。通过将DNA序列视为P进制数并利用哈希值进行比较,可以高效地解决兔子DNA序列的相似性查询问题。

摘要生成于 C知道 ,由 DeepSeek-R1 满血版支持, 前往体验 >

很久很久以前,森林里住着一群兔子。

有一天,兔子们想要研究自己的 DNA 序列。

我们首先选取一个好长好长的 DNA 序列(小兔子是外星生物,DNA 序列可能包含 26 个小写英文字母)。

然后我们每次选择两个区间,询问如果用两个区间里的 DNA 序列分别生产出来两只兔子,这两个兔子是否一模一样。

注意两个兔子一模一样只可能是他们的 DNA 序列一模一样。

输入格式

第一行输入一个 DNA 字符串 S。

第二行一个数字 m,表示 m 次询问。

接下来 m 行,每行四个数字 l1,r1,l2,r2l1,r1,l2,r2,分别表示此次询问的两个区间,注意字符串的位置从1开始编号。

输出格式

对于每次询问,输出一行表示结果。

如果两只兔子完全相同输出 Yes,否则输出 No(注意大小写)。

数据范围

1≤length(S),m≤10000001≤length(S),m≤1000000

输入样例:

aabbaabb
3
1 3 5 7
1 3 6 8
1 2 1 2

输出样例:

Yes
No
Yes
难度:简单
时/空限制:1s / 64MB
总通过数:480
总尝试数:965
来源:《算法竞赛进阶指南》

 

字符串hash的经典入门题,具体原理:https://blog.csdn.net/sdz20172133/article/details/98859255

//核心思想:将字符串看成P进制数,P的经验值是131或13331,取这两个值的冲突概率低
//小技巧:取模的数用2^64,这样直接用unsigned long long存储,溢出的结果就是取模的结果
#include<bits/stdc++.h>
using namespace std;
typedef unsigned long long ULL;
const int N=1e6+5;
ULL h[N], power[N]; // h[k]存储字符串前k个字母的哈希值, power[k]存储 P^k mod 2^64
char str[N];
int len,P;
// 初始化
void calHash()
{
	P=131;
    power[0] = 1;
    for (int i = 1; i <= len; i ++ )
    {
        h[i] = h[i - 1] * P + (str[i]-'a'+1);
        power[i] = power[i - 1] * P;
    }
}


// 计算子串 str[l ~ r] 的哈希值
ULL get(int l, int r)
{
    return h[r] - h[l - 1] * power[r - l + 1];
}

int main()
{
	scanf("%s",str+1);
	len=strlen(str+1);
	calHash();
	int m;
	scanf("%d",&m);
	while(m--)
	{
	  int l1,r1,l2,r2;
	  scanf("%d%d%d%d",&l1,&r1,&l2,&r2);
	  if(get(l1,r1)==get(l2,r2))
	  {
	  	printf("Yes\n");
	  }
	  else
	  {
	  	printf("No\n");
	  }
	}
	return 0;
}

 

评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值