当前位置: 首页 > news >正文

哈希冲突 及 双哈希

前言

若不知道 哈希和字符串哈希 看我上一个作品:

字符串哈希从入门到精通 

今天讲的约等于它的拓展……

一.解决哈希冲突

1.1 基本概念

字符串哈希 将不同字符串映射成不同的整数。

思想:将字符串映射成一个 p进制数字

我们定义如下哈希函数:(该字符串下标从1开始

                                ​​​​​​​        hash(s)=\sum_{i=1}^{n}s[i]\ * \ p^{n-i}(mod\ M)

例如:p = 131,s = abc,其哈希值为 ​​​​​​​

但是,有时会存在多个不同的字符串哈希值相同的情况,我们通常的处理方式是调整p和M的值,取p为质数,M为大质数

 M 我们要取一个比较大的质数,但是可恶的出题人往往对一些质数如1e9 + 7、998244353等搞一些卡哈希的数据 (恶心)(往往通过生成一个随机数,根据随机数再取质数,去避免卡hash

当然我们肯定是有解决方案了,那就是我们今天要讲的双哈希!!!(其实还有许多方法但考试一般只需要双哈希就够了,如果在意可以去了解一下)

双哈希有多强呢?有一道题叫 Hash Killer III” 题目大概就是让你造数据去卡他的双哈希,直到出题网站倒闭这个题也没人A……

接下来给大家带来方法……

1.2 实现方式

双哈希顾名思义就是模两次hash 防止出题人的狡猾

整理了一个模板(仅供参考)

struct HASH{
	long long sed,mod,h[N],pw[N];
	void init(int ser_in,int mod_in){
		sed=ser_in,mod=mod_in;
		pw[0]=1;
		for(int i=1;i<N;i++){
			pw[i]=pw[i-1]*sed%mod;
		}
	} 
	void make(string s){
		h[0]=s[0]%mod;
		for(int i=1;i<s.size();i++){
			h[i]=(h[i-1]*sed%mod+s[i])%mod;
		}
	}//构造hash
	long long get(int l,int r){
		return (h[r]-h[l-1]*pw[r-l+1]%mod+mod)%mod;
	}//取子串可以根据题目使用
}S1,S2;

该怎么用呢?来个题试试!!!

二.例题《不同子串》

2.1 题目描述

2.2 思路

我们输入完后建立一个pair数组去记录我们的双哈希,然后将数组排序方便下面比较,比较这一个的哈希值与前一个的哈希值(我们已经排序了所以前面的要么比他小,要么相等)是否相等,如果不相等或i==1,那么不同的字串+1

2.3 代码

#include<bits/stdc++.h>
using namespace std;
string s;
int n,l;
const int N=1e6+5;
struct HASH{
	long long sed,mod,h[N],pw[N];
	void init(int ser_in,int mod_in){
		sed=ser_in,mod=mod_in;
		pw[0]=1;
		for(int i=1;i<N;i++){
			pw[i]=pw[i-1]*sed%mod;
		}
	} 
	void make(string s){
		h[0]=s[0]%mod;
		for(int i=1;i<s.size();i++){
			h[i]=(h[i-1]*sed%mod+s[i])%mod;
		}
	}
	long long get(int l,int r){
		return (h[r]-h[l-1]*pw[r-l+1]%mod+mod)%mod;
	}
}S1,S2;//模板
int idx;
pair<long long,long long> ans[N];//双哈希数组
int main(){
    ios::sync_with_stdio(0),cin.tie(0),cout.tie(0);
    int cnt=0;
    cin>>n>>l;
    cin>>s;
    s=" "+s;
    S1.init(114,1e9+7);
    S2.init(114514,998244353);//构造
    S1.make(s);
    S2.make(s);//构建整个字符串的哈希
    for(int i=1;i<=n-l+1;i++){
        ans[++idx].first=S1.get(i,i+l-1);
        ans[idx].second=S2.get(i,i+l-1);//截取字串
    }
    sort(ans+1,ans+idx+1);
    for(int i=1;i<=idx;i++){
        if(ans[i]!=ans[i-1]||i==1){//判断是否为不同字串
            cnt++;
        }
    }
    cout<<cnt;//输出
    return 0;
}

加纳!!!!!

相关文章:

  • 与 AI “对话”,多模态音视频交互
  • NX二次开发刻字功能——打印文本(识别电脑中的字体)
  • 【今日半导体行业分析】2025年3月28日
  • 【透明物体感知的破局之思——读《基于迭代语义与几何融合的透明物体单目深度估计与分割方法》】
  • 如何正确安装和校准在线式气体浓度检测仪?
  • 正则\u与\U符号
  • HTML简单介绍
  • 视图、MySQL、触发器、存储过程、流程控制语句
  • 详细介绍ASSERT()
  • B4X编程语言:字节转换器ByteConverter用法详解
  • 爱普生晶体单元FC2012AN在5G RedCap中的应用
  • Python新手练习——五子棋
  • 霸王茶姬小程序(2025年1月版)任务脚本
  • 指定 Python 3.12.6-slim 作为基础镜像
  • AwesomeQt分享3(含源码)
  • persist 应用自启流程
  • 硬件测试工装设计不合理的补救措施
  • Linux内核2-TFTP与NFS环境搭建
  • 通过Map类和List类的List<Map<>>组合类体会JSON
  • 信号与系统(郑君里)第一章-绪论 1-19 课后习题解答
  • 中方是否支持或参加俄乌谈判?外交部:支持一切有利于和平的努力
  • 外交部:中方支持俄乌直接对话谈判,支持政治解决危机
  • 加快推进科技服务业高质量发展,九部门联合发文
  • 4月份国民经济顶住压力稳定增长
  • 水果预包装带来的环境成本谁来分担?
  • 南京艺术学院博导、雕塑家尹悟铭病逝,年仅45岁