-
2022-01-26 20:42:25
哈希值简介
概述:
哈希值就是JDK根据指定的对象的地址,字符串,数字等属性计算出来的一个int类型的值。可以把哈希值理解为就是对象对应的编号
特点
1.同一个对象多次调用hashCode()方法获取哈希值,结果肯定是一样的。 2.默认情况下,不同对象的哈希值是不同的,但我们可以通过方法重写,实现让不同对象的哈希值也相同。 3.同一个对象的哈希值肯定相同,不同对象的哈希值一般不同,有可能出现相同的情况,尽量避免 4.实际开发中,我们认为,如果同一个类的两个对象的各个属性值都相同,那么它们就是同一个对象。
如何获取哈希值
可以通过Object#hashCode()方法实现,即:public int hashCode(); 获取对象的哈希值。
更多相关内容 -
C#计算字符串哈希值(MD5、SHA)的方法小结
2020-09-03 10:42:30主要介绍了C#计算字符串哈希值(MD5、SHA)的方法,以实例形式较为详细的分析总结了C#计算字符串哈希值的各种常用技巧,具有一定参考借鉴价值,需要的朋友可以参考下 -
android apk sha256哈希值签名验证示例
2020-08-14 16:16:26获取apk的sha256哈希值,对apk的签名进行验证,仅供参考 -
单哈希值碰撞工具.exe
2020-06-08 18:15:34哈希值碰撞工具,通过哈希值,逆向计算出哈希文本,MD5值 。计算机,以及游戏常用的储存数据手段, -
Kali Linux-findmyhash命令-破解哈希值.docx
2021-10-29 13:47:26Kali Linux-findmyhash命令-破解哈希值.docx -
哈希值MD5校验工具.zip
2020-07-23 21:15:37哈希值MD5校验工具.zip -
文件哈希值计算工具
2018-05-06 12:01:39检测SHA1值官方校验. 可在线核对md5 文件校验工具ihasher是微软原版镜像分享站我告诉你出品的一款富有特色的文件校验值计算工具。ihasher除了能够对镜像进行校验之外,还提供了在线验证功能,如果镜像计算后的校验码... -
FileHashTool:Windows GUI 实用程序,将计算和显示指定文件的 MD5、SHA-1、SHA-256 和 SHA-512 哈希值
2021-06-25 16:19:24GUI 实用程序,将计算和显示指定文件的 MD5、SHA-1、SHA-256 和 SHA-512 哈希值。 计算完成后,它还会将哈希文本复制到剪贴板。 先决条件 PowerShell v3 或更新版本 关于 出于兼容性原因以 32 位模式编译 在 ... -
哈希值爆破
2018-09-10 12:02:07可针对md5 sha1 sha224 sha256 sha384 sha512六种常见类型进行爆破 -
棉花团酷狗哈希值解析直链下载地址(酷狗音乐mp3链接生成器)V1.1绿色版
2019-07-25 12:46:13棉花团酷狗哈希值解析直链下载地址(酷狗音乐mp3链接生成器)是一款可以根据酷狗音乐哈希值提取直链地址,时间,大小等歌曲信息。很多人想把酷狗里面的音乐设置为qq空间背景音乐,那么酷狗里面的歌如何设为QQ空间的... -
易语言取QQ哈希值
2020-07-23 03:42:18易语言取QQ哈希值源码,取QQ哈希值,hash -
文件哈希值比较工具Hasher绿色版.rar
2019-09-04 11:14:18Hasher Pro绿色版用于验证哈希值,也可用于校验2个文件的哈希值是否相同。拖拽你的文件和文件夹到软件窗口中,按住SHIFT键来比较下一个或CTRL键比较两个文件。可校验的内容:CRC32/MD2/MD4/MD5/SH1/SHA256/SHA512/... -
MD5-Hash哈希值校验工具
2016-11-02 19:06:04MD5-Hash哈希值校验工具 -
取QQ哈希值.rar
2020-04-06 23:12:14取QQ哈希值.rar -
哈希值转换程序
2014-10-10 12:15:46该程序可以将你需要加密的数字转换为哈希值,起到加密安全的作用 -
gethash:一组命令行工具,可以生成或检查各种哈希值
2021-04-03 19:07:38一组可以生成或检查各种哈希值的命令行工具。 安装 需要Python 3.6及更高版本。 $ pip install -U gethash 或(如果您需要旧式哈希算法) $ pip install -U gethash[all] 用法 安装后,有9个命令可用: crc32 ... -
获取哈希值
2018-01-29 16:55:46HashHash 获取哈希值获取哈希值获取哈希值获取哈希值获取哈希值 -
易语言取QQ哈希值源码-易语言
2021-06-13 07:40:50易语言取QQ哈希值源码 -
多算法哈希值计算软件工具v1.1绿色版
2019-07-25 06:44:46多算法哈希值计算软件工具支持计算字符串的哈希值和计算文件的哈希值,支持MD5、CRC32、SHA1(160)、SHA-224、SHA-256、SHA-384、SHA-512算法。一个软件即可计算多种算法,非常强大好用! -
利用打印机窃取目标系统哈希值.pdf
2019-12-04 18:13:32利用打印机窃取目标系统哈希值,获取目标系统的高级权限,通过其他系统连接打印机的信息。网络上的打印机的配置文件修改方法。 -
哈希值计算
2015-12-18 21:02:15一个完全免费而且体积小巧的哈希值计算程序,支持字符串和文件的哈希值计算,使用的时候只需把你需要计算哈希值的文件拖放到程序窗口中即可。 -
Hasher Pro(哈希值校验)3.2汉化版.rar
2019-09-03 16:15:38使用方法:点击添加按钮添加要校验的文件,也可拖拽文件或文件到软件窗口中计算哈希值,按住SHIFT与下一个文件对比或按住CTRL对比两个文件。可以计算文件的:CRC32/MD2/MD4/MD5/SH1/SHA256/SHA512/RMD128/RMD168/ED2K... -
棉花团酷狗哈希值解析直链下载地址 v1.0.zip
2019-07-15 13:48:51棉花团酷狗哈希值解析直链下载地址根据酷狗音乐哈希值来获取歌曲的各种信息,比如:直链地址、比特率、时间、歌曲名称、文件大小、文件类型,也就是说不管你用什么方法获取到哈希值即可解析这些信息了。 使用方法:... -
【数据结构】哈希表、哈希值计算分析
2021-03-08 09:54:03哈希表、哈希值计算分析引出哈希表哈希表(Hash Table)哈希冲突(Hash Collision)JDK1.8的哈希冲突解决方案哈希函数如何生成 key 的哈希值Integer 的哈希值计算Float 的哈希值计算Long 的哈希值计算那么, `^` 和 ...哈希表、哈希值计算分析
哈希表完整代码
引出哈希表
设计一个写字楼通讯录,存放所有公司的通讯信息
- 座机号码作为 key(假设座机号码最长是 8 位),公司详情(名称、地址等)作为 value
- 添加、删除、搜索的时间复杂度要求是 O(1)
我们用这种思路,将座机号码作为索引值(数组索引),公司详情作为数据元素值(数组的值)。
由于数组添加、删除、搜索元素的时间复杂度都是 o ( 1 ) o(1) o(1),可以达到要求。
但是这种做法有缺点。
-
空间复杂度非常大
要保证存储所有元素,所以需要开辟一个非常大的空间。 -
空间使用率极其低,非常浪费内存空间
就拿电话号码来说,开辟了100000000大小的空间,但是1~99999999之间有很多数字是索引值是用不到的。
其实 数组companies 就是一个哈希表,典型的 【空间换时间】。
哈希表(Hash Table)
哈希表也叫做散列表(hash有“剁碎”的意思)
哈希表是如何实现高效处理数据的?
put("Jack",666); put("Rose",777); put("Kate",888);
1.利用哈希函数生成 key 对应的 index【 O ( 1 ) O(1) O(1)】
2.根据 index 操作定位数组元素【 O ( 1 ) O(1) O(1)】
-
哈希表添加、搜索、删除的流程都是类似的
-
哈希表是【空间换时间】的典型应用
-
哈希函数,也叫做 散列函数
-
哈希表内部的数组元素,很多地方也叫 Bucket(桶),整个数组叫 Buckets 或者 Bucket Array
哈希冲突(Hash Collision)
哈希冲突 也叫做 哈希碰撞
-
2 个不同的 key,经过哈希函数计算出相同的结果
-
key1 ≠ key2,hash(key1) = hash(key2)
如下图,“Rose” 不等于 “Kate”,但是经过哈希函数算出来的索引确实相同的,此时就产生了冲突。
解决哈希冲突的常见方法-
开放定址法(Open Addressing) ✓ 按照一定规则向其他地址探测,直到遇到空桶
线性探测:往下 一个一个顺序查找,直到遇到空桶
平方探测:往下按照平方数顺序查找,直到遇到空桶 -
再哈希法(Re-Hashing) ✓ 设计多个哈希函数
-
链地址法(Separate Chaining) ✓ 比如通过链表将同一index的元素串起来
JDK1.8的哈希冲突解决方案
-
默认使用单向链表将元素串起来
-
在添加元素时,可能会由单向链表转为红黑树来存储元素
比如当哈希表容量 ≥ 64 且 单向链表的节点数量大于 8 时 -
当红黑树节点数量少到一定程度时,又会转为单向链表
-
JDK1.8 中的哈希表是使用 链表+红黑树 解决哈希冲突
思考:这里为什么使用单链表而不是双向链表?
-
每次都是从头节点开始遍历(依次比较每个元素,若有相同key则替换原本的值,若无相同key,则将新元素添加在链表尾部)
-
单向链表比双向链表少一个指针,可以节省内存空间
哈希函数
◼ 哈希表中哈希函数的实现步骤大概如下
- 先生成 key 的哈希值(必须是整数)
- 再让 key 的哈希值 跟 数组的大小 进行相关运算,生成一个索引值
◼ 为了提高效率,可以使用
&
位运算取代%
运算【前提:将数组的长度设计为 2 的幂( 2 n 2^n 2n)】
将数组的长度设计为 2 的幂( 2 n 2^n 2n)是因为 2 n − 1 2^{n - 1} 2n−1 的二进制必然为全 110 - 1 = 1 2^1 - 1 = 1 100 - 1 = 11 2^2 - 1 = 3 1000 - 1 = 111 2^3 - 1 = 7 10000 - 1 = 1111 2^4 - 1 = 15 100000 - 1 = 11111 2^5 - 1 = 31
哈希值的二进制与一个全为1的二进制
&
(与),结果必然小于等于哈希值,如下图。
◼ 良好的哈希函数,让哈希值更加均匀分布 → 减少哈希冲突次数 → 提升哈希表的性能如何生成 key 的哈希值
key 的常见种类可能有
-
整数、浮点数、字符串、自定义对象
-
不同种类的 key ,哈希值的生成方式不一样,但目标是一致的
尽量让每个 key 的哈希值是唯一的尽量让 key 的所有信息参与运算(即让key的所有数字、内容参与运算)
在Java中,HashMap 的 key 必须实现 hashCode、equals 方法,也允许 key 为
null
Integer 的哈希值计算
整数值当做哈希值
比如 10 的哈希值就是 10
Java 中
Integer.hashCode()
源码:
Float 的哈希值计算
将存储的二进制格式转为整数值
Java 中
Float.hashCode()
源码:
Long 的哈希值计算
Long.HashCode()
,Java源码如下:
那么,
^
和>>>
的作用是什么呢?-
高32bit 和 低32bit 混合计算出 32bit 的哈希值
-
充分利用所有信息计算出哈希值
>>>
即 无符号右移,代码中的 value >>> 32 即将 value 的值无符号右移 32 位。^
即位运算中的异或,它的作用是:两数异或,不同为1,相同为0。为什么用 ^ 而不用 &、| 呢?
& 与
:结果就是低32位,那高32位相当于没参数运算| 或
:如果高32位都是1,那么结果全是1,很容易造成哈希冲突^ 异
:最合适的,把高32位 和 低32位,全部参与运算
>>>
无符号右移:无论正负数高位全部补0
>>
有符号右移:正数高位全部补0,负数高位全部补1
由上图可知,将 64bit 的二进制数字,无符号右移 32bit 后,左边32位必然全为 0(第二行), 右边则为左32位的数字,(value ^ (value >>> 32))
相当于用自己的右32位 异或 自己的左32位,最后(int)
强转回了 32bit ,相当于把左边的32位全部去掉。这样可以充分利用了自身所有信息来计算哈希值。Double 的哈希值计算
Double.HashCode()
的计算和 Long 差不多
String 的哈希值计算
思考一下:整数 5489 是如何计算出来的?
5 ∗ 1 0 3 + 4 ∗ 1 0 2 + 8 ∗ 1 0 1 + 9 ∗ 1 0 0 5 ∗ 10^3 + 4 ∗ 10^2 + 8 ∗ 10^1 + 9 ∗ 10^0 5∗103+4∗102+8∗101+9∗100
字符串是由若干个字符组成的
-
比如字符串 jack,由 j、a、c、k 四个字符组成(字符的本质就是一个整数)
-
因此,
jack
的哈希值可以表示为 j ∗ n 3 + a ∗ n 2 + c ∗ n 2 + k ∗ n 0 j \ ∗\ n^3 + a\ ∗\ n^2 + c\ ∗\ n^2 + k\ ∗\ n^0 j ∗ n3+a ∗ n2+c ∗ n2+k ∗ n0
等价于 [ ( j ∗ n + a ) ∗ n + c ] ∗ n + k [(j*n + a) * n + c ] * n + k [(j∗n+a)∗n+c]∗n+k(这样写效率比上面更高)
new String().hashCode()
源码如下:
由上图可知,在JDK中,乘数n为31,为什么使用31?-
JVM 会将 31 * i 优化成 (i << 5) - i
-
31 ∗ i = ( 2 5 − 1 ) ∗ i = i ∗ 2 5 − i 31 * i =(2^5-1) * i = i * 2^5 - i 31∗i=(25−1)∗i=i∗25−i
-
31 不仅仅是符合 2 n − 1 2^n − 1 2n−1 ,它是个奇素数(既是奇数,又是素数,也就是质数)
-
素数和其他数相乘的结果比其他方式更容易产成唯一性,减少哈希冲突
-
最终选择 31 是经过观测分布结果后的选择
因此在Java中,下面两种写法完全等价。
自定义对象 的哈希值
自定义对象作为key
重写hashCode方法和equals方法
自定义对象作为 key,最好同时重写 hashCode 、equals 方法,什么时候调用?
-
hashCode
:计算索引的时候调用,让索引分布均匀,避免哈希冲突,即插入到数组中的哪个位置的时候; -
equals
:当发生哈希冲突,比较两个对象是否相同的时候调用,即在计算完hashCode的之后
equals 用以判断 2 个key 是否为同一个key。
-
自反性
对于任何非 null 的 x
x.equals(x)
必须返回 true -
对称性
对于任何非 null 的 x、y
如果y.equals(x)
返回 true
x.equals(y)
必须返回 true -
传递性
对于任何非 null 的 x、y、z
如果x.equals(y)
、y.equals(z)
返回 true
那么x.equals(z)
必须返回 true -
一致性
对于任何非 null 的 x、y
只要 equals 的比较操作在对象中所用的信息没有被修改
x.equals(y)
的结果就不会变
hashCode
-
必须保证 equals 为 true 的 2 个 key 的哈希值一样
-
反过来 hashCode 相等的 key,不一定 equals 为 true
◼ 不重写 hashCode 方法只重写 equals 会有什么后果?
✓ 可能会导致 2 个 equals 为 true 的 key 同时存在哈希表中
不同类型的数据有可能计算出相同的哈希值,例如
String类型
的数据与Double类型
的数据的哈希值可能相同,此时会产生冲突,Java中解决冲突的方法为单链表与红黑树。当两个 key 不相等,但是哈希值相等时,我们需要用
equals 方法
来判断两个 key 是否为同一个key,此时就需要重写 equals。public class Person { private int age; private float height; private String name; public Person(int age, float height, String name) { super(); this.age = age; this.height = height; this.name = name; } @Override /** * 比较两个对象是否相等 */ public boolean equals(Object obj) { if(this == obj) return true; if(obj == null || obj.getClass() != getClass()) return false; Person person = (Person)obj; return person.age == age && person.height == height && person.name==null ? name==null : person.name.equals(name); // 传入name若为空,则当前对象name也必须为空才为 true // 传入name若不为空,则调用equals方法比较即可 } @Override public int hashCode() { int hashCode = Integer.hashCode(age); hashCode = hashCode * 31 + Float.hashCode(height); hashCode = hashCode * 31 + (name!=null ? name.hashCode() : 0); return hashCode; } }
验证一下重写了
equals
和hashCode
的作用:-
由于
重写 hashCode
,p1、p2 哈希值必然相等,则放入 map 会去比较 key -
由于
重写 equals
,p1、p2 为同一 key,则 p1 会覆盖 p2
public static void main(String[] args) { Person p1 = new Person(18, 1.75f, "jerry"); Person p2 = new Person(18, 1.75f, "jerry"); // 由于重写 hashCode(),p1、p2哈希值必然相等 Map<Object, Object> map = new HashMap<>(); map.put(p1, "abc"); map.put("test", "bcd"); // 由于 p1 与 p2 哈希值相等 // 会比较 p1 与 p2 是否为同一key // 由于重写 equals(), p1、p1为同一key map.put(p2, "ccc"); // 同一 key 则覆盖,map里的元素数量不增加 System.out.println(map.size()); // 2 }
-
若只重写
hashCode
由于重写hashCode
,p1、p2 哈希值必然相等,则放入 map 会去比较 key
但是equals
默认比较地址,p1、p2地址不同,不为同一 key,因此map.size()
为3 -
若只重写
equals
由于没有重写hashCode
,p1、p2 哈希值大概率不相等(有极小可能相等)
一般情况下,p1、p2哈希值不相等,map.size()
值应当为3
若是真遇到了哈希值相等的情况,由于重写了equals
,map.size()
值为2
结论就是,重写
hashCode
与equals
是最稳妥的做法。关于使用%来计算索引
◼ 如果使用%来计算索引
-
建议把哈希表的长度设计为素数(质数)
-
可以大大减小哈希冲突
10%8 = 2 10%7 = 3
20%8 = 4 20%7 = 6
30%8 = 6 30%7 = 2
40%8 = 0 40%7 = 5
50%8 = 2 50%7 = 1
60%8 = 4 60%7 = 4
70%8 = 6 70%7 = 0◼ 下表格列出了不同数据规模对应的最佳素数,特点如下
- 每个素数 略小于 前一个素数的 2倍
- 每个素数尽可能接近2的幂(
2
n
2^n
2n)
易错点总结
-
哈希值相等,根据哈希函数求的索引必然相等
-
哈希值不相等,根据哈希函数求的索引有可能相等
原因是hash_code(key) & (table.length - 1)
取模运算可能会遇到相等的情况
可以理解为 2 % 3 = 2,5 % 3 = 2,2 和 3 不相等,%3 的结果却相等 -
HashMap 的 key 必须实现 hashCode、equals 方法,也允许 key 为null
-
hash-loader:根据文件名导出带有哈希值的所有模块
2021-05-13 11:47:06哈希加载器 根据文件名导出带有哈希值的所有模块 用法 执照 麻省理工学院,有关详细信息,请参阅 。 -
HashCalculator(哈希值计算器)v1.2.2.0绿色汉化版
2019-07-25 06:44:42将任意长度的二进制值映射为固定长度的较小二进制值称为哈希值,完成这个计算过程我们需要一些工具。HashCalculator就是这样一款哈希值计算工具,它通过文件和字符串输入来计算哈希值,然后可以选择导出到文本文件。... -
C语言获取文件的SHA1哈希值
2014-05-12 00:23:50C语言获取文件的SHA1哈希值,详情请参考:http://blog.csdn.net/testcs_dn/article/details/25569975 -
文件哈希值计算软件
2018-12-14 21:51:21文件哈希值、MD5计算软件,小巧,快速,防毒必备佳品。 -
哈希值计算 MD5校验
2018-06-12 11:25:04哈希值计算 MD5校验 哈希值计算 MD5校验 哈希值计算 MD5校验 -
哈希值(hashCode)
2021-09-07 18:39:50哈希值一、哈希值简介二、实例简单的object继承类总结 一、哈希值简介 哈希值是一个十进制的整数,有系统随机给出(就是对象的地址值,是一个逻辑地址,是模拟出来的地址,不是数据实际存储的物理地址) 在Object类...
一、哈希值简介
哈希值是一个十进制的整数,有系统随机给出(就是对象的地址值,是一个逻辑地址,是模拟出来的地址,不是数据实际存储的物理地址)
在Object类中有一个方法可以获取对象的哈希值。
代码如下(示例):public native int hashCode();
public native int hashCode(); native:代表该方法调用的是本地操作系统的方法
二、实例
简单的object继承类
代码如下(示例):
//创建实例 Object a="aaaa"; Object b="aaaa"; //接收值为十进制数字 int h1=a.hashCode(); int h2=b.hashCode(); System.out.println(h1); System.out.println(h1);
我们可以看到打印的数据:
这就是一个十进制的数字我们熟悉的toString()方法,我们查看源码可以看到
代码如下(示例):public String toString() { return getClass().getName() + "@" + Integer.toHexString(hashCode()); }
我们可以看到,这实际上就是返回一个hashcode的值。
在String类中有两个特殊的哈希值
System.out.println("重地".hashCode()); System.out.println("通话".hashCode());
通过打印我们可以看到:
虽然字符串不一样,但是哈希值是一样的,这是一个特殊的。这就是我们所说的哈希值,其实就是一个十进制数字,没有重写系统随机给你一个,重写了你想要什么数字就是什么数字。
该处使用的url网络请求的数据。
总结
提示:这里对文章进行总结:
例如:以上就是今天要讲的内容,本文仅仅简单介绍了pandas的使用,而pandas提供了大量能使我们快速便捷地处理数据的函数和方法。