一、什么是Hash碰撞
hash碰撞指的是,两个不同的值(比如张三、李四的学号)经过hash计算后,得到的hash值相同,后来的李四要放到原来的张三的位置,但是数组的位置已经被张三占了,导致冲突
二、Hash如何存数据
hash表的本质其实就是数组,hash表中通常存放的是键值对Entry。
三、解决方法
1 开放寻址法:开放寻址法指的是,当前数组位置1被占用了,就放到下一个位置2上去,如果2也被占用了,就继续往下找,直到找到空位置。
2 拉链法:拉链法采用的是链表的方式,这个时候位置1就不单单存放的是Entry了,此时的Entry还要额外保存一个next指针,指向数组外的另一个位置,将李四安排在这里,张三那个Entry中的next指针就指向李四的这个位置,也就是保存的这个位置的内存地址。如果还有冲突,就把又冲突的那个Entry放到一个新位置上,然后李四的Entry指向它,这样就形成一个链表。
总结起来:开放寻址法和拉链法都是想办法找到下一个空位置来存发生冲突的值。
4、hash链表和红黑树知识扩展
1:HashMap的初始长度?每次扩容?
HashMap的初始长度是16,每次扩容时都会在原始的长度上翻倍(size × 2),所以长度一定是2的n次方。
哈希桶扩容的条件:元素数量 >= 长度(16)× 加载因子(0.75)
2:链表在多长的时候会转红黑树,为啥在这个长度转红黑树?
当链表长度超过8,并且经过扩容后当前数组长度大于64,会将链表转化为红黑树
而当HashMap的红黑树的元素小于等于6时重新转化为链表结构
3:为何HashMap的红黑树的元素小于等于6时重新转化为链表结构?
为了避免频繁来回转化。
4:为什么当链表长度超过8,并且经过扩容后当前数组长度大于64,才会将链表转化为红黑树?
为什么会在8转为红黑树,可以看一下代码的注释,注释上说了作者是根据概率学的角度来决定的,因为根据统计,一个桶位置上的节点数目的分布式泊松分布,长度超过8的概率十分小,所以作者选用了8作为链表转为红黑树的阈值
为什么并且经过扩容后当前数组长度大于64转为红黑树,因为如果hash冲突通过开放寻址法先存放
5.为什么JDK1.8 HashMap选择红黑树而不是其他的树?
是因为红黑树的特性让它拥有较高的查询性能的同时,避免维持平衡带来的很大开销。
6.就是无论是链表还红黑树,其在数组里面的位置就是一个,get得时候我怎么知道哪个值是我想要的?
先通过寻址算法找到数组对应的index下标;然后获取当前下标的node节点,在get key的过程中是遍历链表或者遍历红黑树来查找对应的key的值value;遍历链表O(n) 遍历红黑树O(lgn)