HashSet的new两个相同的String类字符串的变化

发布时间 2023-08-03 18:21:07作者: codemcr

一、定义

HashSet的底层是通过HashMap实现的,所以要通过HashMap去寻求答案

二、源码分析

其实关于这个问题的答案关键源码需在putVal方法中寻找,我用的版本是JDK8

//源码
public V put(K key, V value) {
        return putVal(hash(key), key, value, false, true);            // 1
}
final V putVal(int hash, K key, V value, boolean onlyIfAbsent,
                   boolean evict) {
        Node<K,V>[] tab; Node<K,V> p; int n, i;
        if ((tab = table) == null || (n = tab.length) == 0)           // 2
            n = (tab = resize()).length;                              // 3
        if ((p = tab[i = (n - 1) & hash]) == null)                    // 4
            tab[i] = newNode(hash, key, value, null);                 // 5 
        else {                
            Node<K,V> e; K k;
            if (p.hash == hash &&
                ((k = p.key) == key || (key != null && key.equals(k))))      //6
                e = p;
            else if (p instanceof TreeNode)
                e = ((TreeNode<K,V>)p).putTreeVal(this, tab, hash, key, value);
            else {
                for (int binCount = 0; ; ++binCount) {                     
                    if ((e = p.next) == null) {
                        p.next = newNode(hash, key, value, null);            
                        if (binCount >= TREEIFY_THRESHOLD - 1) // -1 for 1st
                            treeifyBin(tab, hash);
                        break;
                    }
                    if (e.hash == hash &&                                        
                        ((k = e.key) == key || (key != null && key.equals(k))))        // 7
                        break;
                    p = e;
                }
            }
            if (e != null) { // existing mapping for key        
                V oldValue = e.value;
                if (!onlyIfAbsent || oldValue == null)
                    e.value = value;
                afterNodeAccess(e);
                return oldValue;
            }
        }
        ++modCount;              //8
        if (++size > threshold)
            resize();
        afterNodeInsertion(evict);
        return null;
    }
public class test {
    public static void main(String[] args) {
        Set<String> obj = new HashSet<> ();
        obj.add(new String("java"));
        obj.add(new String("java"));
        for (String s :obj) {
            System.out.println(s);        //只输出java
        }
    }
}

解析:

  1. 从上面代码可以分析,当new两个相同的String类时候,由于HashMap的底层是数组+链表+红黑树的形式,第一个new("java")在进入putVal方法时,先在标记为2的位置进行判断集合是否为空,如果为空或者集合的个数为0,则进入标记为3的那一行进入resize方法中赋一个长度为16的数组,然后在标记为4的代码行对标记1的代码行的hash方法求得的hash值与15进行按位与运算,求得索引值为多少。判断该索引是否有值,因为第一次添加,所以第一个new("java")添加成功,然后跳到标记为8的代码行运算,再判断是否需要扩容,退出循环。

  2. 当第二个new("java")进入其中的时候,由于值相同,则hash值相同,当进入标记2的代码行时由于数组不为空且不为null,所以不会进入;当到标记为4的代码行时,由于hash值相同,所以索引相同,由于第一个new已经加到数组内了,所以跳到标记为6的代码行,该判断条件首先会判断hash值是否相同,hash值相同的条件下会判断两个条件的短路或运算,两个条件分别判断地址是否相同,以及equals方法下值是否相同,由于String类重写了equals方法,所以第二个java加入不进去,跳到标记为8的代码块,退出方法。