《Java开发手册(黄山版)》编程规约-集合处理
该章节的知识点基本都来源于jdk源码,将结合源码及例子进行理解
备注:文章中的详细及说明为手册本身内容
CSDN博客地址:https://blog.csdn.net/qq_35893033/article/details/127470924
1.【强制】关于 hashCode 和 equals 的处理
- 只要覆写 equals,就必须覆写 hashCode。
- 因为 Set 存储的是不重复的对象,依据 hashCode 和 equals 进行判断,所以 Set 存储的对象必须覆写这两种方法。
- 如果自定义对象作为 Map 的键,那么必须覆写 hashCode 和 equals。 说明:String 因为覆写了 hashCode 和 equals 方法,所以可以愉快地将 String 对象作为 key 来使用。
hashCode返回的是对象在哈希表(散列表)中的索引/位置
equals是用来比较两个对象是否相等
两个对象相等,及equals相等,且hashCode一定相等;但是hashCode相等,两个对象不一定相等
- hashCode:保证性能
- equals:保证可靠性
2.【强制】判断所有集合内部的元素是否为空,使用 isEmpty() 方法,而不是 size() == 0 的方式。
说明:在某些集合中,前者的时间复杂度为 O(1),而且可读性更好。
在一些集合中isEmpty和size方法的时间复杂度是一样的O(1),但也有一些集合中这个两个方法的时间复杂度不一致,最差可能为O(n)
1 | // HashMap.java |
1 | // ConcurrentLinkedQueue.java |
3.【强制】在使用Collectors. toMap() 方法时,要传入第3个参数
详细:在使用 java.util.stream.Collectors 类的 toMap() 方法转为 Map 集合时,一定要使用参数类型为 BinaryOperator
说明:在使用 java.util.stream.Collectors 类的 toMap() 方法转为 Map 集合时,一定要使用参数类型为 BinaryOperator,参数名为 mergeFunction 的方法,否则当出现相同 key时会抛出IllegalStateException 异常。
Collectors.toMap()方法最少需要2个参数,会默认补充的第3个参数throwingMerger(),这个参数会指定当转化的数据有同key时的策略,存在相同key会抛出异常
1 | // 示例 |
1 | // Collectors.java |
4.【强制】在使用 Collectors. toMap方法时,value值要非空
详细:在使用 java.util.stream.Collectors 类的 toMap() 方法转为 Map 集合时,一定要注意当 value为 null 时会抛 NPE 异常。
在合并转化时,会对传入的value进行非空判断
1 | // Collectors.java |
5.【强制】ArrayList 的 subList 结果不可强转成 ArrayList
详细:ArrayList 的 subList 结果不可强转成 ArrayList,否则会抛出 ClassCastException 异常:java.util.RandomAccessSubList cannot be cast to
java.util.ArrayList。 说明:subList() 返回的是 ArrayList 的内部类 SubList,并不是 ArrayList 本身,而是 ArrayList 的一个视图,对于 SubList
的所有操作最终会反映到原列表上。
subList只是映射了从起始索引到目标索引的源list
修改subList,同时会作用于原ArrayList
注意使用subList的add方法时,最终元素存储的位置
1 |
|
参考源码注释:ArrayList.subList()
6.【强制】使用 Map 的方法 keySet() / values() / entrySet() 返回集合对象时,不可以对其进行添加元素操作
详细:使用 Map 的方法 keySet() / values() / entrySet() 返回集合对象时,不可以对其进行添加元素操作,否则会抛出 UnsupportedOperationException 异常。
返回的集合是内部类,不是我们想当然以为的实现类本身,并且该内部类没有实现添加方法
Map.keySet():
HashMap.values():
7.【强制】Collections 类返回的集合对象,很多都不可进行添加或删除
详细:Collections 类返回的对象,如:emptyList() / singletonList() 等都是 immutable list,不可 对其进行添加或者删除元素的操作。
同上,返回的集合对象很多是内部类,里面并没有实现添加、删除方法
Collections.emptyList():
8.【强制】在 subList 场景中,高度注意对父集合元素的增加或删除
详细:在 subList 场景中,高度注意对父集合元素的增加或删除,均会导致子列表的遍历、增加、删除产生 ConcurrentModificationException 异常。
父集合的增加、删除会触发子列表的操作,最后抛出异常
1 |
|
9.【强制】用集合转数组的方法,使用toArray(T[]),且传入参数为0的空数组
详细:使用集合转数组的方法,必须使用集合的 toArray(T[] array),传入的是类型完全一致、长度为 0 的空数组。
说明1:直接使用 toArray 无参方法存在问题,此方法返回值只能是 Object[]类,若强转其它类型数组将出现 ClassCastException 错误
说明2:使用 toArray 带参方法,数组空间大小的 length:
1)等于 0,动态创建与 size 相同的数组,性能最好。
2)大于 0 但小于 size,重新创建大小等于 size 的数组,增加 GC 负担。
3)等于 size,在高并发情况下,数组创建完成之后,size 正在变大的情况下,负面影响与 2 相同。
4)大于 size,空间浪费,且在 size 处插入 null 值,存在 NPE 隐患。
1 | // ArrayList.toArray() |
10.【强制】使用 Collection 接口任何实现类的 addAll() 方法时,要对输入的集合参数进行 NPE 判断。
1 | // ArrayList.addAll() |
11.【强制】使用Arrays.asList(),不能使用修改等相关方法
详细:使用工具类 Arrays.asList() 把数组转换成集合时,不能使用其修改集合相关的方法,它的 add / remove / clear 方法会抛出 UnsupportedOperationException 异常。
asList方法返回的只是一个内部类,该内部类中并未实现add/remove等操作集合的方法
12.【强制】泛型通配符<? extends T>不能使用 add 方法, 而<? super T>不能使用 get 方法
详细:泛型通配符<? extends T>来接收返回的数据,此写法的泛型集合不能使用 add 方法, 而<? super T>不能使用 get 方法
说明:扩展说一下 PECS(Producer Extends Consumer Super) 原则,即频繁往外读取内容的,适合用<? extends T>,经常往里插入的,适合用<? super T>
PECS:生产者使用泛型上界通配符,消费者使用泛型下界通配符
详细参考地址
13.【强制】无泛型限制定义的集合赋值时要进行对象类型判断
详细:在无泛型限制定义的集合赋值给泛型限制的集合时,在使用集合元素时,需要进行 instanceof 判断,避免抛出 ClassCastException 异常。
1 |
|
14.【强制】不要在 foreach 循环里进行元素的 remove / add 操作
详细:不要在 foreach 循环里进行元素的 remove / add 操作。remove 元素请使用 iterator 方式, 如果并发操作,需要对 iterator 对象加锁。
详细参考地址
foreach是增强for循环,底层实现依赖迭代器,再循环中进行删除元素时,特定情况下会抛出异常
1 |
|
15.【强制】JDK7 版本及以上,Comparator 实现类注意
详细:在 JDK7 版本及以上,Comparator 实现类要满足如下三个条件,不然 Arrays.sort,Collections.sort 会抛 IllegalArgumentException 异常。
说明:三个条件如下
1)x,y 的比较结果和 y,x 的比较结果相反。
2)x > y,y > z,则 x > z。
3)x = y,则 x,z 比较结果和 y,z 比较结果相同。
反例:下例中没有处理相等的情况,交换两个对象判断结果并不互反,不符合第一个条件,在实际使用中可能会出现异 常。
1 |
|
Comparator实现类注意相等的情况,两个值相等时比较结果要一致
16.【推荐】泛型集合使用时,在 JDK7 及以上,使用 diamond 语法或全省略。
说明:菱形泛型,即 diamond,直接使用<>来指代前边已经指定的类型。
使用泛型创建对象时,前面已经定义了类型,则后面省略
17.【推荐】集合初始化时,指定集合初始值大小。
说明:HashMap 使用构造方法 HashMap(int initialCapacity) 进行初始化时,如果暂时无法确定集合大小,那么指定默认值(16)即可。
正例:initialCapacity = (需要存储的元素个数 / 负载因子) + 1。注意负载因子(即 loaderfactor)默认为 0.75,如果暂时无法确定初始值大小,请设置为 16(即默认值)。
反例:HashMap 需要放置 1024 个元素,由于没有设置容量初始大小,随着元素增加而被迫不断扩容,resize() 方法总共会调用 8 次,反复重建哈希表和数据迁移。当放置的集合元素个数达千万级时会影响程序性能。
涉及集合内部的扩容机制
18.【推荐】使用 entrySet 遍历 Map 类集合 KV,而不是 keySet 方式进行遍历
说明:keySet 其实是遍历了 2 次,一次是转为 Iterator 对象,另一次是从 hashMap 中取出 key 所对应的 value。而entrySet 只是遍历了一次就把 key 和 value 都放到了 entry 中,效率更高。如果是 JDK8,使用 Map.forEach 方法。
entrySet存储了Map.Entry<K,V>,包含了键、值;keySet仅包含键
1 | // HashMap.entrySet() |
19.【推荐】高度注意 Map 类集合 K / V 能不能存储 null 值的情况
集合类 | Key | Value | 说明 |
---|---|---|---|
HashTable | 不为null | 不为null | 线程安全 |
TreeMap | 不为null | 可为null | 线程不安全 |
ConcurrentHashMap | 不为null | 不为null | 线程安全-锁分段技术(JDK8:CAS) |
HashMap | 可为null | 可为null | 线程不安全 |
20.【参考】合理利用好集合的有序性和稳定性
详细:合理利用好集合的有序性(sort)和稳定性(order),避免集合的无序性(unsort)和不稳定性(unorder)带来的负面影响
21.【参考】利用 Set 元素唯一的特性
详细:利用 Set 元素唯一的特性,可以快速对一个集合进行去重操作,避免使用 List 的contains() 进行遍历去重或者判断包含操作。
在使用时,如果需要存储的数据需要唯一的,则优先考虑使用Set