集合就是由若干个确定的元素所构成的整体。
集合体系图
List、Set 集合体系图:
Map 集合体系图:
单列集合
Iterator 接口
迭代器(Iterator)主要用来操作 Java 中的集合对象(Collection),迭代器提供了统一的语法进行集合对象遍历操作,无需关心集合对象内部的实现方式,迭代器只能向前移,无法后退。
Iterator 接口的特点:
Iterator 接口的对象称为迭代器,主要用于遍历 Collection 集合中的元素。
Iterator 接口的对象仅用于遍历集合,它本身并不存放对象。
Iterator 接口的方法:
方法名称 | 描述 |
---|---|
hasNext() |
判断是否还有下一个元素 |
next() |
返回下一个元素 |
注意:在调用
next()
方法之前必须要调用hasNext()
进行检测。若不进行检测,且下一条记录无效,直接调用next()
会抛出 NoSuchElementException 异常。
Collection 接口
Collection 接口是 List、Set 和 Queue 接口的父接口,通常情况下不被直接使用。Collection 接口定义了一些通用的方法,通过这些方法可以实现对集合的基本操作。定义的方法既可用于操作 Set 集合,也可用于操作 List 和 Queue 集合。
Collection 接口的特点:
Collection 的实现类可以存放多个元素,每个元素可以是 Object。
Collection 的实现类,有些可以存放重复的元素,有些不可以。
Collection 的实现类,有些是有序的(List),有些是无序的(Set)。
Collection 接口没有直接的实现子类,是通过它的子接口 List 和 Set 来实现的。
所有实现了 Collection 接口的集合类都有一个
iterator()
方法,用于返回一个迭代器。
Collection 接口的方法:
方法名称 | 描述 |
---|---|
add() |
添加单个元素 |
addAll() |
添加多个元素 |
remove() |
删除指定元素 |
removeAll() |
删除多个元素 |
contains() |
查找元素是否存在 |
containsAll() |
查找多个元素是否都存在 |
size() |
获取元素个数 |
isEmpty() |
判断是否为空 |
clear() |
清除所有元素 |
List 接口
List 是一个有序、可重复的集合,集合中每个元素都有其对应的顺序索引。
List 接口的特点:
List 接口是 Collection 接口的子接口。
List 集合中的元素有序(添加顺序和取出顺序一致)、且可重复。
List 集合中的每个元素都有其对应的顺序索引(从 0 开始),即支持索引。
List 集合中的元素都对应一个整数型的序号记载元素在集合中的位置,可以根据序号存取集合中的元素。
List 接口的方法:
方法名称 | 描述 |
---|---|
get() |
获取此集合中指定索引位置的元素 |
set() |
替换此集合中指定索引位置的元素 |
indexOf() |
返回此集合中第一次出现指定元素的索引,如果此集合不包含该元素,则返回 -1 |
lastIndexOf() |
返回此集合中最后一次出现指定元素的索引,如果此集合不包含该元素,则返回 -1 |
subList() |
截取集合中的一部分形成一个新的集合并返回 |
List 接口的遍历方式:
1 | import java.util.*; |
ArrayList 类
ArrayList 和 Vector 类的特点:
两者几乎是一样的,区别在于 Vector 类是线程安全的,因此效率差于 ArrayList 类。
底层都是使用 Object 类型的数组
elementData
来存储元素。底层都实现了可变长数组,可以添加任意元素且可以重复,包括
null
值。
ArrayList 和 Vector 类的扩容机制:
如果使用无参构造器创建对象时,初始
elementData
容量为 0,第一次添加元素则扩容elementData
为 10。如需再次扩容,ArrayList 类扩容为原来大小的 1.5 倍,Vector 类则是扩容为原来的 2 倍。
如果使用的是指定大小的构造器,则初始
elementData
容量为指定大小,扩容机制不变。
LinkedList 类
LinkedList 类的特点:
LinkedList 类是线程不安全的。
底层使用 Node(静态内部类)类型的结点来存储元素。
底层有两个属性
first
和last
分别指向头结点和尾结点。每个结点中又有三属性,
prev
指向直接前驱结点,next
指向直接后继结点,item
存储真正的元素。底层实现了双向链表和双端队列,可以添加任意元素且可以重复,包括
null
值。底层采用双向链表的结构保存元素,这种结构的优点是便于向集合中插入或者删除元素。
两者的区别
ArrayList 和 LinkedList 类的区别:
需要频繁修改和查询元素时,使用 ArrayList 类。
需要频繁插入和删除元素时,使用 LinkedList 类。
ArrayList 是底层基于可变长数组,增删效率较低(扩容需要大量拷贝),改查效率较高(通过索引直接定位)。
LinkedList 是底层基于双向链表,增删效率较高(元素通过指针连接),改查效率较低(查询需要依次遍历)。
ArrayList 与 LinkedList 都是 List 接口的实现类,因此都实现了 List 的所有未实现的方法,只是实现的方式有所不同。
Set 接口
Set 是一个无序、不可重复的集合,且没有索引。
Set 接口的特点:
Set 接口是 Collection 接口的子接口。
Set 集合中的元素无序(添加顺序和取出顺序不一致,但是取出顺序是固定的),且不可重复。
Set 集合中的元素不按特定的方式排序,只是简单地把元素加入集合。
Set 集合中不能包含重复的元素,并且只允许包含一个
null
值。
Set 接口的方法:
和 List 接口一样,Set 接口也是 Collection 的子接口,因此常用方法和 Collection 接口一样。
Set 接口的遍历方式:
和 Collection 的遍历方式一样,可以使用迭代器和增强 for
循环,但不能使用索引的方式来获取。
HashSet 类
HashSet 类的特点:
HashSet 类是线程不安全的。
底层使用 Node(静态内部类)类型的结点数组
table
来存储元素。底层实际上是 HashMap 类,是由数组和链表以及红黑树构成的。
HashSet 类是按照 Hash 算法来存储集合中的元素,因此具有很好的存取和查找性能。
HashSet 类添加元素的底层机制:
添加元素时会先计算哈希值,再将哈希值转换为索引值。
找到
table
数组,查看该索引的位置是否有元素。如果没有则直接加入元素。如果有,则比较两个元素是否相同。
相同就放弃添加,不相同就以链表的方式添加到尾部,形成数组加链表的模式。
注意:比较两个元素是否相同是通过
equals()
方法和hashCode()
方法的返回值来一同决定的;equals()
方法和hashCode()
方法可以重写来修改比较的标准;只有在哈希值相同的情况下才会使用equals()
方法进行比较。
HashSet 类扩容和转成红黑树的底层机制:
第一次添加元素时,
table
数组扩容到 16,且临界值设为16 * 0.75 = 12
(0.75
是加载因子)。当集合中的元素个数达到临界值 12 时,
table
数组就会扩容到16 * 2 = 32
。新的临界值就是
32 * 0.75 = 24
,以此类推。注意:这里的扩容机制判断的是整个集合中的元素个数,并非一定是
table
数组中的元素个数。如果单条链表中元素达到 8,同时
table
数组的大小达到 64 时,就会进行树化(红黑树),若table
数组大小未达到 64,则采用数组扩容机制进行扩容,直到table
数组大小达到 64,再树化。注意:这里的扩容机制主要是为了防止单条链表上的元素过多,所以会进行扩容,加快树化的进度。
LinkedHashSet 类
LinkedHashSet 类的特点:
LinkedHashSet 类继承了 HashSet 类。
底层实际上是 LinkedHashMap 类,是由数组和双向链表构成的。
底层使用 Entry(静态内部类)类型的结点来存储元素。
每个结点中有
before
和after
属性,before
指向直接前驱结点,after
指向直接后继结点。底层是根据元素的哈希值决定元素的存储位置,同时使用双向链表维护元素的次序,这使得元素看起来是以插入顺序保存的。
LinkedHashSet 类添加元素的底层机制:
LinkedHashSet 类和 HashSet 类的机制大同小异。
LinkedHashSet 类在添加元素时不仅会执行 HashSet 类同样的操作,同时还会将元素加入到双向链表。
双列集合
Map 接口
Map 是一种键值对(key-value)集合,Map 集合中的每一个元素都包含一个键(key)对象和一个值(value)对象。用于保存具有映射关系的数据。
Map 接口的特点:
Map 集合中的 key 和 value 可以是任何引用类型的数据,会封装到 HashMap 类中的 Node 静态内部类对象中。
Map 集合中的 key 不允许重复,但 value 可以重复;key 可以有一个为
null
值,value 可以多个为null
值。Map 集合中的 key 和 value 之间存在单向一对一关系,即通过指定的 key 总能找到对应的 value。
Map 接口的方法:
方法名称 | 描述 |
---|---|
put() |
添加键值对 |
remove() |
根据键删除映射关系 |
get() |
根据键获取值 |
size() |
获取键值对个数 |
isEmpty() |
判断键值对个数是否为 0 |
containsKey() |
查找键是否存在 |
clear() |
清除所有键值对 |
keySet() |
获取所有的键 |
values() |
获取所有的值 |
entrySet() |
获取所有的键值对 |
Map 接口的遍历方式:
1 | import java.util.*; |
HashMap 类
HashMap 类的特点:
HashMap 类是线程不安全的。
底层使用 Node(静态内部类)类型的结点数组
table
来存储元素。每个结点中又有四个属性,
key
存放键,value
存放值,hash
存放键的哈希值,next
存放直接后继结点。
HashMap 类添加元素的底层机制:
添加元素时,通过
key
的哈希值得到在table
数组的索引。判断该索引处是否有元素,如果没有则直接添加。
如果该索引处有元素,则判断该元素的
key
是否和准备加入的元素的key
相等。如果相等,则直接替换
value
,如果不相等,则需要判断是树结构还是链表结构,做出相应的处理。如果添加时发现容量不够,则需要扩容。HashMap 类的扩容和转成红黑树的底层机制和 HashSet 类相同。
Hashtable 类
Hashtable 类的特点:
Hashtable 类是线程安全的。
底层使用 Entry(静态内部类)类型的结点数组
table
来存储元素。Hashtable 类的使用方法基本上和 HashMap 类一样。
Hashtable 类的键和值都不能为
null
,否则会抛出 NullPointerException 异常。
Hashtable 类扩容的底层机制:
首次添加元素时,初始化
table
数组为 11。临界值为
table
数组的大小乘以 0.75。当集合中的元素达到临界值时,则按照原
table
数组大小的两倍再加 1 进行扩容。
Properties 类
Properties 类的特点:
Properties 类继承了 Hashtable 类。
Properties 类的键和值都不能为
null
,否则会抛出 NullPointerException 异常。
TreeMap 类
TreeMap 类的特点:
底层是由二叉树构成,实现了红黑树的结构。
TreeMap 类默认会对键进行排序,所以键必须实现自然排序和定制排序中的一种。
集合选型规则
在开发中,选择什么集合实现类,主要取决于业务操作特点,然后根据集合实现类的特性进行选择。
先判断存储的类型:一组对象(单列)还是一组键值对(双列)。
一组对象:Collection 接口
允许重复的:List 接口
- 增删操作多:LinkedList 类
- 改查操作多:ArrayList 类
不允许重复的:Set 接口
- 无序的:HashSet 类
- 可排序的:TreeSet 类
- 插入和取出顺序一致的:LinkedHashSet 类
一组键值对:Map 接口
- 键是无序的:HashMap 类
- 键是可排序的:TreeMap 类
- 键的插入和取出顺序一致的:LinkedHashMap 类
- 可读取文件的:Properties 类
Collections 工具类
Collections 类是一个操作 Set、List 和 Map 等集合的工具类。Collections 类中提供了一系列静态的方法对集合元素进行排序、查询和修改等操作。
Collections 工具类的常用方法:
方法名称 | 描述 |
---|---|
Collections.reverse() |
反转 List 集合中元素的顺序 |
Collections.shuffle() |
对 List 集合中的元素进行随机排序 |
Collections.sort() |
根据元素的自然顺序对指定的 List 集合中的元素按升序排序 |
Collections.swap() |
将指定 List 集合中的两个元素进行交换 |
Collections.frequency() |
返回指定集合中指定元素的出现次数 |