itinikax   发表于 2020-3-26 18:38:46 |栏目:





我是一名很普通的双非大三学生,跟很多同学一样,有着一颗想进大厂的梦。接下来的几个月内,我将坚持写博客,输出知识的同时巩固自己的基础,记录自己的成长和锻炼自己,备战2021暑期实习面试!奥利给!!
ArrayList 我们几乎每天都会使用到,本文就一起来看看同样是面试高频问到的ArrayList的相关知识吧。


其实ArrayList是很简单的, ArrayList 其实就是围绕底层数组结构,各个 API 都是对数组的操作进行封装,看下图:

//默认数组大小10
private static final int DEFAULT_CAPACITY = 10;
//数组使用的大小
private int size;
//数组存放的容器
transient Object[] elementData; // non-private to simplify nested class access
123456789
图中展示是长度为 8 的数组(为了画图方便,其实默认是10),长度从 1 开始计数,index 表示数组的下标,从 0 开始计数,elementData 表示数组本身。
源码中除了这两个概念,还有以下三个基本概念:

DEFAULT_CAPACITY 表示数组的初始大小,默认是 10,这个数字要记住;
size 表示当前数组的大小,类型 int,没有使用 volatile 修饰,非线程安全的;
modCount 统计当前数组被修改的版本次数,数组结构有变动,就会 +1。
modCount继承自AbstractList,主要应用快速失败机制,在上一篇HashMap中有提到这个机制,这里就不在赘述了

三种初始化办法:无参数直接初始化、指定大小初始化、指定初始数据初始化
//  无参数构造器,默认是空数组
public ArrayList() {
this.elementData = DEFAULTCAPACITY_EMPTY_ELEMENTDATA;
}
// 指定大小初始化
public ArrayList(int initialCapacity) {
if (initialCapacity > 0) {
this.elementData = new Object[initialCapacity];
} else if (initialCapacity == 0) {
this.elementData = EMPTY_ELEMENTDATA;
} else {
throw new IllegalArgumentException("Illegal Capacity: "+
                                         initialCapacity);
}
}
// 指定初始数据初始化
public ArrayList(Collection<? extends E> c) {
//elementData 是保存数组的容器,默认为 null
    elementData = c.toArray();
//如果给定的集合(c)数据有值,则进行拷贝赋值操作
if ((size = elementData.length) != 0) {
//如果集合元素类型不是 Object 类型,才开始拷贝,否则不执行
if (elementData.getClass() != Object[].class) {
        elementData = Arrays.copyOf(elementData, size, Object[].class);
}
} else {
// 给定集合(c)无值,则默认空数组
this.elementData = EMPTY_ELEMENTDATA;
}
}
12345678910111213141516171819202122232425262728293031
注意:ArrayList 无参构造器初始化时,默认大小是空数组,跟HashMap一样,都是在第一次 add 的时候扩容的数组值。

新增的代码其实很简短
// 添加到数组尾部
public boolean add(E e) {
//确保数组大小足够,不够需要扩容
ensureCapacityInternal(size + 1); // Increments modCount!!
//直接赋值,线程不安全的
    elementData[size++] = e;
return true;
}
// 添加到指定位置
public void add(int index, E element) {
rangeCheckForAdd(index);
ensureCapacityInternal(size + 1); // Increments modCount!!
/**
   * @param      src      the source array. 源数组
   * @param      srcPos   starting position in the source array. 源数组的起始位置
   * @param      dest     the destination array. 目标数组
   * @param      destPos  starting position in the destination data. 目标数组的起始位置
   * @param      length   the number of array elements to be copied. 复制的长度
   */
    System.arraycopy(elementData, index, elementData, index + 1,
                     size - index);
    elementData[index] = element;
    size++;
}
12345678910111213141516171819202122232425
我们可以看到两个add方法,我们来分析一下这两个方法:
添加到数组尾部 时间复杂度O(1):

其实就是两步,判断是否需要扩容,如果需要就执行扩容操作;然后赋值;

添加到指定位置 时间复杂度O(n):

rangeCheckForAdd 先判断下标是否正确
ensureCapacityInternal 判断是否需要扩容
arraycopy 将原数组从下标开始的数据全部往后移一位
给指定下标的位置赋值


// 扩容
private void grow(int minCapacity) {
int oldCapacity = elementData.length;
// oldCapacity >> 1 是把 oldCapacity / (2 ^ 1) 的意思
int newCapacity = oldCapacity + (oldCapacity >> 1);
// 如果扩容后的值 < 我们的期望值,扩容后的值就等于我们的期望值
if (newCapacity - minCapacity < 0)
      newCapacity = minCapacity;
// 如果扩容后的值 > jvm 所能分配的数组的最大值,那么就去 Integer 的最大值
if (newCapacity - MAX_ARRAY_SIZE > 0)
      newCapacity = hugeCapacity(minCapacity);
// 通过复制进行扩容  底层实际上还是System.arraycopy方法
    elementData = Arrays.copyOf(elementData, newCapacity);
}
123456789101112131415161718
我们可以看到扩容是通过这行代码来实现的:Arrays.copyOf(elementData, newCapacity);,这行代码指的就是数组之间的拷贝,扩容是会先新建一个预期容量的新数组,然后把老数组的数据拷贝过去,底层还是System.arraycopy 方法进行拷贝,此方法是 native 的方法
这里需要注意:扩容的规则是原来容量大小 + 容量大小的一半,也就是原来容量的 1.5 倍;ArrayList 中的数组的最大值是 Integer.MAX_VALUE。且 ArrayList 是允许 null 值的。

ArrayList 删除元素有很多种方式,比如根据数组索引删除、根据值删除或批量删除等等,原理和思路都差不多,我们选取根据值和下标删除方式来进行说明:
//根据数组下标去删除
public E remove(int index) {
rangeCheck(index);

    modCount++;
    E oldValue = elementData(index);
int numMoved = size - index - 1;
if (numMoved > 0)
      System.arraycopy(elementData, index+1, elementData, index,
                       numMoved);
    elementData[--size] = null; // 方便GC,防止造成内存溢出
return oldValue;
}
// 按值删除
public boolean remove(Object o) {
// 如果要删除的值是 null,找到第一个值是 null 的删除
if (o == null) {
for (int index = 0; index < size; index++)
if (elementData[index] == null) {
fastRemove(index);
return true;
}
} else {
// 如果要删除的值不为 null,找到第一个和要删除的值相等的删除
for (int index = 0; index < size; index++)
// 这里是根据  equals 来判断值相等的,相等后再根据索引位置进行删除
if (o.equals(elementData[index])) {
fastRemove(index);
return true;
}
}
return false;
}
1234567891011121314151617181920212223242526272829303132333435

我们需要注意的是:

在新增的时候我有提到是可以add null的,所以删除的时候也是允许删除 null 值的,只不过是删除找到的第一个null;
按值删除,需要先找到值在数组中的索引位置,是通过 equals 来判断的,如果数组元素不是基本类型,就需要我们做 equals 的具体实现。

总结:
我们可以看出其实新增和删除都涉及到了数组的复制,这也是为什么ArrayList适合查找,LinkedList适合新增删改,但是如果是直接添加到数组尾部的话,还是很快的。但是这是有条件的,也就是我们不指定位置直接添加元素时(add(E element)),元素会默认会添加在最后,不会触发底层数组的复制,不考虑底层数组自动扩容的话,时间复杂度为O(1) ,在指定位置添加元素(add(int index, E element)),需要复制底层数组,根据最坏打算,时间复杂度是O(n)。

我们都知道所有集合都是Collection接口的实现类,又因为Collection继承了Iterable接口,因此所有集合都是可迭代的。我们常常会采用集合的迭代器来遍历集合元素,我们来看看ArrayList对迭代器的实现,从而深入分析为什么对集合执行相关修改操作时为什么会抛出ConcurrentModificationException。
// 实现 Iterator 接口
private class Itr implements Iterator<E> {
// 迭代过程中,下一个元素的位置,从 0 开始,用来控制拿下一个元素
int cursor;
// 新增时表示上一次迭代过程中,索引的位置,删除成功时为 -1
int lastRet = -1;
// 迭代过程中期望数组修改版本号
int expectedModCount = modCount;
public boolean hasNext() {...}
public E next() {
//迭代过程中,判断版本号有无被修改,有被修改,抛 ConcurrentModificationException 异常
checkForComodification();
... 省略代码
      // 返回元素值
return (E) elementData[lastRet = i];
}
public void remove() {
//迭代过程中,判断版本号有无被修改,有被修改,抛 ConcurrentModificationException 异常
checkForComodification();
try {
// 调用自身的remove
        ArrayList.this.remove(lastRet);
... 省略代码
        expectedModCount = modCount;
} catch (IndexOutOfBoundsException ex) {
throw new ConcurrentModificationException();
}
}
// 对比迭代器的删除,你发现了什么?
public E remove(int index) {
... 省略代码
    modCount++;
... 省略代码
    return oldValue;
}
1234567891011121314151617181920212223242526272829303132333435363738
该迭代器实现了Iterator接口并实现了相关方法,提供我们对集合的遍历能力。
总结:ArrayList的迭代器默认是其内部类实现,实现一个自定义迭代器只需要实现Iterator接口并实现相关方法即可。而实现Iterable接口表示该实现类具有像for-each loop迭代遍历的能力。
我们都知道,如果在迭代的过程中调用非迭代器内部的remove或者clear方法将会抛出ConcurrentModificationException异常,那到底是为什么呢?
首先这里涉及到两个很重要的变量,一个是expectedModCount,另一个是modCount,expectedModCount在集合内部迭代器中定义,就像上面源码所示,modCount在AbstractList中定义。,默认迭代器初始化的时候expectedModCount = modCount说明两者是相等的,我们可以看到next方法和remove方法都会去判断,只有当不相等的情况下才会抛出异常。我们可以看到ArrayList自身的remove方法在删除元素的时候会将modCount++,虽然迭代器本质上也是this.remove,但它在删除之后执行了一行expectedModCount = modCount,以此保证了两个值的相等,这也是java.util下的集合类的快速失败机制的实现。
总结:
迭代器迭代集合时不能对被迭代集合进行修改,原因是modCount和expectedModCount两个变量值不想等导致的!如果想删除需要调用Iterator.remove (),另外快速失败机制并不能保证ArrayList是线程安全的。
回顾一下,看完这篇文章你答的上以下问题了吗?

说说你自己对 ArrayList 的理解?
ArrayList 无参数构造器构造,现在 add 一个值进去,此时数组的大小是多少,下一次扩容前最大可用大小是多少?
现在我有一个很大的数组需要拷贝,原数组大小是 5k,请问如何快速拷贝?
为什么说扩容会消耗性能?
ArrayList 数组,我们通过增强 for 循环进行删除,可以么?

[url=https://wojtekszczepanski.wordpress.com/2020/

回复 显示全部楼层 使用道具 举报

您需要登录后才可以回帖 登录 | 立即注册

本版积分规则

作者相关信息

更多资源

精品推荐

精华 magento系统

案例源码 by alexander

极品资源

极品 magento系统

案例源码 by alexander

原创模板

200金钱 magento系统

下载排行

热门标签

快速回复 返回顶部 返回列表