SparseArray 源码解析
使用 Android Studio 作为 IDE 的开发者可能会遇到一个现象,就是在代码中如果声明了 Map<Integer, Object>
类型的变量的话,Android Studio 会提示:Use new SparseArray<Object>(...) instead for better performance ...
,意思就是用 SparseArray<Object> 性能更优,可以考虑来替换 HashMap
这里就来介绍下 SparseArray 的内部原理,看看它与 HashMap 有什么差别,关于 HashMap 的源码解析可以看这里:Java集合框架源码解析之HashMap
先看下 SparseArray 的使用方式
SparseArray<String> sparseArray = new SparseArray<>();
sparseArray.put(100, "leavesC");
SparseArray<E> 相当于 Map<Integer,E> ,key 值固定为 int 类型,在初始化时只需要声明 Value 的数据类型即可,其内部用两个数组分别来存储 Key 列表和 Value 列表:int[] mKeys ; Object[] mValues
和 mValues
通过如下方式对应起来:假设要向 SparseArray
存入 key
为 10
为 200
的键值对,则先将 10
存到 mKeys
中,假设 10
在 mKeys
中对应的索引值是 index
,则将 value
存入 mValues[index]
最首要的一点就是 SparseArray 避免了 Map 每次存取值时的装箱拆箱操作,其 Key 值类型都是基本数据类型 int,这有利于提升性能
布尔变量 mGarbage
也是 SparseArray 的一个优化点之一,用于标记当前是否有待垃圾回收(GC)的元素,当该值被置为 true 时,即意味着当前状态需要进行垃圾回收,但回收操作并不马上进行,而是在后续操作中再完成
private static final Object DELETED = new Object();
private boolean mGarbage = false;
private int[] mKeys;
private Object[] mValues;
//该值并不一定是时时处于正确状态,因为有可能出现只删除 key 和 value 两者之一的情况
//所以在调用 size() 方法前都需要进行 GC
private int mSize;
key 数组和 value 数组的默认大小都是 10,如果在初始化时已知数据量的预估大小,则可以直接指定初始容量,这样可以避免后续的扩容操作
public SparseArray() {
* Creates a new SparseArray containing no mappings that will not
* require any additional memory allocation to store the specified
* number of mappings. If you supply an initial capacity of 0, the
* sparse array will be initialized with a light-weight representation
* not requiring any additional array allocations.
public SparseArray(int initialCapacity) {
if (initialCapacity == 0) {
mKeys = EmptyArray.INT;
mValues = EmptyArray.OBJECT;
} else {
mValues = ArrayUtils.newUnpaddedObjectArray(initialCapacity);
mKeys = new int[mValues.length];
mSize = 0;
添加元素的方法有如下几个,主要看 put(int key, E value)
方法,当中用到了 ContainerHelpers
,用于查找目标 key 在 mKeys 中的当前索引或者是目标索引
binarySearch 方法的返回值分为两种情况:
- 如果 mKeys 中存在对应的 key,则直接返回对应的索引值
- 如果 mKeys 中不存在对应的 key
- 假设 mKeys 中存在"值比 key 大且大小与 key 最接近的值的索引"为 presentIndex,则此方法的返回值为 ~presentIndex
- 如果 mKeys 中不存在比 key 还要大的值的话,则返回值为 ~mKeys.length
可以看到,即使在 mKeys 中不存在目标 key,但其返回值也指向了应该让 key 存入的位置。通过将计算出的索引值进行 ~ 运算,则返回值一定是 0 或者负数,从而与“找得到目标key的情况(返回值大于0)”的情况区分开
且通过这种方式来存放数据,可以使得 mKeys 的内部值一直是按照值递增的方式来排序的
//将索引 index 处的元素赋值为 value
//SparseArray 的元素值都是存到 mValues 中的,因此如果知道目标位置(index),则可以直接向数组 mValues 赋值
public void setValueAt(int index, E value) {
if (mGarbage) {
mValues[index] = value;
* Adds a mapping from the specified key to the specified value,
* replacing the previous mapping from the specified key if there
* was one.
public void put(int key, E value) {
//用二分查找法查找指定 key 在 mKeys 中的索引值
int i = ContainerHelpers.binarySearch(mKeys, mSize, key);
if (i >= 0) {
mValues[i] = value;
} else {
//binarySearch 方法的返回值分为两种情况:
//1、如果存在对应的 key,则直接返回对应的索引值
//2、如果不存在对应的 key
// 2.1、假设 mKeys 中存在"值比 key 大且大小与 key 最接近的值的索引"为 presentIndex,则此方法的返回值为 ~presentIndex
// 2.2、如果 mKeys 中不存在比 key 还要大的值的话,则返回值为 ~mKeys.length
//可以看到,即使在 mKeys 中不存在目标 key,但其返回值也指向了应该让 key 存入的位置
//通过将计算出的索引值进行 ~ 运算,则返回值一定是 0 或者负数,从而与“找得到目标key的情况(返回值大于0)”的情况区分开
//且通过这种方式来存放数据,可以使得 mKeys 的内部值一直是按照值递增的方式来排序的
i = ~i;
//如果目标位置还未赋值,则直接存入数据即可,对应的情况是 2.1
if (i < mSize && mValues[i] == DELETED) {
mKeys[i] = key;
mValues[i] = value;
//1、对应 2.1 的一种特殊情况,即目标位置已用于存放其他值了
// 此时就需要将从索引 i 开始的所有数据向后移动一位,并将 key 存到 mKeys[i]
//2、对应的情况是 2.2
if (mGarbage && mSize >= mKeys.length) {
//GC 后再次进行查找,因为值可能已经发生变化了
i = ~ContainerHelpers.binarySearch(mKeys, mSize, key);
mKeys = GrowingArrayUtils.insert(mKeys, mSize, i, key);
mValues = GrowingArrayUtils.insert(mValues, mSize, i, value);
//和 put 方法类似
//但在存入数据前先对数据大小进行了判断,有利于减少对 mKeys 进行二分查找的次数
//所以在“存入的 key 比现有的 mKeys 值都大”的情况下会比 put 方法性能高
public void append(int key, E value) {
if (mSize != 0 && key <= mKeys[mSize - 1]) {
put(key, value);
if (mGarbage && mSize >= mKeys.length) {
mKeys = GrowingArrayUtils.append(mKeys, mSize, key);
mValues = GrowingArrayUtils.append(mValues, mSize, value);
上文说了,布尔变量 mGarbage
用于标记当前是否有待垃圾回收(GC)的元素,当该值被置为 true 时,即意味着当前状态需要进行垃圾回收,但回收操作并不马上进行,而是在后续操作中再完成
以下几个方法在移除元素时,都是只切断了 mValues 中的引用,而 mKeys 并没有进行回收,这个操作会留到 gc()
//如果存在 key 对应的元素值,则将其移除
public void delete(int key) {
//用二分查找法查找指定 key 在 mKeys 中的索引值
int i = ContainerHelpers.binarySearch(mKeys, mSize, key);
if (i >= 0) {
if (mValues[i] != DELETED) {
mValues[i] = DELETED;
mGarbage = true;
public void remove(int key) {
//和 delete 方法基本相同,差别在于会返回 key 对应的元素值
public E removeReturnOld(int key) {
int i = ContainerHelpers.binarySearch(mKeys, mSize, key);
if (i >= 0) {
if (mValues[i] != DELETED) {
final E old = (E) mValues[i];
mValues[i] = DELETED;
mGarbage = true;
return old;
return null;
public void removeAt(int index) {
if (mValues[index] != DELETED) {
mValues[index] = DELETED;
mGarbage = true;
//删除从起始索引值 index 开始之后的 size 个元素值
public void removeAtRange(int index, int size) {
final int end = Math.min(mSize, index + size);
for (int i = index; i < end; i++) {
public void clear() {
int n = mSize;
Object[] values = mValues;
for (int i = 0; i < n; i++) {
values[i] = null;
mSize = 0;
mGarbage = false;
//根据 key 查找相应的元素值,查找不到则返回默认值
public E get(int key, E valueIfKeyNotFound) {
//用二分查找法查找指定 key 在 mKeys 中的索引值
int i = ContainerHelpers.binarySearch(mKeys, mSize, key);
//如果找不到该 key 或者该 key 尚未赋值,则返回默认值
if (i < 0 || mValues[i] == DELETED) {
return valueIfKeyNotFound;
} else {
return (E) mValues[i];
//根据 key 查找相应的元素值,查找不到则返回 null
public E get(int key) {
return get(key, null);
//因为 mValues 中的元素值并非一定是连贯的,有可能掺杂着 DELETED
//所以在遍历前需要先进行 GC,这样通过数组取出的值才是正确的
public E valueAt(int index) {
if (mGarbage) {
return (E) mValues[index];
//根据索引值 index 查找对应的 key
public int keyAt(int index) {
if (mGarbage) {
return mKeys[index];
//根据 key 对应的索引值
public int indexOfKey(int key) {
if (mGarbage) {
return ContainerHelpers.binarySearch(mKeys, mSize, key);
//根据 value 查找对应的索引值
public int indexOfValue(E value) {
if (mGarbage) {
for (int i = 0; i < mSize; i++) {
if (mValues[i] == value) {
return i;
return -1;
//与 indexOfValue 方法类似,但 indexOfValue 方法是通过比较 == 来判断是否同个对象
//而此方法是通过 equals 方法来判断是否同个对象
public int indexOfValueByValue(E value) {
if (mGarbage) {
for (int i = 0; i < mSize; i++) {
if (value == null) {
if (mValues[i] == null) {
return i;
} else {
if (value.equals(mValues[i])) {
return i;
return -1;
因为 SparseArray 中可能会出现只移除 value 和 value 两者之一的情况,导致数组中存在无效引用,因此 gc()
//因为 SparseArray 中可能出现只移除 value 和 value 两者之一的情况
private void gc() {
int n = mSize;
//o 值用于表示 GC 后的元素个数
int o = 0;
int[] keys = mKeys;
Object[] values = mValues;
for (int i = 0; i < n; i++) {
Object val = values[i];
//元素值非默认值 DELETED ,说明该位置可能需要移动数据
if (val != DELETED) {
//以下代码片段用于将索引 i 处的值赋值到索引 o 处
//所以如果 i == o ,则不需要执行代码了
if (i != o) {
keys[o] = keys[i];
values[o] = val;
values[i] = null;
mGarbage = false;
mSize = o;
从上文的解读来看,SparseArray 的主要优势有以下几点:
- 避免了基本数据类型的装箱拆箱操作
- 和 Map 每个存储结点都是一个类对象不同,SparseArray 不需要用于包装的的结构体,单个元素的存储成本更加低廉
- 在数据量不大的情况下,查找效率较高(二分查找法)
- 延迟了垃圾回收的时机,只在需要的时候才一次进进行
- 插入新元素可能会导致移动大量的数组元素
- 数据量较大时,查找效率(二分查找法)会明显降低