Android特有结构笔记

2020-06-14 本文已影响0人 ShihChieh_Ma

ArrayMap

ArrayMap是一个<key,value>映射的数据结构，它设计上更多的是考虑内存的优化，它和SparseArray一样，也会对key的hash使用二分法进行从小到大排序，在添加、删除、查找数据的时候都是先使用二分查找法得到相应的index，然后通过index来进行添加、查找、删除等操作。

mHashs中存储出的是每个key的hash值，并且在这些key的hash值在数组当中是从小到大排序的。
mArray的数组长度是mHashs的两倍，每两个元素分别是key和value，这两元素对应mHashs中的hash值。

get方法是一个计算index的过程，计算出来之后如果index大于0就代表存在，乘以2的一次方是对应的key的值，乘以2加1是对应的value的值。

int index=ContaninerHelpers.bindarySearch(mHashes,N,hash)是二分查找。key的hash值是从小到大排列，二分来找对应key的hash的位置index。

判断index值,小于0代表不包含这个key值。
二分查找只是找到对应的hashcode的值，如果存在多个相同的hashcode，但key不一样时，二分只能定位到其中一个，但不知道这一个hashcode位于这些相同的hashcode值中的第几个。所以，以当前index+1为头，往后寻找，如果找到最后一个hashcode一致但是key仍不一样，那就反过来以index-1为最后一个，向前寻找。没有找到对应的key，说明这个key不在arraymap当中，但是这个key对应的hashcode是存在于mHashes中的。返回~end，就是这些hashcode的序列的最后一个+1。有了endindex就可以把这个key插入到这些hashcodes中的最后一位了。

位非运算符（~）
运算规则：如果位为0，结果是1，如果位为1，结果是0.
比如：~37
在Java中，所有数据的表示方法都是以补码的形式表示，如果没有特殊说明，
Java中的数据类型默认是int,int数据类型的长度是8位，一位是四个字节，就是32字节，32bit.
8转为二进制是100101.
补码后为： 00000000 00000000 00000000 00100101
取反为：    11111111 11111111 11111111 11011010
因为高位是1，所以原码为负数，负数的补码是其绝对值的原码取反，末尾再加1。
因此，将这个二进制数的补码进行还原： 首先，末尾减1得反码：
11111111 11111111 11111111 11011001 其次，将各位取反得原码：
00000000 00000000 00000000 00100110，此时二进制转原码为38
所以~37 = -38.

arrayMap的内存优化：

查找效率
HashMap因为根据hashcode的值直接算出index，所以查找效率是随着数组长度增大而增加。
ArrayMap使用二分，当数组长度每增加一倍时，就需要多进行一次判断，效率下降。
扩容效率
HashMap每次扩容的时候时重新计算每个数组成员的位置，然后放到新的位置。
ArrayMap则是直接使用System.arraycopy。所以效率是ArrayMap占优势。
内存耗费
ArrayMap采用了一种独特的方式，能够重复的利用因为数据扩容而遗留下来的数组空间，方便下一个ArrayMap的使用。HashMap没有这种设计。
ArrayMap只缓存了长度是4和8的时候，所以如果频繁的使用到Map，而且数据量都比较小的时候，ArrayMap相当节省内存。

ArrayMap应用场景

数据量不大，频繁的使用Map存储数据
数据结构类型为Map类型

ArraySet

ArraySet实现了Set和Collections接口，add和remove接口的使用方式相同.
ArraySet的设计是为了更加有效的利用内存，它的对比目标是HashSet:

优势：

ArraySet使用更少的存储单元存储元素
ArraySet使用int类型的数组存储hash，使用Object类型数组存储元素，相较于HashMap使用Node存储节点，ArraySet存储一个元素占用的内存更小。
ArraySet在扩容时容量变化更小

劣势

存储大量元素（超过1000）时比较耗时
相较于HashMap使用hash算法直接找到数组下标，然后从该下表的元素往后搜索，ArraySet在查找元素时需要进行二分查找，如果数组元素数量过多(超过1000)，可能比较耗时。
在扩容和缩容时可能会频繁移动元素
ArraySet在扩容和缩容时需要移动元素，且扩容时容量变化比HashMap小，扩容和缩容的频率可能更高，元素数量过多时，元素的移动可能会对性能产生影响。

int --> Object(SparseArray)

int --> int(SparseIntArray)

int --> boolean(SparseBooleanArray)

int --> long(SparseLongArray)

SparseArray

SparseArray采用两个一维数组，一个是存储key(int类型),一个是存在value。

SparseArray应用场景

1、如果对内存要求比较高，而对查询效率没什么大的要求，可以是使用SparseArray
2、数量在百级别的SparseArray比HashMap有更好的优势
3、要求key是int类型的，因为HashMap会对int自定装箱变成Integer类型
4、要求key是有序的且是升序

SparseIntArray

SparseArray优化了int到Object键值对的存储，SparseIntArray优化了int到int键值对的存储。

元素的查找分键查找和值查找，键查找使用二分查找，值查找直接使用循环遍历。

使用二分查找key在mKeys数组的下标，也是value在mValues数组的下标。如果ContainerHelpers.binarySearch(mKeys,mSize,key)在mKeys数组中没有找到key，返回key待插入位置的下标的取反，如果找到key，更新mValues对应位置的值。
GrowingArrayUtils.insert函数:

如果array在不需要扩大容量的情况下可以添加一个元素，则先将待插入位置index开始的元素整体后移一位，然后插入元素，否则先扩容，然后将元素拷贝到新的数组中。

delete(int key)，先使用二分查找，找到key在mKeys的下标，如果找到即i >= 0，则直接删除mKeys和mValues指定位置的元素。

优势：

避免int键自动装箱
相较于HashMap使用Node，这样的设计使用更小的存储单元即可存储key到value的映射

缺点：

在进行元素查找时使用二分查找，元素较多（谷歌给出的数字是大于1000）时，查找效率较低
在进行元素的添加和删除时，可能会频繁进行元素的移动，运行效率可能会降低

SparseBooleanArray,SparseLongArray

类似SparseIntArray，只是存储的数据类型的mValues数组是boolean 和 long

设计目的是优化int到int, boolean ,long映射的存储
使用int类型的数组mKeys存储键，使用对应类型的数组mValues存储值
int类型的键在存储上是有序的
在查找值时，先使用二分查找，在mKeys中查找值在mValues中的下标，然后返回值