Android特有结构笔记

2020-06-14  本文已影响0人  ShihChieh_Ma

ArrayMap

ArrayMap是一个<key,value>映射的数据结构,它设计上更多的是考虑内存的优化,它和SparseArray一样,也会对key的hash使用二分法进行从小到大排序,在添加、删除、查找数据的时候都是先使用二分查找法得到相应的index,然后通过index来进行添加、查找、删除等操作。


mHashs中存储出的是每个key的hash值,并且在这些key的hash值在数组当中是从小到大排序的。
mArray的数组长度是mHashs的两倍,每两个元素分别是key和value,这两元素对应mHashs中的hash值。



get方法是一个计算index的过程,计算出来之后如果index大于0就代表存在,乘以2的一次方是对应的key的值,乘以2加1是对应的value的值。

int index=ContaninerHelpers.bindarySearch(mHashes,N,hash)是二分查找。key的hash值是从小到大排列,二分来找对应key的hash的位置index。



判断index值,小于0代表不包含这个key值。
二分查找只是找到对应的hashcode的值,如果存在多个相同的hashcode,但key不一样时,二分只能定位到其中一个,但不知道这一个hashcode位于这些相同的hashcode值中的第几个。所以,以当前index+1为头,往后寻找,如果找到最后一个hashcode一致但是key仍不一样,那就反过来以index-1为最后一个,向前寻找。没有找到对应的key,说明这个key不在arraymap当中,但是这个key对应的hashcode是存在于mHashes中的。返回~end,就是这些hashcode的序列的最后一个+1。有了endindex就可以把这个key插入到这些hashcodes中的最后一位了。

位非运算符(~)
运算规则:如果位为0,结果是1,如果位为1,结果是0.
比如:~37
在Java中,所有数据的表示方法都是以补码的形式表示,如果没有特殊说明,
Java中的数据类型默认是int,int数据类型的长度是8位,一位是四个字节,就是32字节,32bit.
8转为二进制是100101.
补码后为: 00000000 00000000 00000000 00100101
取反为:    11111111 11111111 11111111 11011010
因为高位是1,所以原码为负数,负数的补码是其绝对值的原码取反,末尾再加1。
因此,将这个二进制数的补码进行还原: 首先,末尾减1得反码:
11111111 11111111 11111111 11011001 其次,将各位取反得原码:
00000000 00000000 00000000 00100110,此时二进制转原码为38
所以~37 = -38. 
arrayMap的内存优化:
  1. 查找效率
    HashMap因为根据hashcode的值直接算出index,所以查找效率是随着数组长度增大而增加。
    ArrayMap使用二分,当数组长度每增加一倍时,就需要多进行一次判断,效率下降。
  2. 扩容效率
    HashMap每次扩容的时候时重新计算每个数组成员的位置,然后放到新的位置。
    ArrayMap则是直接使用System.arraycopy。所以效率是ArrayMap占优势。
  3. 内存耗费
    ArrayMap采用了一种独特的方式,能够重复的利用因为数据扩容而遗留下来的数组空间,方便下一个ArrayMap的使用。HashMap没有这种设计。
    ArrayMap只缓存了长度是4和8的时候,所以如果频繁的使用到Map,而且数据量都比较小的时候,ArrayMap相当节省内存。
ArrayMap应用场景
  1. 数据量不大,频繁的使用Map存储数据
  2. 数据结构类型为Map类型

ArraySet

ArraySet实现了Set和Collections接口,add和remove接口的使用方式相同.
ArraySet的设计是为了更加有效的利用内存,它的对比目标是HashSet:

优势:
  1. ArraySet使用更少的存储单元存储元素
  2. ArraySet使用int类型的数组存储hash,使用Object类型数组存储元素,相较于HashMap使用Node存储节点,ArraySet存储一个元素占用的内存更小。
  3. ArraySet在扩容时容量变化更小
劣势
  1. 存储大量元素(超过1000)时比较耗时
  2. 相较于HashMap使用hash算法直接找到数组下标,然后从该下表的元素往后搜索,ArraySet在查找元素时需要进行二分查找,如果数组元素数量过多(超过1000),可能比较耗时。
  3. 在扩容和缩容时可能会频繁移动元素
  4. ArraySet在扩容和缩容时需要移动元素,且扩容时容量变化比HashMap小,扩容和缩容的频率可能更高,元素数量过多时,元素的移动可能会对性能产生影响。

int --> Object(SparseArray)

int --> int(SparseIntArray)

int --> boolean(SparseBooleanArray)

int --> long(SparseLongArray)


SparseArray

SparseArray采用两个一维数组,一个是存储key(int类型),一个是存在value。

SparseArray应用场景

1、如果对内存要求比较高,而对查询效率没什么大的要求,可以是使用SparseArray
2、数量在百级别的SparseArray比HashMap有更好的优势
3、要求key是int类型的,因为HashMap会对int自定装箱变成Integer类型
4、要求key是有序的且是升序


SparseIntArray

SparseArray优化了int到Object键值对的存储,SparseIntArray优化了int到int键值对的存储。




元素的查找分键查找和值查找,键查找使用二分查找,值查找直接使用循环遍历。



使用二分查找key在mKeys数组的下标,也是value在mValues数组的下标。如果ContainerHelpers.binarySearch(mKeys,mSize,key)在mKeys数组中没有找到key,返回key待插入位置的下标的取反,如果找到key,更新mValues对应位置的值。
GrowingArrayUtils.insert函数:

如果array在不需要扩大容量的情况下可以添加一个元素,则先将待插入位置index开始的元素整体后移一位,然后插入元素,否则先扩容,然后将元素拷贝到新的数组中。



delete(int key),先使用二分查找,找到key在mKeys的下标,如果找到即i >= 0,则直接删除mKeys和mValues指定位置的元素。
优势:
  1. 避免int键自动装箱
  2. 相较于HashMap使用Node,这样的设计使用更小的存储单元即可存储key到value的映射
缺点:
  1. 在进行元素查找时使用二分查找,元素较多(谷歌给出的数字是大于1000)时,查找效率较低
  2. 在进行元素的添加和删除时,可能会频繁进行元素的移动,运行效率可能会降低

SparseBooleanArray,SparseLongArray

类似SparseIntArray,只是存储的数据类型的mValues数组是boolean 和 long

  1. 设计目的是优化int到int, boolean ,long映射的存储
  2. 使用int类型的数组mKeys存储键,使用对应类型的数组mValues存储值
  3. int类型的键在存储上是有序的
  4. 在查找值时,先使用二分查找,在mKeys中查找值在mValues中的下标,然后返回值
上一篇下一篇

猜你喜欢

热点阅读