OC底层原理04 - 内存字节对齐

2020-09-08  本文已影响0人  卡布奇诺_95d2

什么是内存对齐

现代计算机中内存空间都是按照byte划分的,从理论上讲似乎对任何类型的变量的访问可以从任何地址开始,但实际情况是访问特定类型变量的时候经常从特定的内存地址访问,这就需要各种类型的数据按照一定的规则在空间上排列,而不是一个接一个的排放,这就是内存对齐

内存对齐的原因

图解处理器如何读取内存数据

尽管内存是以字节为单位,但是大部分处理器并不是按字节来对存取内存的,它一般会以2字节、4字节、8字节、16字节甚至32字节为单位来存取内存,我们将这些存取单位称为存取粒度
一般情况下,以8字节为存取粒度。当数据类型的长度小于指定的存取粒度时,以数据类型长度为存取粒度。
示例:当前内存中需要存储如下结构体:

struct LGStruct1 {
    char a;
    int b;
    double c;
}struct1;
  1. 内存未对齐


    内存未对齐

    假设当前1位置就是struct1的起始地址。
    当需要读取a的值时,由于a的数据类型为char,占一个字节,此时可以一次读出a的值。


    image.png
    当需要读取b的值时,由于b的数据类型为int,占4个字节,此时先读取[1,4]位置这4个字节的值,然后再读取[5,8]位置这4个字节,再从这8个字节中获取[2,5]位置这4个字节的数据赋值给b。
    image.png

    当需要读取c的值时,c的数据类型为long,占8个字节,需要先读出[1,8]位置这8个字节,然后再读[9,16]位置这8个字节,再从16个字节中获取[6,13]位置这8个字节的数据赋值给c。


    image.png
    经过上述分析,当内存未对齐时,在读取一些数据时往往需要经过几次读取和复杂的分析,才能完整的获得某个数据,这显然不太好。
  2. 内存对齐


    内存对齐

    假设当前1位置就是struct1的起始地址。
    当需要读取a的值时,由于a的数据类型为char,占一个字节,此时可以一次读出a的值。


    image.png
    当需要读取b的值时,由于b的数据类型为int,占4个字节,此时先读取[1,4]位置这4个字节的值,发现该值不是b的值,然后再读取[5,8]位置这4个字节,该值为b的值则赋值给b。
    image.png

    当需要读取c的值时,c的数据类型为long,占8个字节,需要先读取[1,8]位置这8个字节的值,发现该值不是c的值,然后再读[9,16]位置这8个字节,该值为c的值赋值给c。


    image.png
    由上述分析可以看出来,经过内存对齐之后,读取效率明显高出很多,因此内存对齐是很有必要的。

内存对齐的原则

既然内存对齐可以提高效率,那内存对齐需要遵循怎样的原则呢?

数据成员的对齐规则

结构体或联合的数据成员,第一个成员放在offset为0的地方,以后每个数据成员存储的起始位置要从该成员大小或者成员的子成员大小的整数倍开始。
以下通过不同案例进行分析
案例1:

struct LGStruct1 {
    double a;
    char b;
    int c; 
    short d;
}struct1;
struct LGStruct2 {
    double a;
    int b; 
    char c; 
    short d;
}struct2;

总结:对数据成员进行内存对齐主要有2个关键点:1. 第一个成员放在offset为0的位置;2. 其它成员放在该成员大小的整数倍位置。

结构体作为成员的对齐规则

在数据成员完成各自对齐之后,结构(联合)本身也需要进行对齐,对齐将按照成员中最大数据长度的整数倍开始存储
案例1:

struct LGStruct3 {
    long c;
    char d;
}struct3;

struct LGStruct4 {
    int a;
    struct LGStruct3 b;
}struct4;

案例2:

struct LGStruct3 {
    int c;
    char d[10];
}struct3;

struct LGStruct4 {
    short a;
    struct LGStruct3 b;
}struct4;

结构体整体对齐规则

结构体的总大小,即sizeof的结果,必须是其内部最大成员的整数倍,不足需要补齐
案例1:

struct LGStruct1 {
    double a;
    int b;
    char c;
    short d; 
}struct1;
struct LGStruct2 {
    int a;
    char b[10];
}struct2;
struct LGStruct3 {
    struct LGStruct1 a;
    short b;
    struct LGStruct2 c;
    int d;
}struct3;
  1. struct LGStruct1
  1. struct LGStruct2
  1. struct LGStruct3

案例2:

struct LGStruct1 {
    double a; 
    char b; 
    int c; 
    short d; 
}struct1;
struct LGStruct2 {
    int c;
    char d[10];
}struct2;
struct LGStruct4 {
    struct LGStruct1 a;
    short b;
    struct LGStruct2 c;
    int d;
}struct4;
  1. struct LGStruct1
  1. struct LGStruct2
  1. struct LGStruct3

总结

结构体作为一种复合数据类型,其构成元素既可以是基本数据类型的变量,也可以是一些复合型类型数据。对此,编译器会自动进行成员变量的对齐以提高运算效率。默认情况下,按自然对齐条件分配空间。各个成员按照它们被声明的顺序在内存中顺序存储,第一个成员的地址和整个结构的地址相同,向结构体成员中size最大的成员对齐。

上一篇 下一篇

猜你喜欢

热点阅读