c++ 中 struct 的内存布局

2016-10-22 本文已影响445人圣斗士皮皮

C++ or C

这里讨论的是 C++, 在C中内存布局差不多，但是也不尽相同。如一个空的struct，c++中大小为1， C中却大小为0.

struct 的最小大小为1

C++中每个对象必须有个唯一的地址，所以每个对象的大小必须不能为0，因此一个 struct 的最小大小为 1. 一个例子是一个空struct:

struct EmptyStruct {};

布局流程

一个 struct 的内存布局流程可以简化为下面几步：

struct 放到地址0上
2.struct 的所有成员顺序地依次放置到自己的偏移位置上
3.所有成员放置完毕，对struct的内容大小（最后一个成员的终了位置）进行对齐，计算出新大小

流程中涉及到两点：

如何确定一个成员的放置起始位置
2.如何最后对struct的内容大小进行对齐

成员的起始位置

当放置完上一个成员之后，对接下来的成员放置位置是有要求的，要求这个位置偏移（对于struct的起始位置)必须是这个成员的内部最大pod类型的大小的倍数。

成员的内部最大pod类型可以分成集中情况来讨论：

第一种是这个成员就是基本的pod类型（int,char,double,...) ，那么其内部最大pod类型大小自然是其本身成员的大小了。

第二种是这个成员是struct类型，其内部最大pod类型为struct内部的各个成员的内部最大pod类型中最大的那个（有个递归了）。

第三种是数组，数组的内存布局要求是，每个数组成员之间无空隙排列的，没有填充字节。所以数组的总大小是数组长度乘以每个数组成员的大小。内部最大pod类型的大小为数组成员内部的最大pod类型大小（有个递归了）。

伪代码如下:

function maxInnerUnitSize(data)
    if data 是 pod类型：
         return sizeof(pod类型)
    else if data 是 struct 类型:
        return max(map(data.members, maxInnerUnitSize))
    else if data  是 数组类型:
       return maxInnerUnitSize(data[0])
end

在上个放置成员尾部和当前成员起始位置之间如果有间隙，那么编译器会填充无效字节。

然后就可以把当前成员放置进去，放入的大小为当前成员的总大小。一个数组的总大小计算伪代码：

function dataSize(data)
    if data 是 pod类型：
         return sizeof(pod类型)
    else if data 是 struct 类型:
        return struct 的大小
    else if data  是 数组类型:
       return 数组长度 * sizeof(data[0])
end

struct 的大小对齐

成员都放置完毕之后，struct的内容大小有个规则，是必须是内部最大pod类型的大小的倍数。没错就是上面那个 maxInnerUnitSize。

然后在最后一个成员末尾到struct的新大小末尾会填充字节（如果有空隙的话）。

举个例子：

struct AAA {
    char a[3];
    int64_t b;
    char c;
};

a 的地址为 0, 占3个字节，b的地址必须为8的倍数，所以编译器填充5个字节，然后b从地址8处开始放置，占用8个字节， c 放置在地址16处, 占用1个字节。整个struct内容大小为17，内部最大的pod类型大小为8，所以调整到8的倍数，struct 大小调整为24.

#pragma pack(n) 的影响

pack 的参数n，有1，2，4，8，16，原则是2的次幂。这个参数影响的是上面流程中的内部最大pod类型大小。影响是从正常流程算出的大小，和pack(n) 指定的大小选取一个小的来布局。

#pragma pack(4)
struct AAA {
    char a[3];
    int64_t b;
    char c;
};

a放置在地址0处，占用3个字节，接下来b的内部最大pod大小为8，选取指定的4，所以b放置在地址4处，占用8个字节， c放置在地址9处，占用1个字节。struct内容区域大小为10，需要调整为 4 的倍数(8和指定的4选小的)，所以大小调整为12.