C++C++

c++ 中 struct 的内存布局

2016-10-22  本文已影响445人  圣斗士皮皮

C++ or C

这里讨论的是 C++, 在C中内存布局差不多,但是也不尽相同。如一个空的struct,c++中大小为1, C中却大小为0.

struct 的最小大小为1

C++中每个对象必须有个唯一的地址,所以每个对象的大小必须不能为0,因此一个 struct 的最小大小为 1. 一个例子是一个空struct:

struct EmptyStruct {};

布局流程

一个 struct 的内存布局流程可以简化为下面几步:

  1. struct 放到地址0上
    2.struct 的所有成员顺序地依次放置到自己的偏移位置上
    3.所有成员放置完毕,对struct的内容大小(最后一个成员的终了位置)进行对齐,计算出新大小

流程中涉及到两点:

  1. 如何确定一个成员的放置起始位置
    2.如何最后对struct的内容大小进行对齐

成员的起始位置

当放置完上一个成员之后,对接下来的成员放置位置是有要求的,要求这个位置偏移(对于struct的起始位置)必须是这个成员的内部最大pod类型的大小的倍数。

成员的内部最大pod类型可以分成集中情况来讨论:

第一种是这个成员就是基本的pod类型(int,char,double,...) ,那么其内部最大pod类型大小自然是其本身成员的大小了。

第二种是这个成员是struct类型,其内部最大pod类型为struct内部的各个成员的内部最大pod类型中最大的那个(有个递归了)。

第三种是数组,数组的内存布局要求是,每个数组成员之间无空隙排列的,没有填充字节。所以数组的总大小是数组长度乘以每个数组成员的大小。内部最大pod类型的大小为数组成员内部的最大pod类型大小(有个递归了)。

伪代码如下:

function maxInnerUnitSize(data)
    if data 是 pod类型:
         return sizeof(pod类型)
    else if data 是 struct 类型:
        return max(map(data.members, maxInnerUnitSize))
    else if data  是 数组类型:
       return maxInnerUnitSize(data[0])
end

在上个放置成员尾部和当前成员起始位置之间如果有间隙,那么编译器会填充无效字节。

然后就可以把当前成员放置进去,放入的大小为当前成员的总大小。一个数组的总大小计算伪代码:

function dataSize(data)
    if data 是 pod类型:
         return sizeof(pod类型)
    else if data 是 struct 类型:
        return struct 的大小
    else if data  是 数组类型:
       return 数组长度 * sizeof(data[0])
end

struct 的大小对齐

成员都放置完毕之后,struct的内容大小有个规则,是必须是内部最大pod类型的大小的倍数。没错就是上面那个 maxInnerUnitSize。

然后在最后一个成员末尾到struct的新大小末尾会填充字节(如果有空隙的话)。

举个例子:

struct AAA {
    char a[3];
    int64_t b;
    char c;
};

a 的地址为 0, 占3个字节,b的地址必须为8的倍数,所以编译器填充5个字节,然后b从地址8处开始放置,占用8个字节, c 放置在地址16处, 占用1个字节。整个struct内容大小为17, 内部最大的pod类型大小为8,所以调整到8的倍数,struct 大小调整为24.

#pragma pack(n) 的影响

pack 的参数n,有1,2,4,8,16, 原则是2的次幂。这个参数影响的是上面流程中的内部最大pod类型大小。影响是从正常流程算出的大小,和pack(n) 指定的大小选取一个小的来布局。

#pragma pack(4)
struct AAA {
    char a[3];
    int64_t b;
    char c;
};

a放置在地址0处,占用3个字节,接下来b的内部最大pod大小为8,选取指定的4, 所以b放置在地址4处,占用8个字节, c放置在地址9处,占用1个字节。struct内容区域大小为10,需要调整为 4 的倍数(8和指定的4选小的),所以大小调整为12.

上一篇下一篇

猜你喜欢

热点阅读