Objective-C内存结构源码解读

2019-03-02  本文已影响0人  大冯宇宙

我们平时编写的OC代码,底层实现其实都是C\C++代码,所以OC的对象和类主要是基于C和C++的数据结构实现的,这里的数据结构就是结构体,下面请看详细报道。

OC代码转换为C和C++

有两种方式,可以用clang(xcode内置的llvm编译器)直接将.m输出为.cpp,但是不能指定平台,一个主函数中只new一个对象的方法,转换出来的代码会有近十万行,命令:clang -rewrite-objc main.m -o main.cpp 。但实际上编译器在编译的时候会考虑平台,所以我们使用xcrun -sdk iphoneos clang -arch arm64 -rewrite-objc main.m -o main.cpp命令,指定编译平台和架构,这样转换出来的代码只有三分之一不到。这是转换前后的代码。因为转换后的代码太长,所以只摘取了千百行。
在关于OC的本质,通常需要来查看NSObject类的结构,因为NSObject是所有类的基类,我们从cpp文件中搜索NSObject,找到一个代码,就能看到OC类底层实现其实就是C的结构体。

struct NSObject_IMPL {
    Class isa; // 因为class是个指针,所以占8个字节(64位系统)
};
typedef struct objc_class *Class;
// 这里要提一嘴,实际上NSObject的类初始化时候是占16字节,
//使用malloc_size((__bridge const void *)obj)方法就能获得obj指针所指向内存的大小>>16。
//class_getInstanceSize([NSObject class])是获得NSObject实例对象的成员变量(isa)所占用的大小 >>8字节

// OC源码,可以看出申请内存,不能小于16字节
size_t instanceSize(size_t extraBytes) {
    size_t size = alignedInstanceSize() + extraBytes;
    // CF requires all objects be at least 16 bytes.
    if (size < 16) size = 16;
    return size;
}

从上面代码可以看出一个NSObject类申请占16字节,通过lldb调试查看内存空间,前8个字节为成员变量isa的8个字节,后8个字节为占位。

<NSObject: 0x100573f70>
(lldb) memory read 0x100573f70
0x100573f70: 41 d1 a9 8d ff ff 1d 00 00 00 00 00 00 00 00 00  A...............

下面我们new一个student类

@interface Student : NSObject
{
    @public
    int _no;
    int _age;
}
@end

通过上边的描述,我们生成一个.cpp文件,可以查看这个student的对象类型是一个结构体指针,源码描述为:

struct Student_IMPL {
//这个继承关系的NSObject就是
//struct NSObject_IMPL {
//    Class isa; // 因为class是个指针,所以占8个字节(64位系统)
//};
    struct NSObject_IMPL NSObject_VARS; 
    int _no;
    int _age;
};

通过源码很容易理解,生成的对象大小其实就是16字节,isa占8个字节,int占4个字节。最后我们通过代码验证一下,具体结果可以使用lldb查看内存空间占的值,这里就不贴出来了:

int main(int argc, const char * argv[]) {
    @autoreleasepool {
        Student *stu = [[Student alloc] init];
        stu->_no = 4;
        stu->_age = 5;
        
        NSLog(@"%zd", class_getInstanceSize([Student class])); //返回这个对象至少需要多少存储空间
        NSLog(@"%zd", malloc_size((__bridge const void *)stu));
        struct Student_IMPL *stuImpl = (__bridge struct Student_IMPL *)stu;
        NSLog(@"no is %d, age is %d", stuImpl->_no, stuImpl->_age);
    }
    return 0;
}

内存对齐:

这里我们要说一下内存对齐,来更深入的探讨OC对象的内存分配。
大学里我们学过内存对齐在结构体中的体现是结构体的大小必须是最大成员的倍数。
iOS操作系统分配内存的时候也会有内存对齐,大小是16字节的倍数,那么为什么是16的倍数,其实就是操作系统认为16的倍数是对操作系统访问最快的方式,我们看看代码怎么说

//new一个person类,
@interface Person : NSObject
{
    int _age;
    int _height;
    int _no;
}
//通过xrun生成cpp代码为
struct Person_IMPL {
    struct NSObject_IMPL NSObject_IVARS;
    int _age;
    int _height;
    int _no;
};
//打印内存大小
int main(int argc, const char * argv[]) {
    @autoreleasepool {
        Person *p = [[Person alloc] init];
        // sizeof是编译阶段确认类型占用内存的大小,如果传入的是p,这为8个字节,因为p是一个指针类型,在编译阶段就已经确定。
        NSLog(@"%zd", sizeof(struct Person_IMPL)); // 24
        // class_getInstanceSize 是在类的创建时候至少需要多少存储空间
        // malloc_size是最终分配了多少内存空间
        NSLog(@"%zd %zd",
              class_getInstanceSize([Person class]), // 24
              malloc_size((__bridge const void *)(p))); // 32
    }
    return 0;
}

我们在看看malloc的源码,去GNU查找最新的C语言源码,有一个叫glibc的库,可以看到malloc-alignment.h


这个函数就是C函数申请一个对齐后的内存,这里在这里我们可以在iOS工程内用sizeof计算出alignof_ (long double) 和 SIZE_SZ的值分别是16和8,所以在iOS的环境下,内存对其的最小是16字节。
#define MALLOC_ALIGNMENT (2 * SIZE_SZ < __alignof__ (long double) \
              ? __alignof__ (long double) : 2 * SIZE_SZ)

OC对象的分类

Objective-C中的对象,简称OC对象,主要可以分为3种

instance对象(实例对象)

上边我们描述的都是实类对象
instance对象就是通过类alloc出来的对象,每次调用alloc都会产生新的instance对象
instance对象在内存中存储的信息包括
isa指针
其他成员变量

class对象(类对象)
        NSObject *object1 = [[NSObject alloc] init];
        NSObject *object2 = [[NSObject alloc] init];
        Class objectClass1 = [object1 class];
        Class objectClass2 = [object2 class];
        Class objectClass3 = object_getClass(object1);
        Class objectClass4 = object_getClass(object2);
        Class objectClass5 = [NSObject class];

objectClass1 ~ objectClass5都是NSObject的class对象(类对象)
它们是同一个对象。每个类在内存中有且只有一个class对象

class对象在内存中存储的信息主要包括:

meta-class对象(元类对象)
Class objectMetaClass = object_getClass([NSObject class];);

objectMetaClass是NSObject的meta-class对象(元类对象)
每个类在内存中有且只有一个meta-class对象

meta-class对象和class对象的内存结构是一样的,但是用途不一样,在内存中存储的信息主要包括:

总结几个方法
从打印结果看,对象方法的内存不同
        NSObject *object1 = [[NSObject alloc] init];
        NSObject *object2 = [[NSObject alloc] init];
获取类对象的打印相同
        Class objectClass1 = [object1 class];
        Class objectClass2 = [object2 class];
        Class objectClass3 = object_getClass(object1);
        Class objectClass4 = object_getClass(object2);
        Class objectClass5 = [NSObject class];
获取元类的方法,传递的是类对象参数。
        Class objectMetaClass = object_getClass([NSObject class];);

        NSLog(@"%p %p",
              object1,
              object2);
        
        NSLog(@"%p %p %p %p %p",
              objectClass1,
              objectClass2,
              objectClass3,
              objectClass4,
              objectClass5);
打印:
2019-12-28 21:46:18.859724+0800 Interview02-class对象[5114:373716] 0x103a1e570 0x103a1f360
2019-12-28 21:46:18.860065+0800 Interview02-class对象[5114:373716] 0x7fff9cc7a118 0x7fff9cc7a118 0x7fff9cc7a118 0x7fff9cc7a118 0x7fff9cc7a118

源码:
获取类对象、元类对象的方法,在objc中实际就是返回isa指针。
Class object_getClass(id obj)
{
    if (obj) return obj->getIsa();
    else return Nil;
}
这里不要跟这个方法混淆,objc_getClass是传递了个类的名称。最后通过map查找到对应的class,下边是精简后的代码。
Class objc_getClass(const char *aClassName)
{
    if (!aClassName) return Nil;

    // NO unconnected, YES class handler
    return look_up_class(aClassName, NO, YES);
}
Class 
look_up_class(const char *name, 
              bool includeUnconnected __attribute__((unused)), 
              bool includeClassHandler __attribute__((unused)))
{
 getClass(name);
}
static Class getClass(const char *name)
{
    Class result = getClass_impl(name);
}
static Class getClass_impl(const char *name)
{
    Class result = (Class)NXMapGet(gdb_objc_realized_classes, name);
}


调用流程

isa指针

// 因为Class的isa没有设置成可以供外部访问,所以我们自己创建一个结构体,跟Class一样,方便我们下边获取isa的值。
struct gkt_objc_class {
    Class isa;
    Class superclass;
};

int main(int argc, const char * argv[]) {

    GKTTest *test = [GKTTest new];
    Class testClass = [GKTTest class];
    Class mateClass = object_getClass(testClass);
    
    struct gkt_objc_class * testClass2 = (__bridge struct gkt_objc_class *)testClass;
    struct gkt_objc_class * mateClass2 = (__bridge struct gkt_objc_class *)mateClass;

    return 0;

}
(lldb) p/x test->isa
(Class) $0 = 0x001d800100001179 GKTTest
(lldb) p/x testClass
(Class) $1 = 0x0000000100001178 GKTTest
(lldb) p/x 0x001d800100001179 & 0x00007ffffffffff8
(long) $2 = 0x0000000100001178
(lldb) p/x testClass2->isa
(Class) $3 = 0x0000000100001150
(lldb) p/x mateClass2
(gkt_objc_class *) $4 = 0x0000000100001150
(lldb) p/x 0x0000000100001150 & 0x00007ffffffffff8
(long) $5 = 0x0000000100001150
(lldb) 


窥探struct objc_class的结构
上一篇 下一篇

猜你喜欢

热点阅读