类的底层原理

这篇文件来探索类的底层c++


类探索

一个自定义类的类名是咱们决定的,因此咱们想进行类探索,就得看看咱们定义的类,在底层是如何被定义的。缓存

一、将OC代码转换成c++代码

先准备一个自定义类DZPerson,在类中定义一个成员变量(_nick),一个属性(nameStr)。实现了一个方法(-saySomethine)和一个类方法(+sayHello)markdown

@interface DZPerson : NSObject
{
    NSString *_nick;
}
@property (copy, nonatomic) NSString *nameStr;
@end

@implementation DZPerson
- (void)saySomething {
    NSLog(@"%s", __func__);
}

+ (void)sayHello {
    NSLog(@"%s", __func__);
}
@end
复制代码

在main中进行初始化。函数

int main(int argc, const char * argv[]) {
    @autoreleasepool {
        // insert code here...
        NSLog(@"Hello, World!");
        
        DZPerson *person = [DZPerson alloc];
    }
    return 0;
}
复制代码

使用终端,进入到main.m文件所在的路径,使用clang命令,编译main.m文件ui

clang -rewrite-objc main.m -o main.cpp
复制代码

输出main.cpp,打开这个文件,在里面进行搜索DZPerson,做为线索的出发点:atom

typedef struct objc_object DZPerson;

⏬⏬⏬

struct DZPerson_IMPL {
	struct NSObject_IMPL NSObject_IVARS;
	NSString *_nick;
};

⏬⏬⏬

struct NSObject_IMPL {
	Class isa;
};

⏬⏬⏬

typedef struct objc_class *Class;
复制代码
  • 自定义类的类名是struct objc_object结构体的别名。
  • 找到了一个struct DZPerson_IMPL结构体,包含两个成员属性:
    • 另外一个结构体struct NSObject_IMPL,经过名字中的字段,了解到这个应该是父类NSObject
    • 咱们定义的成员_nick
  • 查看NSObject_IMPL结构体,里面有一个成员isa,是Class类型。
  • 最后在文件中找到Classstruct objc_class *结构体指针类型。

经过以上逻辑,咱们的目标转移到struct objc_objectstruct objc_class这两个结构体上了。spa

二、struct objc_object & struct objc_class

看看这两个结构体在源码中的定义,代码比较长,我只截获了须要咱们研究的部分:3d

struct objc_object {
private:
    isa_t isa;

public:
    //这里定义了一些函数,先省略
    ...
}

struct objc_class : objc_object {
    // Class ISA;
    Class superclass;
    cache_t cache;             // formerly cache pointer and vtable
    class_data_bits_t bits;    // class_rw_t * plus custom rr/alloc flags

    class_rw_t *data() const {
        return bits.data();
    }
    void setData(class_rw_t *newData) {
        bits.setData(newData);
    }
    //省略后续代码
    ...
}
复制代码
  • objc_object中只有一个成员:isa
  • objc_class继承自objc_object
    • 第一个成员就是父类objc_object中的isa(苹果的注释仍是挺人性的)
    • superclass,字面意思很清楚,super类
    • cache,缓存相关信息
    • bits,里面存放类的相关数据(成员、属性、方法、协议等相关数据信息)
    • 后面还有不少函数,能够自行去查看一下。(此处记录bits的getter和setter函数,由于后面要用到)

经过以上的源码查看和相关的简要分析,咱们能够确认自定义类在底层会被转化成objc_class类型的结构体。实例对象在底层就是objc_object类型。经过下面的两行源码,能够直接证实:指针

typedef struct objc_class *Class;
typedef struct objc_object *id;
复制代码

此时看文章的你可能会有个疑惑:objc_class继承自objc_object,==那么类也是对象?==调试

三、万物皆对象

OC中类也是对象,如何证实呢?咱们知道,实例对象中的isa指向的是类,类中也有isa,咱们经过lldb来看看类的isa: 咱们以文章开头的代码为例:

DZPerson *person = [DZPerson alloc];
复制代码

lldb执行截图:

  1. 打印person的内存状况x/4gx perosn:首地址中的第一个值是person对象的isa。
  2. 从person的isa中读取类信息地址(经过一个系统定义好的宏,进行获取)。
  3. po获得的值,也就是图片中第一个红框,打印是DZPerosn,地址是:0x0000000100002378
  4. 再用与查看person内存相同的方式,产看获得的0x0000000100002378的内存状况,也就是查看DZPerson类的内存
  5. 获取DZPersonisa,并po一下,打印的结果页是DZPerson,可是地址和前面打印的地址不一样。这个第二个DZPerosn元类
  6. 继续查看元类isa,打印出来的是NSObject,可是它不是NSObject类,而是NSObject的元类,也就是根元类。而根元类的isa指向仍是根元类

简单来讲,==实例对象isa指向类,类isa指向元类,元类isa指向根元类,根元类的isa指向根元类。==经过一张图,能够更好的理解isa的走位指向: 图中虚线表明isa走位,实现表明superclass走位。

==所以:类是元类的实例对象,而元类是根元类的示例对象。因此说,类也是对象,万物接对象==。

四、lldb调试打印类中的信息

接下来咱们用lldb来看看类中存储的属性、方法,前文说到这些信息都存储在class_data_bits_t bits中,使用指针偏移的方式就能够获取到bits。 此处放一张objc_class的源码截图: 拿到class在内存中的首地址,分别加上属性isa、superclass和cache占用的内存大小,就能够获得bits的地址。

isasuperclass都是指针类型,因此分别占用8字节。

那么如今须要计算cache占用多少字节,看看cache_t的源码:

struct cache_t {
#if CACHE_MASK_STORAGE == CACHE_MASK_STORAGE_OUTLINED
    explicit_atomic<struct bucket_t *> _buckets;
    explicit_atomic<mask_t> _mask;
#elif CACHE_MASK_STORAGE == CACHE_MASK_STORAGE_HIGH_16
    explicit_atomic<uintptr_t> _maskAndBuckets;
    mask_t _mask_unused;
    
    //省略静态成员变量
    ...
#else
#error Unknown cache mask storage type.
#endif
    
#if __LP64__
    uint16_t _flags;
#endif
    uint16_t _occupied;

public:
    //省略后面的函数
    ...
}
复制代码
  • 首先是编译条件的公式#if和#elif,里面都是有两个成员变量,分别是指针类型和mask_t类型。指针占用8个字节,mask_tuint32_t的别名,也就是占中4个字节。
  • _flags_occupied分别占用2个字节,由于是uint16_t类型。
  • 其他的就是静态成员和函数,在结构体中的静态成员和函数是不占用结构体内存空间的。所以得出cache_t cache成员在结构体中占用16字节

==那么想要获得class_data_bits_t bits的偏移量,就是isa+superclass+cache=8+8+16=32,转换成十六进制就是20==

条件知足,咱们开始打印类中的信息:

  • 打印类地址:直接获取DZPerson的首地址

首地址的第一个元素就是类的isa,因此咱们直接以十六进制打印便可。

  • 获取bits,拿到首地址进行+20偏移,20是前面计算出来的(0x0000000100002398 = 0x0000000100002378 + 20)。而且进行强制类型转换

  • 调用class_rw_t *data() const函数(前文中,objc_class源码中的函数),获得地址,打印地址中的值:

  • 接下来用class_rw_t中的methods()函数,能够获取到方法列表:

  • list函数获取列表的首地址,打印地址的值后,用get查看到类中的全部方法。经过下图能看到类中定义的saySomething方法、属性nameStr的setter和getter方法,还有一个系统生成的.cxx_destruct方法:

  • 类中还定义了一个类方法+ (void)sayHello,在这里是看不到的。由于类方法存在元类中。

经过上面的方式咱们就能够产看到类中方法,也能够证实,方法是存在类中。一样,经过class_rw_t中的properties()能够获取到属性、protocols()获取协议。

成员变量存在ro中,经过函数ro()获取:


总结

  1. 经过查看c++代码,咱们找到了类的底层定义objc_class,而且知道类中也存在isa指针。
  2. 经过isa走位图,知道类也是对象,并推到出‘万物皆对象’。
  3. 经过lldb一步步看到类中的属性、方法、协议以及成员在类中如何存储的。

但愿本文能对你有所帮组,若是有些的很差的地方,还请指出,谢谢!

相关文章
相关标签/搜索