《转》Objective－C Runtime（3）－消息和 Category

时间 2019-11-12

标签 objective runtime 消息 category 栏目 C&C++ 繁體版

原文原文链接

习题内容

下面的代码会？Compile Error / Runtime Crash / NSLog…?数组

@interface NSObject (Sark)
+ (void)foo;
@end

@implementation NSObject (Sark)

- (void)foo
{
    NSLog(@"IMP: -[NSObject(Sark) foo]");
}

@end

int main(int argc, const char * argv[]) {
    @autoreleasepool {
        [NSObject foo];
        [[NSObject new] foo];
    }
    return 0;
}

答案：代码正常输出，输出结果以下：缓存

2014-11-06 13:11:46.694 Test[14872:1110786] IMP: -[NSObject(Sark) foo]
2014-11-06 13:11:46.695 Test[14872:1110786] IMP: -[NSObject(Sark) foo]

使用clang -rewrite-objc main.m重写，咱们能够发现 main 函数中两个方法调用被转换成以下代码：数据结构

((void (*)(id, SEL))(void *)objc_msgSend)((id)objc_getClass("NSObject"), sel_registerName("foo"));
 ((void (*)(id, SEL))(void *)objc_msgSend)((id)((NSObject *(*)(id, SEL))(void *)objc_msgSend)((id)objc_getClass("NSObject"), sel_registerName("new")), sel_registerName("foo"));

咱们发现上述两个方法最终转换成使用 objc_msgSend 函数传递消息。函数

这里先看几个概念

objc_msgSend函数定义以下:性能

id objc_msgSend(id self, SEL op, ...)

关于 id 的解释请看objc runtime系列第二篇博文： objc runtime中Object & Class & Meta Class的细节ui

什么是 SEL

打开objc.h文件，看下SEL的定义以下:this

typedef struct objc_selector *SEL;

SEL是一个指向objc_selector结构体的指针。而 objc_selector 的定义并无在runtime.h中给出定义。咱们能够尝试运行以下代码:spa

SEL sel = @selector(foo);
NSLog(@"%s", (char *)sel);
NSLog(@"%p", sel);

const char *selName = [@"foo" UTF8String];
SEL sel2 = sel_registerName(selName);
NSLog(@"%s", (char *)sel2);
NSLog(@"%p", sel2);

输出以下:ssr

2014-11-06 13:46:08.058 Test[15053:1132268] foo
2014-11-06 13:46:08.058 Test[15053:1132268] 0x7fff8fde5114
2014-11-06 13:46:08.058 Test[15053:1132268] foo
2014-11-06 13:46:08.058 Test[15053:1132268] 0x7fff8fde5114

Objective-C在编译时，会根据方法的名字生成一个用来区分这个方法的惟一的一个ID。只要方法名称相同，那么它们的ID就是相同的。设计

两个类之间，无论它们是父类与子类的关系，仍是之间没有这种关系，只要方法名相同，那么它的SEL就是同样的。每个方法都对应着一个SEL。编译器会根据每一个方法的方法名为那个方法生成惟一的SEL。这些SEL组成了一个Set集合，当咱们在这个集合中查找某个方法时，只须要去找这个方法对应的SEL便可。而SEL本质是一个字符串，因此直接比较它们的地址便可。

固然，不一样的类能够拥有相同的selector。不一样类的实例对象执行相同的selector时，会在各自的方法列表中去根据selector去寻找本身对应的IMP。

那么什么是IMP呢

继续看定义:

typedef id (*IMP)(id, SEL, ...);

IMP本质就是一个函数指针，这个被指向的函数包含一个接收消息的对象id，调用方法的SEL，以及一些方法参数，并返回一个id。所以咱们能够经过SEL得到它所对应的IMP，在取得了函数指针以后，也就意味着咱们取得了须要执行方法的代码入口，这样咱们就能够像普通的C语言函数调用同样使用这个函数指针。

那么 objc_msgSend 究竟是怎么工做的呢

在Objective-C中，消息直到运行时才会绑定到方法的实现上。编译器会把代码中[target doSth]转换成 objc_msgSend消息函数，这个函数完成了动态绑定的全部事情。它的运行流程以下:

检查selector是否须要忽略。(ps: Mac开发中开启GC就会忽略retain,release方法。)
检查target是否为nil。若是为nil，直接cleanup，而后return。(这就是咱们能够向nil发送消息的缘由。)
而后在target的Class中根据Selector去找IMP

寻找IMP的过程:

先从当前class的cache方法列表（cache methodLists）里去找
找到了，跳到对应函数实现
没找到，就从class的方法列表（methodLists）里找
还找不到，就到super class的方法列表里找，直到找到基类(NSObject)为止
最后再找不到，就会进入动态方法解析和消息转发的机制。(这部分知识，下次再细谈)

那么什么是方法列表呢

上一篇博文中提到了objc_class结构体定义，以下：

struct objc_class {
    Class isa  OBJC_ISA_AVAILABILITY;
    #if !__OBJC2__
    Class super_class                                        OBJC2_UNAVAILABLE;
    const char *name                                         OBJC2_UNAVAILABLE;
    long version                                             OBJC2_UNAVAILABLE;
    long info                                                OBJC2_UNAVAILABLE;
    long instance_size                                       OBJC2_UNAVAILABLE;
    struct objc_ivar_list *ivars                             OBJC2_UNAVAILABLE;
    struct objc_method_list **methodLists                    OBJC2_UNAVAILABLE;
    struct objc_cache *cache                                 OBJC2_UNAVAILABLE;
    struct objc_protocol_list *protocols                     OBJC2_UNAVAILABLE;
    #endif
} OBJC2_UNAVAILABLE;

struct objc_method_list {
    struct objc_method_list *obsolete                        OBJC2_UNAVAILABLE;

    int method_count                                         OBJC2_UNAVAILABLE;
#ifdef __LP64__
    int space                                                OBJC2_UNAVAILABLE;
#endif
    /* variable length structure */
    struct objc_method method_list[1]                        OBJC2_UNAVAILABLE;
}

1) objc_method_list 就是用来存储当前类的方法链表，objc_method存储了类的某个方法的信息。

Method

typedef struct objc_method *Method;

Method 是用来表明类中某个方法的类型，它实际就指向objc_method结构体，以下:

struct objc_method {
    SEL method_name                                          OBJC2_UNAVAILABLE;
    char *method_types                                       OBJC2_UNAVAILABLE;
    IMP method_imp                                           OBJC2_UNAVAILABLE;
}                                                            OBJC2_UNAVAILABLE;

method_types是个char指针，存储着方法的参数类型和返回值类型。
SEL 和 IMP 就是咱们上文提到的，因此咱们能够理解为objc_class中 method list保存了一组SEL<->IMP的映射。

2）objc_cache 用来缓存用过的方法，提升性能。

Cache

typedef struct objc_cache *Cache                             OBJC2_UNAVAILABLE;

实际指向objc_cache结构体，以下:

struct objc_cache {
    unsigned int mask /* total = mask + 1 */                 OBJC2_UNAVAILABLE;
    unsigned int occupied                                    OBJC2_UNAVAILABLE;
    Method buckets[1]                                        OBJC2_UNAVAILABLE;
};

mask: 指定分配cache buckets的总数。在方法查找中，Runtime使用这个字段肯定数组的索引位置
occupied: 实际占用cache buckets的总数
buckets: 指定Method数据结构指针的数组。这个数组可能包含不超过mask+1个元素。须要注意的是，指针多是NULL，表示这个缓存bucket没有被占用，另外被占用的bucket多是不连续的。这个数组可能会随着时间而增加。

objc_msgSend每调用一次方法后，就会把该方法缓存到cache列表中，下次的时候，就直接优先从cache列表中寻找，若是cache没有，才从methodLists中查找方法。

说完了 objc_msgSend，那么题目中的Category又是怎么工做的呢?

继续看概念

咱们知道Catagory能够动态地为已经存在的类添加新的方法。这样能够保证类的原始设计规模较小，功能增长时再逐步扩展。在runtime.h中查看定义:

typedef struct objc_category *Category;

一样也是指向一个 objc_category 的C 结构体，定义以下:

struct objc_category {
    char *category_name                                      OBJC2_UNAVAILABLE;
    char *class_name                                         OBJC2_UNAVAILABLE;
    struct objc_method_list *instance_methods                OBJC2_UNAVAILABLE;
    struct objc_method_list *class_methods                   OBJC2_UNAVAILABLE;
    struct objc_protocol_list *protocols                     OBJC2_UNAVAILABLE;
}                                                            OBJC2_UNAVAILABLE;

经过上面的结构体，你们能够很清楚的看出存储的内容。咱们继续往下看，打开objc源代码，在 objc-runtime-new.h中咱们能够发现以下定义:

struct category_t {
    const char *name;
    classref_t cls;
    struct method_list_t *instanceMethods;
    struct method_list_t *classMethods;
    struct protocol_list_t *protocols;
    struct property_list_t *instanceProperties;
};

上面的定义须要提到的地方有三点:

name 是指 class_name 而不是 category_name
cls是要扩展的类对象，编译期间是不会定义的，而是在Runtime阶段经过name对应到对应的类对象
instanceProperties表示Category里全部的properties，这就是咱们能够经过objc_setAssociatedObject和objc_getAssociatedObject增长实例变量的缘由，不过这个和通常的实例变量是不同的

为了验证上述内容，咱们使用clang -rewrite-objc main.m重写，题目中的Category被编译器转换成了这样:

// @interface NSObject (Sark)
// + (void)foo;
/* @end */


// @implementation NSObject (Sark)


static void _I_NSObject_Sark_foo(NSObject * self, SEL _cmd) {
    NSLog((NSString *)&__NSConstantStringImpl__var_folders_gm_0jk35cwn1d3326x0061qym280000gn_T_main_dd1ee3_mi_0);
}

// @end


static struct _category_t _OBJC_$_CATEGORY_NSObject_$_Sark __attribute__ ((used, section ("__DATA,__objc_const"))) = 
{
    "NSObject",
    0, // &OBJC_CLASS_$_NSObject,
    (const struct _method_list_t *)&_OBJC_$_CATEGORY_INSTANCE_METHODS_NSObject_$_Sark,
    0,
    0,
    0,
};

static struct _category_t *L_OBJC_LABEL_CATEGORY_$ [1] __attribute__((used, section ("__DATA, __objc_catlist,regular,no_dead_strip")))= {
    &_OBJC_$_CATEGORY_NSObject_$_Sark,
};

_OBJC_$_CATEGORY_NSObject_$_Sark是按规则生成的字符串，咱们能够清楚的看到是NSObject类,且Sark是NSObject类的Category
_category_t结构体第二项 classref_t 没有数据，验证了咱们上面的说法
因为题目中只有 - (void)foo方法，因此结构体中存储的list只有第三项instanceMethods被填充。
_I_NSObject_Sark_foo表明了Category的foo方法，I表示实例方法
最后这个类的Category生成了一个数组，存在了__objc_catlist里，目前数组的内容只有一个&_OBJC_$_CATEGORY_NSObject_$_Sark

最终这些Category里面的方法是如何被加载的呢?

1.打开objc源代码，找到 objc-os.mm, 函数_objc_init为runtime的加载入口，由libSystem调用，进行初始化操做。

2.以后调用objc-runtime-new.mm -> map_images加载map到内存

3.以后调用objc-runtime-new.mm->_read_images初始化内存中的map, 这个时候将会load全部的类，协议还有Category。NSOBject的+load方法就是这个时候调用的

这里贴上Category被加载的代码：

// Discover categories. 
for (EACH_HEADER) {
    category_t **catlist = 
        _getObjc2CategoryList(hi, &count);
    for (i = 0; i < count; i++) {
        category_t *cat = catlist[i];
        Class cls = remapClass(cat->cls);

        if (!cls) {
            // Category's target class is missing (probably weak-linked).
            // Disavow any knowledge of this category.
            catlist[i] = nil;
            if (PrintConnecting) {
                _objc_inform("CLASS: IGNORING category \?\?\?(%s) %p with "
                             "missing weak-linked target class", 
                             cat->name, cat);
            }
            continue;
        }

        // Process this category. 
        // First, register the category with its target class. 
        // Then, rebuild the class's method lists (etc) if 
        // the class is realized. 
        BOOL classExists = NO;
        if (cat->instanceMethods ||  cat->protocols  
            ||  cat->instanceProperties) 
        {
            addUnattachedCategoryForClass(cat, cls, hi);
            if (cls->isRealized()) {
                remethodizeClass(cls);
                classExists = YES;
            }
            if (PrintConnecting) {
                _objc_inform("CLASS: found category -%s(%s) %s", 
                             cls->nameForLogging(), cat->name, 
                             classExists ? "on existing class" : "");
            }
        }

        if (cat->classMethods  ||  cat->protocols  
            /* ||  cat->classProperties */) 
        {
            addUnattachedCategoryForClass(cat, cls->ISA(), hi);
            if (cls->ISA()->isRealized()) {
                remethodizeClass(cls->ISA());
            }
            if (PrintConnecting) {
                _objc_inform("CLASS: found category +%s(%s)", 
                             cls->nameForLogging(), cat->name);
            }
        }
    }
}

1) 循环调用了 _getObjc2CategoryList方法，这个方法的实现是:

GETSECT(_getObjc2CategoryList,        category_t *,    "__objc_catlist");

方法中最后一个参数__objc_catlist就是编译器刚刚生成的category数组

2) load完全部的categories以后，开始对Category进行处理。

从上面的代码中咱们能够发现：实例方法被加入到了当前的类对象中, 类方法被加入到了当前类的Meta Class中 (cls->ISA)

Step 1. 调用addUnattachedCategoryForClass方法

Step 2. 调用remethodizeClass方法, 在remethodizeClass的实现里调用attachCategoryMethods

static void 
attachCategoryMethods(Class cls, category_list *cats, bool flushCaches)
{
    if (!cats) return;
    if (PrintReplacedMethods) printReplacements(cls, cats);

    bool isMeta = cls->isMetaClass();
    method_list_t **mlists = (method_list_t **)
        _malloc_internal(cats->count * sizeof(*mlists));

    // Count backwards through cats to get newest categories first
    int mcount = 0;
    int i = cats->count;
    BOOL fromBundle = NO;
    while (i--) {
        method_list_t *mlist = cat_method_list(cats->list[i].cat, isMeta);
        if (mlist) {
            mlists[mcount++] = mlist;
            fromBundle |= cats->list[i].fromBundle;
        }
    }

    attachMethodLists(cls, mlists, mcount, NO, fromBundle, flushCaches);

    _free_internal(mlists);
}

这里把一个类的category_list的全部方法取出来生成了method list。这里是倒序添加的，也就是说，新生成的category的方法会先于旧的category的方法插入。

以后调用attachMethodLists将全部方法前序添加进类的method list中，若是原来类的方法列表是a，b，Category的方法列表是c，d。那么插入以后的方法列表将会是c，d，a，b。

小发现

看上面被编译器转换的代码，咱们发现Category头文件被注释掉了，结合上面category的加载过程。这就是咱们即便没有import category的头文件，都可以成功调用到Category方法的缘由。
runtime加载完成后，Category的原始信息在类结构中将不会存在。

解惑

根据上面提到的知识，咱们对题目中的代码进行分析。

1) objc runtime加载完后，NSObject的Sark Category被加载。而NSObject的Sark Category的头文件 + (void)foo 并无实质参与到工做中，只是给编译器进行静态检查，全部咱们编译上述代码会出现警告，提示咱们没有实现 + (void)foo 方法。而在代码编译中，它已经被注释掉了。

2) 实际被加入到Class的method list的方法是 - (void)foo，它是一个实例方法，因此加入到当前类对象NSObject的方法列表中，而不是NSObject Meta class的方法列表中。

3) 当执行 [NSObject foo]时，咱们看下整个objc_msgSend的过程:

结合上一篇Meta Class的知识：

1. objc_msgSend 第一个参数是  “(id)objc_getClass("NSObject")”，得到NSObject Class的对象
2. 类方法在Meta Class的方法列表中找，咱们在load Category方法时加入的是- (void)foo实例方法，因此
并不在NSOBject Meta Class的方法列表中
3. 继续往 super class中找，在上一篇博客中咱们知道，NSObject Meta Class的super class是
NSObject自己。因此，这个时候咱们可以找到- (void)foo 这个方法。
4. 因此正常输出结果

4) 当执行[[NSObject new] foo]，咱们看下整个objc_msgSend的过程:

1. [NSObject new]生成一个NSObject对象
2. 直接在该对象的类（NSObject）的方法列表里找
3. 可以找到，因此正常输出结果

《转》Objective－C Runtime（3）－ 消息 和 Category