Objective-C Runtime 运行时之三:方法与消息

本系列文章转载自南峰子的技术博客

本文原地址:Objective-C Runtime 运行时之三:方法与消息

前面我们讨论了 Runtime 中对类和对象的处理,及对成员变量与属性的处理。这一章,我们就要开始讨论 Runtime 中最有意思的一部分:消息处理机制,我们将详细讨论消息的发送及消息的转发,不过在讨论消息之前,我们先来了解一下与方法相关的一些内容

基础数据类型

SEL

SEL 又叫选择器,是表示一个方法的 selector 的指针,其定义如下:

1
typedef struct objc_selector *SEL;

objc_selector 结构体的详细定义没有在 <objc/runtime.h> 头文件中找到,方法的 selector 用于表示运行时方法的名字,Objective-C 在编译时,会依据每一个方法的名字、参数序列,生成一个唯一的整型标识(Int 类型的地址),这个标识就是SEL。如下代码所示:

1
2
SEL sel1 = @selector(method1);
NSLog(@"sel : %p", sel1);

上面的输出为:

1
2017-04-27 15:56:09.090 RuntimeDemo[5176:514336] sel : 0x107ec7793

两个类之间,不管它们是父类与子类的关系,还是之间没有这种关系,只要方法名相同,那么方法的SEL就是一样的。每一个方法都对应着一个SEL。所以在 Objective-C 同一个类(及类的继承体系)中,不能存在2个同名的方法,即使参数类型不同也不行。相同的方法只能对应一个 SEL。这也就导致 Objective-C 在处理相同方法名且参数个数相同但类型不同的方法方面的能力很差。如在某个类中定义以下两个方法:

1
2
- (void)setWidth:(int)width;
- (void)setWidth:(double)width;

这样的定义被认为是一种编译错误,所以我们不能像 C++, C# 那样。而是需要像下面这样来声明:

1
2
-(void)setWidthIntValue:(int)width;
-(void)setWidthDoubleValue:(double)width;

当然,不同的类可以拥有相同的selector,这个没有问题。不同类的实例对象执行相同的 selector 时,会在各自的方法列表中去根据 selector 去寻找自己对应的IMP。

工程中的所有的SEL组成一个 Set 集合,Set的特点就是唯一,因此 SEL 是唯一的。因此,如果我们想到这个方法集合中查找某个方法时,只需要去找到这个方法对应的 SEL 就行了,SEL 实际上就是根据方法名hash化了的一个字符串,而对于字符串的比较仅仅需要比较他们的地址就可以了,可以说速度上无语伦比!!但是,有一个问题,就是数量增多会增大hash冲突而导致的性能下降(或是没有冲突,因为也可能用的是 perfect hash)。但是不管使用什么样的方法加速,如果能够将总量减少(多个方法可能对应同一个 SEL),那将是最犀利的方法。那么,我们就不难理解,为什么SEL 仅仅是函数名了。

本质上,SEL 只是一个指向方法的指针(准确的说,只是一个根据方法名 hash 化了的KEY值,能唯一代表一个方法),它的存在只是为了加快方法的查询速度。这个查找过程我们将在下面讨论。

我们可以在运行时添加新的 selector,也可以在运行时获取已存在的 selector,我们可以通过下面三种方法来获取 SEL:

  1. sel_registerName 函数
  2. Objective-C编译器提供的@selector()
  3. NSSelectorFromString() 方法

IMP

IMP 实际上是一个函数指针,指向方法实现的首地址。其定义如下:

1
id (*IMP)(id, SEL, ...)

这个函数使用当前 CPU 架构实现的标准的C调用约定,第一个参数是指向 self 的指针(如果是实例方法,则是类实例的内存地址;如果是类方法,则是指向元类的指针),第二个参数是方法选择器(selector),接下来是方法的实际参数列表

前面介绍过的 SEL 就是为了查找方法的最终实现 IMP 的,由于每个方法对应唯一的 SEL,因此我们可以通过 SEL 方便快速准确地获得它所对应的 IMP,查找过程将在下面讨论,取得 IMP 后,我们就获得了执行这个方法代码的入口点,此时,我们就可以像调用普通的 C 语言函数一样来使用这个函数指针了

通过取得 IMP,我们可以跳过 Runtime 的消息传递机制,直接执行IMP指向的函数实现,这样省去了 Runtime 消息传递过程中所做的一系列查找操作,会比直接向对象发送消息高效一些

Method

介绍完 SEL 和 IMP,我们就可以来讲讲 Method 了,Method用于表示类定义中的方法,则定义如下:

1
2
3
4
5
6
7
typedef struct objc_method *Method;
struct objc_method {
SEL method_name OBJC2_UNAVAILABLE; //方法名
char *method_types OBJC2_UNAVAILABLE;
IMP method_imp OBJC2_UNAVAILABLE; //方法实现
}

我们可以看到该结构体中包含一个 SEL 和 IMP,实际上相当于在 SEL 和 IMP 之间作了一个映射。有了 SEL,我们便可以找到对应的 IMP,从而调用方法的实现代码。具体操作流程我们将在下面讨论

objc_method_description

objc_method_description 定义了一个 Objective-C 方法,其定义如下:

1
struct objc_method_description { SEL name; char *types; };

方法相关操作函数

Runtime提供了一系列的方法来处理与方法相关的操作。包括方法本身及SEL。本节我们介绍一下这些函数

方法

方法操作相关函数包括下以:

1
2
3
4
5
6
7
8
9
10
11
12
13
14
15
16
17
18
19
20
21
22
23
24
25
26
// 调用指定方法的实现
id method_invoke ( id receiver, Method m, ... );
// 调用返回一个数据结构的方法的实现
void method_invoke_stret ( id receiver, Method m, ... );
// 获取方法名
SEL method_getName ( Method m );
// 返回方法的实现
IMP method_getImplementation ( Method m );
// 获取描述方法参数和返回值类型的字符串
const char * method_getTypeEncoding ( Method m );
// 获取方法的返回值类型的字符串
char * method_copyReturnType ( Method m );
// 获取方法的指定位置参数的类型字符串
char * method_copyArgumentType ( Method m, unsigned int index );
// 通过引用返回方法的返回值类型字符串
void method_getReturnType ( Method m, char *dst, size_t dst_len );
// 返回方法的参数的个数
unsigned int method_getNumberOfArguments ( Method m );
// 通过引用返回方法指定位置参数的类型字符串
void method_getArgumentType ( Method m, unsigned int index, char *dst, size_t dst_len );
// 返回指定方法的方法描述结构体
struct objc_method_description * method_getDescription ( Method m );
// 设置方法的实现
IMP method_setImplementation ( Method m, IMP imp );
// 交换两个方法的实现
void method_exchangeImplementations ( Method m1, Method m2 );
  • method_invoke 函数,返回的是实际实现的返回值。参数 receiver 不能为空。这个方法的效率会比method_getImplementationmethod_getName 更快。
  • method_getName 函数,返回的是一个 SEL。如果想获取方法名的 C 字符串,可以使用 sel_getName(method_getName(method))
  • method_getReturnType 函数,类型字符串会被拷贝到 dst 中
  • method_setImplementation 函数,注意该函数返回值是方法之前的实现

方法选择器

选择器相关的操作函数包括:

1
2
3
4
5
6
7
8
// 返回给定选择器指定的方法的名称
const char * sel_getName ( SEL sel );
// 在Objective-C Runtime系统中注册一个方法,将方法名映射到一个选择器,并返回这个选择器
SEL sel_registerName ( const char *str );
// 在Objective-C Runtime系统中注册一个方法
SEL sel_getUid ( const char *str );
// 比较两个选择器
BOOL sel_isEqual ( SEL lhs, SEL rhs );

sel_registerName 函数:在我们将一个方法添加到类定义时,我们必须在Objective-C Runtime 系统中注册一个方法名以获取方法的选择器

方法调用流程

在 Objective-C 中,消息直到运行时才绑定到方法实现上。编译器会将消息表达式[receiver message] 转化为一个消息函数的调用,即 objc_msgSend。这个函数将消息接收者和方法名作为其基础参数,如以下所示:

1
objc_msgSend(receiver, selector)

如果消息中还有其它参数,则该方法的形式如下所示:

1
objc_msgSend(receiver, selector, arg1, arg2, ...)

这个函数完成了动态绑定的所有事情:

  1. 首先它找到 selector 对应的方法实现。因为同一个方法可能在不同的类中有不同的实现,所以我们需要依赖于接收者的类来找到的确切的实现。
  2. 它调用方法实现,并将接收者对象及方法的所有参数传给它。
  3. 最后,它将实现返回的值作为它自己的返回值

消息的关键在于我们前面章节讨论过的结构体objc_class,这个结构体有两个字段是我们在分发消息的关注的:

  1. 指向父类的指针
  2. 一个类的方法分发表,即methodLists

当我们创建一个新对象时,先为其分配内存,并初始化其成员变量。其中 isa 指针也会被初始化,让对象可以访问类及类的继承体系

下图演示了这样一个消息的基本框架:

当消息发送给一个对象时,objc_msgSend 通过对象的 isa 指针获取到类的结构体,然后在方法分发表里面查找方法的 selector。如果没有找到selector,则通过 objc_msgSend 结构体中的指向父类的指针找到其父类,并在父类的分发表里面查找方法的selector。依此,会一直沿着类的继承体系到达 NSObject 类。一旦定位到selector,函数会就获取到了实现的入口点,并传入相应的参数来执行方法的具体实现。如果最后没有定位到 selector,则会走消息转发流程,这个我们在后面讨论

为了加速消息的处理,运行时系统缓存使用过的 selector 及对应的方法的地址。这点我们在前面讨论过,不再重复

隐藏参数

objc_msgSend 有两个隐藏参数:

  1. 消息接收对象
  2. 方法的selector

这两个参数为方法的实现提供了调用者的信息,之所以说是隐藏的,是因为它们在定义方法的源代码中没有声明。它们是在编译期被插入实现代码的。

虽然这些参数没有显示声明,但在代码中仍然可以引用它们。我们可以使用 self来引用接收者对象,使用_cmd来引用选择器。如下代码所示:

1
2
3
4
5
6
7
- strange{
id target = getTheReceiver();
SEL method = getTheMethod();
if ( target == self || method == _cmd )
return nil;
return [target performSelector:method];
}

当然,这两个参数我们用得比较多的是self,_cmd在实际中用得比较少

获取方法地址

Runtime 中方法的动态绑定让我们写代码时更具灵活性,如我们可以把消息转发给我们想要的对象,或者随意交换一个方法的实现等,不过灵活性的提升也带来了性能上的一些损耗。毕竟我们需要去查找方法的实现,而不像函数调用来得那么直接。当然,方法的缓存一定程度上解决了这一问题。

我们上面提到过,如果想要避开这种动态绑定方式,我们可以获取方法实现的地址,然后像调用函数一样来直接调用它。特别是当我们需要在一个循环内频繁地调用一个特定的方法时,通过这种方式可以提高程序的性能。

NSObject 类提供了methodForSelector: 方法,让我们可以获取到方法的指针,然后通过这个指针来调用实现代码。我们需要将 methodForSelector: 返回的指针转换为合适的函数类型,函数参数和返回值都需要匹配上

我们通过以下代码来看看methodForSelector:的使用:

1
2
3
4
5
void (*setter)(id, SEL, BOOL);
int i;
setter = (void (*)(id, SEL, BOOL))[target methodForSelector:@selector(setFilled:)];
for (i = 0 ; i < 1000 ; i++)
setter(targetList[i], @selector(setFilled:), YES);

这里需要注意的就是函数指针的前两个参数必须是 id 和 `SEL。

当然这种方式只适合于在类似于for循环这种情况下频繁调用同一方法,以提高性能的情况。另外,methodForSelector: 是由 Cocoa 运行时提供的;它不是Objective-C 语言的特性

消息转发

当一个对象能接收一个消息时,就会走正常的方法调用流程。但如果一个对象无法接收指定消息时,又会发生什么事呢?默认情况下,如果是以 [object message] 的方式调用方法,如果 object 无法响应message 消息时,编译器会报错。但如果是以 perform...的形式来调用,则需要等到运行时才能确定 object 是否能接收 message 消息。如果不能,则程序崩溃。

通常,当我们不能确定一个对象是否能接收某个消息时,会先调用respondsToSelector:来判断一下。如下代码所示:

1
2
3
if ([self respondsToSelector:@selector(method)]) {
[self performSelector:@selector(method)];
}

不过,我们这边想讨论下不使用respondsToSelector: 判断的情况。这才是我们这一节的重点

当一个对象无法接收某一消息时,就会启动所谓 “消息转发(message forwarding)“ 机制,通过这一机制,我们可以告诉对象如何处理未知的消息。默认情况下,对象接收到未知的消息,会导致程序崩溃,通过控制台,我们可以看到以下异常信息:

1
2
-[SUTRuntimeMethod method]: unrecognized selector sent to instance 0x100111940
*** Terminating app due to uncaught exception 'NSInvalidArgumentException', reason: '-[SUTRuntimeMethod method]: unrecognized selector sent to instance 0x100111940'

这段异常信息实际上是由 NSObjectdoesNotRecognizeSelector 方法抛出的。不过,我们可以采取一些措施,让我们的程序执行特定的逻辑,而避免程序的崩溃

消息转发机制基本上分为三个步骤:

  1. 动态方法解析
  2. 备用接收者
  3. 完整转发

下面我们详细讨论一下这三个步骤:

动态方法解析

对象在接收到未知的消息时,首先会调用所属类的类方法 +resolveInstanceMethod: (实例方法)或者 +resolveClassMethod: (类方法)。在这个方法中,我们有机会为该未知消息新增一个”处理方法””。不过使用该方法的前提是我们已经实现了该”处理方法”,只需要在运行时通过 class_addMethod 函数动态添加到类里面就可以了。如下代码所示:

1
2
3
4
5
6
7
8
9
10
11
void functionForMethod1(id self, SEL _cmd) {
NSLog(@"%@, %p", self, _cmd);
}
+ (BOOL)resolveInstanceMethod:(SEL)sel {
NSString *selectorString = NSStringFromSelector(sel);
if ([selectorString isEqualToString:@"method1"]) {
class_addMethod(self.class, @selector(method1), (IMP)functionForMethod1, "@:");
}
return [super resolveInstanceMethod:sel];
}

不过这种方案更多的是为了实现 @dynamic 属性

备用接收者

如果在上一步无法处理消息,则 Runtime 会继续调以下方法:

1
- (id)forwardingTargetForSelector:(SEL)aSelector

如果一个对象实现了这个方法,并返回一个非 nil 的结果,则这个对象会作为消息的新接收者,且消息会被分发到这个对象。当然这个对象不能是 self 自身,否则就是出现无限循环。当然,如果我们没有指定相应的对象来处理 aSelector,则应该调用父类的实现来返回结果

使用这个方法通常是在对象内部,可能还有一系列其它对象能处理该消息,我们便可借这些对象来处理消息并返回,这样在对象外部看来,还是由该对象亲自处理了这一消息。如下代码所示:

1
2
3
4
5
6
7
8
9
10
11
12
13
14
15
16
17
18
19
20
21
22
23
24
25
26
27
28
29
30
31
32
33
34
35
36
37
38
39
40
41
42
43
@interface SUTRuntimeMethodHelper : NSObject
- (void)method2;
@end
@implementation SUTRuntimeMethodHelper
- (void)method2 {
NSLog(@"%@, %p", self, _cmd);
}
@end
#pragma mark -
@interface SUTRuntimeMethod () {
SUTRuntimeMethodHelper *_helper;
}
@end
@implementation SUTRuntimeMethod
+ (instancetype)object {
return [[self alloc] init];
}
- (instancetype)init {
self = [super init];
if (self != nil) {
_helper = [[SUTRuntimeMethodHelper alloc] init];
}
return self;
}
- (void)test {
[self performSelector:@selector(method2)];
}
- (id)forwardingTargetForSelector:(SEL)aSelector {
NSLog(@"forwardingTargetForSelector");
NSString *selectorString = NSStringFromSelector(aSelector);
// 将消息转发给_helper来处理
if ([selectorString isEqualToString:@"method2"]) {
return _helper;
}
return [super forwardingTargetForSelector:aSelector];
}
@end

这一步合适于我们只想将消息转发到另一个能处理该消息的对象上。但这一步无法对消息进行处理,如操作消息的参数和返回值

完整消息转发

如果在上一步还不能处理未知消息,则唯一能做的就是启用完整的消息转发机制了。此时会调用以下方法:

1
- (void)forwardInvocation:(NSInvocation *)anInvocation

运行时系统会在这一步给消息接收者最后一次机会将消息转发给其它对象。对象会创建一个表示消息的 NSInvocation 对象,把与尚未处理的消息有关的全部细节都封装在anInvocation中,包括 selector,目标(target)和参数。我们可以在forwardInvocation 方法中选择将消息转发给其它对象

forwardInvocation:方法的实现有两个任务:

  1. 定位可以响应封装在 anInvocation 中的消息的对象。这个对象不需要能处理所有未知消息
  2. 使用anInvocation作为参数,将消息发送到选中的对象。anInvocation 将会保留调用结果,运行时系统会提取这一结果并将其发送到消息的原始发送者

不过,在这个方法中我们可以实现一些更复杂的功能,我们可以对消息的内容进行修改,比如追回一个参数等,然后再去触发消息。另外,若发现某个消息不应由本类处理,则应调用父类的同名方法,以便继承体系中的每个类都有机会处理此调用请求

还有一个很重要的问题,我们必须重写以下方法:

1
- (NSMethodSignature *)methodSignatureForSelector:(SEL)aSelector

消息转发机制使用从这个方法中获取的信息来创建 NSInvocation 对象。因此我们必须重写这个方法,为给定的 selector 提供一个合适的方法签名

完整的示例如下所示:

1
2
3
4
5
6
7
8
9
10
11
12
13
14
- (NSMethodSignature *)methodSignatureForSelector:(SEL)aSelector {
NSMethodSignature *signature = [super methodSignatureForSelector:aSelector];
if (!signature) {
if ([SUTRuntimeMethodHelper instancesRespondToSelector:aSelector]) {
signature = [SUTRuntimeMethodHelper instanceMethodSignatureForSelector:aSelector];
}
}
return signature;
}
- (void)forwardInvocation:(NSInvocation *)anInvocation {
if ([SUTRuntimeMethodHelper instancesRespondToSelector:anInvocation.selector]) {
[anInvocation invokeWithTarget:_helper];
}
}

NSObjectforwardInvocation: 方法实现只是简单调用了doesNotRecognizeSelector: 方法,它不会转发任何消息。这样,如果不在以上所述的三个步骤中处理未知消息,则会引发一个异常。

从某种意义上来讲,forwardInvocation: 就像一个未知消息的分发中心,将这些未知的消息转发给其它对象。或者也可以像一个运输站一样将所有未知消息都发送给同一个接收对象,这取决于具体的实现

消息转发与多重继承

回过头来看第二和第三步,通过这两个方法我们可以允许一个对象与其它对象建立关系,以处理某些未知消息,而表面上看仍然是该对象在处理消息。通过这种关系,我们可以模拟“多重继承”的某些特性,让对象可以“继承”其它对象的特性来处理一些事情。不过,这两者间有一个重要的区别:多重继承将不同的功能集成到一个对象中,它会让对象变得过大,涉及的东西过多;而消息转发将功能分解到独立的小的对象中,并通过某种方式将这些对象连接起来,并做相应的消息转发。

不过消息转发虽然类似于继承,但 NSObject 的一些方法还是能区分两者。如respondsToSelector:isKindOfClass: 只能用于继承体系,而不能用于转发链。便如果我们想让这种消息转发看起来像是继承,则可以重写这些方法,如以下代码所示:

1
2
3
4
5
6
7
8
9
10
11
- (BOOL)respondsToSelector:(SEL)aSelector
{
if ( [super respondsToSelector:aSelector])
return YES;
else {
/* Here, test whether the aSelector message can *
* be forwarded to another object and whether that *
* object can respond to it. Return YES if it can. */
}
return NO;
}

小结

在此,我们已经了解了 Runtime 中消息发送和转发的基本机制。这也是 Runtime 的强大之处,通过它,我们可以为程序增加很多动态的行为,虽然我们在实际开发中很少直接使用这些机制(如直接调用 objc_msgSend),但了解它们有助于我们更多地去了解底层的实现。其实在实际的编码过程中,我们也可以灵活地使用这些机制,去实现一些特殊的功能,如hook操作等。

参考

  1. Objective-C Runtime Reference
  2. Objective-C Runtime Programming Guide
  3. Objective-C runtime之消息(二)
  4. 深入浅出Cocoa之消息

本人刚开始写博客,主要是为了给自己的知识点做一个笔记,方便自己以后查阅,如果能让别人有所启发也是荣幸之至!如有错误,欢迎指正!