iOS Block用法和实现原理
dyydp
7年前
<p>《Objective-C高级编程》是一本有趣又难懂的书,全书就讲了引用计数、Block、GCD三个概念,有趣是因为讲原理、实现的部分是其它iOS专业书籍里少有的。然而每个章节不读个三五遍还是比较难理解贯通的。本文针对其中的Block部分做些简单的笔记记录,讲述Block的用法和部分实现原理,详细解说从原书中寻。</p> <h2>Block概要</h2> <p>Block:带有 <strong>自动变量</strong> 的 <strong>匿名函数</strong> 。</p> <p>匿名函数:没有函数名的函数,一对{}包裹的内容是匿名函数的作用域。</p> <p>自动变量:栈上声明的一个变量不是静态变量和全局变量,是不可以在这个栈内声明的匿名函数中使用的,但在Block中却可以。</p> <p>虽然使用Block不用声明类,但是Block提供了类似Objective-C的类一样可以通过成员变量来 <strong>保存作用域外变量值</strong> 的方法,那些在Block的一对{}里使用到但却是在{}作用域以外声明的变量,就是Block截获的自动变量。</p> <h2>Block常规概念</h2> <h3>Block语法</h3> <p>Block表达式语法:</p> <p>^ 返回值类型 (参数列表) {表达式}</p> <p>例如:</p> <pre> <code class="language-objectivec">^ int (int count) { return count + 1; };</code></pre> <p>其中,可省略部分有:</p> <ul> <li>返回类型,例: <pre> <code class="language-objectivec">^ (int count) { return count + 1; };</code></pre> </li> <li>参数列表为空,则可省略,例: <pre> <code class="language-objectivec">^ { NSLog(@"No Parameter"); };</code></pre> 即最简模式语法为: <p>^ {表达式}</p> </li> </ul> <h3>Block类型变量</h3> <p>声明Block类型变量语法:</p> <p>返回值类型 (^变量名)(参数列表) = Block表达式</p> <p>例如,如下声明了一个变量名为blk的Block:</p> <pre> <code class="language-objectivec">int (^blk)(int) = ^(int count) { return count + 1; };</code></pre> <p>当Block类型变量作为函数的参数时,写作:</p> <pre> <code class="language-objectivec">- (void)func:(int (^)(int))blk { NSLog(@"Param:%@", blk); }</code></pre> <p>借助typedef可简写:</p> <pre> <code class="language-objectivec">typedef int (^blk_k)(int); - (void)func:(blk_k)blk { NSLog(@"Param:%@", blk); }</code></pre> <p>Block类型变量作返回值时,写作:</p> <pre> <code class="language-objectivec">- (int (^)(int))funcR { return ^(int count) { return count ++; }; }</code></pre> <p>借助typedef简写:</p> <pre> <code class="language-objectivec">typedef int (^blk_k)(int); - (blk_k)funcR { return ^(int count) { return count ++; }; }</code></pre> <h3>截获自动变量值</h3> <p>Block表达式可截获所使用的自动变量的值。</p> <p>截获:保存自动变量的 <strong>瞬间值</strong> 。</p> <p>因为是“瞬间值”,所以声明Block之后,即便在Block外修改自动变量的值,也不会对Block内截获的自动变量值产生影响。</p> <p>例如:</p> <pre> <code class="language-objectivec">int i = 10; void (^blk)(void) = ^{ NSLog(@"In block, i = %d", i); }; i = 20;//Block外修改变量i,也不影响Block内的自动变量 blk();//i修改为20后才执行,打印: In block, i = 10 NSLog(@"i = %d", i);//打印:i = 20</code></pre> <h3>__block说明符号</h3> <p>自动变量截获的值为Block声明时刻的瞬间值,保存后就不能改写该值,如需对自动变量进行重新赋值,需要在变量声明前附加__block说明符,这时该变量称为__block变量。</p> <p>例如:</p> <pre> <code class="language-objectivec">__block int i = 10;//i为__block变量,可在block中重新赋值 void (^blk)(void) = ^{ NSLog(@"In block, i = %d", i); }; i = 20; blk();//打印: In block, i = 20 NSLog(@"i = %d", i);//打印:i = 20</code></pre> <h3>自动变量值为一个对象情况</h3> <p>当自动变量为一个类的 <strong>对象</strong> ,且没有使用__block修饰时,虽然不可以在Block内对该变量进行重新赋值,但可以修改该对象的属性。</p> <p>如果该对象是个Mutable的对象,例如NSMutableArray,则还可以在Block内对NSMutableArray进行元素的增删:</p> <pre> <code class="language-objectivec">NSMutableArray *array = [[NSMutableArray alloc] initWithObjects:@"1", @"2",nil ]; NSLog(@"Array Count:%ld", array.count);//打印Array Count:2 void (^blk)(void) = ^{ [array removeObjectAtIndex:0];//Ok //array = [NSNSMutableArray new];//没有__block修饰,编译失败! }; blk(); NSLog(@"Array Count:%ld", array.count);//打印Array Count:1</code></pre> <h2>Block实现原理</h2> <h3>使用Clang</h3> <p>Block实际上是作为极普通的 <strong>C语言源码</strong> 来处理的:含有Block语法的源码首先被转换 <strong>成C语言编译器能处理的源码</strong> ,再作为普通的C源代码 <strong>进行编译</strong> 。</p> <p>使用LLVM编译器的clang命令可将含有Block的Objective-C代码转换成C++的源代码,以探查其具体实现方式:</p> <p>clang -rewrite-objc 源码文件名</p> <p>注:如果使用该命令报错: <em>’UIKit/UIKit.h’ file not found</em> 。</p> <h3>Block结构</h3> <p>使用Block的时候,编译器对Block语法进行了怎样的转换?</p> <pre> <code class="language-objectivec">int main() { int count = 10; void (^ blk)() = ^(){ NSLog(@"In Block:%d", count); }; blk(); }</code></pre> <p>如上所示的最简单的Block使用代码,经clang转换后,可得到以下几个部分(有代码删减和注释添加):</p> <pre> <code class="language-objectivec">static void __main_block_func_0( struct __main_block_impl_0 *__cself) { int count = __cself->count; // bound by copy NSLog((NSString *)&__NSConstantStringImpl__var_folders_64_vf2p_jz52yz7x4xtcx55yv0r0000gn_T_main_d2f8d2_mi_0, count); }</code></pre> <p>这是一个函数的实现,对应Block中{}内的内容,这些内容被当做了C语言函数来处理,函数参数中的 <strong>__cself</strong> 相当于Objective-C中的self。</p> <pre> <code class="language-objectivec">struct __main_block_impl_0 { struct __block_impl impl; struct __main_block_desc_0* Desc; //描述Block大小、版本等信息 int count; //构造函数函数 __main_block_impl_0(void *fp, struct __main_block_desc_0 *desc, int _count, int flags=0) : count(_count) { impl.isa = &_NSConcreteStackBlock; //在函数栈上声明,则为_NSConcreteStackBlock impl.Flags = flags; impl.FuncPtr = fp; Desc = desc; } };</code></pre> <p>__main_block_impl_0即为 <strong>main()函数栈上的Block结构体</strong> ,其中的__block_impl结构体声明如下:</p> <pre> <code class="language-objectivec">struct __block_impl { void *isa;//指明对象的Class int Flags; int Reserved; void *FuncPtr; };</code></pre> <p>__block_impl结构体,即为Block的结构体,可理解为 <strong>Block的类结构</strong> 。</p> <p>再看下main()函数翻译的内容:</p> <pre> <code class="language-objectivec">int main() { int count = 10; void (* blk)() = ((void (*)())&__main_block_impl_0((void *)__main_block_func_0, &__main_block_desc_0_DATA, count)); ((void (*)(__block_impl *))((__block_impl *)blk)->FuncPtr)((__block_impl *)blk); }</code></pre> <p>去除掉复杂的类型转化,可简写为:</p> <pre> <code class="language-objectivec">int main() { int count = 10; sturct __main_block_impl_0 *blk = &__main_block_impl_0(__main_block_func_0, //函数指针 &__main_block_desc_0_DATA)); //Block大小、版本等信息 (*blk->FuncPtr)(blk); //调用FuncPtr指向的函数,并将blk自己作为参数传入 }</code></pre> <p>由此,可以看出, <strong>Block也是Objective-C中的对象</strong> 。</p> <p>Block有三种类(即__block_impl的 <strong>isa</strong> 指针指向的值,根据Block对象创建时 <strong>所处数据区不同</strong> 而进行区别:</p> <ul> <li><strong>_NSConcreteStackBlock</strong> :在栈上创建的Block对象</li> <li><strong>_NSConcreteMallocBlock</strong> :在堆上创建的Block对象</li> <li><strong>_NSConcreteGlobalBlock</strong> :全局数据区的Block对象</li> </ul> <h3>如何截获自动变量</h3> <p>上部分介绍了 <strong>Block的结构</strong> ,和 <strong>作为匿名函数的调用机制</strong> ,那 <strong>自动变量截获</strong> 是发生在什么时候呢?</p> <p>观察上节代码中 <strong>__main_block_impl_0</strong> 结构体(main栈上Block的结构体)的构造函数可以看到,栈上的变量count以参数的形式传入到了这个构造函数中,此处即为 <strong>变量的自动截获</strong> 。</p> <p>因此可以这样理解: <strong>__block_impl</strong> 结构体已经可以代表Block类了,但在栈上又声明了 <strong>__main_block_impl_0</strong> 结构体,对 <strong>__block_impl</strong> 进行 <strong>封装</strong> 后才来表示栈上的 <strong>Block类</strong> ,就是为了获取Block中使用到的栈上声明的变量( <strong>栈上没在Block中使用的变量不会被捕获</strong> ),变量被保存在Block的结构体实例中。</p> <p>所以在blk()执行之前,栈上简单数据类型的count无论发生什么变化,都不会影响到Block以参数形式传入而捕获的值。但这个变量是指向对象的指针时,是可以修改这个对象的属性的,只是不能为变量重新赋值。</p> <h3>Block的存储域</h3> <p>上文已提到,根据Block创建的位置不同,Block有三种类型,创建的Block对象分别会存储到栈、堆、全局数据区域。</p> <pre> <code class="language-objectivec">void (^blk)(void) = ^{ NSLog(@"Global Block"); }; int main() { blk(); NSLog(@"%@",[blk class]);//打印:__NSGlobalBlock__ }</code></pre> <p>像上面代码块中的全局blk自然是存储在全局数据区,但注意在 <strong>函数栈上</strong> 创建的blk,如果 <strong>没有截获自动变量</strong> ,Block的结构实例还是会被设置在程序的 <strong>全局数据区,而非栈上</strong> :</p> <pre> <code class="language-objectivec">int main() { void (^blk)(void) = ^{//没有截获自动变量的Block NSLog(@"Stack Block"); }; blk(); NSLog(@"%@",[blk class]);//打印:__NSGlobalBlock__ int i = 1; void (^captureBlk)(void) = ^{//截获自动变量i的Block NSLog(@"Capture:%d", i); }; captureBlk(); NSLog(@"%@",[captureBlk class]);//打印:__NSMallocBlock__ }</code></pre> <p>可以看到截获了自动变量的Block打印的类是 <strong>NSGlobalBlock</strong> ,表示存储在全局数据区。</p> <p>但为什么捕获自动变量的Block打印的类却是设置在堆上的 <strong>NSMallocBlock</strong> ,而非栈上的 <strong>NSStackBlock</strong> ?这个问题稍后解释。</p> <h3>Block复制</h3> <p>配置在栈上的Block,如果其所属的栈作用域结束,该Block就会被废弃,对于超出Block作用域仍需使用Block的情况,Block提供了 <strong>将Block从栈上复制到堆上的方法</strong> 来解决这种问题,即便Block栈作用域已结束,但被拷贝到堆上的Block还可以继续存在。</p> <p>复制到堆上的Block, <strong>将_NSConcreteMallocBlock</strong> 类对象写入Block结构体实例的成员变量isa:</p> <pre> <code class="language-objectivec">impl.isa = &_NSConcreteMallocBlock;</code></pre> <p>在ARC有效时,大多数情况下编译器会进行判断,自动生成将Block从栈上复制到堆上的代码,以下几种情况 <strong>栈上的Block会自动复制到堆上</strong> :</p> <ul> <li>调用Block的copy方法</li> <li>将Block作为函数返回值时</li> <li>将Block赋值给__strong修改的变量时</li> <li>向Cocoa框架含有usingBlock的方法或者GCD的API传递Block参数时</li> </ul> <p>其它时候向方法的参数中传递Block时,需要手动调用copy方法复制Block。</p> <p>上一节的栈上截获了自动变量i的Block之所以在栈上创建,却是 <em>NSMallocBlock_</em> 类,就是因为这个Block对象赋值给了 <em> <strong>_strong修饰的变量</strong> captureBlk( <em> </em></em></p> <p>strong是ARC下对象的默认修饰符)。</p> <p>因为上面四条规则,在ARC下其实很少见到_NSConcreteStackBlock类的Block,大多数情况编译器都保证了Block是在堆上创建的,如下代码所示,仅最后一行代码直接使用一个不赋值给变量的Block,它的类才是__NSStackBlock</p> <p>:</p> <pre> <code class="language-objectivec">int count = 0; blk_t blk = ^(){ NSLog(@"In Stack:%d", count); }; NSLog(@"blk's Class:%@", [blk class]);//打印:blk's Class:__NSMallocBlock__ NSLog(@"Global Block:%@", [^{NSLog(@"Global Block");} class]);//打印:Global Block:__NSGlobalBlock__ NSLog(@"Copy Block:%@", [[^{NSLog(@"Copy Block:%d",count);} copy] class]);//打印:Copy Block:__NSMallocBlock__ NSLog(@"Stack Block:%@", [^{NSLog(@"Stack Block:%d",count);} class]);//打印:Stack Block:__NSStackBlock__</code></pre> <p>另外,原书存在ARC和MRC混合讲解、区分不明的情况,比如书中几个使用到栈上对象导致Crash的例子是MRC条件下才会发生的,但书中没做特殊说明。</p> <h3>使用__block发生了什么</h3> <p>Block捕获的自动变量添加__block说明符,就可在Block内读和写该变量,也可以在原来的栈上读写该变量。</p> <p>自动变量的截获保证了栈上的自动变量被销毁后,Block内仍可使用该变量。</p> <p>__block保证了栈上和Block内(通常在堆上)可以访问和修改 <strong>“同一个变量”</strong> ,__block是如何实现这一功能的?</p> <p>__block发挥作用的 <strong>原理</strong> :将栈上用__block修饰的自动变量 <strong>封装成一个结构体</strong> ,让其在堆上创建,以方便从栈上或堆上访问和修改同一份数据。</p> <p>验证过程:</p> <p>现在对刚才的代码段,加上__block说明符,并在block内外读写变量count。</p> <pre> <code class="language-objectivec">int main() { __block int count = 10; void (^ blk)() = ^(){ count = 20; NSLog(@"In Block:%d", count);//打印:In Block:20 }; count ++; NSLog(@"Out Block:%d", count);//打印:Out Block:11 blk(); }</code></pre> <p>将上面的代码段clang,发现Block的结构体 <strong>__main_block_impl_0</strong> 结构如下所示:</p> <pre> <code class="language-objectivec">struct __main_block_impl_0 { struct __block_impl impl; struct __main_block_desc_0* Desc; __Block_byref_count_0 *count; // by ref __main_block_impl_0(void *fp, struct __main_block_desc_0 *desc, __Block_byref_count_0 *_count, int flags=0) : count(_count->__forwarding) { impl.isa = &_NSConcreteStackBlock; impl.Flags = flags; impl.FuncPtr = fp; Desc = desc; } };</code></pre> <p>最大的变化就是count变量不再是int类型了,count变成了一个指向 <strong>__Block_byref_count_0</strong> 结构体的指针, <strong>__Block_byref_count_0</strong> 结构如下:</p> <pre> <code class="language-objectivec">struct __Block_byref_count_0 { void *__isa; __Block_byref_count_0 *__forwarding; int __flags; int __size; int count; };</code></pre> <p>它保存了int count变量,还有一个指向 <strong>__Block_byref_count_0</strong> 实例的指针 <strong>__forwarding</strong> ,通过下面两段代码 <strong>__forwarding</strong> 指针的用法可以知道,该指针其实指向的是对象自身:</p> <pre> <code class="language-objectivec">//Block的执行函数 static void __main_block_func_0(struct __main_block_impl_0 *__cself) { __Block_byref_count_0 *count = __cself->count; // bound by ref (count->__forwarding->count) = 20;//对应count = 20; NSLog((NSString *)&__NSConstantStringImpl__var_folders_64_vf2p_jz52yz7x4xtcx55yv0r0000gn_T_main_fafeeb_mi_0, (count->__forwarding->count)); }</code></pre> <pre> <code class="language-objectivec">//main函数 int main() { __attribute__((__blocks__(byref))) __Block_byref_count_0 count = {(void*)0, (__Block_byref_count_0 *)&count, 0, sizeof(__Block_byref_count_0), 10}; void (* blk)() = ((void (*)())&__main_block_impl_0((void *)__main_block_func_0, &__main_block_desc_0_DATA, (__Block_byref_count_0 *)&count, 570425344)); (count.__forwarding->count) ++;//对应count ++; NSLog((NSString *)&__NSConstantStringImpl__var_folders_64_vf2p_jz52yz7x4xtcx55yv0r0000gn_T_main_fafeeb_mi_1, (count.__forwarding->count)); ((void (*)(__block_impl *))((__block_impl *)blk)->FuncPtr)((__block_impl *)blk); }</code></pre> <p>为什么要通过__forwarding指针完成对count变量的读写修改?</p> <p>为了保证无论是在栈上还是在堆上,都能通过都__forwarding指针找到在堆上创建的count这个 main_block_func_0结构体,以完成对count->count(第一个count是 main_block_func_0对象,第二个count是int类型变量)的访问和修改。</p> <p>示意图如下:</p> <p style="text-align:center"><img src="https://simg.open-open.com/show/c7d4ebc24559a1e01ed9054e28c22780.jpg"></p> <p> </p> <p>来自:http://www.jianshu.com/p/d28a5633b963</p> <p> </p>