Autorelease实现原理

AndersonChi 8年前
   <p>内存管理一直是学习 Objective-C 的重点和难点之一,尽管现在已经是 ARC 时代了,但是了解 Objective-C 的内存管理机制仍然是十分必要的。</p>    <p>Autorelease机制是iOS开发者管理对象内存的好伙伴,MRC中,调用 [obj autorelease] 来延迟内存的释放是一件简单自然的事,ARC下,我们甚至可以完全不知道Autorelease就能管理好内存。而在这背后,objc和编译器都帮我们做了哪些事呢,它们是如何协作来正确管理内存的呢?刨根问底,一起来探究下黑幕背后的Autorelease机制。</p>    <p><strong>Autorelease对象什么时候释放?</strong></p>    <p>很多答案都是“当前作用域大括号结束时释放”,显然木有正确理解Autorelease机制.</p>    <p>在没有手加Autorelease Pool的情况下,Autorelease对象是在当前的runloop迭代结束时释放的,而它能够释放的原因是 系统在每个runloop迭代中都加入了自动释放池Push和Pop .</p>    <p><strong>从 main 函数开始</strong></p>    <p>main 函数可以说是在整个 iOS 开发中非常不起眼的一个函数,它很好地隐藏在 Supporting Files 文件夹中,却是整个 iOS 应用的入口。</p>    <p style="text-align:center"><img src="https://simg.open-open.com/show/be4ce00bd811330918154a6273170c47.png"></p>    <p>main.m 文件中的代码:</p>    <pre>  <code class="language-objectivec">int main(int argc, char * argv[]) {      @autoreleasepool {          return UIApplicationMain(argc, argv, nil, NSStringFromClass([AppDelegate class]));      }  }</code></pre>    <p>在这个 @autoreleasepool block 中只包含了一行代码,这行代码将所有的事件、消息全部交给了 UIApplication 来处理,但是这不是本文关注的重点。</p>    <p>需要注意的是: 整个 iOS 的应用都是包含在一个自动释放池 block 中的 。</p>    <p><strong>Autorelease原理</strong></p>    <p>@autoreleasepool 到底是什么?我们在命令行中使用 clang -rewrite-objc main.m 让编译器重新改写这个文件得到cpp文件,在cpp文件代码中我们找到main函数代码:</p>    <pre>  <code class="language-objectivec">int main(int argc, const char * argv[]) {      /* @autoreleasepool */ { __AtAutoreleasePool __autoreleasepool;       }      return 0;  }</code></pre>    <p>为了弄清楚这行含义,我们找到__AtAutoreleasePool结构体:</p>    <pre>  <code class="language-objectivec">struct __AtAutoreleasePool {    __AtAutoreleasePool() {atautoreleasepoolobj = objc_autoreleasePoolPush();}    ~__AtAutoreleasePool() {objc_autoreleasePoolPop(atautoreleasepoolobj);}    void * atautoreleasepoolobj;  };</code></pre>    <p>这个结构体会在初始化时调用 objc_autoreleasePoolPush() 方法,会在析构时调用 objc_autoreleasePoolPop 方法。</p>    <p>这表明,我们的 main 函数在实际工作时其实是这样的:</p>    <pre>  <code class="language-objectivec">int main(int argc, const char * argv[]) {      {          void * atautoreleasepoolobj = objc_autoreleasePoolPush();          objc_autoreleasePoolPop(atautoreleasepoolobj);      }      return 0;  }</code></pre>    <p>@autoreleasepool 只是帮助我们少写了这两行代码而已,让代码看起来更美观,然后要根据上述两个方法来分析自动释放池的实现。</p>    <p>来看一下objc_autoreleasePoolPush 和 objc_autoreleasePoolPop 的实现:</p>    <pre>  <code class="language-objectivec">void *objc_autoreleasePoolPush(void) {      return AutoreleasePoolPage::push();  }    void objc_autoreleasePoolPop(void *ctxt) {      AutoreleasePoolPage::pop(ctxt);  }</code></pre>    <p>上面的方法看上去是对 AutoreleasePoolPage 对应静态方法 push 和 pop 的封装。</p>    <p><strong>AutoreleasePoolPage 的结构</strong></p>    <p>AutoreleasePoolPage 是一个 C++ 中的类,它在 NSObject.mm 中的定义是这样的:</p>    <pre>  <code class="language-objectivec">class AutoreleasePoolPage {      magic_t const magic;      id *next;      pthread_t const thread;      AutoreleasePoolPage * const parent;      AutoreleasePoolPage *child;      uint32_t const depth;      uint32_t hiwat;  };</code></pre>    <ul>     <li>magic 用于对当前 AutoreleasePoolPage 完整性的校验</li>     <li>thread 保存了当前页所在的线程<br> 每一个自动释放池都是由一系列的 AutoreleasePoolPage 组成的,并且每一个 AutoreleasePoolPage 的大小都是 4096 字节(16 进制 0x1000) <pre>  <code class="language-objectivec">#define I386_PGBYTES 4096  #define PAGE_SIZE I386_PGBYTES</code></pre> </li>    </ul>    <p>双向链表</p>    <p>自动释放池中的 AutoreleasePoolPage 是以双向链表的形式连接起来的:</p>    <p style="text-align: center;"><img src="https://simg.open-open.com/show/4a7dbcc10fe53a271b9b3789ed2a931f.png"></p>    <p>parent 和 child 就是用来构造双向链表的指针。</p>    <p><strong>自动释放池中的栈</strong></p>    <p>如果我们的一个 AutoreleasePoolPage 被初始化在内存的 0x100816000 ~ 0x100817000 中,它在内存中的结构如下:</p>    <p style="text-align:center"><img src="https://simg.open-open.com/show/10cae3bdf91fae93d5c9cdbe58e28178.png"></p>    <p>其中有 56 bit 用于存储 AutoreleasePoolPage 的成员变量,剩下的 0x100816038 ~ 0x100817000 都是用来存储加入到自动释放池中的对象。</p>    <p>begin() 和 end() 这两个类的实例方法帮助我们快速获取 0x100816038 ~ 0x100817000 这一范围的边界地址。</p>    <p>next 指向了下一个为空的内存地址,如果 next 指向的地址加入一个 objec t,它就会如下图所示移动到下一个为空的内存地址中:</p>    <p style="text-align:center"><img src="https://simg.open-open.com/show/6b547ec499b84e9868bdb0229b98c6e6.png"></p>    <ul>     <li>AutoreleasePool并没有单独的结构,而是由若干个AutoreleasePoolPage以双向链表的形式组合而成(分别对应结构中的parent指针和child指针)</li>     <li>AutoreleasePool是按线程一一对应的(结构中的thread指针指向当前线程)</li>     <li>AutoreleasePoolPage每个对象会开辟4096字节内存(也就是虚拟内存一页的大小),除了上面的实例变量所占空间,剩下的空间全部用来储存autorelease对象的地址</li>     <li>上面的id *next指针作为游标指向栈顶最新add进来的autorelease对象的下一个位置</li>     <li>一个AutoreleasePoolPage的空间被占满时,会新建一个AutoreleasePoolPage对象,连接链表,后来的autorelease对象在新的page加入</li>    </ul>    <p><strong>POOL_SENTINEL(哨兵对象)</strong></p>    <p>到了这里,你可能想要知道 POOL_SENTINEL 到底是什么,还有它为什么在栈中。</p>    <p>首先回答第一个问题: POOL_SENTINEL 只是 nil 的别名。</p>    <p>#define POOL_SENTINEL nil</p>    <p>在每个自动释放池初始化调用 objc_autoreleasePoolPush 的时候,都会把一个 POOL_SENTINEL push 到自动释放池的栈顶,并且返回这个 POOL_SENTINEL 哨兵对象 。</p>    <pre>  <code class="language-objectivec">int main(int argc, const char * argv[]) {      {          void * atautoreleasepoolobj = objc_autoreleasePoolPush();          objc_autoreleasePoolPop(atautoreleasepoolobj);      }      return 0;  }</code></pre>    <p>上面的 atautoreleasepoolobj 就是一个 POOL_SENTINEL 。</p>    <p>而当方法 objc_autoreleasePoolPop 调用时,就会向自动释放池中的对象发送 release 消息,直到第一个 POOL_SENTINEL :</p>    <p style="text-align: center;"><img src="https://simg.open-open.com/show/e92f165b675a537de56b1bb1ec0d889e.png"></p>    <p>objc_autoreleasePoolPush的返回值正是这个哨兵对象的地址,被objc_autoreleasePoolPop(哨兵对象)作为入参,于是:</p>    <ul>     <li>根据传入的哨兵对象地址找到哨兵对象所处的page</li>     <li>在当前page中,将晚于哨兵对象插入的所有autorelease对象都发送一次- release消息,并向回移动next指针到正确位置</li>     <li>补充2:从最新加入的对象一直向前清理,可以向前跨越若干个page,直到哨兵所在的page</li>    </ul>    <p><strong>objc_autoreleasePoolPush 方法</strong></p>    <p>了解了 POOL_SENTINEL ,我们来重新回顾一下 objc_autoreleasePoolPush 方法:</p>    <pre>  <code class="language-objectivec">void *objc_autoreleasePoolPush(void) {      return AutoreleasePoolPage::push();  }</code></pre>    <p>它调用 AutoreleasePoolPage 的类方法 push ,也非常简单:</p>    <pre>  <code class="language-objectivec">static inline void *push() {     return autoreleaseFast(POOL_SENTINEL);  }</code></pre>    <p>在这里会进入一个比较关键的方法 autoreleaseFast ,并传入哨兵对象 POOL_SENTINEL :</p>    <pre>  <code class="language-objectivec">static inline id *autoreleaseFast(id obj)  {     AutoreleasePoolPage *page = hotPage();     if (page && !page->full()) {         return page->add(obj);     } else if (page) {         return autoreleaseFullPage(obj, page);     } else {         return autoreleaseNoPage(obj);     }  }</code></pre>    <p>上述方法分三种情况选择不同的代码执行:</p>    <ul>     <li>有 hotPage 并且当前 page 不满<br> 》调用 page->add(obj) 方法将对象添加至 AutoreleasePoolPage 的栈中</li>     <li>有 hotPage 并且当前 page 已满<br> 》调用 autoreleaseFullPage 初始化一个新的页<br> 》调用 page->add(obj) 方法将对象添加至 AutoreleasePoolPage 的栈中</li>     <li>无 hotPage<br> 》调用 autoreleaseNoPage 创建一个 hotPage<br> 》调用 page->add(obj) 方法将对象添加至 AutoreleasePoolPage 的栈中<br> 最后的都会调用 page->add(obj) 将对象添加到自动释放池中。<br> hotPage 可以理解为当前正在使用的 AutoreleasePoolPage。</li>    </ul>    <p><strong>page->add 添加对象</strong></p>    <p>id *add(id obj) 将对象添加到自动释放池页中:</p>    <pre>  <code class="language-objectivec">id *add(id obj) {      id *ret = next;      *next = obj;      next++;      return ret;  }</code></pre>    <p>这个方法其实就是一个压栈的操作,将对象加入 AutoreleasePoolPage 然后移动栈顶的指针。</p>    <p><strong>autoreleaseFullPage(当前 hotPage 已满)</strong></p>    <p>autoreleaseFullPage 会在当前的 hotPage 已满的时候调用:</p>    <pre>  <code class="language-objectivec">static id *autoreleaseFullPage(id obj, AutoreleasePoolPage *page) {      do {          if (page->child) page = page->child;          else page = new AutoreleasePoolPage(page);      } while (page->full());        setHotPage(page);      return page->add(obj);  }</code></pre>    <p>它会从传入的 page 开始遍历整个双向链表,直到:</p>    <p>1、查找到一个未满的 AutoreleasePoolPage</p>    <p>2、使用构造器传入 parent 创建一个新的 AutoreleasePoolPage</p>    <p>在查找到一个可以使用的 AutoreleasePoolPage 之后,会将该页面标记成 hotPage ,然后调动上面分析过的 page->add 方法添加对象。</p>    <p><strong>autoreleaseNoPage(没有 hotPage)</strong></p>    <p>如果当前内存中不存在 hotPage ,就会调用 autoreleaseNoPage 方法初始化一个 AutoreleasePoolPage :</p>    <pre>  <code class="language-objectivec">static id *autoreleaseNoPage(id obj) {      AutoreleasePoolPage *page = new AutoreleasePoolPage(nil);      setHotPage(page);        if (obj != POOL_SENTINEL) {          page->add(POOL_SENTINEL);      }        return page->add(obj);  }</code></pre>    <p>既然当前内存中不存在 AutoreleasePoolPage ,就要从头开始构建这个自动释放池的双向链表,也就是说,新的 AutoreleasePoolPage 是没有 parent 指针的。</p>    <p>初始化之后,将当前页标记为 hotPage ,然后会先向这个 page 中添加一个 POOL_SENTINEL 对象,来确保在 pop 调用的时候,不会出现异常。</p>    <p>最后,将 obj 添加到自动释放池中。</p>    <p><strong>objc_autoreleasePoolPop 方法</strong></p>    <p>同样,回顾一下上面提到的 objc_autoreleasePoolPop 方法:</p>    <pre>  <code class="language-objectivec">void objc_autoreleasePoolPop(void *ctxt) {      AutoreleasePoolPage::pop(ctxt);  }</code></pre>    <p>看起来传入任何一个指针都是可以的,但是在整个工程并没有发现传入其他对象的例子。不过在这个方法中传入其它的指针也是可行的,会将自动释放池释放到相应的位置。</p>    <p>我们一般都会在这个方法中传入一个哨兵对象 POOL_SENTINEL ,如下图一样释放对象:</p>    <p style="text-align: center;"><img src="https://simg.open-open.com/show/e92f165b675a537de56b1bb1ec0d889e.png"></p>    <p><strong>对 objc_autoreleasePoolPop 行为的测试</strong></p>    <p>在继续分析这个方法之前做一个小测试,在 objc_autoreleasePoolPop 传入非哨兵对象,测试一下这个方法的行为。</p>    <p>下面是 main.m 文件中的源代码:</p>    <pre>  <code class="language-objectivec">#import <Foundation/Foundation.h>  int main(int argc, const char * argv[]) {      @autoreleasepool {            NSString *s = @"Draveness";          [s stringByAppendingString:@"-Suffix"];      }      return 0;  }</code></pre>    <p>在代码的这一行打一个断点,因为这里会调用 autorelease 方法,将字符串加入自动释放池:</p>    <p style="text-align:center"><img src="https://simg.open-open.com/show/9c10011031c57cff95b4bb4044aa84a3.jpg"></p>    <p>当代码运行到这里时,通过 lldb 打印出当前 hotPage 中的栈内容:</p>    <p style="text-align: center;"><img src="https://simg.open-open.com/show/aa46580ebee3b373cfda227b7a3d8375.png"></p>    <ul>     <li>通过 static 方法获取当前 hotPage</li>     <li>打印 AutoreleasePoolPage 中的内容</li>     <li>打印当前 next 指针指向的内容,以及之前的内容,-2时已经到了 begin() 位置</li>     <li>使用 print()和 printAll()打印自动释放池中内容</li>    </ul>    <p>然后将字符串 @"Draveness-Suffix" 的指针传入 pop 方法,测试 pop 方法能否传入非哨兵参数。</p>    <p style="text-align:center"><img src="https://simg.open-open.com/show/b10669af39370b4f3ab7a1181bd5f065.png"></p>    <p>再次打印当前 AutoreleasePoolPage 的内容时,字符串已经不存在了,这说明向 pop 方法传入非哨兵参数是可行的,只是我们一般不会传入非哨兵对象。</p>    <p>让我们重新回到对 objc_autoreleasePoolPop 方法的分析,也就是 AutoreleasePoolPage::pop 方法的调用:</p>    <p>`</p>    <p>static inline void pop(void <em> </em></p>    <p>token) {</p>    <p>page = pageForPointer(token);</p>    <p>id <em>stop = (id</em> )token;</p>    <pre>  <code class="language-objectivec">page->releaseUntil(stop);    if (page->child) {      if (page->lessThanHalfFull()) {          page->child->kill();      } else if (page->child->child) {          page->child->child->kill();      }  }</code></pre>    <p>} `</p>    <p>在这个方法中删除了大量无关的代码,以及对格式进行了调整。</p>    <p>该静态方法总共做了三件事情:</p>    <ul>     <li>使用 pageForPointer 获取当前 token 所在的 AutoreleasePoolPage</li>    </ul>    <ul>     <li>调用 releaseUntil 方法释放栈中的对象,直到 stop</li>     <li>调用 child 的 kill 方法</li>    </ul>    <p>我到现在也不是很清楚为什么要根据当前页的不同状态 kill 掉不同 child 的页面。</p>    <pre>  <code class="language-objectivec">if (page->lessThanHalfFull()) {      page->child->kill();  } else if (page->child->child) {      page->child->child->kill();  }</code></pre>    <p><strong>pageForPointer 获取 AutoreleasePoolPage</strong></p>    <p>pageForPointer 方法主要是通过内存地址的操作,获取当前指针所在页的首地址:</p>    <pre>  <code class="language-objectivec">static AutoreleasePoolPage *pageForPointer(const void *p) {      return pageForPointer((uintptr_t)p);  }    static AutoreleasePoolPage *pageForPointer(uintptr_t p) {      AutoreleasePoolPage *result;      uintptr_t offset = p % SIZE;        assert(offset >= sizeof(AutoreleasePoolPage));        result = (AutoreleasePoolPage *)(p - offset);      result->fastcheck();        return result;  }</code></pre>    <p>将指针与页面的大小,也就是 4096 取模,得到当前指针的偏移量,因为所有的 AutoreleasePoolPage 在内存中都是对齐的:</p>    <pre>  <code class="language-objectivec">p = 0x100816048  p % SIZE = 0x48  result = 0x100816000</code></pre>    <p>而最后调用的方法 fastCheck() 用来检查当前的 result 是不是一个 AutoreleasePoolPage 。</p>    <p>通过检查 magic_t 结构体中的某个成员是否为 0xA1A1A1A1。</p>    <p><strong>releaseUntil 释放对象</strong></p>    <p>releaseUntil 方法的实现如下:</p>    <pre>  <code class="language-objectivec">void releaseUntil(id *stop) {      while (this->next != stop) {          AutoreleasePoolPage *page = hotPage();            while (page->empty()) {              page = page->parent;              setHotPage(page);          }            page->unprotect();          id obj = *--page->next;          memset((void*)page->next, SCRIBBLE, sizeof(*page->next));          page->protect();            if (obj != POOL_SENTINEL) {              objc_release(obj);          }      }        setHotPage(this);  }</code></pre>    <p>它的实现还是很容易的,用一个 while 循环持续释放 AutoreleasePoolPage 中的内容,直到 next 指向了 stop 。</p>    <p>使用 memset 将内存的内容设置成 SCRIBBLE ,然后使用 objc_release 释放对象。</p>    <p><strong>kill() 方法</strong></p>    <p>到这里,没有分析的方法就只剩下 kill 了,而它会将当前页面以及子页面全部删除:</p>    <pre>  <code class="language-objectivec">void kill() {      AutoreleasePoolPage *page = this;      while (page->child) page = page->child;        AutoreleasePoolPage *deathptr;      do {          deathptr = page;          page = page->parent;          if (page) {              page->unprotect();              page->child = nil;              page->protect();          }          delete deathptr;      } while (deathptr != this);  }</code></pre>    <p><strong>autorelease 方法</strong></p>    <p>我们已经对自动释放池生命周期有一个比较好的了解,最后需要了解的话题就是 autorelease 方法的实现,先来看一下方法的调用栈:</p>    <pre>  <code class="language-objectivec">- [NSObject autorelease]  └── id objc_object::rootAutorelease()      └── id objc_object::rootAutorelease2()          └── static id AutoreleasePoolPage::autorelease(id obj)              └── static id AutoreleasePoolPage::autoreleaseFast(id obj)                  ├── id *add(id obj)                  ├── static id *autoreleaseFullPage(id obj, AutoreleasePoolPage *page)                  │   ├── AutoreleasePoolPage(AutoreleasePoolPage *newParent)                  │   └── id *add(id obj)                  └── static id *autoreleaseNoPage(id obj)                      ├── AutoreleasePoolPage(AutoreleasePoolPage *newParent)                      └── id *add(id obj)</code></pre>    <p>在 autorelease 方法的调用栈中,最终都会调用上面提到的 autoreleaseFast 方法,将当前对象加到 AutoreleasePoolPage 中。</p>    <p>这一小节中这些方法的实现都非常容易,只是进行了一些参数上的检查,最终还要调用 autoreleaseFast 方法:</p>    <pre>  <code class="language-objectivec">inline id objc_object::rootAutorelease() {      if (isTaggedPointer()) return (id)this;      if (prepareOptimizedReturn(ReturnAtPlus1)) return (id)this;        return rootAutorelease2();  }    __attribute__((noinline,used)) id objc_object::rootAutorelease2() {      return AutoreleasePoolPage::autorelease((id)this);  }    static inline id autorelease(id obj) {     id *dest __unused = autoreleaseFast(obj);     return obj;  }</code></pre>    <p>由于在上面已经分析过 autoreleaseFast 方法的实现,这里就不会多说了。</p>    <p><strong>Autorelease返回值的快速释放机制</strong></p>    <p>值得一提的是,ARC下,runtime有一套对 autorelease 返回值的优化策略。</p>    <p>比如一个工厂方法:</p>    <pre>  <code class="language-objectivec">+ (instancetype)createSark {      return [self new];  }  // caller  Sark *sark = [Sark createSark];</code></pre>    <p>秉着谁创建谁释放的原则,返回值需要是一个 autorelease 对象才能配合调用方正确管理内存,于是乎编译器改写成了形如下面的代码:</p>    <pre>  <code class="language-objectivec">+ (instancetype)createSark {      id tmp = [self new];      return objc_autoreleaseReturnValue(tmp); // 代替我们调用autorelease  }  // caller  id tmp = objc_retainAutoreleasedReturnValue([Sark createSark]) // 代替我们调用retain  Sark *sark = tmp;  objc_storeStrong(&sark, nil); // 相当于代替我们调用了release</code></pre>    <p>一切看上去都很好,不过既然编译器知道了这么多信息,干嘛还要劳烦 autorelease 这个开销不小的机制呢?于是乎,runtime使用了一些黑魔法将这个问题解决了。</p>    <h3><strong>小结</strong></h3>    <p>整个自动释放池 AutoreleasePool 的实现以及 autorelease 方法都已经分析完了,我们再来回顾一下文章中的一些内容:</p>    <ul>     <li>自动释放池是由 AutoreleasePoolPage 以双向链表的方式实现的</li>     <li>当对象调用 autorelease 方法时,会将对象加入 AutoreleasePoolPage 的栈中</li>     <li>调用 AutoreleasePoolPage::pop 方法会向栈中的对象发送 release 消息</li>    </ul>    <h3><strong>参考资料</strong></h3>    <p><a href="/misc/goto?guid=4959730906336838427" rel="nofollow,noindex">http://www.cocoachina.com/ios/20160702/16569.html</a></p>    <p><a href="/misc/goto?guid=4958973894588037131" rel="nofollow,noindex">http://blog.sunnyxx.com/2014/10/15/behind-autorelease/</a></p>    <p> </p>    <p>来自:http://www.jianshu.com/p/b0c19505a5a4</p>    <p> </p>