iOS:如何捕获异常?
57482053
8年前
<h2>前言</h2> <p>今天在ios高级群,有朋友问到iOS的异常捕捉的问题,这一块以前也没有研究过,趁此机会研究了一把。并写了一个demo,如有需要可以在文章最下面去下载。</p> <p>在阅读文章之前,建议大家在阅读完此篇文章后可以阅读漫谈iOS Crash收集框架,了解一下原理。</p> <p>开发iOS应用,解决Crash问题始终是一个难题。Crash分为两种,一种是由EXC_BAD_ACCESS引起的,原因是访问了不属于本进程的内存地址,有可能是访问已被释放的内存;另一种是未被捕获的Objective-C异常(NSException),导致程序向自身发送了SIGABRT信号而崩溃。其实对于未捕获的Objective-C异常,我们是有办法将它记录下来的,如果日志记录得当,能够解决绝大部分崩溃的问题。这里对于UI线程与后台线程分别说明</p> <h2>一. 系统Crash</h2> <p>对于系统Crash而引起的程序异常退出,可以通过UncaughtExceptionHandler机制捕获;也就是说在程序中catch以外的内容,被系统自带的错误处理而捕获。我们要做的就是用自定义的函数替代该ExceptionHandler即可。</p> <h2>二. 处理signal</h2> <p>使用Objective-C的异常处理是不能得到signal的,如果要处理它,我们还要利用unix标准的signal机制,注册SIGABRT, SIGBUS, SIGSEGV等信号发生时的处理函数。该函数中我们可以输出栈信息,版本信息等其他一切我们所想要的。</p> <p>下面是一些信号说明</p> <p>1) SIGHUP</p> <p>本信号在用户终端连接(正常或非正常)结束时发出, 通常是在终端的控制进程结束时, 通知同一session内的各个作业, 这时它们与控制终端不再关联。</p> <p>登录Linux时,系统会分配给登录用户一个终端(Session)。在这个终端运行的所有程序,包括前台进程组和后台进程组,一般都属于这个 Session。当用户退出Linux登录时,前台进程组和后台有对终端输出的进程将会收到SIGHUP信号。这个信号的默认操作为终止进程,因此前台进 程组和后台有终端输出的进程就会中止。不过可以捕获这个信号,比如wget能捕获SIGHUP信号,并忽略它,这样就算退出了Linux登录, wget也 能继续下载。</p> <p>此外,对于与终端脱离关系的守护进程,这个信号用于通知它重新读取配置文件。</p> <p>2) SIGINT</p> <p>程序终止(interrupt)信号, 在用户键入INTR字符(通常是Ctrl-C)时发出,用于通知前台进程组终止进程。</p> <p>3) SIGQUIT</p> <p>和SIGINT类似, 但由QUIT字符(通常是Ctrl-)来控制. 进程在因收到SIGQUIT退出时会产生core文件, 在这个意义上类似于一个程序错误信号。</p> <p>4) SIGILL</p> <p>执行了非法指令. 通常是因为可执行文件本身出现错误, 或者试图执行数据段. 堆栈溢出时也有可能产生这个信号。</p> <p>5) SIGTRAP</p> <p>由断点指令或其它trap指令产生. 由debugger使用。</p> <p>6) SIGABRT</p> <p>调用abort函数生成的信号。</p> <p>7) SIGBUS</p> <p>非法地址, 包括内存地址对齐(alignment)出错。比如访问一个四个字长的整数, 但其地址不是4的倍数。它与SIGSEGV的区别在于后者是由于对合法存储地址的非法访问触发的(如访问不属于自己存储空间或只读存储空间)。</p> <p>8) SIGFPE</p> <p>在发生致命的算术运算错误时发出. 不仅包括浮点运算错误, 还包括溢出及除数为0等其它所有的算术的错误。</p> <p>9) SIGKILL</p> <p>用来立即结束程序的运行. 本信号不能被阻塞、处理和忽略。如果管理员发现某个进程终止不了,可尝试发送这个信号。</p> <p>10) SIGUSR1</p> <p>留给用户使用</p> <p>11) SIGSEGV</p> <p>试图访问未分配给自己的内存, 或试图往没有写权限的内存地址写数据.</p> <p>12) SIGUSR2</p> <p>留给用户使用</p> <p>13) SIGPIPE</p> <p>管道破裂。这个信号通常在进程间通信产生,比如采用FIFO(管道)通信的两个进程,读管道没打开或者意外终止就往管道写,写进程会收到SIGPIPE信号。此外用Socket通信的两个进程,写进程在写Socket的时候,读进程已经终止。</p> <p>14) SIGALRM</p> <p>时钟定时信号, 计算的是实际的时间或时钟时间. alarm函数使用该信号.</p> <p>15) SIGTERM</p> <p>程序结束(terminate)信号, 与SIGKILL不同的是该信号可以被阻塞和处理。通常用来要求程序自己正常退出,shell命令kill缺省产生这个信号。如果进程终止不了,我们才会尝试SIGKILL。</p> <p>17) SIGCHLD</p> <p>子进程结束时, 父进程会收到这个信号。</p> <p>如果父进程没有处理这个信号,也没有等待(wait)子进程,子进程虽然终止,但是还会在内核进程表中占有表项,这时的子进程称为僵尸进程。这种情 况我们应该避免(父进程或者忽略SIGCHILD信号,或者捕捉它,或者wait它派生的子进程,或者父进程先终止,这时子进程的终止自动由init进程 来接管)。</p> <p>18) SIGCONT</p> <p>让一个停止(stopped)的进程继续执行. 本信号不能被阻塞. 可以用一个handler来让程序在由stopped状态变为继续执行时完成特定的工作. 例如, 重新显示提示符</p> <p>19) SIGSTOP</p> <p>停止(stopped)进程的执行. 注意它和terminate以及interrupt的区别:该进程还未结束, 只是暂停执行. 本信号不能被阻塞, 处理或忽略.</p> <p>20) SIGTSTP</p> <p>停止进程的运行, 但该信号可以被处理和忽略. 用户键入SUSP字符时(通常是Ctrl-Z)发出这个信号</p> <p>21) SIGTTIN</p> <p>当后台作业要从用户终端读数据时, 该作业中的所有进程会收到SIGTTIN信号. 缺省时这些进程会停止执行.</p> <p>22) SIGTTOU</p> <p>类似于SIGTTIN, 但在写终端(或修改终端模式)时收到.</p> <p>23) SIGURG</p> <p>有”紧急”数据或out-of-band数据到达socket时产生.</p> <p>24) SIGXCPU</p> <p>超过CPU时间资源限制. 这个限制可以由getrlimit/setrlimit来读取/改变。</p> <p>25) SIGXFSZ</p> <p>当进程企图扩大文件以至于超过文件大小资源限制。</p> <p>26) SIGVTALRM</p> <p>虚拟时钟信号. 类似于SIGALRM, 但是计算的是该进程占用的CPU时间.</p> <p>27) SIGPROF</p> <p>类似于SIGALRM/SIGVTALRM, 但包括该进程用的CPU时间以及系统调用的时间.</p> <p>28) SIGWINCH</p> <p>窗口大小改变时发出.</p> <p>29) SIGIO</p> <p>文件描述符准备就绪, 可以开始进行输入/输出操作.</p> <p>30) SIGPWR</p> <p>Power failure</p> <p>31) SIGSYS</p> <p>非法的系统调用。</p> <p>关键点注意</p> <ul> <li>在以上列出的信号中,程序不可捕获、阻塞或忽略的信号有:SIGKILL,SIGSTOP</li> <li>不能恢复至默认动作的信号有:SIGILL,SIGTRAP</li> <li>默认会导致进程流产的信号有:SIGABRT,SIGBUS,SIGFPE,SIGILL,SIGIOT,SIGQUIT,SIGSEGV,SIGTRAP,SIGXCPU,SIGXFSZ</li> <li>默认会导致进程退出的信号有:</li> <li>SIGALRM,SIGHUP,SIGINT,SIGKILL,SIGPIPE,SIGPOLL,SIGPROF,SIGSYS,SIGTERM,SIGUSR1,SIGUSR2,SIGVTALRM</li> <li>默认会导致进程停止的信号有:SIGSTOP,SIGTSTP,SIGTTIN,SIGTTOU</li> <li>默认进程忽略的信号有:SIGCHLD,SIGPWR,SIGURG,SIGWINCH</li> <li>此外,SIGIO在SVR4是退出,在4.3BSD中是忽略;SIGCONT在进程挂起时是继续,否则是忽略,不能被阻塞。</li> </ul> <h2>三. 实战</h2> <p>1.AppDelegate.m中</p> <pre> <code class="language-objectivec">- (BOOL)application:(UIApplication *)application didFinishLaunchingWithOptions:(NSDictionary *)launchOptions { // Override point for customization after application launch. InstallSignalHandler();//信号量截断 InstallUncaughtExceptionHandler();//系统异常捕获 return YES; } </code></pre> <p>2.SignalHandler.m的实现</p> <pre> <code class="language-objectivec">void SignalExceptionHandler(int signal) { NSMutableString *mstr = [[NSMutableString alloc] init]; [mstr appendString:@"Stack:\n"]; void* callstack[128]; int i, frames = backtrace(callstack, 128); char** strs = backtrace_symbols(callstack, frames); for (i = 0; i [mstr appendFormat:@"%s\n", strs[i]]; } [SignalHandler saveCreash:mstr]; } void InstallSignalHandler(void) { signal(SIGHUP, SignalExceptionHandler); signal(SIGINT, SignalExceptionHandler); signal(SIGQUIT, SignalExceptionHandler); signal(SIGABRT, SignalExceptionHandler); signal(SIGILL, SignalExceptionHandler); signal(SIGSEGV, SignalExceptionHandler); signal(SIGFPE, SignalExceptionHandler); signal(SIGBUS, SignalExceptionHandler); signal(SIGPIPE, SignalExceptionHandler); } </code></pre> <p>有关错误类型可以看上面的说明,SignalExceptionHandler是信号出错时候的回调。当有信号出错的时候,可以回调到这个方法</p> <p>3.UncaughtExceptionHandler.m的实现</p> <pre> <code class="language-objectivec">void HandleException(NSException *exception) { // 异常的堆栈信息 NSArray *stackArray = [exception callStackSymbols]; // 出现异常的原因 NSString *reason = [exception reason]; // 异常名称 NSString *name = [exception name]; NSString *exceptionInfo = [NSString stringWithFormat:@"Exception reason:%@\nException name:%@\nException stack:%@",name, reason, stackArray]; NSLog(@"%@", exceptionInfo); [UncaughtExceptionHandler saveCreash:exceptionInfo]; } void InstallUncaughtExceptionHandler(void) { NSSetUncaughtExceptionHandler(&HandleException); } </code></pre> <p>4.测试–踩坑关键</p> <p>这里最关键的一步,SignalHandler不要在debug环境下测试。因为系统的debug会优先去拦截。我们要运行一次后,关闭debug状态。应该直接在模拟器上点击我们build上去的app去运行。而UncaughtExceptionHandler可以在调试状态下捕捉</p> <pre> <code class="language-objectivec">- (IBAction)buttonClick:(UIButton *)sender { //1.信号量 Test *pTest = {1,2}; free(pTest);//导致SIGABRT的错误,因为内存中根本就没有这个空间,哪来的free,就在栈中的对象而已 pTest->a = 5; } - (IBAction)buttonOCException:(UIButton *)sender { //2.ios崩溃 NSArray *array= @[@"tom",@"xxx",@"ooo"]; [array objectAtIndex:5]; } </code></pre> <p style="text-align:center"><img src="https://simg.open-open.com/show/2a44287f24c7e87c1bb83e9ca997e93b.jpg"></p> <p style="text-align:center"><img src="https://simg.open-open.com/show/b5ee4d0302a246c3b03e2b2f8900bed5.jpg"></p> <h2>四. Crash Callstack分析 – 进 <strong>一步分析</strong></h2> <table> <thead> <tr> <th>属性</th> <th>说明</th> <th> </th> </tr> </thead> <tbody> <tr> <td>0x8badf00d</td> <td>在启动、终⽌止应⽤用或响应系统事件花费过⻓长时间,意为“ate bad food”。</td> <td> </td> </tr> <tr> <td>0xdeadfa11</td> <td>⽤用户强制退出,意为“dead fall”。(系统⽆无响应时,⽤用户按电源开关和HOME)</td> <td> </td> </tr> <tr> <td>0xbaaaaaad</td> <td>⽤用户按住Home键和⾳音量键,获取当前内存状态,不代表崩溃</td> <td> </td> </tr> <tr> <td>0xbad22222</td> <td>VoIP应⽤用因为恢复得太频繁导致crash</td> <td> </td> </tr> <tr> <td>0xc00010ff</td> <td>因为太烫了被干掉,意为“cool off”</td> <td> </td> </tr> <tr> <td>0xdead10cc</td> <td>因为在后台时仍然占据系统资源(⽐比如通讯录)被干掉,意为“dead lock”</td> <td> </td> </tr> </tbody> </table> <h2>五. 参考文献</h2> <p>1.程序crash后的调试技巧</p> <p>2.iOS开发socket程序被SIGPIPE信号Terminate的问题</p> <p>3.美女念茜</p> <p>4.如何定位Obj-C野指针随机Crash(一):先提高野指针Crash率</p> <p>5.如何定位Obj-C野指针随机Crash(二):让非必现Crash变成必现</p> <p>6.如何定位Obj-C野指针随机Crash(三):加点黑科技让Crash自报家门</p> <p> </p> <p>来自:http://mobile.51cto.com/iphone-535262.htm</p> <p> </p>