iOS性能优化过程浅析
这一系列文章是我的读书笔记,整理一下,也算是温故而知新。
一:性能优化策略
性能问题的处理流程
- 发现/重现问题
- 利用工具剖析
- 形成假设
- 改进代码和设计
在以上的四个步骤中循环反复,直到问题解决。
Profile!不要猜!
性能优化的主要策略:
- 不要做无用功:不要在启动时花几百ms来做logging,不要为同样的数据做多次查询
- 试图重用:对于创建过程昂贵的对象,要重用而不是重新创建
- Table View的cell
- Date/Number的formatter
- 正则表达式
- SQLite语句
- 使用更快的方式设计、编程:选择正确的集合对象和算法来进行编程、选择适合的数据存储格式(plist、SQLite)、优化SQLite查询语句
- 事先做优化
- 对于昂贵的计算,要进行事先计算。iCal中的重复事件,是预先计算出来的,并保存到数据库中。
- 事先计算并缓存一些对象,可能会占用大量的内存。注意不要将这些对象声明为static并常驻内存。
- 事后做优化:异步加载、懒加载
- 为伸缩性而做优化:当数据有10条、100条、1000条甚至更多的时候,应用程序的性能不应该对应的呈数量级式的增长,否则无法使用。
说起来惭愧,我真的很少遇到性能问题。以前假设中的性能问题,很多是根本不存在的。事前计划也杜绝了不了性能问题的产生,所以不如暂时忘记它吧。当然对于一些常识性的提高性能的设计,仍然是必须的。
二:iOS应用启动速度优化
很多app的开发者都不重视app的启动速度,这对于碎片化使用情景的用户来说,简直是灾难。
iOS应用的启动速度
应用启动时,会播放一个放大的动画。iPhone上是400ms,iPad上是500ms。最理想的启动速度是,在播放完动画后,用户就可以使用。
如果应用启动过慢,用户就会放弃使用,甚至永远都不再回来。抛开代码不谈,如果抱着PC端游和单机游戏的思维,在游戏启动时强加公司Logo,启动动画,并且用户不可跳过,也会使用户的成功使用率大大降低。
iOS系统的“看门狗”
为了防止一个应用占用过多的系统资源,开发iOS的苹果工程师门设计了一个“看门狗”的机制。在不同的场景下,“看门狗”会监测应用的性能。如果超出了该场景所规定的运行时间,“看门狗”就会强制终结这个应用的进程。开发者们在crashlog里面,会看到诸如0x8badf00d
这样的错误代码(“看门狗”吃了坏的食物,它很不高兴)。
场景 | “看门狗”超时时间 |
---|---|
启动 | 20秒 |
恢复运行 | 10秒 |
悬挂进程 | 10秒 |
退出应用 | 6秒 |
后台运行 | 10分钟 |
值得注意的是,Xcode在Debug的时候,会禁止“看门狗”。
如何测试启动时间
两种方法:一种使用NSLog,另外一种使用Time Profiler。
- 使用NSLog
CFAbsoluteTime StartTime; int main(int argc, char **argv) { StartTime = CFAbsoluteTimeGetCurrent(); // ... 5 } 6 - (void)applicationDidFinishLaunching:(UIApplication *)app { dispatch_async(dispatch_get_main_queue(), ^{ NSLog(@"Launched in %f sec", CFAbsoluteTimeGetCurrent() - StartTime); }); // ... }
- 使用Time Profiler
- Instruments->Time Profiler
- Profile你的app
- 切换到CPU strategy view,找到你的app启动的第一帧
- 搜索
-[UIApplication _reportAppLaunchFinished]
- 找到包含
-[UIApplication _reportAppLaunchFinished]
的最后一帧,即可计算出启动时间
iOS App启动过程
- 链接并加载Framework和static lib
- UIKit初始化
- 应用程序callback
- 第一个Core Animation transaction
链接并加载Framework及static lib时需要注意:
- 每个Framework都会增加启动时间和占用的内存
- 不必要的Framework,不要链接
- 必要的Framework,不要票房为Optional
- 只在使用在Deployment Target之后发布的Framework时,才使用Optional(比如你的Deployment Target是iOS 3.0,需要链接StoreKit的时候)
- 避免创建全局的C++对象
初始化UIKit时需要注意:
- 字体、状态栏、user defaults、main nib会被初始化
- 保持main nib尽可能的小
- User defaults本质上是一个plist文件,保存的数据是同时被反序列化的,不要在user defaults里面保存图片等大数据
应用程序的回调:
application:willFinishLaunchingWithOptions:
- 恢复应用程序的状态
application:didFinishLaunchingWithOptions:
我一直认为设计的本质是折衷。当你为了100ms的启动速度优化欢欣不已,而无视那长达10秒的启动动画时,应该想想究竟什么是应该做的。做正确的事情比把事情做好更重要。
三:事件处理-拯救主线程
用户经常评论app的一个用词是“卡顿”,很大的因素是因为主线程被占用了。用户的事件是在主线程被处理的,包括点击、滚动、加速计、Proximity Sensor。
为了保证事件的平滑处理,需要进行如下优化:
- 最小化主线程的CPU占用
- 将工作“搬离”主线程
- 不要阻塞主线程
最小化主线程的CPU占用
前面两篇文章,我们接触到了Time Profiler。使用它可以剖析不同线程的CPU使用情况,并给出调用堆栈的CPU时间占用百分比。如果app“卡顿”,并且在Time Profiler的结果可以找到明确的高占用堆栈,你需要把它优化掉。
将工作“搬离”主线程 – 隐式并发
为了得到更流畅的交互体验,iOS已经帮我们做了很多事情,Android就没有这么好运了。iOS将以下这些事情搬离了主线程:
- View和layer的动画(动画绘制前的计算,而不是drawing过程)
- Layer的组合计算(drawing后的叠加)
- PNG的解码(是的,你没看错;而且利用了CPU的多核心)
注意滚动(Scrolling)不是一个动画,而是在Main Run Loop中不断接收事件并且处理。
将工作“搬离”主线程 – 显式并发
这里是需要开发者们搞定的部分。磁盘、网络等I/O会阻塞线程,不要把它们放到主线程里。常用的技术有:
- Grand Central Dispatch(GCD)
- NSOperationQueue
- NSThread
iOS 4.0后,易用的GCD技术被广泛使用。例如:
dispatch_async(dispatch_get_global_queue(DISPATCH_QUEUE_PRIORITY_DEFAULT, 0), ^{ // do something in background dispatch_async(dispatch_get_main_queue(), ^{ // do something on main thread }); });
GCD的陷阱
GCD其实就是线程,只不过提供了一个更高层次的抽象。过多的线程一定会带来性能损失,因此GCD设计了一个最高允许的线程值(对开发者透明,不用管到底有多少)。那么如何解决这个问题呢?
- 将队列串行化
- 使用Dispatch sources
- 使用带有限制的NSOperationQueue
- 使用Cocoa Touch提供的异步方法
另外一个陷阱是线程安全:
- UIKit必须要在主线程使用,除了UIGraphics,UIBezierPath,UIImage
- 大多数CG、CA、Foundation的类,不是线程安全的
- 如果你使用了ojbc runtime来进行introspection,由于它是thread safe的,可能会导致竞争
此外,iOS 4.3添加了DISPATCH_QUEUE_PRIORITY_BACKGROUND
,它拥有非常低的优先级。这个优先级只用于不太关心完成时间的真正的后台任务,如果要表示较低的优先级,你通常需要的是DISPATCH_QUEUE_PRIORITY_LOW
。
不要阻塞主线程
即使占用了很少的CPU时间(如果你在Time Profiler中看到这些的数据),也可能会阻塞主线程。磁盘、网络、Lock、dispatch_sync以及向其它进程/线程发送消息都会阻塞主线 程。Time Profiler只能检测出占用CPU过多的堆栈,但检测不了这些IO的问题。
大多数的阻塞事件,都会伴随着一个系统调用,如:
read/write
- 读写文件send/recv
- 收发网络数据psynch_mutex_wait
- 获得锁mach_msg
- IPC
System Trace
这个Instrumentor,记录了所有的系统调用,以及每次调用的等待时间。如果你在System Trace里面发现了CPU Time很低,但Wait Time很高的调用,说明在主线程处理I/O已经严重损害了app的性能。
保证主线程的低CPU占用,将I/O移至其它线程,可以大大地提高主线程对交互事件的处理能力。我建议开发者朋友们写代码的时候,除非是以前遇到过的问题,都没有必要假设问题存在。80%的优化都是不必要的。