iOS核心动画高级技巧 - 8
15. 图层性能
图层性能
要更快性能,也要做对正确的事情。 ——stephen r. covey
在第14章『图像io』讨论如何高效地载入和显示图像,通过视图来避免可能引起动画帧率下降的性能问题。在最后一章,我们将着重图层树本身,以发掘最好的性能。
15.1 隐式绘制
隐式绘制
寄宿图可以通过core graphics直接绘制,也可以直接载入一个图片文件并赋值给contents
属性,或事先绘制一个屏幕之外的cgcontext
上下文。在之前的两章中我们讨论了这些场景下的优化。但是除了常见的显式创建寄宿图,你也可以通过以下三种方式创建隐式的:1,使用特性的图层属性。2,特定的视图。3,特定的图层子类。
了解这个情况为什么发生何时发生是很重要的,它能够让你避免引入不必要的软件绘制行为。
文本
catextlayer
和uilabel
都是直接将文本绘制在图层的寄宿图中。事实上这两种方式用了完全不同的渲染方式:在ios 6及之前,uilabel
用webkit的html渲染引擎来绘制文本,而catextlayer
用的是core text.后者渲染更迅速,所以在所有需要绘制大量文本的情形下都优先使用它吧。但是这两种方法都用了软件的方式绘制,因此他们实际上要比硬件加速合成方式要慢。
一个开发者,有一个学习的氛围跟一个交流圈子特别重要,这是一个我的ios交流群:1012951431, 分享bat,阿里面试题、面试经验,讨论技术, 大家一起交流学习成长!希望帮助开发者少走弯路。
不论如何,尽可能地避免改变那些包含文本的视图的frame,因为这样做的话文本就需要重绘。例如,如果你想在图层的角落里显示一段静态的文本,但是这个图层经常改动,你就应该把文本放在一个子图层中。
光栅化
在第四章『视觉效果』中我们提到了calayer
的shouldrasterize
属性,它可以解决重叠透明图层的混合失灵问题。同样在第12章『速度的曲调』中,它也是作为绘制复杂图层树结构的优化方法。
启用shouldrasterize
属性会将图层绘制到一个屏幕之外的图像。然后这个图像将会被缓存起来并绘制到实际图层的contents
和子图层。如果有很多的子图层或者有复杂的效果应用,这样做就会比重绘所有事务的所有帧划得来得多。但是光栅化原始图像需要时间,而且还会消耗额外的内存。
当我们使用得当时,光栅化可以提供很大的性能优势(如你在第12章所见),但是一定要避免作用在内容不断变动的图层上,否则它缓存方面的好处就会消失,而且会让性能变的更糟。
为了检测你是否正确地使用了光栅化方式,用instrument查看一下color hits green和misses red项目,是否已光栅化图像被频繁地刷新(这样就说明图层并不是光栅化的好选择,或则你无意间触发了不必要的改变导致了重绘行为)。
15.2 离屏渲染
离屏渲染
当图层属性的混合体被指定为在未预合成之前不能直接在屏幕中绘制时,屏幕外渲染就被唤起了。屏幕外渲染并不意味着软件绘制,但是它意味着图层必须在被显示之前在一个屏幕外上下文中被渲染(不论cpu还是gpu)。图层的以下属性将会触发屏幕外绘制:
-
圆角(当和
masktobounds
一起使用时) -
图层蒙板
-
阴影
屏幕外渲染和我们启用光栅化时相似,除了它并没有像光栅化图层那么消耗大,子图层并没有被影响到,而且结果也没有被缓存,所以不会有长期的内存占用。但是,如果太多图层在屏幕外渲染依然会影响到性能。
有时候我们可以把那些需要屏幕外绘制的图层开启光栅化以作为一个优化方式,前提是这些图层并不会被频繁地重绘。
对于那些需要动画而且要在屏幕外渲染的图层来说,你可以用cashapelayer
,contentscenter
或者shadowpath
来获得同样的表现而且较少地影响到性能。
cashapelayer
cornerradius
和masktobounds
独立作用的时候都不会有太大的性能问题,但是当他俩结合在一起,就触发了屏幕外渲染。有时候你想显示圆角并沿着图层裁切子图层的时候,你可能会发现你并不需要沿着圆角裁切,这个情况下用cashapelayer
就可以避免这个问题了。
你想要的只是圆角且沿着矩形边界裁切,同时还不希望引起性能问题。其实你可以用现成的uibezierpath
的构造器+bezierpathwithroundedrect:cornerradius:
(见清单15.1).这样做并不会比直接用cornerradius
更快,但是它避免了性能问题。
清单15.1 用cashapelayer
画一个圆角矩形
#import "viewcontroller.h" #import @interface viewcontroller () @property (nonatomic, weak) iboutlet uiview *layerview; @end @implementation viewcontroller - (void)viewdidload { [super viewdidload]; //create shape layer cashapelayer *bluelayer = [cashapelayer layer]; bluelayer.frame = cgrectmake(50, 50, 100, 100); bluelayer.fillcolor = [uicolor bluecolor].cgcolor; bluelayer.path = [uibezierpath bezierpathwithroundedrect: cgrectmake(0, 0, 100, 100) cornerradius:20].cgpath;  //add it to our view [self.layerview.layer addsublayer:bluelayer]; } @end
可伸缩图片
另一个创建圆角矩形的方法就是用一个圆形内容图片并结合第二章『寄宿图』提到的contenscenter
属性去创建一个可伸缩图片(见清单15.2).理论上来说,这个应该比用cashapelayer
要快,因为一个可拉伸图片只需要18个三角形(一个图片是由一个3*3网格渲染而成),然而,许多都需要渲染成一个顺滑的曲线。在实际应用上,二者并没有太大的区别。
清单15.2 用可伸缩图片绘制圆角矩形
@implementation viewcontroller - (void)viewdidload { [super viewdidload]; //create layer calayer *bluelayer = [calayer layer]; bluelayer.frame = cgrectmake(50, 50, 100, 100); bluelayer.contentscenter = cgrectmake(0.5, 0.5, 0.0, 0.0); bluelayer.contentsscale = [uiscreen mainscreen].scale; bluelayer.contents = (__bridge id)[uiimage imagenamed:@"circle.png"].cgimage; //add it to our view [self.layerview.layer addsublayer:bluelayer]; } @end
使用可伸缩图片的优势在于它可以绘制成任意边框效果而不需要额外的性能消耗。举个例子,可伸缩图片甚至还可以显示出矩形阴影的效果。
shadowpath
在第2章我们有提到shadowpath
属性。如果图层是一个简单几何图形如矩形或者圆角矩形(假设不包含任何透明部分或者子图层),创建出一个对应形状的阴影路径就比较容易,而且core animation绘制这个阴影也相当简单,避免了屏幕外的图层部分的预排版需求。这对性能来说很有帮助。
如果你的图层是一个更复杂的图形,生成正确的阴影路径可能就比较难了,这样子的话你可以考虑用绘图软件预先生成一个阴影背景图。
15.3 混合和过度绘制
混合和过度绘制
在第12章有提到,gpu每一帧可以绘制的像素有一个最大限制(就是所谓的fill rate),这个情况下可以轻易地绘制整个屏幕的所有像素。但是如果由于重叠图层的关系需要不停地重绘同一区域的话,掉帧就可能发生了。
gpu会放弃绘制那些完全被其他图层遮挡的像素,但是要计算出一个图层是否被遮挡也是相当复杂并且会消耗处理器资源。同样,合并不同图层的透明重叠像素(即混合)消耗的资源也是相当客观的。所以为了加速处理进程,不到必须时刻不要使用透明图层。任何情况下,你应该这样做:
-
给视图的
backgroundcolor
属性设置一个固定的,不透明的颜色 -
设置
opaque
属性为yes
这样做减少了混合行为(因为编译器知道在图层之后的东西都不会对最终的像素颜色产生影响)并且计算得到了加速,避免了过度绘制行为因为core animation可以舍弃所有被完全遮盖住的图层,而不用每个像素都去计算一遍。
如果用到了图像,尽量避免透明除非非常必要。如果图像要显示在一个固定的背景颜色或是固定的背景图之前,你没必要相对前景移动,你只需要预填充背景图片就可以避免运行时混色了。
如果是文本的话,一个白色背景的uilabel
(或者其他颜色)会比透明背景要更高效。
最后,明智地使用shouldrasterize
属性,可以将一个固定的图层体系折叠成单张图片,这样就不需要每一帧重新合成了,也就不会有因为子图层之间的混合和过度绘制的性能问题了。
15.4 减少图层数量
减少图层数量
初始化图层,处理图层,打包通过ipc发给渲染引擎,转化成opengl几何图形,这些是一个图层的大致资源开销。事实上,一次性能够在屏幕上显示的最大图层数量也是有限的。
确切的限制数量取决于ios设备,图层类型,图层内容和属性等。但是总得说来可以容纳上百或上千个,下面我们将演示即使图层本身并没有做什么也会遇到的性能问题。
裁切
在对图层做任何优化之前,你需要确定你不是在创建一些不可见的图层,图层在以下几种情况下回事不可见的:
-
图层在屏幕边界之外,或是在父图层边界之外。
-
完全在一个不透明图层之后。
-
完全透明
core animation非常擅长处理对视觉效果无意义的图层。但是经常性地,你自己的代码会比core animation更早地想知道一个图层是否是有用的。理想状况下,在图层对象在创建之前就想知道,以避免创建和配置不必要图层的额外工作。
举个例子。清单15.3 的代码展示了一个简单的滚动3d图层矩阵。这看上去很酷,尤其是图层在移动的时候(见图15.1),但是绘制他们并不是很麻烦,因为这些图层就是一些简单的矩形色块。
清单15.3 绘制3d图层矩阵
#import "viewcontroller.h" #import #define width 10 #define height 10 #define depth 10 #define size 100 #define spacing 150 #define camera_distance 500 @interface viewcontroller ()  @property (nonatomic, strong) iboutlet uiscrollview *scrollview; @end @implementation viewcontroller - (void)viewdidload { [super viewdidload]; //set content size self.scrollview.contentsize = cgsizemake((width - 1)*spacing, (height - 1)*spacing); //set up perspective transform catransform3d transform = catransform3didentity; transform.m34 = -1.0 / camera_distance; self.scrollview.layer.sublayertransform = transform; //create layers for (int z = depth - 1; z >= 0; z--) { for (int y = 0; y < height; y++) { for (int x = 0; x < width; x++) { //create layer calayer *layer = [calayer layer]; layer.frame = cgrectmake(0, 0, size, size); layer.position = cgpointmake(x*spacing, y*spacing); layer.zposition = -z*spacing; //set background color layer.backgroundcolor = [uicolor colorwithwhite:1-z*(1.0/depth) alpha:1].cgcolor; //attach to scroll view [self.scrollview.layer addsublayer:layer]; } } }  //log nslog(@"displayed: %i", depth*height*width); } @end
15.5 总结
总结
本章学习了使用core animation图层可能遇到的性能瓶颈,并讨论了如何避免或减小压力。你学习了如何管理包含上千虚拟图层的场景(事实上只创建了几百个)。同时也学习了一些有用的技巧,选择性地选取光栅化或者绘制图层内容在合适的时候重新分配给cpu和gpu。这些就是我们要讲的关于core animation的全部了(至少可以等到苹果发明什么新的玩意儿)。