优化Angular应用的性能

strom3x 9年前

来自: http://web.jobbole.com/85043/

优化Angular应用的性能

MVVM框架的性能,其实就取决于几个因素:

  • 监控的个数
  • 数据变更检测与绑定的方式
  • 索引的性能
  • 数据的大小
  • 数据的结构

我们要优化Angular项目的性能,也需要从这几个方面入手。

1. 减少监控值的个数

监控值的个数怎么减少呢?

考虑极端情况,在不引入Angular的时候,监控的个数是为0的,每当我们有需要绑定的数据项,就产生了监控值。

我们注意到,Angular里面使用了一种HTML模板语法来做绑定,开发业务项目非常方便,但考虑一下,这种所谓的“模板”,其实与我们常见的那种模板是不同的。

传统的模板,是静态模板,将数据代入模板之后生成界面,之后数据再有变化,界面也不会变。但Angular的这种“模板”是动态的,当界面生成完毕,数据产生变更的时候,界面还是会更新。

这是Angular的优势,但我们有时候也会因为使用不当,反而增加困扰。因为Angular采用了变动检测的方式来跟踪数据的变化,这些事情都是有负担的,很多时候,有些数据在初始化之后就不再会变化,但因为我们没有把它们区分出来,Angular还是要生成一个监听器来跟踪这部分数据的变化,性能也就受到牵累。

在这种情况下,可以采用单次绑定,仅在初始化的时候把这些数据绑定,语法如下:

<div>{{::item}}</div>
<div>{{::item}}</div>
</div>
<ul>      <li ng-repeat="item in ::items">{{item}}</li>  </ul>
<ul>      <ling-repeat="item in ::items">{{item}}</li>  </ul>
</div>

这样的数据就不会被持续观测,也就有效减少了监控值的数目,提高了性能。

2. 降低数据比对的开销

这一个环节是从数据变更检测与绑定的方式入手。细节不说太多了,之前都说过。从数据到界面的更新,一般就两种方式:推、拉。

所谓推,就是在set的时候,主动把与之相关的数据更新,大部分框架是这种方式,低版本浏览器用defineSetter之类。

function Employee() {      this._firstName = "";      this._lastName = "";        this.fullName = "";  }    Employee.prototype = {      get firstName(){          return this._firstName;      },      set firstName(val){          this._firstName = val;          this.fullName = val + " " + this.lastName;      },      get lastName(){          return this._lastName;      },      set lastName(val){          this._lastName = val;          this.fullName = this.lastName + " " + val;      }  };
function Employee() {      this._firstName = "";      this._lastName = "";         this.fullName = "";  }     Employee.prototype = {      getfirstName(){          return this._firstName;      },      setfirstName(val){          this._firstName = val;          this.fullName = val + " " + this.lastName;      },      getlastName(){          return this._lastName;      },      setlastName(val){          this._lastName = val;          this.fullName = this.lastName + " " + val;      }  };
</div>

所谓拉,就是set的时候只改变自己,关联数据等到用的时候自己去取。比如:

function Employee() {      this.firstName = "";      this.lastName = "";  }    Employee.prototype = {      get fullName() {          return this.firstName + " " + this.lastName;      }  };
function Employee() {      this.firstName = "";      this.lastName = "";  }     Employee.prototype = {      getfullName() {          return this.firstName + " " + this.lastName;      }  };
</div>

有些框架中,两种方式都可以用。这时候可以自己考虑下适合用哪种方式,比如说,可能有些框架是合并变更,批量更新的,可能就用拉的方式效率高;有些框架是实时变动,差异更新的,那可能就是用推的效率高些。

上面的代码能看出来,从代码编写的简洁性来说,拉模式要比推模式简单很多,如果能预知数据量较小,可以这样用。

在实际开发过程中,这两种方式是需要权衡的。我们举的这个例子比较简单,如果说某个属性依赖于很多东西,例如,一个很大的购物列表,有个总价,它是由每个商品的单价乘以购买个数,再累加起来的。

在这种情况下,如果使用拉模式,也就是在总价的get上做这个变动,它需要遍历整个数组,重新作计算。但是如果使用推模式,每次有商品价格或者商品购买个数发生变更的时候,都只要在原先的总价上,减去两次变动的差价即可。

此外,不同的框架用不同方式来检测数据的变动,比如Angular,如果有一个数组中的元素发生变化了,它是怎样知道这个数组变了呢?

它需要保持变动之前的数据,然后作比对:

  • 首先比对数组的引用是否相等,这一步是为了检测数组的整体赋值,比如this.arr = [1, 2, 3]; 直接把原来的替换掉了,如果出现这种情况,就认为它肯定变化了。(其实,如果内容与原先相同,是可以认为没有变的,但因为这些框架的内部实现,往往都需要更新数据与DOM元素的索引关系,所以不能这样)
  • 其次,比较数组的长度,如果长度跟原先不相等了,那肯定也产生变化了
  • 然后只能挨个去比对里面元素的变化了

所以,会有人考虑在Angular中结合immutable这样的东西,加速变更的判定过程,因为immutable的数据只要发生任何变化,其引用都一定会变,所以只要第一步判定引用就足以知道数据是否改变了。

有人说,你这个判定降低的开销并不大啊,因为引入immutable要增加复制的开销,跟这里的新旧数据比对开销相比,也低不到哪里去。但这个地方要注意,Angular在有事件产生的时候,会把所有监控数据都重新比对,也就是说,如果你在界面上有个大数组,你从未对它重新赋值,而是经常在另外一个很小的表单项绑定的数据上进行更新,这个数组也是要被比对的,这就比较坑了,所以如果引入immutable,可以大幅降低平时这种不受影响时候的比对成本。

但是引入immutable也会对整个应用造成影响,需要在每个赋值取值的地方都使用immutable的封装方式,而且还要在绑定的时候,对数据作解包,因为Angular绑定的数据是pojo。

所以,用这种方式还是要慎重,除非框架自身就构建在immutable的基础上。或许,我们可以期望有一套与ng-model平行的机制,ng-immutable之类,实现的难度也还是挺大的。

在使用ES5的场景下,可以利用一些方法加速判断,比如数组的:

  • filter
  • map
  • reduce

它们能够返回一个全新的数组,与原先的引用不等,所以在第一步判断就可以得出结果,不必继续后面几步的比较。

不过,这个环节的优化其实很不明显,最关键的优化在于与之配套的索引优化,参见下一节。

3. 提升索引的性能

在Angular中,可以通过ng-repeat来实现对数组或者对象的遍历,但这个遍历的机制,其实有很多技巧。

在使用简单类型数组的时候,我们很可能会碰到这么一个问题:数组中存在相同的值,比如:

this.arr = [1, 3, 5, 3];
this.arr = [1, 3, 5, 3];
</div>
<ul>      <li ng-repeat="num in arr">{{num}}</li>  </ul>
<ul>      <ling-repeat="num in arr">{{num}}</li>  </ul>
</div>

这时候会报错,然后如果去搜索一下,会发现一个解决方式:

<ul>      <li ng-repeat="num in arr track by $index">{{num}}</li>  </ul>
<ul>      <ling-repeat="num in arr track by $index">{{num}}</li>  </ul>
</div>

为什么这就能解决呢?

我们先思考一下,如果自己实现类似Angular这样的功能,因为要在DOM和数据之间建立关联,这样,当改变数据的时候,才能刷新到对应的界面,所以,必然有个映射关系。

映射关系需要唯一的索引,在刚才那个例子中,Angular默认对简单类型使用自身当索引,当出现重复的时候,就会出错了。如果指定$index,也就是元素在数组中的下标为索引,就可以避免这个问题。

那么,对于对象数组,又是怎样呢?

比如说这么一个数组,我们用不同的两个方式来绑定:

function ListCtrl() {      this.arr = [];      for (var i=0; i10000; i++) {          this.arr.push({              id: i,              label: "Item " + i          });      }        var time = new Date();      $timeout(function() {          alert(new Date() - time);          console.log(this.arr[0]);      }.bind(this), 0);  }
function ListCtrl() {      this.arr = [];      for (var i=0; i10000; i++) {          this.arr.push({              id: i,              label: "Item " + i          });      }         var time = new Date();      $timeout(function() {          alert(new Date() - time);          console.log(this.arr[0]);      }.bind(this), 0);  }
</div>
<ul ng-controller="ListCtrl as listCtrl">      <li ng-repeat="item in listCtrl.arr">{{item}}</li>  </ul>
<ulng-controller="ListCtrl as listCtrl">      <ling-repeat="item in listCtrl.arr">{{item}}</li>  </ul>
</div>
<ul ng-controller="ListCtrl as listCtrl">      <li ng-repeat="item in listCtrl.arr track by item.id">{{item}}</li>  </ul>
<ulng-controller="ListCtrl as listCtrl">      <ling-repeat="item in listCtrl.arr track by item.id">{{item}}</li>  </ul>
</div>

示例地址 ,多点击几下:

我们惊奇地发现,这两个时间有不小差别。

关注一下在绑定之后,arr里面的数据,发现在没有加track by $index的时候,原始数据被改变了,添加了一些索引信息,这些索引是当数据产生变更时,Angular能够找到关联界面的重要线索。

Object {id: 0, label: "Item 0", $$hashKey: "object:4"}
Object {id: 0, label: "Item 0", $$hashKey: "object:4"}
</div>

如果我们知道数据的唯一性由什么保证,并且手动指定其为索引,可以减少不必要的添加索引的过程。

4. 降低数据的大小

看到这个标题,可能有人会感到奇怪。业务数据的大小并不是由程序员控制的,怎么降低呢?这里的降低,指的是降低那些被用于绑定到界面的数据大小。

数据的大小也会影响绑定效率,我们考虑一个屏幕能展示的数据有限,并不需要把所有东西都立即展示出来,可以从数据中截取一段进行展示,比如大家都熟悉的数据分页就是这么一种方式。

很传统的那种数据分页,是会有一个分页条,上面写着总共多少数据,然后上一页,下一页,这样切换。后来出现了一些变种,比如滚动加载,当滚动条滚到底部的时候,再去加载或生成新的界面。

如果说,我们有上万条数据形成的一个列表,但是又不打算用那么老圡的方式放个分页条在下面,如何在性能与体验中取得一个平衡呢?

接触过Adobe Flex的人,可能会对其中的列表控件印象深刻,因为就算你给它上百万数据,它也不会因此而慢下来,为什么呢?因为它的滚动条是假的。

同理,我们也可能在浏览器中使用DOM来模拟一个滚动条,然后利用这个滚动条的位置,从全量数据中获取对应的那一段数据,并且绑定渲染到界面上。

这种技术一般称为Virtual List,在很多框架中都有第三方实现,可以参见这篇文章: AngularJS virtual list directive tutorial

上面这篇文章做到的,只是初步的优化,并不精细,因为它假定列表中所有项的大小是一致的,而且要在创建阶段即已预知,这样就很不灵活了。如果需要做更精细的优化,需要做实时的度量,对每个已创建并渲染的子项作度量,然后以此来更新滚动区的位置。

参见demo: http://codepen.io/xufei/pen/avRjqV

5. 将数据的结构扁平化

那么,数据的结构又是怎样影响到执行效率的呢?我举一个常见的例子就是树形结构,这个结构一般人会使用ul和li之类的结构做,然后不可避免地要用递归的方式来使用MVVM框架。

我们考虑一下,为什么非要使用这种方式呢?其原因有二:

  • 给定的数据结构就是树形的
  • 我们习惯于使用树形DOM结构来表达树形数据

这个树形数据对我们来说,是什么?是数据模型。但是我们知道,比对两个树形结构是很麻烦的,它的层级使得监控变得复杂,无论是数据的逐一比对,还是存取器、或者刚被取消的observe提案,都会比单层数据麻烦很多。

如果我们想要用一种更加扁平的DOM结构来展示它,而不是层级结构,怎么办呢?所谓的树形DOM结构,能展现给我们的无非是位置的偏移,比如所有下级节点比上级更靠右,这些东西其实可以很轻易使用定位来模拟,这么一来,就有可能适用平级DOM结构来表达树的形状了。

回忆一下,MVVM,这几个字母什么意思?

Model View ViewModel

我们看了前两者了,但从未关注过视图模型。在很多人眼里,视图模型只是模型的一个简单封装,其实那只是特例,Angular官方的demo形成了这种误导。视图模型的真正作用应当包括:把模型转化为适合视图展示的格式。

如果说我们需要在视图层有比较扁平的数据结构,就必须在这一层把原始数据拍扁,举个栗子,我们要做一个动态的组织架构图,这个展开会像一个树,内部肯定也会有树形的数据结构,但我们可以同时维护树形和扁平的两种结构,并且随时保持同步:

原始数据如下:

var source = [      {id: "0", name: "a"},      {id: "1", name: "b"},      {id: "013", name: "abd", parent: "01"},      {id: "2", name: "c"},      {id: "3", name: "d"},      {id: "00", name: "aa", parent: "0"},      {id: "01", name: "ab", parent: "0"},      {id: "02", name: "ac", parent: "0"},      {id: "010", name: "aba", parent: "01"},      {id: "011", name: "abb", parent: "01"},      {id: "012", name: "abc", parent: "01"}  ];
var source = [      {id: "0", name: "a"},      {id: "1", name: "b"},      {id: "013", name: "abd", parent: "01"},      {id: "2", name: "c"},      {id: "3", name: "d"},      {id: "00", name: "aa", parent: "0"},      {id: "01", name: "ab", parent: "0"},      {id: "02", name: "ac", parent: "0"},      {id: "010", name: "aba", parent: "01"},      {id: "011", name: "abb", parent: "01"},      {id: "012", name: "abc", parent: "01"}  ];
</div>

转换代码如下:

var map = {};  var dest = [];    source.forEach(function(it) {      map[it.id] = it;  });    source.forEach(function(it) {      if (!it.parent) {          //根节点          dest.push(it);      }      else {          //叶子节点          map[it.parent].children = map[it.parent].children || [];          map[it.parent].children.push(it);      }  });
var map = {};  var dest = [];     source.forEach(function(it) {      map[it.id] = it;  });     source.forEach(function(it) {      if (!it.parent) {          //根节点          dest.push(it);      }      else {          //叶子节点          map[it.parent].children = map[it.parent].children || [];          map[it.parent].children.push(it);      }  });
</div>

转换之后的dest变成了这样:

[      {          "id": "0",          "name": "a",          "children": [              {                  "id": "00",                  "name": "aa",                  "parent": "0"              },              {                  "id": "01",                  "name": "ab",                  "parent": "0",                  "children": [                      {                          "id": "013",                          "name": "abd",                          "parent": "01"                      },                      {                          "id": "010",                          "name": "aba",                          "parent": "01"                      },                      {                          "id": "011",                          "name": "abb",                          "parent": "01"                      },                      {                          "id": "012",                          "name": "abc",                          "parent": "01"                      }                  ]              },              {                  "id": "02",                  "name": "ac",                  "parent": "0"              }          ]      },      {          "id": "1",          "name": "b"      },      {          "id": "2",          "name": "c"      },      {          "id": "3",          "name": "d"      }  ]
[      {          "id": "0",          "name": "a",          "children": [              {                  "id": "00",                  "name": "aa",                  "parent": "0"              },              {                  "id": "01",                  "name": "ab",                  "parent": "0",                  "children": [                      {                          "id": "013",                          "name": "abd",                          "parent": "01"                      },                      {                          "id": "010",                          "name": "aba",                          "parent": "01"                      },                      {                          "id": "011",                          "name": "abb",                          "parent": "01"                      },                      {                          "id": "012",                          "name": "abc",                          "parent": "01"                      }                  ]              },              {                  "id": "02",                  "name": "ac",                  "parent": "0"              }          ]      },      {          "id": "1",          "name": "b"      },      {          "id": "2",          "name": "c"      },      {          "id": "3",          "name": "d"      }  ]
</div>

我们在界面绑定的时候仍然使用source,而在操作的时候使用dest。因为,绑定的时候,不必去经过深层检测,而操作的时候,需要有父子关系来使得操作便利。

比如说,我们要做一个树状拓扑图,或者是MindMap这类产品,如果不作这样的考虑,很可能会直接把界面结构绑定到树状数据上,这时候效率相对会比较低些。

但我们也可以作这种优化:

  • 同时保存扁平化的原始数据,也生成树状数据
  • 把展示结构绑定到扁平化的数据上
  • 每当结构变更的时候,在树状数据上更新,并且在数据模型内部计算出界面坐标
  • 展示结构的扁平数据因为跟树状数据是相同引用,也被更新了,也就引发界面刷新
  • 这时候,界面是单层刷新,无需跟踪层级数据,效率可以提高不少,尤其在层次较深的时候

6. 小结

MVVM存在的意义就是尽可能提高开发效率,只有很极端情况下值得去优化性能。如果你的场景中出现非常多的性能问题,很可能是不适合用这类框架的业务形态。

总结一下我们的几种优化方式,他们的机制分别是:

  • 减少监控项
  • 加快变更检测速度
  • 主动设置索引
  • 缩小渲染的数据量
  • 数据的扁平化

可以看到,我们所有的优化都是在数据层面,不必刻意去优化界面。如果你用了一个MVVM框架,却为它作了各种各样相当多的优化,那还不如不要用它,全手工写。

针对其他MVVM框架,也大致可以用类似的几种方式,只是部分细节有差异,可以触类旁通。

</div>