如何提升 RailS 应用的性能?

dmc3 9年前

提升 RAILS 应用性能的一些建议

Is rails slow?

「铁路很慢」,你也许听过这个笑话,那么我们的 Rails 框架呢? 如果说 Rails 慢,那么如何提升 Rails APP 的性能就成了开发者们最关注的问题。

也许你听说过很多提升 RoR APP 性能的方法,它们有难有易,我们需要在选择其中最能帮助开发者脱离性能困境的。

这里列举了几种不同的提升 Rails 应用性能的方法。

1. 数据库索引

你的 APP 被 DB 性能限制,优秀的数据库索引可以在大型数据库表中带给你100倍的性能提升。然而并非所有 Rails 开发者都明白这一点有多重要。

添加 indexes 很容易:

class AddIndexToClientIndustry < ActiveRecord::Migration     def change       add_index :client_industries, :client_id     end  end

接下来就有无 Index 的情况做个对比。

有 Index 的情况:

 CREATE INDEX    addresses_addressable_id_addressable_type_idx  ON   addresses  USING btree  (addressable_id,addressable_type);   t1 = Time.now    c = Company.find(178389)    a = c.addresses.first   t2 = Time.now   puts "---Operation took #{t2-t1} seconds---”     Result with index:   ---Operation took 0.012412 seconds---

没有 Index 的情况:

DROP INDEX   addresses_addressable_id_addressable_type_idx;    t1 = Time.now   c = Company.find(178389)   a = c.addresses.first  t2 = Time.now  puts "---Operation took #{t2-t1} seconds---”    Result without index:  ---Operation took 0.378073 seconds---

0.378073 / 0.012412 = 30.46 没有索引比有索引慢了30.46秒。

因此工程师可以在所有引用参数,或者其他经常查询的参数中加入 Indexes。但是不能加太多, 因为每一个都会增加 DB Size 从而影响性能。

2. 数据库查询数量

RoR让编程更快捷,但反过来也让每条请求的数据库查询次数难以控制。举个例子,如果每一个 Client 有一或多个 Industries。 我们想要显示 Client List 和它们的 Primary Industries:

<% @clients.each do |client| %>    <tr>        <td><%= client.id %></td>        <td><%= client.business_name %></td>        <td><%= client.industries.first.name %></td>    </tr>  <% end %>    # app/controllers/clients_controller.rb  def index      @clients = Client.all  end

如果有50个 Clients, 则会有51条数据库查询:

Processing by ClientsController#index as HTML  SELECT "clients".* FROM "clients"   SELECT "industries".* FROM "industries" INNER JOIN "client_industries" ON "industries"."id" = "client_industries"."industry_id" WHERE "client_industries"."client_id" = 1 LIMIT 1  SELECT "industries".* FROM "industries" INNER JOIN "client_industries" ON "industries"."id" = "client_industries"."industry_id" WHERE "client_industries"."client_id" = 2 LIMIT 1  SELECT "industries".* FROM "industries" INNER JOIN "client_industries" ON "industries"."id" = "client_industries"."industry_id" WHERE "client_industries"."client_id" = 3 LIMIT 1  …

解决方案: Eager Loading

# app/controllers/clients_controller.rb  def index      @clients = Client.includes(:industries).all  end

现在只有2至3条数据库查询而非51条:

Processing by ClientsController#index as HTML  SELECT "clients".* FROM "clients"   SELECT "client_industries".* FROM  "client_industries" WHERE  "client_industries"."client_id" IN (1, 2, 3)  SELECT "industries".* FROM "industries" WHERE "industries"."id" IN (1, 5, 7, 8, 4)

3. 减少内存占用

  • 只用真正需要的gem
  • 使用时再加载对象
  • 分批处理海量数据。

一个使用真实数据的例子——find_each:

Using find:
t1 = Time.now    Company.where(:country_id=>1).find do |c|  puts "do something!" if ['Mattski Test'].include?(c.common_name)  end  t2 = Time.now  puts "---Operation took #{t2-t1} seconds---”
Result:
1 query, taking 46.65 seconds
Now using find_each:
t1 = Time.now    Company.where(:country_id=>1).find_each do |c|        puts "do something!" if ['Mattski Test'].include?(c.common_name)  end    t2 = Time.now  puts "---Operation took #{t2-t1} seconds---"
Result:
100 queries, taking 15.53 seconds in total (3x faster)

也有查询多了反而快的情况。

4. 使用缓存

缓存的使用对性能有巨大影响,首先确保数据模型正确,缓存可以帮你隐藏结构问题。

  • 对象缓存 在使用对象缓存的情况下,应该把查询方法的 include 去掉,避免关联查询无法利用缓存的现象。

  • 查询缓存 在不要求实时的情况下,对于统计类耗时查询,那么可以使用 memcache-client 将查询结果缓存到 memcached 里。

  • 页面局部缓存 对象缓存和查询缓存都会降低数据库访问负载,但如果 RoR 的负载很高,就只能依靠页面局部缓存了。

「web2.0网站比较常用使用页面局部缓存,Rails 的页面局部缓存有一个缺点,就是和页面查询结果对应的 Action 当中的查询语句要放在 View 里面,否则每次 Action 里面的查询还是会被执行,但是这样做会破坏程序代码良好的 MVC 结构。这种情况下,也可以采用另外一个 Cache 插件: better rails caching,在缓存页面的同时可以缓存 Action 当中的查询语句。」

5. 让 web 请求更快

只有少量可用进程用于服务 web 请求,因此需要使 web 请求更快。理想情况下, web 进程一般在毫秒内完成,1至2秒算是慢的,10秒以上是非常慢的。如果你的 web 请求很慢,你的Rails APP 将无法支撑同一时间的大量用户。

解决方案:使用后台运行 对长时间运行的项目使用后台运行诸如 delayed jobs, 从而释放你的 web 进程来解决更多请求。

6. 性能监控

对 APP 进行性能监控从而便于发现哪部分运行的慢,甚至快速定位到问题所在,可以利用国内应用性能监控做的最好的 OneAPM 监控工具。

OneAPM for Ruby 能够深入到所有 Ruby 应用内部完成应用性能管理和监控,包括代码级别性能问题的可见性、性能瓶颈的快速识别与追溯、真实用户体验监控、服务器监控和端到端的应用性能管理。 追溯性能瓶颈至:性能表现差的 SQL 语句、第三方 API、Web Services、Caching Layers、后台任务等。

alt text

图为使用 OneAPM 进行监控的总览页面,在这里可以对请求在服务器端耗时有个初步印象。可以直观的看到不同时间 web 事物、后台任务、数据库和外部服务的平响应时间、吞吐量、执行次数等指标,图中 web 事物在15:41的时候响应时间出现峰值,响应速度较慢。

alt text

为了进一步确定问题所在,点进 web 事物界面可以进一步了解各慢事物响应时间占比,快速定位到api/medicines/index的响应时间较长。

alt

点击错误的请求地址,将会列出该错误的 URL、第一次和最后一次发生时间、错误发生次数、监测到错误的 Agent 名称、错误信息和堆栈信息。

好的应用性能监控往往需要花大量的时间和精力实现,因此选择优秀的第三方监控工具将极大地提高运维效率,这对提升 Rails APP 性能有极大帮助。

7. 使用内存数据库

当查询和排序都在内存中完成,数据库将会运行的更快,而它们需要在磁盘上运行的时候就变得很慢。

解决方案:

  • 限制 DB 的大小,保证它完全适合内存。
  • 将不紧急的信息移出主要数据库,移入次要数据库或其他地方。
  • 如果有大量存储需求,考虑使用非关系型数据库。

8. 更多性能建议:

  • 对静态文件使用内容分发网络,例如使用 AWS CloudFront。
  • 对需要1-2秒的加载项使用延迟加载。
  • 使用服务导向架构,使一些进程在托管栈同步进行。

相信选择一种或几种适合的性能提升方法,可以使 RoR APP 更令用户满意。

备注:本文参考并翻译了 Matt Kuklinski 在 slideshare 上关于 提升 Rails 性能所分享的部分内容。

本文系 OneAPM 工程师编译整理。OneAPM 是应用性能管理领域的新兴领军企业,能帮助企业用户和开发者轻松实现:缓慢的程序代码和 SQL 语句的实时抓取。想阅读更多技术文章,请访问 OneAPM 官方博客