高并发秒杀系统分析
qam37b88
8年前
<p>项目源码:</p> <h2>一、秒杀系统中存在高并发的点</h2> <p style="text-align: center;"><img src="https://simg.open-open.com/show/38f61651feeb7366c2e81ddc23443f17.png"></p> <p>一个秒杀系统的基本流程基本如上所示</p> <p>用户请求详情页,系统时间,请求秒杀接口,执行秒杀操作都是位于服务端,都会被大量访问,那么我们优化系统高并发就是从这四点着手</p> <h2>1. 请求详情页的优化</h2> <p>详情页是属于静态济源,例如css,js等,对于这些静态资源,如果全部放在服务端主机中,势必对服务主机造成很大的压力,并发量也得不到支持,我们可以使用CDN来进行优化</p> <p style="text-align: center;"><img src="https://simg.open-open.com/show/57418702b2fb84d7e6c769d404a4e3cf.png"></p> <h3>什么是CDN?</h3> <p>使用CDN会极大地简化网站的系统维护工作量, 网站维护人员只需将网站内容注入CDN的系统,通过CDN部署在各个物理位置的服务器进行全网分发,就可以实现跨运营商、跨地域的用户覆盖 。由于CDN将内容推送到网络边缘,大量的用户访问被分散在网络边缘,不再构成网站出口、互联互通点的资源挤占,也不再需要跨越长距离IP路由了</p> <p><strong>传统的B/S架构:</strong></p> <p>B/S架构,即Browser-Server(浏览器 服务器)架构,是对传统C/S架构的一种变化或者改进架构。在这种架构下,用户只需使用通用浏览器,主要业务逻辑在服务器端实现。B/S架构,主要是利用了不断成熟的WWW浏览器技术,结合浏览器的多种Script语言(VBScript、JavaScript等)和ActiveX等技术,在通用浏览器上实现了C/S架构下需要复杂的软件才能实现的强大功能。</p> <p style="text-align: center;"><img src="https://simg.open-open.com/show/4dcad9445b7874f0756e0f0dcb127f3d.jpg"></p> <p>①用户在自己的浏览器中输入要访问的网站域名。</p> <p>②浏览器向本地DNS服务器请求对该域名的解析。</p> <p>③本地DNS服务器中如果缓存有这个域名的解析结果,则直接响应用户的解析请求。</p> <p>④本地DNS服务器中如果没有关于这个域名的解析结果的缓存,则以递归方式向整个DNS系统请求解析,获得应答后将结果反馈给浏览器。</p> <p>⑤浏览器得到域名解析结果,就是该域名相应的服务设备的IP地址。</p> <p>⑥浏览器向服务器请求内容。</p> <p>⑦服务器将用户请求内容传送给浏览器</p> <p><strong>加入cdn后:</strong></p> <p>在网站和用户之间加入CDN以后,用户不会有任何与原来不同的感觉。最简单的CDN网络有一个DNS服务器和几台缓存服务器就可以运行了。一个典型的CDN用户访问调度流程</p> <p style="text-align: center;"><img src="https://simg.open-open.com/show/162a8ade9600869c60c0afa44321cec0.jpg"></p> <p>①当用户点击网站页面上的内容URL,经过本地DNS系统解析,DNS系统会最终将域名的解析权交给CNAME指向的CDN专用DNS服务器。</p> <p>②CDN的DNS服务器将CDN的全局负载均衡设备IP地址返回用户。</p> <p>③用户向CDN的全局负载均衡设备发起内容URL访问请求。</p> <p>④CDN全局负载均衡设备根据用户IP地址,以及用户请求的内容URL,选择一台用户所属区域的区域负载均衡设备,告诉用户向这台设备发起请求。</p> <p>⑤区域负载均衡设备会为用户选择一台合适的缓存服务器提供服务,选择的依据包括:根据用户IP地址,判断哪一台服务器距用户最近;根据用户所请求的URL中携带的内容名称,判断哪一台服务器上有用户所需内容;查询各个服务器当前的负载情况,判断哪一台服务器尚有服务能力。基于以上这些条件的综合分析之后,区域负载均衡设备会向全局负载均衡设备返回一台缓存服务器的IP地址。</p> <p>⑥全局负载均衡设备把服务器的IP地址返回给用户。</p> <p>⑦用户向缓存服务器发起请求,缓存服务器响应用户请求,将用户所需内容传送到用户终端。如果这台缓存服务器上并没有用户想要的内容,而区域均衡设备依然将它分配给了用户,那么这台服务器就要向它的上一级缓存服务器请求内容,直至追溯到网站的源服务器将内容拉到本地。</p> <p>DNS服务器根据用户IP地址,将域名解析成相应节点的缓存服务器IP地址,实现用户就近访问。使用CDN服务的网站,只需将其域名解析权交给CDN的GSLB设备,将需要分发的内容注入CDN,就可以实现内容加速了。</p> <h2>2. 获取系统时间操作的优化</h2> <p>获取系统时间的操作不用优化,java访问一次内存大概10ns,1,000,000,000 纳秒 = 1秒 ,也就是说1s中可以访问1,000,000,00次内存,所以根本不需要我们去优化!</p> <h2>3. 秒杀地址接口获取的优化</h2> <p>cdn适合存放不变的内容,例如css,js等静态内存,所以它不适合放在cdn中缓存,但是适合在服务端缓存,例如redis,甚至可以做redis集群。</p> <p style="text-align: center;"><img src="https://simg.open-open.com/show/83ca27cd8f6f01a789a39fafc78226c3.png"></p> <h2>4. 秒杀操作高并发的问题(重点)</h2> <p>1. 这个也是不能使用cdn缓存的,但是能不能使用redis做缓存呢?秒杀首先会在数据库中减库存,那我们能在redis缓存中做减库存操作吗?肯定不可以,因为这会导致数据一致性的问题,凡是需要进行写操作的数据都不适合做缓存。</p> <p>2. 高并发的点还在于,热点商品竞争上。当多个用户在秒杀同一个商品时,由于mysql的事务机制和行级锁,一个用户在获取该商品额行级锁进行减库存操作时,其它的用户只能等待,这就变成了串行的操作,这就是秒杀操作高并发中最困难的优化点</p> <p style="text-align: center;"><img src="https://simg.open-open.com/show/1d1e4990ad41e767c89eada5d9f1d305.png"></p> <h2>二、如何优化秒杀操作</h2> <h2>第一个方案:</h2> <p style="text-align: center;"><img src="https://simg.open-open.com/show/09f15592e31d3f5267e150421f8c50d2.png"></p> <p>首先,可以用NoSQL例如redis作为一个原子计数器,记录商品的库存,当用户秒杀该商品时,该计数器便减1;</p> <p>然后记录哪个用户秒杀了该商品,作为一个消息,存储到分布式mq中(例如alibaba的rocketMQ);</p> <p>最后由服务端的服务去执行数据库的update操作。</p> <h3>这个方案有什么问题呢?</h3> <p>1. 运维和不稳定性,NoSQL不如MySQL稳定,所以需要高水平的运维团队</p> <p>2. 重发秒杀的问题。在记录行为信息中,分布式MQ只知道记录哪个用户在秒杀该商品,但是不知道该用户是否已经重复秒杀过该商品,因此还需要另外维护一个NoSQL,来记录哪些用户已经秒杀了哪些商品,加大了成本</p> <h2>第二个方案:在mysql上优化</h2> <p>我们之所以考虑第一个方案,就是因为MySQL低效,为什么低效</p> <p>我们来看看mysql执行一条update的并发量:</p> <p style="text-align: center;"><img src="https://simg.open-open.com/show/7f10786fb62027a2b8b75443cde70bf7.png"></p> <p>可以看到,mysql可以抗住大约4wQPS,那么MySQL本身是不低效的,但是是什么地方使得它低效呢?</p> <h3>我们分析一下瓶颈所在:</h3> <p style="text-align: center;"><img src="https://simg.open-open.com/show/939c378ecccae4cb3327563b0c3bf24b.png"></p> <p>服务端的程序和数据库一般放在不同的主机上,当服务端进行减库存操作时,会发送update的sql语句到数据库中,这里会存在一个网络延迟和gc,同样insert语句记录秒杀明细也会存在网络延迟和gc,假如一次的网络延迟和gc加起来的总延迟是2ms,那么1s就只能进行500次的秒杀操作</p> <p>同城机房:</p> <p style="text-align: center;"><img src="https://simg.open-open.com/show/a0c333289b2a63d4b48adc752b8f5543.png"></p> <p>异地机房:</p> <p style="text-align: center;"><img src="https://simg.open-open.com/show/ab14598ee1290575b5dae0395f5aebcb.png"></p> <h3>优化:把服务器的执行逻辑放在mysql服务端,避免网络延迟和gc延迟</h3> <p>两种方案:</p> <p>1. 定制sql方案:update /* + [auto_commit] + */,需要修改mysql源码(太困难)</p> <p>2. 使用存储过程,在mysql中去完成整个秒杀操作的事务(即把下面这个操作放到存储过程中),虽然存储过程在互联网中很少用,但是在</p> <p style="text-align: center;"><img src="https://simg.open-open.com/show/27b210df570def8c30e711bdc171e2dd.png"></p> <p> </p> <p> </p> <p>来自:http://blog.csdn.net/jeffleo/article/details/56015710</p> <p> </p>