12306真实建站成本调查:2亿缘何变5亿?
本报记者汤浔芳北京报道
一份招标采购合同,将 12306 网站再次推到风口浪尖。
日前,有媒体报道称,太极集团承接 12306 网站项目的两份合同被曝光,合同金额达到 2 亿元,加上此前爆出太极集团与同方集团分别中标 12306 网站,中标金额分别是 1.99 亿元和 1.3 亿元。至此,12306 网站的花费就超过 5 亿元。
“按照 12306 网站的访问量与订单成交量的需求来计算,满打满算,建立这个网站的总成本花费了 1 亿多元,最多不需要超过 2 亿元。”一位知名电商网站的技术负责人在向本报记者评价此事时说。
这位负责人认为,12306 网站的巨额花费是一种“不经济”的行为。12306 网站的访问高峰只有每年的春节与国庆节两次,使用频次太低。因此, 12306 网站可以开放接口,让淘宝、京东、携程等电商公司帮助卖票,这样可以节省很多资源。
最低 1 亿可建站
一般来说,建立一个网站的花费大约在硬件(服务器、数据库)、软件、人工研发等部分。
上述知名电商网站的技术负责人给记者算了一笔账:按照 12306 网站的访问量规模,硬件部分的服务器需要 1000 多台,一台服务器以均价 5 万~10 万元的成本来计,那么购买服务器的花费在 5000 万~1 亿元。数据库一般以 CPU 的个数来计算,一般一个 20 多万元,可能采用 32 个 CPU 或者 64 位,这部分钱约需要 1000 万。软件部分的花费需要 1000 万~2000 万。除了这些需要购买的费用外,剩下的便是人工费用,差不多 2000 人月(软件行业的工时计法,如 200 个人工作 10 个月),4000 万~5000 万元便足够。
如果网站对安全性、稳定性要求比较高,那么再加上一层防火墙,这个软硬结合的防火墙花费在 1000 万~2000 万之间。至此,花费 2 亿元,12306 网站便是豪华配置。
但是,依据目前媒体曝光的情况来看,12306 网站的花费总计超过 5 亿元。根据媒体的公开报道,2010 年 12 月 18 日,太极集团与铁道部签订了“铁路客户服务中心信息系统铁道部级一期工程”了金额为 5451 万元的合同;2011 年 5 月 18 日,太极集团与铁道部签订了金额超过 1.46 亿元的“铁道部级二期工程互联网售票部分”项目。此前,2011 年,太极股份和同方股份发布公告称,两家公司都中标了铁道部“新一代客票系统一期工程项目”,中标金额分别为 1.99 亿元和 1.3 亿元。
原本只需要花费 2 亿元的 12306 网站,缘何最后却花费 5 亿多元?媒体的公开报道称,12306 网站的采购是铁道部的“自循环”。太极公司给 12306 网站提供系统集成、软件开发运维服务,但其采购的产品来自中铁信金、中铁信等铁道部信息技术中心旗下的公司。并且,层层招标也滋生了大量的腐败空间。
此前,媒体公开报道称,IBM 也曾给 12306 网站的建设出了一套咨询方案,但并未被 12306 网站采纳。对此,这位软件行业人士称,这在软件行业亦属正常,国际 IT 公司进入政府行业大多是“曲线救国”。12306 网站的服务器由 IBM、戴尔、HP 三家提供,存储则由 EMC 公司提供。“中国很多政府行业都有一些国有的、本土的系统集成商,但这些系统商往往只是一个‘搬运工’的角色,服务器、数据库、部分软件还都使用国际 IT 大公司的产品。”
“12306 网站这个项目也是一波三折。”一位接近 12306 网站的业内人士告诉本报记者,此前,刘志军在任铁道部部长时,曾一度将 12306 这个项目按压不发。后来,刘志军下台,12306 网站的项目才得以上马。2011 年 6 月 1 日,12306 网站试运行,出售高铁、动车的火车票。2012 年 1 月 1 日,12306 抢在春运前正式上线。
改变系统架构
虽然花了 5 亿多元,但 12306 网站的用户体验却很一般,这也给了抢票软件以生存空间。
“从观测来看,12306 网站今年还是采用集中式的服务器架构,并没有采取互联网的分布式架构。”这位互联网技术工程师告诉记者,2012 年春节,大量的访问让集中式架构的 12306 网站陷入瘫痪,今年虽然增加了服务器,用户能够正常登录,但是这种架构本身仍然让服务器承压比较大。
与互联网不同的是,铁路系统往往参照政府行业,以安全、稳定为先,一般采用诸如 IBM 小型机的服务器,并且数据库往往不使用开源的,而是购买 Oracle 的数据库,一个数据库服务器的价格可能在 20 万美元。这一方面是硬件价格昂贵,造成建造网站的成本上升。另一方面,单个服务器的处理能力再强,亦有瓶颈,面对互联网的大流量并发,却无法通过扩展来分 解压力。
比如,火车票会有很多的查询操作,如查时间、座位、铺位,一趟车次不行,再接着查另一次。而伴随着大量的查询操作,下单的时候需要对数据库操 作。这意味着,用户每点一次查询,服务器就需要做出交互响应。而每秒种上亿次的请求,便很可能让网站崩溃。这些技术问题,12306 网站目前并没有解决。
针对 12306 网站的技术问题,网友“大学 001”成立了一个“12306ng.org”开源项目组,这里容纳了 1.2 万个技术工程师,从交互、票池等 10 个模式来给 12306 提供建议。这个项目组最大的宗旨是开源。
一位在 12306NG 开源项目组的互联网技术工程师表示,订票系统与电商的订单系统比较相似,它们都需要完成“占住库存”、“支付(可选)”、“扣除库存”的库存操作。并且, 电商网站有很多个品类,而 12306 网站只有订票一种品类,在宽带、并发量、数据交互上,电商网站的经验更丰富一些,12306 可以向电商网站学习。
而一位 CDN 行业的技术工程师告诉记者,此前,12306 网站的技术人员曾与阿里巴巴的技术工程师有过交流,阿里也建议 12306 网站采用互联网公司常用的分布式 IT。
“IT 投入并不是一次性的,接下来,每年的运维、设备的更新都要花一大笔钱。”一位互联网技术工程师称,而由于 12306 网站的特殊性,花了大钱可能也没有效果。
开放方解难题
虽然,互联网售票的数量与去年相比没有太多变化,但是购票人数与单位用户对网站的访问量提升了不少。来自网宿科技 WSA 监测平台的数据显示,今年 12306 网站日均点击量峰值(日均请求数)超过 100 亿,点击量比去年增加 3 倍多。
一个好的变化是,今年,在较高访问量下,12306 网站并没有瘫痪。网宿科技相关负责人告诉记者,今年,12306 网站使用了网宿科技 WSA 全站加速方案。不仅可以对文字、图片等静态内容进行加速,而且还可以对订票、余票查询等动态交互式应用进行传输过程的加速。这让面对“洪水”的访问 量,12306 网站基本可以正常登录。
但严峻的是,短短两年时间,网络售票已经成为铁道部售票的重要窗口。据铁道部运输局相关负责人介绍,目前在各个售票渠道中,互联网占 34%,电话订票占 4.3%,车站窗口占 38.6%,代售点占 18.5%,自动售票机占 4.6%。今年,网络购票提前 20 天,线下购票提前 18 天。那么,每到放票时,12306 网站会首当其冲。
不仅如此,火车票是时间段放票制,在供远小于求的情况下,会产生大量的抢票行为。于是在放票那一刻,几百万,甚至上千万人同时去反复查询。 2012 年春节期间,铁路放票主要集中在 8 点、10 点,15 点这三个时间段。而今年,全国 12306 网站的放票时间分为 10 个时间段,虽然在一定程度缓冲了抢票带来的访问压力,但是终究治标不治本。
“今年是第二年使用网络订票,用户点击量就增长了三倍,明年的春节会增长得更多。”一位 CDN (内容分发网络)行业的技术工程师认为,如果 12306 网站每年都采用购买硬件、不断扩容,那么 IT 投入将是一个无底洞,非常不经济。
一位负责航空电子售票的人士建议,“火车票应该与飞机票一样开放接口,让人们可以用更多的互联网手段来购票。”
此前,京东试水网销火车票被铁道部一纸命令叫停,携程铁友网,以及其他网络销售火车票等网站也一直处于“不死不活”的状态。除 12306 外,其他网站售票几无可能。
前述知名电商网站技术负责人提议,12306 网站可以做出开放,让互联网网站对 12306 网站的查询服务进行分流。实际上,12306 网站只需要收到预订成功火车票的相关数据交互便可,而这部分数据的传输可以延时来进行。
值得一提的是,12306 网站平常的访问量都比较小,只是春节、国庆等节假日,点击量迅速激增。这位电商公司的技术负责人建议道,“未来,12306 网站采用云租赁的模式来做,平常,12306 网站只需要维持正常的运营就好,一旦到了春节、国庆等访问高峰,租用云服务便可完成。”