运营商 PK BAT,谁的数据更有价值?
要谈起大数据,必然要提到BAT等互联网公司,它们在大数据领域是先发者,不过这也很正常,因为它本身是有数据基因的,其天然的在线性,其血液中流淌着BIT的血,并通过BIT的形式来售卖自己的产品和服务,它如果不提大数据,不提DT,反倒是不正常了,况且他的数据处理能力和应用成熟度也是领先的。但是,从对整个社会的价值角度讲,其数据也是很受局限的,而运营商的数据也许更有代表性和竞争力。
互联网大数据公司的劣势
先来说说BAT等互联网公司的大数据,其数据存在局部性、割裂性、封闭性和全面性等问题哦,当然这仅代表个人观点,如有异议,欢迎大家探讨:
(1)数据局部性:互联网公司的数据还是相互割裂的,比如淘宝只有淘宝的售卖数据,京东也一样,即使淘宝联合京东,他也只有在线销售的数据,它并没有百度搜索的数据,没有一家互联网公司的数据能够代表全局,具有战略眼光的互联网公司当然意识到这一点,当前的收购兼并相当程度是为数据而来。
(2)数据割裂性:互联网的数据整合困难,比如你在百度搜索了裤子,又在淘宝买了裤子,你的行为数据在两个地方以不同的形式存储,百度用了张三ID来代表你,而淘宝会用李四ID来代表你,但谁都不知道这是同一个人,还有广告个推的COOKIE等技术,也是短期的,不稳定的,当前大家都看得到很多互联网业务都依托QQ账号注册,非常方便,其实一定程度也反映了QQ希望ID融合的思路,互联网公司数据建模中的一个核心就是各类数据ID的统一。
(3)数据封闭性:很少有互联网公司愿意开放自己的数据,毕竟这是他的资产,是核心竞争力所在,因此所提的开放更多是商业模式层面和应用层面,而绝对不是指数据,“你来合作,数据给我”,现在互联网公司还是更多的在搜集数据,即使开放了一些,主要也是一些高度收敛的数据,当然一些互联网公司会相互合作交换数据,但这与开放无关,当前环境下,如何让互联网公司能够开放共享数据,从而推进社会的进步是值得研究的课题。
(4)数据全面性:在客户、业务、时间、空间等多个层次上,互联网公司的数据受限于自身的业务,其数据的范围和深度都是有限的,某宝也许对于线上购物用户有一定的刻画,但对于搜索领域、社交领域等很多互联网领域的信息仍然一无所知,同时其在空间、ID贯通上天生数据上的软肋,使得其对于人物兴趣偏好的客户还是比较片面的,以前某宝不是分析出来新疆的泳衣卖得好吗,但如果你深问为什么,可能只能回答也许新疆人好奇呗,但其实这个答案也许是瞎掰,我们只有知道买衣服的人从事什么职业,有什么特征,才能推测出具体的原因,从而制定更好的销售策略,谁知道买得人是不是个批发商啊或中间商呢。
为什么运营商的数据更具优势?
当然,BAT等互联网公司的数据也具有自己的优势,比如对于自己从事的垂直领域数据具有较大的发言权,但从全面性、完整性等角度讲,运营商的数据也许更有代表性和竞争力,为什么呢?
1.因为运营商是数据管道,任何个人、企业的上网和通话的行为都以BIT的形式流淌在运营商的管道里,并且任何时候你的位置都需要上报给运营商的基站以便能够随时沟通,移动互联网越发展,运营商的数据规模优势就越大。
2.运营商以号码为唯一的ID来整合各类数据,因此刻画客户的完整性是一般企业难以企及的,因为号码就是业务本身,而且还有终端ID作为移动通信网天生的业务属性而存在。
3.运营商承担着相当大的社会责任,从偏远地区不惜成本的建立基站可见一般,运营商也在不断践行这些责任,前段时间中国移动和招商银行准备建立征信公司就是起步的象征哦,但你一般不会看到互联网公司会有分享数据的行为,数据基本是在它的体内循环,毕竟是竞争所在,而三家运营商虽然业务上有竞争,但从大数据角度来讲,我甚至认为是互补的,可以形成良好的合作生态。
客观的来说,运营商的数据资源是比较全面的,基于这类数据,能更立体的描述客户,也许还能回答我们在移动互联网时代最为关注的三个问题?我是谁,我在哪里,我在干什么,这是很多企业的数据难以比拟的。
最具价值的运营商的八类数据
下面就从技术、业务角度简要解读下最具价值的运营商的八类数据(当然运营商的数据远不止于此),这些数据在运营商内是被安全保存的,用户不用担心个人隐私会被泄露,如果要开放这些数据,也需要征得个人的同意和授权,我仅仅希望通过运营商的数据的一些解释来表明,运营商大数据对于未来社会的推动作用是巨大的:
1.位置
其实运营商有多种定位客户的手段,潜力很大。
(1)以手机附着的基站位置来判定用户的位置,城镇的误差在几百米,农村、山区在1公里以上。
(2)以MR数据来判定用户的位置,主要基于多个基站与手机的信号的距离衰减来定位,目前误差已可以做到几十米。
(3)WLAN热点定位、应急车、无人飞机等等:也许是几米哦。
因此,并不是运营商不拥有精准的位置数据,更多的在于投入成本的考虑,比如MR数据,涉及所有基站测量数据的搜集整合,会涉及系统的标准化和扩容。
但通过运营商的位置等信息,可以帮助用户带来生活的极大便利,举个例子,比如你想买房吧,买在哪个地段呢,以前你可能只能依赖于特定的媒体或房产商的忽悠,但卖瓜的说瓜好到底有多少真实性呢?,你可不希望所住的小区基本是一帮小年轻,每天三更半夜的活动,你也不希望每天听到广场舞,你希望是高端商务区,周边邻居用户好歹是一群白领,又比如政府想规划一条路啊,想建立一个发电站啊,企业想开个店啊,广告主想租一个户外媒体广告啊,所有的场景大家都希望了解周边的人群情况,判断下这些人群是否是你的目标客户哦,而所有这些,运营商的数据就可以帮到忙。
2.身份
当前国家要求手机实名认证,无论是手机、宽带都会提供更多的信息,数据的准确度是很高的。也许银行会说我的客户资料更靠谱吧,但运营商不仅客户信息覆盖完整,还可以基于实际行为进行验证,这是一般银行及其它企业无法比拟的。通过身份信息,可以帮助金融机构快速的判定用户的信用程度,贷款也许不再像以前那么困难,在银行,小贷,保险,投资各个领域,运营商的数据都具有极大的应用潜力,可以有效推进社会诚心体系的建立,阿里现在推出了芝麻信用,实际上就是通过身份相关信息的分析,来测算你的信用程度,从而为不同用户提供不同等级的服务。
3.上网
移动互联网时代大家将衣食住行信息都搬到了线上,所有的上网数据都以BIT的方式传给运营商以便计费,包括访问了什么网址,下载了什么应用,访问了什么内容等,这些信息都蕴藏着极大的价值,堪称网上生活的记录仪,当前部分运营商业开始尝试提供访问明细详单查询服务,以帮助用户理解自己的上网消费行为,不仅如此,在用户允许的条件下,运营商基于这些数据的挖掘,还可以高效的撮合需求方和提供方,比如帮助女性化妆品公司将它的新产品推荐给喜欢时髦化妆的女性,而不是乱发广告,帮助出版商向用户推荐他感兴趣的书,而不是将卖的最火的玄幻类书籍推荐给一个老人读者,让垃圾广告滚蛋吧,这个就是大数据的魅力,可以真正做到个性化服务。
4.社交
运营商拥有天然的社交数据,即通信交往圈(含语音,短信及彩信等),在一定程度上,其粘性是远高于QQ等交往圈的。
(1)通信交往圈:基于通信交往圈的大小,主被叫,时间序列,很容易得到任何一个用户的社交特征,比如某人的影响力,人与人之间的亲密程度,人群之间的上下属关系,甚至可以得到人脉路径,理论上,任何两个人都可以通过多个中间人的传递而认识对方哦。
(2)簇群网络:中国移动话务经营近几年最成功的产品是什么?,那就是推出了虚拟网,家庭网,亲情网,校讯通系列以簇群为核心的产品,这些产品一方面极大的提升了存量客户的稳定度,另外一方面,基于这些数据天然的形成了以工作,家庭和朋友的社交网络,这些社交数据是运营商巨大的金矿哦。
相信未来,通过用户之间的历史交往分析,能帮助找到遗失的朋友和曾经的用户,让志同道合的朋友聚合在一起,让陌生的双方有缘千里来相会;通过历史的连接,可以追踪到失信用户的踪迹,帮助维护公司正当权益;通过社交异动分析,可以找到欺诈电话和欺诈用户的规律,让欺诈无处遁形,从而让社会更加和谐。有次路过相亲大会,发现有大量的人聚集在那里,还在到处贴小纸条招亲哦,如果有了大数据,我想一定会让大家更快找到心仪的对象。
5.支出
用户每月愿意在通信上怎么花钱,能够深刻的反映用户的很多特征。
(1)支付能力:ARPU即用户每月的消费总额(当然周期也可以到每天),这个数据很有价值,因为它一定程度代表了某人的消费能力,我们曾经将这个数据作为重要变量以区分商务人士,发现其效果远远好于其他注册的一些信息,一些消费的变化还能微妙的感觉用户,比如每到月底有些用户的消费会突然降下来,说明这个用户属于消费敏感型哦。
(2)消费类型:运营商有客户最为详实的消费账单,账单中的每个费用项是有业务含义的,比如流量费,短信费、语音费、新业务费等等,这些信息都能反映用户的一些特征,比如流量很多说明喜欢上网,没流量说明是老人、打工仔、农民的可能性会大点。
通过用户支出额度、支付及时性、欠费情况等的分析,可以构建用户信用模型,为金融企业提供风控服务,通过消费类型的判断,可以帮助更好的刻画用户,让企业减少广告投放的盲目性,比如一个ARPU不到30元的男性用户就不要考虑投放宝马汽车广告了,一个消费敏感型的用户商家可以考虑多发些打折优惠券,说不定他会更感兴趣。
6.通信
运营商通过每次通信行为数据(包括语音,短信或彩信)的记录进行计费,这个数据其实也有很大的价值,除了可以了解用户的通信使用情况(比如本地,漫游,长途,国际等),还可以通过对端解读更多的信息,从而为用户提供更为便利的服务,比如运营商发现用户喜欢煲电话粥,就会推荐虚拟网,亲情网等产品,让大家享受更为便捷的通信服务,实际上,未来,运营商可以联合更多的企业,为用户提供更多贴心的服务,比如发现用户经常打快餐电话,会结合位置推荐适合你的快餐店,同时将快餐企业的优惠券及时推送给你,让每个人都能享受到价格公道的服务。当然,通信中蕴藏的巨大数据价值还有待我们去挖掘,这里仅作抛砖引玉。
7.终端
移动互联网时代,我们每天面对最多的是什么,终端,是的,掌握了终端的数据,你就理解了很多行为,也理解了终端产业的发展,而运营商天然就有终端的基因。
(1)手机终端:基于移动通信协议,每次你使用通信业务,你的终端信息就需要上传到运营商的网络中,并被忠实的记录下来,这个信息我们一般叫作(IMEI),是这款终端全球的唯一标识。每个厂家在生产终端时,都有自己特定的IMEI的格式,这就是在当前移动互联网中准确识别你终端型号的基础,任何终端的使用,变更,都被运营商系统准确的记录下来,因此,关于终端的大多数分析运营商都能做哦。
(2)平板终端/PC:如果你通过固话宽带上网,我们的系统记录的是你的网卡标识MAC,照样能够识别出你哦,也许你会说MAC无法判别PC或PAD型号吧,好吧,我告诉你浏览网页的时候还有个数据叫UA,他暴露了你的终端型号哦,甚至是操作系统。 基于这些数据,能帮助各类企业理解终端产业的发展情况,比如任何一款终端的使用情况,用户使用特征,发展趋势,用户换机周期等等,从而帮助终端企业改进产品,从而为用户带来更喜爱的产品;还能维护公平正义,杜绝一些终端厂商销售造假,比如双11销量的造假,在运营商的数据里,有真实的用户终端使用记录,是否造假,一查就明哦。
8.时序
基于运营商数据的多样性,比如通过用户上网,位置,通话等行为按照时间排列,可以了解更多规律,从而提供更多服务。比如,基于大量通话时序分析可以找到诈骗电话和短信的规律,从而实现精准的定位,在欺诈发生的时刻进行拦截,这些规律包括某个电话交往圈很多,对端都不一样,每次通话模式类似等;也可以对于防止银行卡盗刷提供支持,比如发现当前刷卡的POS机所处位置时间与该卡归属户主号码当前所处位置时间无法匹配等。
当然,运营商的大数据远不止于上面几类,其大数据全面性、多维性、中立性、完整性是其它企业很难比拟的,而且通过这些不同维度数据的交叉关联,可以创造更多的新数据和新价值。当前国家发布了《促进大数据发展的规划纲要》,将数据上升到国家基础性战略资源的高度,提出要加强顶层设计和头筹协调,大力推动公共数据互联网开放共享,消除信息孤岛,很多省也提出了推动大数据产业的相关举措,比如贵州成立了国内首家大数据交易所。
作为大数据的拥有者,运营商更应该承担其相应的责任,在确保客户信息安全的条件下,通过开放共享的方式,积极参与大数据生态体系的建立,通过创造大数据价值应用,有效得连接个人,企业和政府,让大数据真正服务于社会。
Via:微信公众号 SDX