百度迁徙用到了哪些技术?
最近一朋友问我百度迁徙图到底是怎么弄出来的?而在这过程中发现我原来也有我好多不明白的地方,这也激发了我这个技术宅的兴趣,我到处找资料研究终于知道了基本的整个原理,后来想想肯定也有很多朋友不知道这背后的原理,那就分享出来做个科普吧。
为什么会有地理定位这个技术?
一谈到为什么会有定位技术,可能很多人的第一反应是认为这个发明就是为了让自己看地图还有找餐馆的,呵呵,其实事实相去甚远。
现在我们从源头来讲,为什么我们会有地理定位技术?
其实最早的定位系统是来自美国国防部 50 年代的军备竞赛,当时苏联在 1957 年发射了 Sputnik-1 人造卫星,而美国不甘示弱,1958 年,为了实现军事上的高精确打击,美国海军开始研制子午仪卫星定位系统。1973 年美国建立国防导航卫星系统 DNSS,此后 DNSS 改名为 Navstar 即授时和测距导航卫星或者说是全球定位系统(Navigation Signal Timing and Ranging/Global Positioning System),后来简称 GPS。1994 年,终于完成覆盖全球 98% 的卫星系统。
从军备竞赛到全面民用这和互联网的发展有相似之处,互联网的前生就是为了防止遭到苏联的核打击后被摧毁重要中心节点导致全面瘫痪,进而建立起的去中心化网络,这个意外的军事发明也在随后被民间大量普及。
一切都是意外啊亲,这个发明真的不是用来给你找餐馆的。
百度如何做定位的?
百度、苹果谷歌是不是只用 GPS 定位呢?错了,因为民用 GPS 的定位误差大,没有军用 GPS 定位准确,而科技公司不可能发射高精度卫星,只能退而求其次,除了用 GPS 定位以外还会用其他办法为用户做到更精确的定位,下面开始介绍百度定位时用到的方法。
百度地图定位用到的主流方法:
1)GPS 定位,主要用于室外导航。
2)IP 定位,这在 PC 时代一直都在用,比如以前用 QQ 外挂的时候可以看到对方在那座城市和网吧,就是用的 IP 定位技术。但是 IP 定位有个弱点就是范围不是太精确,只能定位到街道级别。
3) 基站定位,用户用 2G、3G 和 4G 网络都是要经过运营商基站的,那么通过获得用户所使用的基站位置,判断用户位置,定位半径精确范围是 265 米左右。
4)WIFI 定位,WIFI 定位是最为精准的,因为 WIFI 的强度半径相比于其他来说都最小,当然这里的 WIFI 指的是大商场或者咖啡厅的 wifi,通过这些公用 WIFI 就能相当精准的收集到信息,定位半径精确范围是 35 米左右。
5)混合定位,就是将上述定位方法全部混合,定位半径精确范围是 60 米左右。
基于以上定位方法,使用大数据相关技术才能实现比较精确的定位。例如,一个用户既连着 WIFI 又连着基站的 4G,那么百度就可以根据该 WIFI 在和基站在数据库中的空间坐标以及他们的辐射半径来计算出更精确的位置范围。百度还会根据用户连接基站时移动中的信号强弱变化确定用户位置,计算起来相当 复杂。
上面谈的都是如何更精确定位的技术,现在谈下如何为用户提供决策方案的技术。百度通过收集大量用户在某些地段移动的设备、速度进而来判断某个路 段的交通拥堵情况,这就是百度地图的“实时路况”功能,而百度导航又会根据“实时路况”为用户提供出行最优解决方案,当然,目前除了为个人出行提供决策方 案以外,已经在为交通部的道路规划提供决策支持。
百度迁徙的数据从哪里来?
好了,现在再谈最后一个问题了,有了这样的技术后,百度迁徙的数据从哪里来。
数据来源一:地图用户。凡是使用百度地图的用户,百度就可以收集到对应数据,根据 CNNIC 发布的《2013-2014 年中国移动互联网调查研究报告》,2014 年 8 月百度地图占领地图市场的 63.7% 的用户,这也就是说百度能够收集到绝对多数的移动互联网用户的出行数据。
数据来源二:第三方应用。很多手机应用都是需要地理定位的,比如天气应用,再比如同城类应用,而普通开发者一般是没有强大定位技术的,只能借助 于第三方开放定位技术平台,在国内做的最好的两家也就是百度地图开放平台和高德地图开放平台,而选择百度地图开放平台的应用,只要用户使用该应用,百度就 能获得更多的数据。
目前墨迹天气和百信网用的就是百度地图的开放技术,还有更多安装了百度地图的应用百度就能收集数据。
这两个数据源就是百度最主要的数据统计来源,目前百度已与交通部有深入合作,预计后期会有可能来自交通部更加精确的数据。
最后,百度用这些定位数据的变化在春节期间做出了很 diao 的“百度迁徙”。
结语
百度迁徙图非常有意思,我们看到的是一个最后呈现的完整数据图,但是在这背后确有十分复杂的高精尖技术做支撑,远比我们想象中的复杂。同时我们 也看到地理定位技术最先发源于军事,最后又由于移动时代的商业发展诉求得到了更为深入的发展,所以顺着这次百度迁徙我们也再次看到了驱动技术发展的本质— 恐惧与欲望。