外国科学家探秘新浪微博

jopen 12年前

外国科学家探秘新浪微博

        我们都知道,新浪微博是一个很和谐的地方,这也没什么需要探寻或质疑的成分。然而,有那么一群人对新浪微博的和谐机制产生了兴趣。这些人思想不正常吗?不,因为他们是一群外国人。

        以 Dan Wallach 为首的计算机专家们今日通过 technologyreview 发布了他们对新浪微博和谐机制的研究结果。令他们感到好奇并加以研究的是,新浪微博作为一个用户破 4 亿、每天产生 1 亿条微博的社交平台,究竟如何完成如此大规模的平台内容净化工作,这背后又需要多少的工作人员。

        很明显,Dan Wallach 和他的同事们生活在中国,或至少是新浪微博的用户。他们准确地分清了用户自主删除微博与平台和谐删除微博的区别,还划定了自己的研究范围——研究不恰当微博在发出后多长的时间内会被系统删除,从而推测平台背后的运行方式。

        监测微博上的所有用户很不现实,研究团队因此选定了一个有代表性的样本团体——样本中只有 3500 位用户,但他们在研究前 15 天内发布了全站 12% 的不和谐内容。监测结果显示,30% 的微博被当即删除(1 分钟内),另外有 5% 会在 8 分钟内被删除;总体上,90% 的不恰当微博会在一天内被删除,偶尔会有一些漏网之鱼能够存活一天以上。

        低延迟的删除效率透露了一个事实,新浪微博负责净化内容的工作人员工作得很卖力,而且人很多。有多少人呢?Dan 估算,一个检查员每分钟审查 50 条微博,每天连续工作 8 小时,这就需要 4200 个人轮岗。当然,这只是理想情况,现实数字会更大。

        好奇心害死猫,Dan 的研究团队又对这些工作人员的作息产生了兴趣。经过他们的观察,新浪微博在夜间的删除效率普遍低于白天,Dan 认为这是因为上夜班的人比较少。令人感兴趣的是,观测结果显示,晚上 7 点左右新浪微博的删除效率会出现短暂性的下降。Dan 解释道,这大概是因为新闻联播的播出。当然,这是一个外国人能给出的合理解释,也有可能删微博的是军人。

        众所周知的是,新浪微博会通过一系列辅助机制帮助净化平台内容,例如监控曾有不良记录的用户、敏感词检查等等。Dan 表示,他们会继续对此进行进一步的分析研究,比如新浪微博后台如何制定微博审查的优先级标准。最后,Dan 希望团队的研究不会被不可抗力所阻挡,希望他们的微博账户及 Tor 网络连接不要被查封。