../
谈一谈乱序时间线 ================ 2017-09-26 社交网络和 BBS 等其它早期互联网应用最大的区别就是“时间线”这一机制。早期社交网络 的时间线机制非常简单,就是将好友的状态按时间先后排列。如今,很多社交网络仍维持 了该机制,如腾讯的 QQ 空间以及微信朋友圈。这种按照时间顺序的时间线简单明了,当 用户刷到某个时间点的时候就会知道,自己已经看完了所有的最新的动态,可以结束了。 然而,一种新的时间线机制诞生了:乱序时间线。不过我必须说明一下,“乱序时间线”这 个词并不是一个被广泛接受的名字,只是我为了描述这一类时间线机制而生造出来的一个 词。 乱序时间线发明的具体时间,我并没有找到确切的记载。是在我的印象中,最早使用此机 制的似乎是 Facebook。Facebook 在时间线(或者 News Feed)中使用了一种名为 EdgeRank 的算法。2010 年,Facebook 公布了 EdgeRank 的一个简化版本,从命名上,它 应该是致敬了 Google 的 PageRank 算法。但是,EdgeRank 看上去似乎并没有 PageRank 那么复杂,但是因为这只是一个简化版本,所以后其真实情况仍未可知。这个简化版的 EdgeRank 算法采用了三个参数:亲密度、权重、时间。根据这三个参数,Facebook 会把 用户的好友状态进行评分,并把这些状态排列。这和 Hackernews 的排序算法颇有几分神 似。我还找到了一个专门介绍 EdgeRank 的小网站,主页的配图有种工业革命时代的 风格。 不过,今天,Facebook 已经不再使用 EdgeRank 这个算法,而是采用了更为复杂的机器学 习算法。新的机器学习算法相比 EdgeRank 参数更多,但是时间线机制总体来说还是类似 的。与此同时,Twitter 也开始采用了类似的机制,大约从一年前开始,Twitter 用户的 时间线上的推文不在像以前一样完全按照时间顺序排列,与此同时,算法还会自动选择把 一部分用户点赞的信息显示在时间线上。但是,相比 Facebook 来说,Twitter 的时间线 机制仍然是相对规整的。 和传统的时间线机制相比,这种乱序时间线自然是有些好处的。在传统的社交网络当中, 如果用户关注的用户数量过多,时间线就会变得拥挤不堪,让人陷入信息的海洋当中,不 知所措。像 EdgeRank 这样的算法,就起到了帮助用户进行选择的作用,从某种意义上节 约了用户的时间。看上去,乱序时间线的机制是先进的,是为用户着想的,但在事实上, 这其实是一种对用户的暴政,因为用户失去了自由,所有这些使用了乱序时间线的社交网 络,而不是让用户自由选择。这也就意味着,乱序时间线是被强加给用户的。 这种乱序时间线暴政有很多危害。首先,它纵容了用户毫无节制地关注其它用户。这在某 种意义上提高了用户粘性,但这也让社交网络的规模不受控制。如果使用传统时间线,当 关注人数过多,信息拥挤不堪的时候,我们会自然想到精简关注用户数。但是有了算法推 荐之后,这种担忧不复存在,关注的数量也不再有上限。第二,用户不再有选择自己看什 么内容的自由,算法会决定用户今天看什么不看什么。或许算法本身是大公无私的,但是 它并非运行于我们自己的电脑中,而是运行在服务器里,所以,它的运行结果是可以被服 务器管理者操控的。所以,到最后,就会演变为,由硅谷的巨头决定用户该看什么不该看 什么。互联网的去中心化让传媒权来到了每一个人的手中。只是,互联网的日趋集中化, 让传媒权又重新回到了少数人的手中,不能不说这是一种倒退。这似乎也能解释,为何川 普的大本营不是 Facebook,而是时间线机制更加传统的 Twitter。人的思维活动会不可避 免的受到外界的影响,人的思维活动会不可避免的受到外界的影响,这种操纵人心的权利 非常值得警惕。 国内的互联网自然难以免俗。知乎和微博早已相继引入了这种算法推荐的乱序时间线。这 些机制给了这些网站肆意进行限流和推广的权利,也让这些网站的商业运作有了更大的空 间。每天,都会有无数数据包,从闪着绿光并且嗡嗡作响的机器里,发往全球。这些数据 包,可能是一个经过精心调校后的人工神经网络的运行结果,也可能直接是某个幕后人物 精巧的设计。这种筛选,有的人喜欢,有的人不喜欢。只是,不喜欢的人无力改变,只得 选择逃离。 -------------------------------------------------------------------- Email: i (at) mistivia (dot) com