推特开源算法与开放革命

3 月 31 日,马斯克如约开源了一系列推特推荐算法代码

Twitter 开源推荐算法代码

这次开源代码的操作,出发点跟大多数商业公司不太一样。

我在《企业实践开源的动机》当中提到的动机,要么是扩展软件的生态,要么是拿来即用后的回馈上游,最为“无私”的动机,也是希望开源标准以保护现存业务。所有这些动机,企业开放的源代码,都不包含业务代码,而是支撑业务代码的基础软件逻辑。

这次推特开源推荐算法代码,是史无前例的。以往接近的类型,当属阿里巴巴公开 BLINK 代码,或者苹果公开 Darwin XNU 代码。不过,后两者都是基础软件,而推荐算法是业务代码。

BLINK 的一次性开源

XNU 的单向开源

这些代码公众只能阅读,而没有任何参与协同开发的途径,甚至代码应该如何跑起来,都是不知道的。

这样的开源,放在基础软件系统上,就像是一篇代码写成的论文,可以阅读和理解,但是不能共同创作,距离实际能工作的软件也还有一定距离。而放在业务软件系统上,其基础技术研究意义并不明显,因为业务系统往往跟具体场景绑定颇深,许多的代码逻辑没有对应的环境非常难以理解,更遑论复用。

业务系统开源缺乏实际环境与数据

我不是马斯克,也不知道推特做出这一决定真实的原因,但是从它当前产生的结果来看,这样的开源动作不是商业诉求推动的,除了可能满足马斯克的表现欲,这一事件将极大鼓舞推动社会开放革命和传播自由文化理念的人群。

权当这一猜测的佐证,就在几周之前,马斯克在推特上发文,称研发 ChatGPT 的组织 OpenAI 成立之初的目的是作为一个平衡谷歌影响力的开源非营利组织。

OpenAI 的初心是开源非盈利组织

开放革命的理念有两种出发点。

其一认为当前人类的创造力在信息极大丰富并自由流通的情况下已经井喷,如果仍然保留以往保护专利和商业秘密的法律体系、社会制度,将会阻碍创新与发展。持有这一观念的人通常援引人类基因组的开放协作和维基百科的成功及其经济学模式作为论据。

其二认为在线空间是人类社会的延伸,平台运行的规则和社会活动在线化的逻辑,其对应的代码如同现实世界中的规章和法律,如果不开放,是违背自由主义精神的。美国一部分州采用开源选举投票系统就是这一理念发展的成果。

这次推特开源其推荐算法代码,可以认为是第二种开放理念出发点的体现。

毫无疑问,推特是一个垄断型的在线社交平台。它首创的时间线事件流信息推送机制,极大的改变了在线用户的阅读习惯。这一机制实际上导致平台尤其是其推荐算法逻辑决定了用户将会在时间线上看到什么内容。如果这些算法逻辑是不透明的,那么用户毫无疑问是被剥夺了获取信息的自由,成为被投喂的对象。另一方面,平台垄断将导致广告主和内容创作者处于极度不利的地位,为了提升自己的曝光量,很多时候只能任凭平台予取予求。国内的抖音平台就学习了这一机制,可以类比抖音的用户、广告主和内容创作者的日常来理解这种情况。

只有开放垄断平台运行规则的代码,如今生活与在线空间密不可分的大众才有可能监督自己贡献注意力、创作内容的平台到底有没有公平的对待它的每一个用户。马斯克也是推特的用户之一,这次代码开源就发现了推荐算法中判断推文作者是否是马斯克做特殊处理的逻辑。

算法中特判老板的逻辑

应当说,开放革命和自由文化的理念离我们所生活的社会还很远,推特这次开源推荐算法代码的动作会不会引起一连串的连锁反应,尚且是未知数。除了凑个热闹和分析开源出来的代码以外,大家不妨也读一读相关的书籍文章,了解一下这些理念的背景和发展,为可能到来的变革做好准备。