算法的广泛应用深刻地改变着人们的日常工作与生活,为我们带来了前所未有的便利。但不可否认,算法的应用也产生了不少负面影响,如“信息茧房”、诱导沉迷、大数据“杀熟”、侵害劳动者权益等现象的浮现。对算法应用影响的讨论逐渐引发广大社会科学研究者乃至社会大众的关注和参与。然而,在这些相关的讨论中,存在着一些亟待澄清的误区。
有人倾向于认为这些负面影响多是由算法本身造成的,甚至有批评认为算法是“万恶之源”,主张应将一切的不良后果归咎于算法,因此要求对算法进行公开审计,实现算法透明,让社会大众知晓算法是如何工作的。另外,还有一部分批评者将矛头直指互联网平台企业,认为平台企业应该对算法应用造成的负面影响负主要责任,其理由在于,算法是由互联网平台开发并部署的,反映的完全是互联网平台的意志,平台借助算法达到其自身利益最大化的目标,因此自然应当对算法造成的负面影响负责。
当代技术思想家布莱因·阿瑟(W.Brian Arthur)指出,技术的本质是通过捕获或利用现象,对现象进行的有目的的编程。阿瑟的讨论主要针对基于物理现象的技术而展开,他将这些称为“标准技术”。实际上,算法不同于阿瑟所谓的这些标准技术,它通常是基于逻辑和数学现象的,更加复杂的算法甚至还要捕获或利用人类社会的组织和行为现象。但与此同时,算法始终没有脱离“有目的的系统”这一技术本性,仍旧是为了实现特定目的的手段。从本质来看,算法是为实现特定目的而定义的一系列计算规则的组合。
算法与大多数技术一样,都是组件间存在丰富相互作用的复杂系统,这在目前广泛应用的深度神经网络算法模型上有着最典型、最直接的体现。神经网络算法模型由大量的感知机学习器组成,感知机之间以一定的网络结构相连,模型在预测任务上的优异表现通常被认为是其作为整体系统的涌现能力。很多更复杂的算法模型与神经网络算法类似,本身并不透明且缺乏可解释性,而它们成为“黑盒”都并非算法开发者刻意为之。对算法专家来说,想弄清楚其中的工作和决策机理或许都是不小的难题。理论上讲,算法公开与透明会有利于增加用户对算法的信任,但在实际中这是否可行且必要,以及用何种方式、在何种意义上实现公开与透明,都是值得深入探讨的问题。
此外,算法还是开放的复杂系统。它不仅包含内部各组件间的复杂组合与互动,还持续地与外部输入(也即数据)发生着动态交互。数据通过影响模型参数,进而影响算法决策。用于训练模型的数据虽是一种外在于计算规则系统的要素,但却在算法的后续决策中扮演至关重要的角色。许多因算法应用而带来的负面影响,如算法歧视,很大程度上正是由训练算法时使用的数据存在偏差所导致的。2014年,亚马逊开发了一个自动筛选求职者简历的招聘算法。投入使用后,人们发现该算法存在“歧视”女性求职者的现象。究其原因,亚马逊用于训练该算法的数据是过去十年间求职者的简历,而对于这样一家科技行业的企业来说,求职者又大多是男性,由此训练得到的算法系统在决策时会倾向于优先选择男性求职者,甚至只要简历中出现“女子”相关字样,就会被赋予一个较低的权重。因此,在讨论算法的影响时,数据的作用不容忽视。数据的来源、贡献者和数据本身的质量都会直接影响算法的表现。
算法开放系统的特性以及数据在其中发挥作用的方式,都决定了其后果往往不是某个工程师、部门或平台企业能够单方面操控的,而是多元主体共同作用的结果。以外卖平台的配送调度算法为例,骑手、订单消费者、商家都在其中贡献着数据。骑手过往的接单行为、送达时长、路线选择习惯,消费者的下单时间、位置分布、评价反馈,商家的供给能力、备餐速度等数据,均反映了各主体的行为与偏好。骑手希望提高收入、优化工作安排,消费者追求快速配送与优质服务,商家关注餐品送达时的品质与自身的经营收益,各主体的目的既有交叉重叠,又存在一定的张力与冲突,而那些体现了多元目的与需求的数据,共同构成了算法优化决策的依据,并直接影响配送任务的分配与调度。如果我们将算法视为一种“有目的的系统”,那么其最终的目的一定不简单等同于作为算法开发者的互联网平台的目的,而是多重目的交织下的复杂互动结果。
对算法的治理应建立在理性认识算法本质的基础上,充分考虑其复杂性特征,这需要贯彻一种生态视角。首先,由于算法应用的负面影响并非是由算法本身带来的,针对算法的监管,需审慎权衡社会成本与信任收益。与其不计成本地追求事前的算法公开和透明,不如将用户对算法的信任建立在完善的问责与追责机制基础上。其次,算法创新与算法规制是需要考量的一对关键变量,二者间也存在生态性关联,对算法进行过严的事前监管很可能会抑制企业的创新积极性。就算法技术特别是原创性技术创新方面,美国仍居世界领先地位。需要关注的是,目前美国正在酝酿松绑算法监管等一系列计划,其背后的战略目标在一定程度上指向与中国的科技竞争。鼓励算法技术创新仍是当下应当坚持的首要方向,而互联网平台企业无疑是算法创新的重要力量。最后,避免算法应用所造成的负面影响,不能仅仅依靠平台企业,还需要政府、平台企业、用户等各方主体的协同合作与共同努力。特别要注重提升社会大众的数字素养,让算法能够被理性正确地认知和使用。
营造良好的算法生态,将是实现算法向善,让算法更好地服务于人类,助力人类自身发展的重要前提。
(作者系北京大学社会学系助理教授)