中国社会科学报记者 练志闲
在人工智能技术以指数级速度发展,不断影响知识生产与传播方式的当下,一场关于技术伦理与版权制度的全球性辩论正在火热进行。当生成式人工智能工具在眨眼间生成学术论文、在分秒间复现艺术大师的画作风格时,技术突破的耀眼光芒背后,一个核心矛盾逐渐浮出水面:如此令人瞩目的生成结果究竟建立在何种数据基础上?
分析显示,主流人工智能企业普遍通过非营利性在线图书馆等包含受版权保护内容的平台获取训练数据。有人认为,这些企业如此行事是出于故意,因为相较于事前申请授权,这些企业或许更倾向于事后致歉。众多创作者在社交平台谴责自己的作品被用于人工智能训练,人工智能企业最终可能会受到处罚,但个人作者不太可能从中获得任何实质性补偿,即便有,也是微不足道的。这些企业在最初决定使用盗版内容时,很可能就已经预估到了这一结果。
美国东北大学人工智能教学事务高级副主任兰斯·伊顿(Lance Eaton)近日在英国伦敦政治经济学院官网发文表示,对于人工智能使用受版权保护的信息,人们有许多担忧,而这种担忧是合理的。相关争议揭开了版权制度的深层矛盾,其中核心问题在于:若技术获得突破,最终让人们更加容易地获取信息,我们是否应固守既有版权框架,限制这种可能性?
伊顿表示,个人从盗版资源库获得更多信息被视为是合理需求,而企业基于相同逻辑的商业实践却遭到议论。无论是个人用户自己完成的盗版下载,还是人工智能企业系统性抓取受版权保护的信息,本质上都是在非法获取受版权保护的信息,都是使用了原创作品而没有向作者提供报偿,其差异在于规模化程度而非行为本质,只不过批评企业比批评非法下载受版权保护作品的无数个体要容易得多。
之前曾发生过出版机构将学者作品使用权出售给人工智能企业的事件,这引发了许多学者的愤怒与讨论。众所周知,部分出版机构的利润率相当高,有时还会向希望发表作品的学者收取费用,但在此基础上,这些机构还将相关信息再次出售以获取更多收益,伊顿认为这充分证明了这些出版机构在不断剥削学者。此外,这种现象的存在导致知识流向那些能够控制、购买或窃取信息的人和机构,而在这样的知识流通中,社会利益很少被考虑在内。
在伊顿看来,创作者只有借鉴某种文化,才能让其作品在该文化语境中具有可读性。版权制度设立的初衷是通过给予创作者从其作品中获利的有限期限,平衡创作者的利益和贡献。过去,创作者可以在其作品进入公有领域之前更新版权。如今,除非另有规定,否则受版权保护的作品要在作者去世数十年后才能进入公有领域。
伊顿研究了学术实践、文献获取等现象以及学者使用盗版资料的问题,探讨了学者如何看待使用提供盗版学术资料的网站与其学术身份之间的关系。伊顿发现,在许多学者看来,那些提供盗版资料的平台对他们的工作至关重要,甚至是不可或缺的。这些平台使他们能够紧跟学术前沿,参与到前沿学术研究中,进而产出成果。伊顿认为,这凸显了一个严峻问题,即大量研究被锁在付费墙背后,一些学者难以获取所需资源并有效开展工作。学者使用提供盗版资料的平台在一定程度上反映出控制作品版权并从中牟利的出版机构,未能合理、及时地将作品展现给公众。而如果科研人员不得不依赖盗版平台以维持学术产出,那么人们或许应该更多地去关注知识获取体系本身存在的问题。
从道德的角度出发,如果人们将创造性作品和智力成果建立在欺骗和能够窃取信息的技术上,甚至能够实现一键自动生成作品,那么如何确定学生与创造性作品和智力作品之间的道德关系?但若因此就全盘否定人工智能技术,无异于因噎废食。因此,伊顿认为这是如今人工智能领域内一个值得关注的重要问题。