特定的时代背景对法学知识形态的形成具有决定性影响。大数据时代背景下法学研究的新知识形态是数据法学。数据法学有其独立的研究对象、研究方法和研究内容。数据法学是继法教义学、实证法学、计算法学之后的第四种法学知识形态,是法学研究创新发展的新方向,同时也是一门独立的法学新学科。
数据法学的概念及研究对象
当前,我们处在大数据时代。不同于传统时代,大数据时代的科学新范式是数据科学。根据不同时期,可将科学范式区分为实验科学、理论科学、计算科学、数据科学。数据科学新范式反映在法学研究中即为数据法学。基于此,数据法学是以法律数据为研究对象,运用数据科学方法创造法律数据产品和发现法学知识的独立的法律科学。
数据法学有其特定的研究对象,即法律数据。法律数据就是指以任何电子或者其他方式对法律信息的记录。作为数据法学特有的研究对象,法律数据可被界定为:以任何电子或者其他方式对形式完好的、具有意义的、能给予相关参考点一个值的法律信息的记录。需要指出的是,一串不具有任何意义的数据不是数据法学的研究对象。
当数据与其他数据组合在一起,且能给予相关参考点一个值,即能解释数据的意义时,该字段才是信息。
尽管法律数据概念的外延既涵盖数据法律规范文本,也涵盖宪法、刑事法律、民事法律与行政法律诸规范文本,但法律规范不是数据法学的直接研究对象。只有当数据法律规范作为数据分析中自然语言处理的对象,即作为数据分析的对象时,数据法律规范才成为数据法学的研究对象。同样地,作为数据分析对象的宪法、刑事法律规范、民事法律规范与行政法律规范才是数据法学的研究对象。虽然数据法律规范可同时作为数据法学和数据法教义学的研究对象,但作为数据分析对象的法律规范与作为法教义学规范分析对象的法律规范明显不同。具言之,数据法学研究建立在基于数据驱动的数据分析基础之上,而数据法教义学研究建立在数据法律规范分析的基础之上。数据法律现象、数字法律现象、信息法律现象也不是数据法学的直接研究对象。
数据法学的研究方法
数据法学有其特定的研究方法,即法律大数据方法。法律大数据方法是指运用机器学习算法对法律大数据进行抓取、维护、处理、分析,从而发现法律数据之间的相关关系,并据以创造法律数据产品和发现法律规则、原则、制度等法学知识的科学方法。通过运用法律大数据方法,研究者可实现对复杂法律系统的理解和对未来法律事件的预测。法律大数据是法律大数据方法的物质基础,机器学习算法是法律大数据方法的技术基础,算力是法律大数据方法的动力基础。三个方面的基础条件共同构成法律大数据方法的物质特征、技术特征和动力特征。只有具备前述三个特征的法学研究方法才是法律大数据方法。
数据法学研究的本体论内容
数据法学本体论所要回答的问题是:数据法学这一存在的存在是什么?显然,数据法学研究对本体论的追问是以基于数据驱动的数据分析为基础的。质言之,数据法学研究既非以形而上的哲学思辨为基础,也非以规范分析命题为基础。此与数据法教义学对本体论的追问显著不同,后者以法律规范分析为基础。从基于数据驱动的数据分析出发,可将数据法学研究的本体论简约为权益保护论。基于此,刑事法律数据的本体论是刑法法益保护,民事法律数据的本体论是民事权益保护,法律数据的本体论是数据权益保护。
数据法学研究的认识论内容
数据法学研究的认识论需要回答的问题是:数据法学是关于因果关系的知识,还是关于相关关系的知识?从认识论角度考察,数据法学研究的内容包括法律数据产品的创造和法学知识的发现两个方面。前者是后者的前提,后者是在前者基础上的知识发现。数据法学认识论坚持主张,数据法学是关于相关关系的科学知识。
法律数据产品的创造是法律规则、原则、制度诸法学知识发现的前提。数据法学认识论坚持主张,数据法学是关于相关关系的知识。基于经验主义认识论立场,数据科学认为,数据自己会说话。持经验主义认识论立场的数据科学强调,“我们不需要知道‘为什么’,而只要知道‘是什么’就够了”,坚称自己不属于传统科学的阵营,并始终认为基于数据科学方法发现的知识是关于“是什么”而非“为什么”的知识。
数据法学的研究定位
特定的科学研究范式对法学知识形态的发展具有决定性的影响。回顾科学研究范式的演进历程,考察法学知识形态的发展脉络,我们认为数据法学是继法教义学、实证法学、计算法学之后的第四种法学知识形态。
实验科学研究范式对法教义学知识形态的形成具有决定性的影响。法教义学是一门视现行法律秩序为信条,并以此为基点开展法律解释学研究的规范科学。
在20世纪,现代科学研究不再停留在“实验科学”阶段,而是向“理论科学”迈进。承继理论科学范式,法学知识形态开始向实证法学演进。基于数据,通过数学模型或者理论模型,可分析、评估与预测法律事实状况与法律事件的发展方向。因此,实证法学研究的是“现实中的法”,而非“当为规范”。先例是现实中的法的典型形式,故案例研究是实证法学研究的重要形式。多数学者认为,实证研究既包括定性研究,也包括定量研究。
在20世纪中后期,科学研究范式演进到计算科学。与之相随,法学知识形态开始向计算法学转型。计算法学是对计算科学范式的必然反映。斯坦福大学计算机科学教授迈克尔·格尼塞吉内思(Genesereth)将计算法学界定为一种法律推理自动化方法。他认为,实现法律推理自动化方法需要两个要素:一是采用形式逻辑的句子来表征事实和规则;二是利用机械推理技术来获得所表征的事实与法律之间的因果关系。
大数据时代的科学范式是数据科学,与之相一致的法学知识形态是数据法学。数据科学家认为,未来属于那些能够把数据变成产品的公司和人们。数据科学方法可被理解为一个由捕获、维护、处理、分析、转化五个环节组成的数据科学生命圈。基于此,建立在数据科学基础上的数据法学既是第四种法学知识新形态,也是一种基于法律大数据驱动而创造法律数据产品和发现法学知识的新方法。由此,数据法学方法既是一种基于算法的理性演绎,也是一种基于法律数据的归纳推理。正如数据科学是科学研究创新发展的新方向,建立在数据科学之上的数据法学是法学研究创新发展的新方向。
数据法学是一门独立的法学学科,原因在于数据法学有其特定的研究对象、方法和内容。法教义学视角下的数据法学、信息法学、数字法学不是一门独立的法学学科,原因在于其研究对象为数据法规范、信息法规范、数字法规范,研究方法为法律解释。实证法学研究视角下的数据法学、信息法学、数字法学也不是一门独立的法学学科,因为这些学科的研究对象为数据法律现象、信息法律现象、数字法律现象,研究方法为实证方法,也就是说,这些学科也不具有特定的研究对象和研究方法。法教义学视角下的数据法学、信息法学、数字法学归属于法教义学研究,实证法学研究视角下的数据法学、信息法学、数字法学归属于实证法学研究,这些都不是独立的法学学科。同样地,网络法学亦不具有其特定的研究对象和研究方法,不是一门独立的法学学科。
数据法学研究将对法律数据产品的创造和法学知识的科学发现产生影响。我国一些法律数据库并不具有法学知识发现的功能。我国法学研究需要精通数据法学的专门人才。数据法学的实践基点是质化的对法律信息的标注及其数字化,因此,数据法学人才的培养应专注于法律数据数字化能力的培养。法律人应当务实学习数据科学知识,有效创造法律数据产品,以真实地发现法学知识。