预测性研究的三大认识误区及其应对

2025-02-06 来源:中国社会科学网-中国社会科学报

微信公众号

分享
链接已复制

  预测性研究离不开参数体系和研究工具。一方面,官方层面的各类统计数据、普查数据等权威数据,非官方的各类调查数据、业界数据等,都是形成预测研究参数体系的重要依据。另一方面,已有预测理论、模型、算法等都是预测性研究的主要工具。

  然而,由于预测性研究是基于以往材料推断未来发展,受各类因素的干扰较多,存在一定的偶然性和复杂性,在实践和应用中常常面临一些认识误区。第一,孤立地看待范式间关系与静态地看待预测结果;第二,以预测为预言或断言,忽视研究的概率性,泛化预测结果;第三,过度依赖乃至迷信新工具和新技术,以工具代替主体思考;“信息茧房”效应导致预测结果被误读。这些误区在理论、方法论和实践层面均有体现,值得引起高度重视。

  静态孤立型认识误区

  这一误区主要表现为,孤立地看待范式间关系与静态地看待预测结果,忽视研究复杂性。

  第一,孤立地看待预测性研究范式和其他研究范式的关系,忽视了不同范式的内在关联。众所周知,常见的学术研究范式主要包括探索性、描述性、解释性、预测性四个类别。从逻辑结构看,这四个类型存在明显的梯次性,分别为初步建构认知、寻求统计相关、得到因果解释和开展预测研究,体现出由浅入深的认识过程。孤立使用预测性研究范式,在实际研究中撕裂同其他范式的有机联系,容易导致盲目臆断和预测失据,对预测结论陷入主观想象的境地。

  第二,静态地处理预测指标体系,忽视预测性研究的复杂性和动态性,对指标体系滞后风险评估不足。预测性研究的基础是各类数据、材料,在操作中需要将其整合成参数体系,利用相应的模型计算预测结果,其本质仍然是线性的。参数体系通常是基于一定时间内的断面、切片数据(参数、指标)形成的,是“过去”的数据。因此,短期预测结果通常错误较少或处于可接受区间,若进行中长期预测,则需要对参数体系和预测模型适时调整,以适应现实变化。

  此外,预测性研究通常对初始参数十分敏感。由于统计误差和调查误差等,初始参数形成的基础材料难免存在一定的偏误,当作为预测依据的参数指标时,也存在“测不准”的风险。

  以偏概全型认识误区

  以偏概全型认识误区主要表现为,将概率性的预测结果认定为必然性结果,忽视其存在的误差与代表性。这种认识误区的本质是混淆了偶然性与必然性、特殊性与一般性这两组关系,导致忽略预测概率性和过度概化两个问题。

  第一,忽视预测的概率性,将预测结论作为必然性发展趋势。一般而言,预测模型在设定中会通过调整参数来获得不同水平的预测结果以描述特定现实情况,如人口预测中常采用“高、中、低”三个水平。预测结果也须落入相应的置信区间并符合相应的置信水平,即在何种范围内有效。常用的置信水平为95%或99%,数值越高代表检验越严格、准确性越高。所以,预测性研究的结果是概率性、或然性结果。以或然性结果去下必然性结论,在逻辑上是不成立的。

  第二,以单次预测结果作为普遍性结论的依据,易产生“过度概化”的问题。预测结果对于预测参数和模型设置是十分敏感的,个别参数的微调便可能产生预测结果的系统性变化,一项特定预测性研究能够得到的结果也是千差万别的。此外,研究者的经验和主观认知对设计预测方案和筛选预测结果也会产生相当大的影响。而对于同一议题的相关预测研究通常是多主体、多情境和多频次开展的,预测结果也丰富多元。因此,在预测结果代表性上,需考虑“特殊性”与“一般性”的关系。

  工具主导型认识误区

  这一误区主要表现为过度依赖乃至迷信新工具和新技术,以工具代替主体思考,反过来影响甚至主导主体对预测内在机制的探索过程。工具主导型认识误区表现为工具依赖型(主体异化型)认识误区和“信息茧房”型认识误区。

  第一,工具依赖型认识误区产生于对新型预测工具的过度依赖乃至迷信。互联网和信息技术的新进展,给预测研究带来了新的“范式革命”。模拟仿真、人工智能等研究工具的强化,大幅提高了研究精准性。如“社会计算”“舆情监测”等各类研究应用产生了积极的社会影响。但依靠新型预测工具开展的研究也面临挑战。一方面,无论是模拟仿真还是大数据的精准预测,其底层逻辑仍然是统计学、数学和计算科学,尚未推动研究范式产生革命性的变化。另一方面,人工智能、模拟仿真等工具,在实践中需要经过大量训练和深度学习,而这一过程无法离开大数据。大数据的精准研究依据的是海量“正常”数据,但微量“异常”数据则容易被模型排除或忽视。群体与个体、秩序与行为层面均存在明显的选择性,在数据采集和记录过程中也易于产生系统性偏误。由此,新型预测工具在“精准预测”的同时,也可能带来“精准错误”的问题。

  第二,“信息茧房”型认识误区并非直接产生于预测方法本身,而更多作为工具依赖型认识误区的延伸,主要体现在预测结果的媒体传播和大众理解层面。预测性研究遵循科学研究方法和研究规范,其论证过程和结论常常过于专业晦涩,不利于理解和传播。在各类媒体传播过程中,又面临过度简化和片面化的问题,易变形走样甚至产生错误。在互联网平台系统和算法加持下,受众可及性与选择性被进一步强化,极易形成信息茧房。

  辩证把握多重关系

  不断优化预测性研究

  预测性研究出现认识误区的根本原因,在于预测目标本身的不确定性、预测工具的不完备性、人类行为与社会的复杂性。识别预测性研究的认识误区,需要辩证地把握几对关系:个体与系统、静态与动态、偶然与必然、特殊与一般、工具性/客体性与主体性。

  实践中的预测性研究仍然至关重要,是不可或缺的研究范式,也是经济社会长期发展的基础性参照。对我国而言,数智化时代电子政务系统积累的各项行政数据,及各类调查数据,为预测性研究提供了丰富的素材。需要明确的是,预测不是预言,而是概率性呈现未来一段时期社会经济发展趋势的工具,需要经由检验和试错过程尽可能达成最优预测。预测是动态变化的,需要定期更新预测系统、调整预测参数乃至修正预测模型,以有助最优预测的达成。

  (作者系中国社会科学院中国式现代化研究院助理研究员)

转载请注明来源:中国社会科学网【编辑:李文珍(报纸)胡子轩(网络)】