随着现代信息技术的发展与数据的爆发式增长,数据日益成为具有时代特征的生产要素。通过健康医疗海量数据的集聚,可深挖健康保险数据信息内涵,可拓展精算模型风险因子,可依据大数据技术和相关算法创新推动健康与医疗保险定价及风险控制方法体系的变革。利用海量数据(或称大数据)要素及其所蕴藏的巨大价值,有助于健康保险的精算统计模型与风险监管突破数据孤岛,对健康保险进行个性化、多维化和动态化定价,并自动、精准、高效地检测和预警健康保险运行风险,以推进健康保险及风险管理可持续发展,这是完善我国多层次医疗保障体系亟待解决的重要问题。围绕以上问题的探索和思考,作者着力开展大数据背景下健康保险的精算统计模型及风险监管研究,具有重要的理论价值和现实意义。
《大数据背景下健康保险的精算统计模型与风险监管研究》有以下几个显著特点与亮点。
第一,研究视角有创新。其一,针对传统健康保险精算的局限性,作者提出了分布式算法、最优子抽样、基于密度比模型的经验似然算法、数据插补和模型平均算法等健康保险大数据融合方法,符合健康大数据多源异构的特征,为大数据背景下健康保险精算建模奠定了理论基础,也为健康保险大数据从理论层面转向实践做了有益的尝试;其二,不同于以往健康保险统计与精算的研究较多停留在定性分析层面,且相关大数据统计方法的量化研究更多地集中在流行病、疾病等的预测上,该书从量化角度,基于大数据分析方法对健康保险精算展开了较为系统的研究,弥补了现有健康保险精算领域大数据精算技术的不足;其三,针对大数据背景下智能审核控制健康保险道德风险的理论模型缺失问题,及利用传统计量模型研究健康保险风险控制中模型依赖较强分布与参数假设的局限,作者提出的K均值聚类方法、LightGBM方法、Logistic算法和决策树算法,为自动、精准、高效地检测和预警医保欺诈行为,保障医疗保险基金长期可持续发展提供了技术与方法保障。
第二,研究技术有拓展。针对传统保险精算技术方法的单一性,该书在技术方面的拓展主要体现在:一是基于随机森林分类模型和回归模型对商业医疗保险,结合BP组合神经网络模型及离散时间的多状态Markov模型对长期护理保险,结合朴素贝叶斯模型及连续时间Markov模型对重疾险等进行精准定价;基于隐马尔可夫模型,引入被保险人多维度健康管理数据,实现对健康保险费率的实时动态调整。传统“少量影响因子对‘标准体’定价+核保调整价格”的定价模式,由于考虑的风险因素少、模型需依赖多方面精算假定等局限,往往导致测算结果较粗略、精确度不高。运用大数据分析技术,有助于健康保险定价模型由传统模型向“事前定价+动态调整”转变。二是采用大数据技术,将具有高欺诈风险的医疗服务提供方和参保方的相关信息筛选出来,进行保险欺诈识别的技术创新。作者通过实证分析论证了大数据方法中的聚类方法、LightGBM方法、Logistic算法和决策树算法,能够对医疗保险欺诈识别与智能核赔起到风险预警作用。三是针对大数据时代的健康保险数据非标和口径不统一问题,作者基于HL7-RIM构建健康保险业务底层数据的标准化模型,这不仅能为健康保险高效发展提供数据标准,也能为未来保险业的大数据标准化提供前期铺垫。
第三,研究结论有价值。作者紧密结合当前全球大数据急速发展的背景,在创立健康保险大数据融合新方法的基础上,对大数据背景下医疗保险、重大疾病保险及长期护理保险的精算统计模型进行优化和创新;还开展了医疗保险风险欺诈识别与健康保险风险控制的新探索,提出大数据背景下保险监管的优化对策。该书相关结论对持续深入研究如何利用大数据技术提升健康保险及风险管理水平,提供了诸多可资借鉴之处;对监管部门面对错综复杂的健康医疗大数据,及健康保险供给转型背景下的监管政策改进,也具有重要参考价值。
鉴于此,衷心祝贺该书付梓并欣然为之作序。
(作者系西南财经大学教授、博士生导师;国务院应用经济学学科评议组成员;教育部金融学类教学指导委员会副主任委员)