许闲,复旦大学经济学院风险管理与保险学系主任,复旦发展研究院中国保险与社会安全研究中心主任,中国保险科技实验室主任;
杨昊,复旦大学经济学院本科生。
本文构建了保险条款可读性指标,测度了93家保险公司的2872份健康险产品条款的可读性。
结果表明:
从保险产品类型来看
重疾险条款的可读性最优、百万医疗次优、医疗险次之、终身重疾最次;
从公司所有制类型来看
国有保险公司的条款普遍可读性更优;
从公司类型来看
互联网保险公司的条款可读性极强,银行系保险公司和专业健康险公司的条款可读性较差。
一、问题的提出
金融消费者保护对于增强金融消费者信心、维护金融机构信用、维持金融市场秩序和防范金融风险有着至关重要的意义。但是,由于金融产品的专业性和复杂性以及消费者本身金融知识和素养的缺乏,金融消费者面临着产品信息的“鸿沟”,很难正确地认识和理解各类金融产品(赵大伟,2021)。如何提高金融产品信息披露水平,让金融消费者更好地“读懂”金融产品,是我国金融消费者保护面临的重要课题,研究金融产品的可读性也就有了十分重要的现实意义。目前政产学研均未存在统一的方法度量与比较不同类型金融产品合同条款的可读性。本文针对中文金融产品特征构建指标,选取较为复杂的保险产品条款为例检验其有效性,并对我国在售的健康险产品条款可读性做相应分析。
二、保险条款可读性指标构建
本文从文本“质”的维度(单位文字的难易程度)和“量”的维度(文字的多少)考察文本的可读性:
对于词汇而言,越是生僻的词越是难以理解,因此本文以词汇在汉语语境中的使用频率为标准判断词汇难易程度,并以平均100个词汇中难词出现的频数作为词汇层面可读性的度量。本文在定义难词时,参考了清华大学开放中文词库(THUOCL),据此统计了条款中难词的数量,计算得到难词密度=难词数/总词数*100。
而对于句子而言,本文参考了FogIndex和Flesch–KincaidIndex等指标的惯用做法,以平均句长,即单位句子所含字数表示句子层面的可读性。
综合词汇和句子的可读性指标,就可以得到整体文本“质”层面的可读性指数。本文在已有方法的逻辑上做了改进,将难词密度和平均句长分别按Z-Score标准化,将标准化了的因子的平均数作为整体的可读性指数。
再来看“量”的维度。很好理解的是,相较于短小精悍的文本,从长篇大论中读取有效信息的阅读成本是更高的,这也就意味着对消费者而言,条款越长则越难读懂。因此,条款文本的文件大小可以作为“量”维度可读性的度量。
综上所述,本文设计了四种不同的可读性指标。一是平均句长,用以描述句子层面的可读性;二是难词密度,用以描述词汇层面的可读性;三是平均句长和难词频率的标准化分数的平均值,用以衡量总体的可读性(readability);四是文本长度,相比于前三个指标从“质”的维度出发,该指标从“量”的维度衡量了文本的可读性。这四个指标越大,则说明文本可读性越差,越难以理解。
三、保险条款可读性指标
有效性检验
四、我国健康保险条款出
可读性状况
本文运用前述方法度量了93家保险公司的2872份健康险条款的可读性,其中1364份重疾险条款,1508份医疗保险条款。
本文接下来进一步具体分析比较了我国健康险保险条款的可读性。
第一,比较不同保险类型条款可读性的差异。本文所统计的健康险条款分为两类:医疗险和重疾险,其中又细分出“百万医疗险”和终身重疾险。在控制了公司固定效应之后,用可读性指标对保险类型生成的哑变量做了回归,回归结果表明:从可读性排名来看,重疾险最优、百万医疗次优、医疗险再次、终身重疾最次,同时该结论稳健。该结论也很好理解:医疗险为费用补偿型保险而重疾险为发生给付型保险,从保险责任明确和道德风险的角度来说,重疾险的条款都较医疗险更简单;而百万医疗险作为普通医疗险的升级,通过其高免赔高保额的特点减少了很大一部分的道德风险,同时也为了迎合其便捷销售的特点,因此条款在其他方面的限制上会有所放松,显得更加易读;终身重疾险则将普通短期的重疾保险期间延长至终身,这毫无疑问增大了可保风险,保险公司处于自身利益的考虑有动机将条款表述得更为详尽和缜密,因此可读性上最差。
第二,比较不同所有制类型保险公司的健康险条款可读性。本文定义“国企”为国有独资保险公司,“外资”为中外合资保险公司。采用相同的回归方法,得到结论:国有保险公司在保单文本叙述的通俗易懂方面做得更好。这可能是由于国有企业在销售设计上考虑保险消费者的阅读感受,也有可能是国有企业往往规模更大,受到更严格的监管。
第三,比较不同类型保险公司保险条款可读性。本文选择了三类具有明显特征的保险公司:银行系保险公司、专业健康保险公司和互联网保险公司。结果表明:互联网保险公司的条款可读性极强,可读性指数大幅低于其他类型公司,银行系保险公司和专业健康险公司的条款可读性较差。