大数据在保险行业的应用上海数据分析网

特许全球金融科技师简介特许全球金融科技师(CGFT)是上海高金金融研究院在上海交通大学上海高级金融学院的学术指导下,倾力打造...

上海第60期数据分析师(CPDA)认证课程正在火热报名中!...

曾在SunMicrosystems和Oracle公司任高级研发工程师、高级技术顾问工作。对计算机基础架构、系统软件以及云计算有丰富的经验。

首先,因为信息化已经做了很多年了,人人手里都有很多的数据。

原来这些数据是用来为应用系统服务的,主要用于实现业务流程,新的技术手段让这些数据有了很高的价值,所以大量的需求产生了,而且数据越多需求越旺盛。

老话说,不见兔子不撒鹰,现在兔子满地跑,而且看见别人家的老鹰已经捉到不少兔子了,所以整个圈子里老鹰捉兔子就火了。

打个比方,就像乐高玩具一样,零件开发得很成熟了,各种尺寸大小形状的零件都很规范,也能方便的买到,同时各种图纸也成熟起来,男孩儿的飞机汽车,女孩儿的过家家场景,不同的小朋友根据自己的喜好,总能找到满意的题材很轻松地搭建喜欢的模型。

保险这个行业

保险行业的关键数据有:承保、保险、理赔数据。

承保是新建保单,投保的时候填写的,投保人和保险公司签订的合同。里面有投保人信息被保人信息,保障内容,赔付条款,免责条款,等等。保全和理赔是修改保单,变更保单的内容,或者拿着保单去理赔。

这些数据看起来就是记录保单整个生命周期内的信息的,保证了保险销售和保险服务能够依据保单运转起来。

一张保单涉及到好几个人,投保人,被保人,涉及到他们之间的关系,直系亲属,公司同事。保全和理赔更是涉及到用户的数据,用户信息通过保全进行更新,理赔过程中有用户出险原因等信息。

还有更好的事儿,就是这些数据都非常真实,承保时有保险代理人来搜集验证数据,保全有业务人员来搜集验证数据,赔付时有核保人员来搜集验证数据。

这就要从保险业务入手了。

保险行业数据的特征

规模性(Volume)

保险行业数据的规模很大,首先是交易数据本身的规模就很大。

2017年全年,寿险新增保单1.1亿件,每天30万件,每小时1.3万件,每秒3.5件。这只是寿险,健康险,意外险,财产险这些保单数量还要比寿险大很多。

寿险的保单大,意外险财产险的保单金额小,比如周末旅游买个短期意外险,几十块钱。乘坐交通工具的附加险,几块钱。所以保单数据时刻都在大量产生。

保单中的数据不仅仅限于交易数据本身,不仅仅是办理业务填写的各种单据里的数据。还有所有用户行为产生的数据,比如去一趟门店,什么时候去的,和保险代理人进行一次访谈,谈话中聊到的个人社会关系信息,等等等等。

不是的,原有的业务系统只是产生了数据,实现了业务流程的信息化,对业务本身进行了简单的统计分析,并没有分析数据本身。

多样性(Varity)

比如语音记录,保存下来的作用就只是存档而已,遇到投诉的时候,调出来查一查,没有别的用处了。不对这些数据进行分析,非常可惜。

所以这第二个V,多样性的数据,在传统的保险行业中也是一直存在的,很丰富,图像音频视频都有,还都不少。

高速性(Velocity)

前面咱们已经讨论过产生保单的频率,但说寿险是每秒3.5个保单,这个数字看起来还不算产生数据的速度快。

从某种角度来说,Velocity和Volume有相同的地方,互相补偿,高速的数据处理不了就会积攒成大量的数据。

举个例子,保险是洗钱的渠道之一,往往会有人通过购买保单来洗钱,如果在保单生成的时刻就能判断出投保人的洗钱风险,是价值最高的。

价值性(Value)

大量的客户信息,不但有价值,而且都有价值到了涉及道德问题的程度了。

最近腾讯的马总在说数据中台的事情,说腾讯不是不能做,而是做数据整合是很敏感很危险的事情。

所以我们在挖掘数据价值的时候,主要担心的不是挖掘不出价值来,而是怎么能安全地挖掘价值,在保护用户隐私的前提下来挖掘价值。

一般电商会记录用户的购物习惯,上网行为习惯,而保险公司记录的是,例如用户生病的记录,这个就敏感得多了。

电商上的客户大部分都是个人信息,而保险公司记录了很多用户生活中的社交关系信息,家庭人员关系,投保被保人关系,这就更加敏感了。

面对这么多数据,用哪些技术手段去处理呢这其实是三个问题:

数据的采集技术

一类采集是抓取新的数据,比如说抓取日志数据,使用爬虫抓取网页数据,使用插码技术抓取用户行为数据。

这是个典型的架构,多个爬虫进程抓取数据,扔到消息队列,使用流处理技术,storm从消息队列中实时取数,分析数据,打标签,然后放到ES库里。这里面用到了kafka,storm,elasticsearch。

严格来说,在这个例子里只有爬虫抓取网页是采集,后面的都是分析和存储了,不过在ES保存的数据对于它的消费者来说,也只算是爬虫采集到的数据而已。

*插码:我们在浏览网页,例如京东或者淘宝时,一些操作行为、习惯会被记录下来,这些记录的工具一般是网页中的一段代码,这些预先写好的代码被植入已有的系统后,就会具有相应的功能,这个被称为“插码系统”。

这类采集简单的做法是直接写sql,复杂一些的是开发很多ETL的,采集、分析、存储作为一个整体过程。

还有一类采集技术是把非结构化的数据转化成结构化数据。

例如文字识别,图像识别,语音和自然语言识别。这些技术相对来说比较独立,一般是在一个项目中如果需要的话作为一个单独的模块引入或者开发。

举个例子,投保单的电子化,大家觉得一张纸质的投保单是怎么录入系统的

我们在银行里也有很多类似的经历,手动填写很多表格,怎么电子化的呢手动写的字那么不清楚,怎么识别出来的呢智能识别手写内容——大家想多了,保存影印件,然后人工复核,甚至是人工录单,有专门的外包公司会来做这些工作。

从这里可能看出来,像保险公司这类的传统企业,很难对核心系统做大的改动,新技术往往都是在外围进行应用。

数据的存储技术

还有一种之前不太常用,现在比较常用的是缓存技术。

传统的报表系统的实现方式是什么样的呢最底层是基础数据,在基础数据的基础上加工为很多指标,将不同的指标拉到一个表里,生成报表。

当指标不止一层的时候,一些指标是另一些指标加工而来的,从最终的报表到基础数据之间隔着好几层指标,每次算报表的时候都层层往下去算指标,开销太大了,所以中间很多相对稳定的指标就放在缓存里,以提供给上游的指标使用。

数据的分析技术

分析技术是大头,也是现在公司里耗费人力最多的地方,业务需求最集中的地方。先说说传统的,现在已有的分析方式是什么样呢

大家第一反应肯定是机器学习,但目前企业里,主要的还是写SQL,写一个不够就拼好几个SQL,不行就写ETL。

这种模式对BI需求来说,足够好了了已经,如果能有什么改进的话,引入流失计算,用规则引擎替换掉SQL等,到不了需要使用机器学习的程度。

看起来比SQL更加友好,完全不懂技术的业务人员也可以操作。但是他解决的只是易用性的问题,功能和传统SQL比起来不会更好,甚至不如SQL。

另外一方面对现有分析技术的改进,是引入流式处理的模式,处理的不是静态保存起来的结构化数据,而是处理的在一个数据流中的数据。

最后,还是要涉及到机器学习。虽然前面说现在的业务模式中并不依赖机器学习,但是在对新的领域进行分析的时候,传统的方式是无法胜任的,还是得求助于新的分析模型,这个时候需要使用机器学习技术。

举个例子,公司内在做人员画像分析的时候,人员的数据和岗位的数据使用什么样的方式可以结合起来人员的数据会以什么样的方式影响到他所在岗位的绩效这能不能写个sql,编一段规则,或者写个python程序算出来呢不行,只能借助机器学习了。

公司里在做人员分析的时候,其实大量用到机器学习的方法。只是这些分析都是独立的,针对特定场景进行的一次性分析,没有能够集成到现有的应用或平台中去。

数据的展现技术

展示出来的数据是数据服务的最终交付物,无论前面怎么采集存储分析,最终起作用的是呈现出来的部分。所以会做ppt才是王道。

二是数据展示和数据探索往往会结合在一起。

数据的安全合规

首先第一个场景,也是最重要的,就是数据的安全合规。

这里说的监管指的是数据上的监管,不是经营上的监管。金融行业受到严格监管,而且这种监管的力度是越来越强的。

监管的手段随着技术的进步在不断推进,所以金融机构本身也就必须要跟得上才行,一旦落后,就意味着违规。

最常见的两类监管:

监管的方式是要求保险公司上报数据,按照指定的规格上报数据。有的是每天上报,有的是不定期的现场检查。

监管机构对数据的要求是不会考虑各个公司自己数据的组织形式的,他们会定义自己想要的数据结构和数据内容,被监管的机构有义务将自己的数据整理成监管机构想要的样子。

一两年前这其实也不是太大的问题,开发一些ETL就足够满足需求了。但是,数据监管的要求更新很快,每年都会更新,对数据需求的范围和复杂程度两方面的增加,对于开发ETL来说,复杂度不是线性增长的,而是要增长得更快。

保险行业最初是不太经营客户的概念,和银行业不太一样,银行业的所有业务和核心系统都是围绕客户、账户来的,而保险行业的核心系统都是围绕保单来的。但是事实上保险行业现在非常需要围绕客户来进行经营。

开拓新业务

很多企业都有这样的打算,就是把数据转化为数据服务,把这种服务提供出来。

举个例子,但这不是保险公司,是银保监会的保单登记平台,这个平台的作用是让所有保险公司将自己的保单登记进来。

各个保险公司的保单数据在这个平台上就打通了。但是各家的数据肯定是不能给其他家看的了,但是保单登记平台有了所有的数据后,可以基于这些数据提供风险提示服务给各家保险公司。

比如有人在A保险公司投保的时候,A保险公司就可以查询一下这个人是不是在不同的保险公司重复投了保,如果是的话,那么承保的风险就比较高。

现在都没有想出来,看来数据服务本身还是比较敏感,服务模式也不太成熟,大部分停留在对内服务阶段,还远没有达到拓展出公司新业态的程度。

技术与业务的有机结合

技术要落地,在业务场景里落地,要成为可以交付的产品,要实际用起来才行。所以最后一部分,和大家聊聊技术怎么落地,落在什么位置。

前台能够快速响应需求,快速交付价值,充分利用中台的服务,快速托拉拽就生成一个展示系统。

比如说,中台有一套强大的指标管理系统,提供实时查询服务,那么生成报表这样的前台应用就能迅速创建出来了。

而对中台的期望呢,是够强大,对外要能提供出足够多的服务来,自己内部又要把对后台的访问充分地封装。

而后台呢,要稳定可靠,不存在任何性能上的瓶颈,能满足中台所有的计算或者存储请求。

这是对于单个系统而言的三个层级,对于多个系统来说,我们希望有统一的后台,统一的中台,加上多个灵活的前台。

现实中对系统的建设是业务驱动的,而不是科技驱动的,至少目前还是这样的状态。业务驱动的最大问题就在于,对于每一个业务的需求,都是期望通过建设新的专用的系统来解决问题,这个系统是专用的,不存在可以和别的业务或系统共享的部分。

另一个有机结合的话题是,技术和业务结合在一块儿后,提供出来是系统,还是平台和服务

这其实在前面的前台中台后台策略是一致的。目前我们都是提供系统,不同系统间相互隔离。等打通一部分系统的中台后,才能形成平台和服务来。因此一个重要的衡量标准,就是看目前公司的系统更多还是平台和服务更多。

Q1:什么是数据仓库当前保险公司使用什么样的数据仓库

A1:在银行或者保险公司,一般使用的数据仓库都不是Oracle而是DB2。

A2:传统企业对于数据没有太多自己的观念,但对此非常重视,所有最前沿的技术我们都会使用。

THE END
1.161家产寿险公司前三季度保费和利润完整榜新浪财经来源:保险一哥 除了18家未公布偿付能力外 161家公司都公布了偿付能力报告 今天发布161家公司 保费利润完整数据 ① 数据披露情况 85家财险和76家寿险 公布了三季度偿付能力报告 3家财险和15家寿险 ▼尚未披露 ② 整体保费 财险总保费13056亿 同比增长6% https://finance.sina.com.cn/money/insurance/bxdt/2024-11-07/doc-incvfuhv2272040.shtml
2.富德生命人寿:半年度理赔结案创新高,理赔时效再加速依托科技创新,富德生命人寿将“云赔、快赔、直赔”等理赔服务模式深化应用,持续提升理赔效率,优化客户体验。而通过数据分析和精确洞察,富德生命人寿也为客户提供了更具个性化、更具精准度的保障方案。 随着保险行业的竞争加剧以及消费者需求的日益变化,富德生命人寿将继续以客户为中心,推动数智化转型,创新理赔服务模式,...https://news.yongzhou.gov.cn/mixmedia/content/WS6731bb6ee4b0005f4ec38805.html
3.保险2024-11-07 17:23●前海人寿韶关医院保险直付结算服务已于10月份上线 2024-11-07 17:10●满足多元需求 前海人寿推出“融耀金生”分红型增额终身寿险 ...2024-11-07 00:08●财险“老三家”前三季度车险保费合计超4664亿元 占财险行业车险保费收入的71.3% 2024-11-05 16:16●腾讯微保参与全国首个数据要素...http://www.zqrb.cn/jrjg/insurance/index_p1.html
4.2019保险理赔数据,2019保险理赔数据概览报告分析了2019年保险行业的理赔数据,包括理赔数量、金额、速度等方面的统计信息,探讨了保险行业的现状和未来趋势。 ,理想股票技术论坛https://www.55188.com/search-2019%B1%A3%CF%D5%C0%ED%C5%E2%CA%FD%BE%DD.html
5.发布年度保险理赔报告探讨保险服务八大趋势——中国平安2022年...5月9日,中国平安举办“平安大讲堂·中国平安保险理赔报告发布与保险趋势观察”活动,本次平安大讲堂围绕保险理赔行业现状与发展趋势、保险理赔高质量发展、创新理赔服务等话题展开。 会上,中国平安发布2022年度保险理赔报告(以下简称《报告》)。数据显示,2022年,中国平安旗下4家保险公司赔付总件数超2亿件,平均每天赔付...http://finance.hnr.cn/bxzx/article/1/1656198110085738497
6.2022年14月保险行业累计赔付额为4513亿元同比上涨14.2%根据中国银行保险监督管理委员会发布的最新图标数据显示:2022年1-4月份保险行业累计赔额为5520亿元,同比2021年1-4月的5191亿元,增加了329亿元,同比上涨6.3%。 温馨提示:慧择升级保险服务体系:布局“全险种” 扩大理赔服务对象。最新动态随时看,请关注金投网APP。https://m.cngold.org/insurance/xw8163251.html
7.保险理赔数据分析报告根据最新的保险理赔数据分析报告显示,近年来保险理赔案件数量呈逐年增加的趋势。这主要是由于人们对保险的认知度提高,保险购买意识增强,以及社会风险因素的增加所致。在保险理赔案件中,车辆保险理赔占据了相当大的比例。由于交通https://m.xyz.cn/toptag/baoxianlipeishujufenxibaogao-77156.html
8.从理赔看保险:2018年度理赔数据解读,你看到了什么?对于用户来讲,重疾保险不需过分关注疾病种类。虽然重疾病种的越来越多,但重疾的高发病种,始终固定在行业统一的25类高发重疾中,各家公司并无不同。 而最大的问题在于,重疾险不幸发生,保险赔付的保额远远不够。理赔数据显示,多数保单在20万保额以内;早期的保单,更不少在10万以下。 https://www.jianshu.com/p/9aa2fccbab70
9.保险大数据保险报表BI保险数据分析保险数字化保险行业数据解决方案 方案依托帆软生态体系,结合上百家保险客户的合作经验,总结并提炼出了承保、保全(批改)、理赔、续期、精算、投资等一整套的数据应用场景,助力保险机构更好地完成企业数字化转型。 立即体验 数字化转型面临的业务挑战 金融监管总局要求数字化建设...https://www.fanruan.com/solutions/insurance/
1.保险公司工作总结模板14篇一、各项理赔数据完成情况 截止11月30日,我司共接受各类报案1767件,较去年同期(555件)上升218%,其中机动车辆险1749件(交强险653件,商业险1096件),卡单意外险15件,团意险1件,建筑工程团体意外2件。其中,委托外地代查勘245。查勘定损岗共完成定损931件。理算岗共理算各类赔案1526件,立案注销114件。涉及伤人案件...https://www.jy135.com/gongzuozongjie/1556591.html
2.保险公司业务未达成述职报告(精选21篇)十月下旬参加山东省保险行业协会组织的全省四级机构高管人员培训学习,学习过程中一如既往的刻苦努力、虚心好学,并在培训结束后获得优秀学员证书。通过这几次学习,使我对保险学科的基础理论、保险学的基础知识、保险基本业务以及保险市场基本运行方式有较全面的认识和了解;学习培训后,我对保险业在市场经济、金融经济中的...https://www.ruiwen.com/shuzhibaogao/6793123.html
3.机动车辆保险理赔管理指引内容有哪些机动车辆保险理赔管理指引的内容包括理赔管理、数据管理、运行保障、追偿及损余物资处理、理赔服务等,有关机动车辆保险理赔管理指引详细内容请阅读下文。华律网小编为您整理出来相关的内容,欢迎大家浏览,谢谢。 机动车辆保险理赔管理指引内容有哪些 关于印发《机动车辆保险理赔管理指引》的通知 ...https://www.66law.cn/laws/110619.aspx
4.2020中国保险业NPS白皮书保险市场成熟度:保险市场成熟度较高的地区,保险产品和服务更完善,NPS也较高。例如,北京、上海等一线城市NPS普遍高于二三线城市。 文化差异:不同地区的文化差异对保险需求也有影响。例如,南方地区对寿险需求较高,而北方地区对财险需求较高。 根据行业数据,中国保险行业各地区的NPS表现如下: ...https://blog.csdn.net/weixin_42601608/article/details/141578495
5.保险行业统计名词解释指标基础数据来自财险公司的财务损益表,该指标反映财险公司承保业务的获利能力,指标值越高说明公司盈利能力越强。 (二)保单年赔付率 赔付率是保险公司最常用的评价业务质量的指标,简单来说就是赔款与保费的比值,只是不同口径的赔款与保费进行匹配会得到不同意义下的赔付率指标,一般有简单赔付率、综合赔付率、事故年赔...https://www.oh100.com/ahsrst/a/201704/266866_2.html
6.2023年中国保险业数字化转型研究报告在可持续增长与业务创新等诉求的驱动下,多项技术的融合赋能与契合场景需求的创新开发已成为保险机构核心竞争力的构建共识,前沿科技的实践探索正重塑保险各环节价值链,推动保险保障类型、产品内涵、业务模式、行业生态发生根本性变革。根据艾瑞咨询调研数据显示,大数据与人工智能技术的持续攻坚与相互赋能仍为保险机构决策者最...https://36kr.com/p/2382894555673096
7.保险理赔究竟难不难?2023保险理赔平安人寿中国人寿泰康人寿...保险公司理赔难,这是长期以来大众对保险的严重刻板印象。 而这两年,我们逐渐撕去保险“不赔”标签,不仅可以赔,还讲究“高效赔”、“便捷赔”。 恰逢其时,平安人寿、中国人寿、泰康人寿、新华人寿、太平洋人寿等60家险企,先后公布了2023年理赔年报(包含了理赔金额、获赔率、理赔时效等数据)。 https://m.huize.com/study/detail-361819.html