【关键词】慢病管理;数据分析技术;精准诊疗
1面向精准诊疗的慢性疾病发展现状
1.1面向精准诊疗的慢性疾病发展状况
随着我国经济飞速发展,慢病同样也成为影响我国国民生活质量的重要问题,《中国卫生健康统计年鉴(2020)》显示,在我国居民主要死亡原因构成中,心血管疾病、恶性肿瘤与呼吸系统疾病排名占据前三,开展面向精准诊疗的慢病数据分析,进行患者全过程慢病管理已迫在眉睫。在《“健康中国2030”规划纲要》《关于促进“互联网+医疗健康”发展的意见》等政策中明确指出,我国坚持“将健康融入所有政策”的理念,针对心脑血管疾病、癌症、慢性呼吸系统疾病和糖尿病等4类重大慢病开展管理、防治工作。与此同时,国家鼓励通过信息技术进行慢病管理实践,在《中国防治慢性病中长期规划(2017一2025年)》中指出,需要充分利用移动互联网、大数据、云计算等信息技术丰富慢病防治手段,推进远程诊疗、疾病管理、在线随访等网络服务应用。将慢病分析的关键信息技术融入各个环节,实现传统诊疗管理模式向数字化精准诊疗管理模式转变。
虽然海量、高维的慢病诊疗过程中产生的大数据为精准诊疗的发展和应用提供了数据支撑,但由于记录慢病诊疗过程的信息系统繁杂性、异构性等,使得数据储存、清洗、分析和应用的难度增加:此外,存储成本高、效率低,也成为慢病大数据分析下的精准诊疗技术应用面临的主要问题。随着物联网技术以及人工智能技术的成熟与普及,为慢病精准诊疗提供了技术支持。
当前,在互联网、智能手机以及智能可穿戴设备的快速发展下,移动物联网技术日趋成熟,并且在慢病领域逐渐形成了高效、稳定的现代化医疗服务新模式。以移动物联网技术对慢病管理进行危险因素控制,有助于患者生活质量的提升。Pagiatakis等人提出基于物联网可穿戴设备的远程医药服务平台,通过管理糖尿病患者用药进行危险因素控制。Omboni等人主要研究以移动医疗与远程健康为特征干预的临床慢病诊疗的有效性,用Meta分析验证了其有效性。Lee等人构建了一种基于云端的生命体征监测系统,并支持患者在各种终端上进行查看。虽然国内对于基于精准诊疗的慢病数据分析技术研究相对起步较晚,但前景较为广阔。段凯等人结合互联网技术,构建慢病监测系统,实现不受时空约束,依据患者自身情况进行慢病管理。Guo等人对可穿戴设备及非侵入式传感技术进行了分析,为慢病管理模式提供了技术支持。徐明珍等人结合AI技术,分析了当前慢病数据分析与管理面临的挑战及解决策略,为精准诊疗的慢病管理系统提供了新的思路。
针对面向精准诊疗的慢病分析关键技术研究,国内外均在借助专业医疗知识,移动物联网技术、人工智能技术等改进现有慢病管理过程中的某一方面或具体环节,提高慢病管理效果取得了较多进展。
2慢性疾病数据分析关键技术
随着移动物联网、人工智能技术的飞速发展,以及可穿戴设备的普及,健康医疗数据迅速积累,形成了医疗健康领域的“大数据”,基于慢病数据分析的精准诊疗应运而生,包括了精准预防、精准治疗、精准预后等。借助于医疗健康大数据的AI方法,可将来自不同系统、设备记录、收集的海量慢病数据进行充分挖掘与知识学习,实现精准的个体慢病决策支持。
在慢病管理领域,人工智能技术主要为以本体为代表的知识驱动方法与以机器学习、深度学习为代表的数据驱动方法。以本体为代表的知识驱动方法所表达的模型具有支持语义互操作、可共享、可重用等慢病领域模型的常见特征。数据驱动方法可以划分为基于结构化数据的统计学习方法、机器学习方法和基于非结构化数据的深度学习方法。
2.1基于本体的模型知识表达
本体是对可共享概念模型的一种明确而形式化的说明,本体的构建是一项较为复杂的工程,本体应主要包括:类、属性以及对属性的限制约束,一般类由概念构成,属性由描述概念特征构成。将概念进行分层,由本体与类对应的实例的组合构成了知识库,由实例及属性构成了知识图谱。斯坦福大学提出了七步法是当前使用较为广泛的本体构建方法之一,通过将本体构建要素进行结合,提供了一种具有较强可操作性的本体构建方法。见图1。
在慢病分析过程中,本体能够进行慢病精准诊疗管理,搭建底层基础架构。Verma等人指出慢病领域的本体主要包括慢病知识的领域本体以及用于推动精准诊疗的应用本体。本体可以在慢病决策支持过程中对所需要的慢病知识进行高效的表达,为慢病分析赋予演绎式推理的能力。
2.2特征提取方法
在面向精准诊疗的慢病数据选择特征时常用3类方法,即过滤式方法、嵌入式方法、包含式方法。其中,过滤式方法是通过慢病数据筛选的变量排序作为变量选择的标准,再通过使用合适的慢病变量标准对变量进行评分、选择,来减少不必要的变量。嵌入式方法在慢病数据特征选择过程中需要与模型空间进行拟合,通过不断迭代,筛选较好的特征,通过自己的迭代过程融入模型学习中,从而进行特征选择。包含式方法主要是通过学习模型作为子集评估标准,不断在特征空间中找到子集空间,然后进行评估,评估的结果可以作为一个目标函数。
2.3常用机器
学习与深度学习算法在慢病数据分析预测中,常常使用机器学习和深度学习算法进行预测。对输入的慢病数据集按照个体进行分类,被称为分类算法。如经典机器学习方法支持向量机,它是一种二分类的模型,基于线性划分与非线性分类。对于一个慢病样本集,可以利用SVM分类器进行分类,得到一个基于样本集的划分超平面,并通过直线分成不同的类别,通过类别划分为2类时,划分超平面的数量相对较多,其划分的直线对样本集内部发生变化时的影响也最小。尽管传统的机器学习技术已普遍应用在慢病数据分析预测中,但机器学习需要大量带标签的训练样本,在很多情况下,收集足够的训练数据通常比较费时。通过迁移学习,利用来自不同领域获得的数据进行训练,往往效率更高。迁移学习中训练和测试的数据样本分布可能不同。根据迁移学习的定义,可将迁移学习分为3个子设定,包括:直推式迁移学习、归纳迁移学习和无监督迁移学习。
2.4.1常用的推荐算法
建立慢病健康知识库为慢病分析推荐服务提供依据,推荐算法是面向精准诊疗的慢病健康知识推荐技术的核心,根据推荐慢病健康知识算法策略不同,可分为协同过滤推荐、内容推荐及混合推荐等推荐方法。
2.4.2图像分割
在慢病诊疗过程中,需要通过如超声、放射、病理等检查报告进行诊疗确认,而检查报告往往涉及图像的分析过程。通过面向精准诊疗的图像分割方法,可实现系统化、快速分析、分类。
图像分割一般是指根据如纹理、形状、灰度、颜色等在内的特征把图像划分成若干个互不交叠的区域,使这些特征在同一区域内呈现出相似性,不同区域间呈现出明显的差异性。
传统的图像分割方法是通过医学图像的先验特征进行划分的。它通过设定一个阈值,将图像的像素值与阈值进行比较分类,通过医学图像的自身特性,诸如纹理、颜色、边缘等作为阈值标准进行图像划分。针对基于深度学习的图像分割,提供了基于标准深层网络结构的基础,以及新的算法模型。在图像分类、检测分割方面,卷积神经网络取得了巨大的成果,它的多层结构能自动学习特征,并且可以学习到多个层次的特征。它可以对传统分割区域赋予特定的语义类别属性,更为细粒度层面进行分类,具有重要的研究意义和广阔的应用前景。
2.4.3医疗大数据可视化技术
基于医疗大数据的精准慢病诊疗可视化技术包含传统的可视化展示和信息可视化,从面向精准诊疗的慢病数据分析角度出发,信息可视化技术尤为重要。根据慢病数据类型可分为时空数据、非时空数据2大类。
网络数据不具有自下向上或自上向下的层次结构,这决定了网络数据可视化可用弧长链接图法和力引导布局图来实现。文本信息是医疗大数据时代非结构化数据的典型,能够将文本中蕴含的语义特征形象化表达,可采用标签云和文档散,又称旭日图法的2种方法。复杂高维的多元数据是指具有多个维度属性的数据变量。高维多元慢病数据分析的日标是探索高维多元数据项的分布规律和分布模式,从而揭示不同维度属性之间的隐含关系。
3思考与建议
3.1加强数据驱动
当前慢病数据分析与管理常用基于语义规则引擎进行决策支持。虽然规则驱动的方法能够准确表达慢病医学知识,保证结果的可解释性,但该方法需要进行人工维护,无法应对更加复杂的场景和个性化需求。在未来面向精准诊疗的慢病分析研究领域,需要着重对以数据驱动的智能化决策支持方法进行研究。
3.2配备可穿戴设备
慢病患者可通过自我监测进行自身身体状况的掌握和实时动态的预警,这就要求监测数据的准确性。但目前可穿戴设备能够实现局域网络环境的闭环式工作流程相对较少,患者无法方便地在局域网或医疗机构内网环境中进行移动终端设备的实时传输。此外,智能监护算法与物联网设备目前并没有实现产业化闭环式管理。因此,基于物联网技术的居家监测设备集成也是慢病管理未来的研究方向之一。