本研究提供了在家庭环境中对神经外科脊柱疾病患者进行实际客观疼痛评估的机会。
背景:在神经外科实践中,疼痛评估在很大程度上仍然是主观的,但机器学习的出现为客观疼痛评估提供了可能。
目的:使用一组诊断为神经性脊柱疾病的患者的智能手机语音记录来预测每日疼痛水平。
方法:经机构伦理委员会批准,通过普通神经外科门诊招募脊柱疾病患者。通过Beiwe智能手机应用程序定期进行家庭疼痛调查和语音录音。从语音记录中提取Praat音频特征,用作KNN机器学习模型的输入。使用从0到10分的疼痛评分评估轻度至重度疼痛,以获得更好的疼痛分辨能力。
结果:共纳入60名患者,并使用384个观察值来训练和测试预测模型。使用KNN预测模型,在将疼痛强度分级为重度和轻度时,准确率达到71%,阳性预测值为0.71。该模型预测重度疼痛的精确度为0.71,轻度疼痛的精确度为0.70。对重度疼痛的回忆是0.74,对轻度疼痛的回忆是0.67。总体F1得分为0.73。
结论:我们的研究使用KNN模型来模拟从脊柱疾病患者的智能手机收集的语音特征与疼痛水平之间的关系。所提出的模型是神经外科临床实践中客观疼痛评估发展的垫脚石。
关键词:数字表型、语音分析、患者报告的结果测量、脊柱手术、机器学习、智能手机
脊柱疾病引起的疼痛会使患者活动能力下降,是脊柱手术的主要驱动因素。然而,疼痛的主观性质使其评估和治疗具有挑战性。目前神经外科临床实践中,疼痛评估的金标准包括使用数字评定量表(NRS)和视觉模拟量表等方法;NRS是一个患者自己对疼痛程度评估的从0到10的数字评分。尽管这些方法被证明是简单的疼痛评估方法,但它们通常需要患者亲自到诊所就诊,并且依赖于患者的回忆。
先前的研究表明,疼痛可以改变某些患者的语言。此外,语言已被证明可以为诊断抑郁症,精神分裂症和阿尔茨海默病提供异常大脑活动的证据。因此,语音数据可能是代表疼痛的数字生物学标志,以补充当前的疼痛评估方法。
在神经外科研究中,机器学习方法的适用性在过去几年中大幅增加。机器学习技术能够根据旁大数据集来创建模型进行多种应用,非常适用于数字表型数据分析,然而,在临床环境中实施疼痛预测等应用仍存在重大挑战。本研究的目的是创建一个机器学习模型,使用通过智能手机应用程序收集的数字表型语音数据来预测脊柱疾病患者当天的疼痛水平。
方法
患者登记
数据预处理
特征提取
Beiwe应用程序的语音录音以各种格式提供。为了兼容软件包,最初以MP3录制的语音录音被转换为波形音频文件格式。语音特征是使用ParselmouthPython库提取的,它是一个进行Praat音频分析的软件。提取的语音特征列表包meanF0Hz,stdevF0Hz,harmonicto-noiseratio,localJitter,localabsoluteJitter,rapJitter,ppq5Jitter,localShimmer,localdbShimmer,apq3Shimmer,apq5Shimmer,apq11Shimmer,JitterPCA,andShimmerPCA。F0是指基频,harmonicto-noiseratio是周期和非周期成分的比值,Jitter描述频率变化,Shimmer描述振幅变化。Praat语音特征源自时域。此外,使用librosaPython库从频域中提取了13个梅尔频率倒谱系数(MFCC)语音特征。
单变量分析
创建线性混合模型以检查语音特征和疼痛评分之间的显着关联。对于每个模型,疼痛是结果变量,每个语音特征都被视为其自身的预测因子。为每位患者添加随机截距以控制基线疼痛感知的变化。
模特训练
为了训练机器学习模型,数据准备好进行5折交叉验证,并最终分成不相交的训练集(80%)和测试集(20%),这样测试集中的患者就不会包含在训练集数据中。为了防止模型偏向较大的语音特征,在训练前对训练数据和测试数据进行鲁棒缩放。鲁棒缩放是一种统计方法,它使用四分位间距以减少异常值影响的方式缩放数据。由于样本量的限制,我们创建了一个二元分类模型。疼痛评分在0到4之间被归类为轻度疼痛,疼痛评分在5到10之间被归类为重度疼痛。选择这些特定的疼痛评分组是为了提供相同数量的重度和轻度疼痛评分样本。
基于K最近邻的预测模型
使用K-nearestneighbor(KNN)分类器将语音记录分为轻或重度疼痛类别。我们之所以选择这个算法,是因为它的简单性和可解释性。KNN是医学研究中常用的机器学习算法之一。该算法的作用是将训练数据绘制在n维空间中,并根据最接近K的训练数据点对每个测试数据点进行分类。我们还训练了逻辑回归和随机森林模型。Scikit-learnpython库用于构建和训练机器学习模型。所有模型均使用以下计算硬件进行训练:Intel(R)Core(TM)i5-10210UCPU@1.60GHz,Architecturex86_64,OperatingsystemUbuntu20.04.1LTS,CPU(s):8。
结果
患者人口统计学
应用排除标准后,使用来自60名不同患者的384段语音录音来训练和测试KNN模型(图1)。平均年龄为58.5岁,26名(43.3%)患者为男性。中位随访间隔为33天(范围0-187天)。53名(88.3%)患者是白人。大多数患者患有腰椎疾病(61.7%),颈椎疾病(21.7%)是次常见的脊柱疾病部位(表1)。脊柱疾病诊断包括22例(36.7%)中央狭窄、12例(20.0%)椎间盘突出、8例(13.3%)椎间孔狭窄、8例(13.3%)脊椎滑脱和4例(6.7%)脊柱侧凸。骨折、硬膜外肿块、骶髂关节病变和椎间盘炎等被认为是“其他”诊断。
图1.排除患者和语音记录的流程图
表1.患者特点
疼痛和语音数据
每个患者的音频文件数量中位数为5(范围1-28,图2),平均疼痛评分为4.6±2.7(表2)。图3提供了疼痛评分的直方图。平均录音长度为43.3±10.1秒。将疼痛评分转换为轻度和重度疼痛后,有183个轻度疼痛评分的语音样本和201个重度疼痛评分的语音样本。
图2.每个患者的语音记录数量分布
表2.语音记录和疼痛评分
图3.疼痛评分的分布
表3.线性混合模型结果显示Praat语音特征和疼痛评分之间的关系,每个患者随机截取
模型性能
训练集中有268条语音记录,测试集中有116条语音记录。在测试集中,55个(47.4%)样本为轻度疼痛,61个(52.6%)为重度疼痛。KNN在测试集上的预测准确率为71%。图4中显示了一个混淆矩阵,它显示重度疼痛的精确度为0.71,回忆为0.74。对于轻度疼痛,精确度为0.70,回忆为0.67。总体F1得分为0.73(表4)。
图4.KNN疼痛预测模型的混淆矩阵
表4.使用测试数据集的K最近邻疼痛预测模型的结果
讨论
脊柱疾病仍然是神经外科实践中的常见疾病,通常会导致严重的疼痛。尽管目前的疼痛评估方法已在临床实践中得到验证,但它们会受到患者回忆偏差的影响,而且需要患者亲自到诊所就诊。通过智能手机和其他移动设备进行持续和远程疼痛监测对于神经外科医生进行患者评估具有极高的价值。使用数字表型数据,可以通过在家庭环境中及时进行疼痛评估来补充当前的疼痛评估工具,从而控制患者对其疼痛感知的变化。我们研究目的是建立一个数据驱动的机器学习模型,使用从脊柱疾病患者的个人智能手机收集的语音数据来预测当天的疼痛水平。
局限性
结论
本研究提供了在家庭环境中对神经外科脊柱疾病患者进行实际客观疼痛评估的机会。调查智能手机语音数据与神经外科患者疼痛之间关联的研究有限。在此,我们提出了一种基于机器学习的方法,使用来自智能手机的语音数据和一组脊柱疾病患者的自我报告疼痛调查来量化疼痛。使用我们的预测模型作为基线,未来的模型可以改进我们的框架,以更好地评估脊柱疾病患者的疼痛水平。
编译:韩晓庆审校:张钊
原始文献
DueyAH,RanaA,SiddiF,HusseinH,OnnelaJP,SmithTR.DailyPainPredictionUsingSmartphoneSpeechRecordingsofPatientsWithSpineDisease.Neurosurgery.2023Mar30.doi:10.1227/neu.0000000000002474
不感兴趣
看过了
取消
人点赞
人收藏
打赏
我有话说
0/500
同步到新浪微博
进群即领
扫码加入
扫码进群
您的申请提交成功
意见反馈
下载APP
健康界APP
了解更多
返回顶部
您已认证成功,可享专属会员优惠,买1年送3个月!开通会员,资料、课程、直播、报告等海量内容免费看!