【临床研究】腕关节患者功能自评量表的设计及其信度与效度评价

来源:中华骨科杂志作者:刘路 等时间:2023-04-28 阅读:9440评论:0赞:0 有0人参与
点击标题下「蓝色微信名」可快速关注


文章来源: 中华骨科杂志, 2023,43(5) : 300-307

作者:刘路 魏绮珮 李秋雅 白帆 王志新 刘畅 陈山林


摘要  

目的

设计适合中国患者使用的腕关节患者自评量表并对其信度和效度进行评价。


方法

参考现有国外量表和国内腕关节专家意见,建立初选条目池。11名手外科医生及10例腕关节疾病患者对条目池进行评价及取舍,构建量表的基本框架,形成初始测试量表。采用方便取样法,抽取2015年9月至2016年11月于北京市积水潭医院手外科住院的100例腕关节疾病患者进行问卷调查。总结问卷调查结果的条目应答率、条目区分度、条目-维度归属度、变异度、反应度、条目整体归属情况、内部一致性及因子负荷共8项指标,对各条目取舍,得到腕关节患者功能自评量表。使用重测信度、Cronbach系数、专家评分、KMO值、替代性检验指数(χ2/df)、近似均方根误差(root mean square error of approximation,RMSEA)、比较拟合指数(comparative fit index,CFI)对量表的信度及效度进行评价。


结果

对备选条目池共40个主观条目进行取舍,形成初始测试量表,共32个条目(A1~D4),分为生理、安全、疼痛、情感与归属四个维度。92例患者完成问卷调查,全部条目的应答率>90%。条目区分度中,只有B10条目的高分组得分[(3.20±0.577)分(范围1~3分)]与低分组[(2.68±0.627)分(范围2~5分)]比较差异无统计学意义(t=5.11,P=0.340),被删除。条目-维度归属度结果中考虑删除A1、A2、A5、A6、A7、A8、A9、A10、A11、A12、B4、B6、B7、C5、D1、D2、D3,共17个条目。共11个条目的变异度<0.65:A4(0.645)、A7(0.593)、B1(0.590)、B5(0.617)、B8(0.578)、B9(0.612)、B10(0.526)、D1(0.644)、D2(0.320)、D3(0.169)、D4(0.526)。不符合反应度要求的条目为A2、A4、A6、A8、B4、B6、D1、D2、D3、C2、C3、C4、C5、C6。因子负荷<0.4的条目包括D2(-0.051)、D3(-0.127)、D4(0.267)。内部一致性不符合要求的条目为C4(0.026)、C5(0.023)、D1(0.103)、D2(0.434)、D3(0.387)、D4(0.062)。多元线性回归分析中共19个条目未被纳入最终的回归方程中。综合指标分析后删除D1、D2、D3,最终剩余有效条目29条,形成腕关节患者功能自评量表。该量表中生理、安全、疼痛、情感与归属维度重测信度分别为0.984、0.976、0.985、0.802(P<0.001),KMO值为0.894(P<0.001)。因情感与归属维度仅有1项而无法评价,生理维度的χ2/df、CFI及RMSEA分别为5.152、0.817、0.022,安全维度分别为5.378、0.795、0.023,疼痛维度分别为7.439、0.865、0.028。


结论

腕关节患者功能自评量表为依据中国患者的主观评价而制定的量表,共四个维度29个条目,量表具有较好的信度和效度,可以作为中国患者主观评定腕关节功能的量表。


腕关节为复合关节,由远尺桡关节、桡腕关节、腕中关节、第1~5腕掌关节共同构成,涉及屈伸、桡尺偏、环转、旋转以及掷飞镖运动,其结构及运动方式相对复杂。同时,腕关节在开车、写字、穿衣、个人清洁等各种日常活动中都起到重要作用。随着近几十年来对腕关节认知的深入以及腕关节镜的推广,腕三角纤维软骨复合体损伤、桡骨远端畸形愈合、腕骨间韧带损伤等疾病的治疗正受到越来越多的关注[1]。因此,准确评估患者腕关节功能的必要性也随之增加。临床工作中医生常通过关节活动范围、握力及捏力等客观指标来评估患者的腕关节功能,但由于性别、年龄、职业、兴趣爱好、习俗的不同导致患者对自身功能的感受具有较大的差异。因此,主观量表对评估患者腕关节功能同样具有重要意义[2]


目前已广泛使用的腕关节主观评估量表包括上肢功能障碍评定量表(disabilities of the arm,shoulder and hand,DASH)[3]、腕关节患者自行评估量表(patient-rated wrist evaluation,PRWE)[4]、改良Mayo腕关节评分(modified Mayo wrist score,MMWS)[5]、密歇根大学手概况问卷调查表(Michigan hand outcomes questionnaire,MHOQ)[6]、简明版36项健康状况调查问卷(36-item short form health survey,36-SF)等[7]。这些量表虽应用广泛,但存在以下问题:(1)随着社会发展,人们对个人电脑、手机等电子产品的使用率较前大幅增加,而上述腕关节主观量表的编制时间一般为50年前,编写时并未考虑到现代生活中各种新型工作及娱乐方式。(2)由于目前已有的量表皆由国外研究者编制,在制作时参考的评估人群为欧美国家人群,由于生活方式、文化差异和语言习惯的不同,表中的如"使用除草机""使用刀叉"等部分条目的设置与我国人群日常生活习惯不符,不能完全准确评价中国人群的腕关节功能[8]。因此,编制一套更符合现代中国人群生活习惯的腕关节主观量表具有重要临床价值。


本研究中,我们先参考既往量表条目及国内人群的生活习惯,设计初始测试量表,然后再通过分析腕关节疾病患者对初始量表的填写结果获得腕关节患者功能自评量表,并对该量表进行信度和效度评价。研究目的:(1)建立符合现代中国人群生活和工作的腕关节功能主观量表;(2)探讨该量表的可靠性和有效性。


资料与方法
一、研究对象
经手术治疗的腕关节疾病(桡骨远端畸形愈合、腕关节滑膜炎、腕三角纤维软骨复合体损伤、腕中韧带损伤等)患者,能够独立完成量表或在调查员的协助下完成调查。排除认知功能障碍(如中枢神经系统损伤)患者。


二、研究方法及流程
(一)量表制定
参考已有的腕关节量表及量表研制流程[9,10,11,12,13,14],筛选既往腕关节量表中的条目,并通过直接询问、电话或邮件等方式咨询国内的腕关节专家,以马斯洛的需求层次理论为基础,结合中国文化背景及语言习惯,建立包括99个备选条目的备选条目池。将99个条目分为四个维度:生理维度、安全维度、疼痛维度、情感与归属维度。经过研究者内部讨论,删除部分通用性欠佳的条目(如"刮胡子""打领带"等),保留40个主观评价条目,形成初选条目池。

使用方便取样的方法随机抽取11名腕关节疾病领域的手外科专家以及10例确诊为腕关节疾病的住院患者对所选条目以及维度的重要性进行评价。每个条目按重要程度赋值,包括不重要(1分)、一般重要(2分)、比较重要(3分)、非常重要(4分)。四个维度同样按重要程度赋值1~4分,分别取专家及患者评价结果的平均值作为该维度专家组及患者组的加权值。每个条目最终的重要性得分为自身得分与加权值的乘积。统计评价结果,将专家及患者评价结果分别由高到低排序,比较二者得分后35%的条目,删除同时存在于专家评分和患者评分后35%条目中的条目,最终形成初始测试量表。按照所在维度及维度内条目数量进行编号,即生理维度(A)、安全维度(B)、疼痛维度(C)、情感与归属维度(D)。其中生理维度、安全维度、情感与归属维度采用Likert 5级评分法,条目中选项按照严重程度由低到高排序为"毫不费力/完全没有""有点困难/稍微有点""一般困难/中度影响""非常困难/重度影响""不能完成/极其影响",得分范围为1~5分。疼痛维度参考视觉模拟评分(visual analogue scale,VAS)使用Likert 10级评分法,条目中选项按照疼痛严重程度由低到高排序,得分范围为1~10分。


(二)量表评估
使用方便取样的方法随机抽取2015年9月至2016年11月于北京市积水潭医院手外科住院的100例腕关节疾病患者填写初始测试量表,根据填写结果统计初始测试量表的条目区分度、条目应答率、条目-维度归属度、变异度、反应度、条目整体归属情况、内部一致性及因子负荷共8项指标。根据统计结果,以每项条目中不符合标准的指标数为参考,若指标数超过4个,则该条目删除;若等于4个,则由研究者考虑取舍;若指标数不足4个,则保留该条目。最终得到腕关节患者功能自评量表,并对此量表进行内外部信度、内容效度及结构效度评价。


(三)质量控制
选择具有本科及以上学历的临床医学专业的人员担任调查员,现场调查之前先行培训,使参与填表者熟悉初始测试量表及测试量表内容,了解调查目的,正确完成调查。对初选条目池进行评分的手外科医生均应具有丰富的腕关节疾病诊治经验,评定方式以自评为主;对阅读及作答有困难的患者给予一定协调和解释,使患者清楚调查目的及注意事项。采用双人录入数据,录入的同时对数据进行清理、检查、审核,发现错误及时纠正。如果被试者答复的量表中某一条目未作答,或某一条目勾选了三个及以上选项,则将该条目作为缺失值处理。若被试者在同一条目中选择了相邻的选项,则可选择其中任意一项作为结果。


三、研究内容
(一)测试量表条目可行性评估
1.条目应答率:
该条目被完成例数占参加调查总例数的百分比。条目应答率<90%,说明该条目表述清晰程度、可接受性及可行性低,则删除此条目。


2.条目区分度:
即量表的临界比值(comparative rate),旨在明确被试者对某一条目中的得分是否能有效鉴别被试者的相应能力。参考既往李凌的研究[15],将初始测试量表中各条目的文件结果进行分组,每个条目中得分前27%的样本纳入高分组、得分后27%的样本纳入低分组,各条目中对两组进行统计学分析,如差异无统计学意义则删除此条目。


3.条目-维度归属度:
初始测试量表共四个维度,计算每个维度的总分与其中各条目以及每个维度中各条目之间的Pearson相关系数。考虑删除条目的标准:(1)条目与所在维度总分之间的Pearson相关系数<0.4;(2)条目与其他维度总分之间的pearson相关系数大于条目与所在维度总分之间的pearson相关系数;(3)与同一维度内其他条目之间的相关系数>0.8的条目。


4.变异度:
量表中各条目得分的标准差与均值的比值。若变异度<0.65,则删除此条目。


5.反应度:
统计某一条目的某一选项在所有有效填写问卷结果中被选中的例数,计算其与有效填写问卷总例数的比值,即为条目选项的反应度。测试量表中存在采用Likert 5级和10级两种评分法,若采用5级评分法的条目中存在反应度<10%的选项多于3个或采用10级法的评分条目中反应度<5%的选项多于5个,则删除此条目。


6.条目整体归属情况:
对测试量表中的所有条目进行多元线性回归分析。若某一条目没有被纳入最终的回归方程中,说明该条目与其他条目相比,与量表整体得分关系较小,则删除此条目。


7.内部一致性:
该指标意在评估量表某一维度中的条目是否与其他条目以及整体维度所要评估的内容方向相符。分别计算各个维度中包括或剔除某一特定条目后的Cronbach系数并进行比较,如果Cronbach系数有较大的变化,则说明该条目所评估的内容与所在维度所评估的内容不完全符合,其存在降低了该维度的内部一致性,则将Cronbach系数前后差值进行降序排列,删除前20%的条目。


8.因子负荷:
对量表结果使用因子分析法计算各个条目的特征值,选取特征值>1的条目作为主成分,考察评估各主成分的方差解释率之和,即积累率。根据具体结果选取主成分中积累率较高的成分作为公因子进行正交旋转,计算各个条目的主成分因子负荷,若条目因子负荷低于0.4,则说明该条目与量表所测试内容相关性不高,则删除该条目。


(二)信度及效度评估
1.信度评估:
选取参加调查研究人群中的20例患者填写最终量表,并在2周后再次填写最终量表,比较2次量表填写结果是否具有一致性,以评估量表的外部信度。同时,再次计算各个维度的Cronbach系数,以评估量表各维度的内部信度。


2.效度评估:
使用专家评分评估量表的内容效度,选取10名腕关节领域的手外科医生从条目描述语言、内容以及填写所需时间方面,对量表内容以满意程度的方式进行整体评价,并统计平均得分。其中有严重欠缺为1分、有欠缺为2分、合格为3分、较为完整为4分、十分完整为5分。

使用KMO值、替代性检验指数(χ2/df)、近似均方根误差(root mean square error of approximation,RMSEA)以及比较拟合指数(comparative fit index,CFI)评估量表的结构效度。


四、统计学处理
采用SPSS 24.0统计软件(IBM公司,美国)进行统计学分析。计量资料(测试量表中的条目区分度)以的形式表示,条目区分度中高分组与低分组比较采用独立样本t检验。检验水准α值取双侧0.05。

使用Pearson相关系数进行评价测试量表中的条目-维度归属度及最终量表中的重测信度;使用多元线性回归分析中的步进模型分析测试量表的条目整体归属情况;使用Cronbach系数比较测试量表中的内部一致性及最终量表中的内部信度;最终量表的内容效度使用探索性因子分析法及验证性因子分析法进行分析;测试量表的因子负荷使用主成分因子分析法进行分析;KMO值使用探索性因子分析法进行计算。

使用SPSS Amos 26软件(IBM,美国)建立维度相应的结构方程模型,使用验证性因子分析法分析χ2/df、RMSEA、CFI。χ2/df越小表示模型的配适度越高,其中>10为完全不能接受、<5为可以接受、<3为处于比较理想的状态。RMSEA指数越小代表模型的配适性越好,其中<0.1代表可以接受、<0.05代表处于比较理想的状态。cfi代表模型的契合度,取值范围在0与1之间,值越大越好,一般要求>0.9。


结果
一、初选条目池的筛选
根据手外科医生及腕关节疾病患者评分,最终删除的项目包括:"插拔插线板""拉比较重的抽屉""炒菜""切肉或切菜(用刀切食物)""抚摸脸""用遥控器""娱乐活动(打高尔夫球、使用锤子、打网球、打扑克牌、打麻将)""使用相机"等8个条目,剩余32个条目。生理维度、安全维度、情感与归属维度的每个条目按照Likert评分法设计成5级单项选择式,疼痛维度的每个条目设计成10级单项选择式,制成初始测试量表,各条目编号为A1~D4(表1)。

二、调查问卷的有效性
问卷测试部分发放100份,回收有效问卷(完成的条目不少于90%)92份。其中男56例、女36例,年龄(37.3±16.4)岁(范围7~79岁)。

三、条目筛选结果
1.条目应答率:
全部条目应答率皆为90%以上,无条目删除。

2.条目区分度:
高分组及低分组各25例患者,所有32个条目中,只有条目B10的高分组得分[(3.20±0.58)分(范围1~3分)]与低分组[(2.68±0.63)分(范围2~5分)]比较差异无统计学意义(t=5.11,P=0.340),则删除B10条目。

3.条目-维度归属度:
D1、D2、D3与总分之间的Pearson相关系数<0.4;D1与所在维度之间的Pearson相关系数<0.4;与其他条目的pearson相关系数>0.8的条目包括A1(3次)、A2(3次)、A5(2次)、A6(5次)、A7(2次)、A8(2次)、A9(1次)、A10(2次)、A11(3次)、A12(6次)、B4(2次)、B6(4次),B7(3次)、C5(3次)。考虑删除A1、A2、A5、A6、A7、A8、A9、A10、A11、A12、B4、B6、B7、C5、D1、D2、D3共16个条目。

4.变异度:
A4(0.645)、A7(0.593)、B1(0.590)、B5(0.617)、B8(0.578)、B9(0.612)、B10(0.526)、D1(0.644)、D2(0.320)、D3(0.169)、D4(0.526)的变异度<0.65,考虑删除这些条目。

5.反应度:
5级评分条目中,被选中率<10%的选项多于3个的条目包括A2、A4、A6、A8、B4、B6、D1、D2、D3,10级条目中被选中率<5%的选项多于5个的条目包括C2、C3、C4、C5、C6,考虑删除这些条目。

6.条目整体归属情况:
A2、A3、A5、A6、A7、A9、A10、B1、B3、B4、B5、B7、C1、C3、C5、D1、D2、D3、D4共19个条目未被纳入最终的回归方程中,考虑删除这些条目。

7.内部一致性:
所有32个条目中,将纳入或不纳入某一条目的相应维度的Cronbach系数的差值进行排序,结果由低到高为0.000~0.434。其中差值最大的前20%的系数及相应考虑删除的条目有C4(0.026)、C5(0.023)、D1(0.103)、D2(0.434)、D3(0.387)、D4(0.062),考虑删除这6个条目。

8.因子负荷:
对32个条目进行降维处理,在降维后的32个成分中提取6个特征值>1的成分为主成分对量表所有条目的内容进行解释,6个主成分共可解释量表整体内容的78.650%(表2)。根据碎石图(图1)可观察到,主成分中的前三个成分明显能解释更多的量表整体内容,将此3个成分作为公因子(累计贡献为66.812%)进行正交旋转并以此计算各条目的因子负荷,D2(-0.051)、D3(-0.127)、D4(0.267)3个条目的因子负荷<0.4,则考虑删除。
图1  主成分因子分析碎石图。共6个成分特征值>1,选取为主成分


根据上述方法进行筛选,其中条目D1、D2、D3的指标数超过4个,则被直接删除;条目C5和D4的指标数等于4个,则考虑由研究者取舍(表3)。最终决定删除D1、D2、D3,剩余有效条目共29条。

四、腕关节患者自评量表的信效度考评结果
(一)信度评价
1.外部信度:
20例患者中回收有效问卷(完成的条目不少于90%)13例。对相隔2周填写量表的结果进行重测信度分析,其中生理维度的Pearson相关系数为0.984(P<0.001)、安全维度为0.976(P<0.001)、疼痛维度为0.985(P<0.001)、情感与归属维度为0.802(P<0.001)、总分为0.991(P<0.001)。

2.内部信度:
总量表、生理维度、安全维度、疼痛维度的Cronbach系数分别为0.943(29个条目)、0.973(12个条目)、0.944(10个条目)、0.881(6个条目),其中情感与归属维度仅有1个条目无法计算Cronbach系数。

(二)效度评价
10名腕关节诊治专家分别独立对调查问卷进行评价,评分为(4.1±1.2)分,评价等级为较为完整。计算KMO值为0.894(P<0.001)。采用验证性因子分析法构建该量表的结构方程(图2),因情感与归属维度仅有1项而无法评价,生理维度的χ2/df、CFI及RMSEA分别为5.152、0.817、0.022,安全维度分别为5.378、0.795、0.023,疼痛维度分别为7.439、0.865、0.028。
图2  结构方程路径图:将四个维度两两相关,每个条目均为观测变量,每个观测变量均对应1个潜变量


讨论
一、腕关节患者功能自评量表的设计原则及特点
腕关节患者功能自评量表的设计原则:(1)条目描述语言应简单、准确、易懂,患者填写量表所用时间不应过长;(2)条目关注内容符合中国人日常生活、工作需求;(3)量表评估内容包含现代社会新增的需要腕关节活动的动作;(4)每个条目能有效地反映患者某一方面的功能状态而不重复;(5)同一患者在短期不同时间所填写的量表结果应具有一定程度的稳定性。

考虑到不同患者的精神状态也可能对疾病的严重程度、治疗预期造成影响,而这一问题在既往的量表中并未被体现。因此,本量表中增加了情感与归属这一维度,以明确患者情绪及精神状态对疾病描述的影响,指导临床医生更准确地评估患者病情的严重程度及治疗预后。


二、腕关节患者功能自评量表的信度评价
在对腕关节患者功能自评量表的信度评价中,我们通过重测信度来评价同一患者在短期不同时间内填写的问卷结果是否具有稳定性,通过Cronbach系数评估各条目对相应的维度的归属程度,即量表所评价的各个维度是否具有稳定性。结果提示该量表具有较好的外部信度(重测信度)及内部信度(Cronbach系数),符合测量学要求。


三、腕关节患者功能自评量表的效度评价
在对腕关节患者功能自评量表的效度评价中,我们主要对量表的内容效度以及结构效度进行评估。其中内容效度主要通过专家评分法来评判,在研究中10名腕关节专家对量表的整体评价为较为完整,可以认为该量表具有较好的内容效度。

对于结构效度的研究,通过探索性因子分析法与验证性因子分析法相结合的方法,构建相应的结构方程模型,计算KMO值、χ2/df、RMSEA、CFI结果,从而评估结构效度。其中KMO值为0.894,表明该量表符合进行因子分析标准。除情感与归属维度无法进行因子分析外,其余三个维度的χ2/df结果为5.152、5.378、7.439,由于该指标受样本数量影响较大,其数值相对不稳定,因此参考价值相对较小;三个维度的RMSEA均小于0.05,说明结构方程模型接近拟合;三个维度的CFI值分别为0.817、0.795、0.865,说明该量表的结构方程模型未能完全对量表本身所描述的结果进行拟合。Lai和Green[16]的研究表明,若某一模型的CFI与RMSEA解释结果不一致,其原因可能是:(1)这两种指标的观察角度不同;(2)研究中的cut-off值需要进行修正;(3)进一步明确这两个指标如何对模型拟合的程度进行评价。考虑到本研究中,RMSEA结果良好,CFI值结果欠佳,其原因除二者对模型的观察角度不同外,可能是在不同维度中存在1个或数个条目与自身所在维度描述内容不完全一致。这在一定程度上解释了在统计条目-维度归属度这一指标中存在大量条目的Pearson相关系数不符合要求的情况。

综合上述结果,本量表的内容效度较好;结构效度中RMSEA结果符合标准,而对CFI结果考虑到该指标与RMSEA观测角度不同,且三个维度的CFI结果十分接近提示模型拟合较好的临界值0.9,显示各项指标结果良好,因此可以认为本量表的结构效度相对可靠。


四、研究局限性
本研究仍有不足:(1)样本人数相对较少,可能存在选择偏移,该问题可通过后续研究样本的补充来进一步验证评估;(2)本研究初次对腕关节功能量表的情感与归属维度进行探索,最终该维度内有1个条目,无法完整评估其结构效度,因此其效果需要进一步探索及评价;(3)该量表尚未和其他传统主观评估量表进行比较,因此无法明确该量表的结构效度,需后续工作进一步明确;(4)本研究中量表的结构效度评估指标存在一定分歧,可能需要后续对模型进行进一步修正以及验证。

参考文献(略)


        




小提示:87%用户已下载掌上医讯App,更方便阅读和交流,请扫描二维码直接下载App

(本网站所有内容,凡注明来源为“掌上医讯”,版权均归掌上医讯所有,欢迎转载,转载请注明出处,否则将追究法律责任。凡是本网站注明来源为其他媒体的内容为转载,版权归原作者所有,转载仅作分享,文章观点不作为掌上医讯观点,如有侵权,请及时联系我们,联系电话:0532-67773733)

共有0人参与讨论