网刊加载中。。。

癌症作为严重威胁人类健康的主要致死疾病之一，近年来新发癌症病例数和死亡病例数不断上升，其负担之重亟待破解[1]。成本-效用分析（cost-utility analysis，CUA）作为卫生技术评估（health technology assessment，HTA）常用的研究方法[2]，可用于比较不同癌症领域的干预措施，为癌症的诊治、防护及相关政策制定提供科学循证依据。健康效用（health utility）是人们对某种特定健康状态的偏好程度，用于反映生命质量的权重，其准确测量是CUA结果可靠性的重要保证[3]。本文对癌症患者健康效用测量方法进行介绍和评述，即直接测量法、多属性健康效用测量量表法（multi-attribute utility instrument，MAUI）和映射法，以期为癌症HTA领域内健康效用测量工具选择提供经验参考，继而为优化癌症领域资源配置以及政策制定提供循证依据。1直接测量法直接测量法是效用测量中最为基础的方法，理论依据充分且可以直观地测量出受访者对于某种健康状态的效用，包括刻度评分法（rating scale，RS）、标准博弈法（standard gamble，SG）、时间权衡法（time-trade off，TTO）、离散选择实验法（discrete choice experiment，DCE）、优劣尺度法（best-worst scaling，BWS），这5种方法的理论基础和使用方法见表1。10.6039/j.issn.1001-0408.2023.04.13.T001表15种直接测量法的理论基础和使用方法方法理论基础使用方法RS心理测量学理论引导受试者将自身健康状态按照偏好程度的高低进行排列，随后将所有健康状态排列在1个刻度尺上，不同健康状态之间的间距应与受试者对两者之间偏好的差距相对应SG期望效用理论给受试者提供两种选择的方案。方案1受试者存在一定的风险，可能产生两种结果：（1）通过治疗，患者康复并健康地生存一定的年限（概率为P）；（2）患者治疗无效，立即死亡（概率为1－P）。方案2受试者在健康状态下生存一定年限。不断改变P值，直到受试者对两种方案的选择偏好接近一致。此时，健康状态的效用值为PTTO价值理论给受试者提供两种选择的方案，方案1受试者在健康状态下生存t年，随后死亡；方案2受试者在完全健康状态下生存x年（x＜t），随后死亡。不断改变x值，直到受试者对两种方案的选择偏好接近一致。此时，健康状态的效用值为x/tDCE随机效用理论要求受试者回答若干个选项集，每个选项集一般会包括两个不同的健康状态描述，要求受试者从中进行权衡，选择出较优的一个BWS随机效用理论要求受试者在一系列选项组合中不断重复做出最好项和最差项的选择，并由此评估受试者个体偏好的优先顺序1.1RS、SG和TTORS、SG和TTO这3种方法开发较早，早期使用较多，且在癌症患者健康效用测量中经常联合使用或进行比较。RS是直接测量法中最简便的方法，主要包括类别比例法、尺度评分法和视觉模拟法，其中视觉模拟法最为常用。RS虽然易于理解且操作简单，但其理论基础不强且受访者的心理认知与感受易受到多种外界因素影响，继而影响测量的准确性。甚至有研究者认为在RS中受访者没有进行风险权衡或在多个备选方案中进行选择，因此得出的结果不是效用[4]。TTO与SG具有较强的理论基础，均是找到受访者相对可以接受的均衡点，其中SG是对死亡风险进行权衡，而TTO则是对生存时间进行权衡，但二者均存在实际操作复杂、成本较高以及对受试者的认知要求较高等问题。TTO的实施难度介于RS和SG之间，是三者中应用最为广泛、研究最为深入的效用测量方法。这3种方法在癌症患者健康效用的测量中均有应用[5]。Kaplan等[6]在前列腺癌患者中比较了RS和TTO两种方法，结果显示癌症患者对TTO的满意度较低且具有显著的天花板效应，内部效度差于RS。总而言之，这3种方法获得的癌症患者健康效用存在差异，SG产生的效用最高，TTO次之，RS产生的效用最低[7―8]。这可能因为SG的问题中涉及立即死亡这一选项，而受试者大多对这一风险存在厌恶心理。由Mcneil等[9]和Stiggelbout等[10]的研究可知，人们在面对风险时会采取风险规避措施，而癌症患者病情相对较重，一般存在非常强烈的风险厌恶心理，且风险规避与药物治疗之间存在关联，接受过化疗的癌症患者会更加规避风险。故SG获得的效用一般高于TTO所获得的效用。1.2DCE和BWSDCE和BWS具有相同的理论基础且均是让受试者在虚拟情境下进行选择。DCE在20世纪末被引入健康领域用于测量患者健康效用、分析患者偏好和支付意愿以及资源配置决策和价值判断等研究。DCE通过模拟具体情景可以帮助受试者更好地理解问题并可同时进行多属性评估，实施简单且响应效率较好。BWS是近年来在国际上运用越来越多的测量意愿和偏好的方法，主要包括3种类型：对象型（BWS-1）、组合型（BWS-2）和多重组合型（BWS-3），其中BWS-2主要应用于健康经济学领域。相比于DCE，BWS拥有更强的辨别力且更容易获得所给选项的完整排名，并可通过较小的样本量来准确估计偏好，拥有更高的统计效率[11]。目前二者已被验证具有较好的信度和效度，但二者在癌症领域信度和效度的验证较少，多用于测量癌症患者需求和治疗的偏好且大多数的受访者表示更喜欢DCE[12]。Maculaitis等[13]分别利用DCE和BWS测量乳腺癌患者的健康效用并比较了肿瘤学专家和患者对治疗方法的偏好，结果表明二者测得健康效用以及肿瘤学专家和患者最看重的属性基本一致，但大多数的受访者表示更喜欢DCE。2MAUIMAUI由健康状态分级系统和与其对应的健康效用积分体系两部分组成，研究者利用健康状态分级系统获得受访者目前所处的健康状态后根据其健康效用积分体系计算出该状态的效用。由于不同国家/地区人群所处环境、文化等因素不同致使其健康偏好也存在差异，故需要基于本国/地区人群偏好建立健康效用积分体系。MAUI是目前最为常用的癌症患者健康效用测量方法，主要包括普适性健康效用量表和疾病特异性效用量表。2.1普适性健康效用量表普适性健康效用量表便于理解且操作简单，同时适用于普通人群和患病人群，常用的普适性健康效用量表信息见表2。10.6039/j.issn.1001-0408.2023.04.13.T002表28个普适性健康效用量表的基本信息量表简称量表全称（中/英文）研发年份研发国家维度水平可定义健康状态数量EQ-5D-3L3水平欧洲五维健康量表（EuroQol-5 dimensions-3 levels）1990多国合作53243EQ-5D-5L5水平欧洲五维健康量表（EuroQol-5 dimensions-5 levels）2009多国合作553 125SF-6Dv1六维健康调查简表第一版（short form -6 dimensions version l）1998英国64～618 000SF-6Dv2六维健康调查简表第二版（short form -6 dimensions version 2）2015英国65～618 750HUI2健康效用指数量表第二版（health uti-lity index version 2）1992加拿大73～524 000HUI3健康效用指数量表第三版（health uti-lity index version 3）1995加拿大85～6972 00015D十五维多属性效用量表（15-dimensional multi-attribute utility scale）1994芬兰1553.1×1010QWBa良好适应状态质量评估量表（quality of well-being scale）1976英国3+262～4945a：QWB包含3个维度和1个症状/问题集（26条目）2.1.1EQ-5DEQ-5D是各国各领域最常用的普适性健康效用量表，包括EQ-5D-3L（以下简称“3L”）和EQ-5D-5L（以下简称“5L”）两个版本。EQ-5D已广泛应用于癌症领域且具有较好的信度、效度和反应性，对此美国、韩国和中国等多项研究都提供了有力的证据[14]。目前大多数实证研究均表明5L的测量属性整体优于3L。Zeng等[14]比较了3L和5L在6种常见癌症患者中的测量特性，其中3L的天花板效应（17.8%）远高于5L（10.1%），5L的重测信度和聚合效度也略优于3L，二者均显示出较好的组间效度，但5L区分能力更强。2009年，欧洲生命质量组织开发了适用于儿童及青少年的版本（EQ-5D-Y），EQ-5D-Y依然包括EQ-5D-Y-3L（以下简称“3LY”）和EQ-5D-Y-5L（以下简称“5LY”）两个版本，并且已有研究对EQ-5D-Y两版本的信度和效度进行了检验[15]。沈安乐等[16]在血液肿瘤儿童患者中对EQ-5D-Y进行了验证，结果表明3LY和5LY在该人群中均具有一定的可行性以及可接受性，但5LY的区分能力更强。2.1.2SF-6DSF-6D包括SF-6Dv1和SF-6Dv2两个版本。SF-6Dv1是Brazier等[17]在健康调查简表（SF-36）的基础上开发的基于人群偏好的测量工具，具有测量维度丰富、各维度分级精细以及拥有科学的效用值换算公式等优点，其信度、效度和反应性已在癌症患者中得到验证。近期有研究表明，SF-6Dv1中部分语言表述模糊，可能导致受访者理解存在歧义，并且个别维度的水平数量较少致使该维度的区分度不够，故在此基础上研究者开发了SF-6Dv2。SF-6Dv2虽开发较晚，但其有效性和可靠性在普通人群和癌症患者中均已得到验证[18]。同样作为应用较多的普适性健康效用量表，EQ-5D和SF-6D经常在同一研究中被用来比较。大多研究表明，SF-6D较EQ-5D具有更低的天花板效应和更高的敏感性，但SF-6D的地板效应高于EQ-5D[19]，这一结果同样适用于癌症领域。Tramontano等[20]在肺癌患者中对两个量表进行比较，结果发现EQ-5D的天花板效应（20.0%）远高于SF-6D（2.3%）。两个量表均适用于癌症患者健康效用的测量且能够区分不同癌症患者的健康状态，但利用EQ-5D测得的癌症患者健康效用一般高于SF-6D，这一结果在乳腺癌患者（EQ-5D为0.685，SF-6D为0.653）[21]和肺癌患者（EQ-5D为0.78，SF-6D为0.68）[20]等癌症群体中均有证实。2.1.3其他HUI有3个版本，即HUI1、HUI2和HUI3，目前HUI2和HUI3已经取代了HUI1。相对于HUI2，HUI3拥有更详细的描述系统和更完整的结构独立性，但HUI2有一些HUI3没有的额外维度，如自我照料和生育，故HUI2常用于某些特殊研究中。研究表明，HUI是一种可接受的、可靠的、有效的癌症患者健康效用测量工具，并且可应用于儿童癌症患者当中[22]。Shimoda等[23]、Fu等[24]、Boran等[25]在巴西、中美洲、土耳其等国家或地区的儿童癌症患者中均证明了HUI的可行性、可靠性和有效性。QWB是国际上第一个专门用来测量生命质量以评估质量调整生命年的普适性健康效用量表[26]，该量表在癌症领域具有良好的信度、效度和较高的敏感性，并且其有效性在儿童癌症领域得到了验证[27]，但在国内却鲜有应用。15D是一种通用的、全面的、自我管理的用来测量成人健康相关生命质量的量表，该量表是为16岁以上的成年人设计的，问卷已有14种语言版本[28]，其适用性在西方国家的癌症患者中已被证明[29]。目前该量表在我国应用较少。16D和17D是在15D的基础上开发的：17D适用于8～11岁的儿童，16D适用于12～15岁的青少年[29]，两个版本已在儿童癌症领域中有所应用[30]。2.2疾病特异性效用量表普适性健康效用量表虽已被验证适用于癌症患者，但存在现有条目与癌症的关联性较低以及灵敏度较低等问题。在实际的临床试验和研究中，医护以及患者更愿意选用疾病特异性效用量表来测量癌症患者的健康相关生命质量。“欧洲癌症研究与治疗组织（European Organization for Research on Treatment of Cancer，EORTC）”研发的QLQ-C30和美国西北大学“结局、研究与教育中心”开发的癌症治疗功能评价系统（functional assessment of cancer therapy，FACT）是当前世界范围应用最广的两类癌症患者健康相关生命质量测定的量表。这两个量表总结了许多症状和特定癌症领域的量表，具有很强的临床实用性，但目前无法对癌症患者的健康效用进行直接测量。为了有效解决此问题，癌症多属性效用测量联盟在QLQ-C30和FACT的基础上开发了基于偏好的癌症特异性效用量表QLU-C10D[31]和FACT-8D[32]。2.2.1QLU-C10D2011年，Rowen等[33]利用Young等[34]的方法对655例多发性骨髓瘤患者的临床试验数据进行分析，开发出包含8个维度的生命质量测定量表EORTC-8D。在2016年，癌症多属性效用测量联盟利用同样的方法[34]对来自14个国家的2 616名癌症患者的临床数据汇总并进行二次分析，纳入了肿瘤学家和患者的意见，保证了新开发出的QLU-C10D具有国际适用性和临床有效性[31]。该量表与EORTC-8D在情绪功能、疲劳、恶心和肠道问题4个维度是完全相同的，身体功能维度包含相同的条目但水平不同，角色功能、社交功能和疼痛3个维度包含不同的条目，并在此基础上增加了睡眠和食欲2个维度，可定义1 048 576个健康状态。由于QLU-C10D在研发时样本数量更大且具有多样性及量表涵盖维度更全面等优势，因此其权威性得到公认并被EORTC推荐使用。QLU-C10D的信度和效度已经在癌症人群中得到验证[35]，并且澳大利亚、加拿大、德国、法国、英国、荷兰、西班牙、美国以及奥地利、波兰和意大利（三国合作开发）均已建立起基于本国人群的效用积分体系，此外还有多个国家正在相继开展效用积分体系的构建工作。澳大利亚是第一个采用伴有生存时间的DCE建立QLU-C10D效用值积分体系的国家，效用取值范围是[－0.096，1]。Bulamu等[36]对比了QLU-C10D和3L在食管癌术后患者短期生活质量的反应性和聚合效度，结果表明，虽然二者均适用，但QLU-C10D对患者的短期内效用变化更敏感。Gamper等[37]将基于一般人群的效用积分体系构建方法应用于癌症患者，证明其在癌症患者中的可行性和可接受性，为QLU-C10D将来在癌症患者中的评估研究提供了可能。2.2.2FACT-8DFACT-G作为FACT系列的核心量表在全球范围内已有72个语言版本且在中国也有着广泛的应用。2021年，King等[32]对现有FACT-G进行心理测量学分析并同样邀请了癌症患者对条目进行评估，最终纳入疼痛、疲劳、恶心、睡眠、工作、社会支持、悲伤和未来健康担忧8个维度形成FACT-8D，每个维度包括5个水平，可定义32 768个健康状态。澳大利亚是第一个采用伴有生存时间的DCE的方法建立FACT-8D效用值积分体系的国家[32]。Herdman等[38]评估了FACT-8D在复发性/难治性套细胞淋巴瘤中的有效性和反应性，并与5L进行了比较，结果表明二者均具有良好的聚合效度和反应性，但在组间效度的测量中FACT-8D相较于EQ-5D表现较差。这是首次对FACT-8D的心理测量学特性进行研究，未来还有待于在其他类型的癌症患者中进行验证。3映射法映射法是通过建立非效用量表和效用量表各维度水平之间的映射关系，利用各维度水平的预测概率和效用量表的积分系统计算出患者的健康效用。由于应用于癌症的疾病特异性效用量表大多是非基于偏好的设计，不能直接用于CUA。鉴于此，映射法在癌症领域应用广泛[39]。研究者通常将应用于癌症的疾病特异性效用量表（如QLQ-C30、FACT等）映射到普适性健康效用量表中，再用于CUA，其中EQ-5D及SF-6D最为常见。有研究将QLQ-C30映射到EQ-5D、15D和SF-6D上，结果表明三者模型预测均较好，其中SF-6D的预测能力最佳[40]。映射法在模型的稳健性、结果的准确性以及公式的外推性等方面存在一定争议，英国国家卫生与临床优化研究所等机构将映射法作为相对于直接测量方法和MAUI的次优选择，随着QLU-C10D和FACT-8D的出现及相应积分体系的构建，映射法的应用在将来可能会逐渐减少。4讨论4.1癌症患者健康效用测量方法间的比较直接测量法在癌症领域有着广泛的应用，其信度和效度在癌症患者中已得到验证。相对于RS、TTO和SG这3种方法，DCE和BWS在认知难度方面有所降低，因此这两种测量方法在癌症患者健康效用测量领域应用逐渐增多。但总体而言，直接测量方法依然存在操作复杂、成本较高以及对受试者的认知要求较高等问题，故较少直接用于癌症患者健康效用的测量，多用于量表的效用积分体系的构建及方法学之间的比较研究。MAUI是当前癌症患者健康效用测量的首选方法。普适性健康效用量表在大多数癌症患者健康效用测量的研究中已显示出合理的可靠性、信度和效度，其中EQ-5D和SF-6D应用较多。由于同一工具在不同癌症类型和阶段中表现不同且不同工具在同一癌症人群中的表现也存在差异，所以癌症患者应结合各量表特点选择适合的测量工具。在中国，健康效用测量与健康效用积分体系构建这一领域研究起步相对较晚，在癌症领域的相关研究与应用也较少，目前仅有3L、5L及SF-6Dv2拥有基于中国一般人群的健康效用积分体系。普适性效用量表的维度和水平较为简洁，并非针对癌症患者开发，缺乏识别和区分癌症相关症状的能力。例如癌症患者更重视睡眠、疲劳、认知功能和社会支持等因素，但普适性健康效用量表并没有涵盖[41]，因此临床医生和研究人员通常倾向于选择对患者干预措施的效果更为敏感的疾病特异性效用量表[33]，方便测量和收集癌症患者的相关症状、副作用以及功能和生活质量等方面的信息。但目前可用于测量癌症患者健康效用的疾病特异性量表的研发和基于本国人群效用积分体系的建立仍处于起步阶段。4.2儿童癌症患者健康效用测量现状儿童癌症在儿童常见死因中占据高位[42―43]。儿童癌症虽然预后通常比成人好但副作用带来的长期影响也较大，可能会对儿童、家庭甚至社会产生持续影响。若能对儿童癌症患者的健康效用进行准确测量，可为临床治疗方式选择提供参考。目前健康效用测量工具在儿童癌症中已有一定的验证和应用。Chen等[44]汇总了儿童癌症患者、幸存者以及一般人群的健康效用测量方面的研究，结果显示该领域较多使用HUI2和HUI3，测得的健康效用由高到低分别为一般人群、幸存者和儿童癌症患者，其中有脑部肿瘤的儿童患者测得健康效用最低。总体而言，可用于儿童癌症患者的健康效用测量工具仍较少，一些研究直接使用各量表成人版本进行测量，但大多数儿童和青少年缺乏充分理解量表中条目内容的能力，可能会导致其测量结果存在偏差，应尽量开发、完善儿童癌症患者健康效用的测量工具。4.3癌症患者健康效用测量工具代理版本的开发、完善及应用考虑到癌症患者中较多为重症甚至是濒临死亡的患者，可能不再愿意或无法回答问卷；其次对于儿童患者而言，表达能力和理解能力有限，自填版量表对于儿童而言可能存在一定难度。基于以上两点，癌症领域的研究者对测量工具代理版本的开发和完善较为关注。目前已有一些测量工具的代理版本在癌症患者中应用。Zhou等[45]利用3LY和5LY分别对儿童血液系统恶性肿瘤患儿和照顾者同时进行测量，结果表明二者具有良好的一致性和重测信度；Takura等[46]同样证明了代理版本在晚期肺癌患者中具有可行性。但代理版本和自填版本在癌症患者中测得的效用值存在一定差异，大多研究表明利用自填版量表获得的效用低于代理版本[44，47]。4.4癌症患者健康效用测量工具附加维度的开发附加维度是指为提高量表测量的准确程度在原有量表的维度基础上新增加针对某种疾病人群或某种状况的维度[48]。这一方法在EQ-5D中已经存在相关研究。2005年，Hoeymans等[49]首次在EQ-5D中加入认知维度，结果显示，加入认知维度后可提高内容效度和不同人口学特征人群的区分度。后续研究中，3L和5L的附加维度主要集中在视觉、听觉、睡眠、疲劳、自信、认知、呼吸等方面，其中睡眠和疲劳等与癌症患者关系密切。附加维度同样可用于疾病特异性效用量表来填补描述系统中针对特定癌症部位和新型治疗方法的空白。附加维度既能保留原量表已得到验证的维度，又能提高在特定领域的敏感性，因此可以进一步探讨其在癌症患者健康效用测量的研究中的应用。5结语健康效用测量作为CUA过程中至关重要的一环，其测量方法受到学者们的广泛关注。本文重点对癌症领域健康效用测量方法进行系统介绍并对其在癌症患者中的应用进行评述。尽管MAUI是当前癌症患者健康效用测量的主要方法，但普适性健康效用量表对不同癌症的敏感性和区分度较低，疾病特异性效用量表目前仍处于起步阶段。因此，如何选择癌症领域HTA健康效用测量工具成为研究设计中的重要环节。我国在癌症领域的健康效用测量相关研究开展较晚，今后的研究中应尽快研制符合我国人群语言习惯和文化背景的癌症健康效用量表以及构建其健康效用积分体系，进而推动我国健康效用研究乃至HTA领域的进一步发展。