Dr.2专栏

【科普】精准医疗与遗传基因检测的行业分析(下)

作者：陈遵秋陈漪伊

引言：

上篇文章我们介绍了遗传基因检测的七个种类和效用，谈论了遗传基因检测是否包查百病，人们对于使用遗传基因进行疾病的风险预测十分谨慎。通过GWAS研究遗传基因检测里的数据分析，介绍接收者操作特征曲线。

本文将继续讨论接收者操作特征曲线和保险机构对遗传基因检测的实际操作意见，公众对遗传基因检测的态度，家族病史风险预测模型。

接收者操作特征曲线(receiver operating characteristic: ROC)正是体现了真实风险比率与虚假风险比率之间的动态关系，而线下面积(Area under curve:AUC)则代表了一个风险预测模型综合预测能力。那么如何从真实风险比率与虚假风险比率得到接收者操作特征曲线呢？我们可以把模型计算得到的个体患病风险系数按照不同的分类标准进行划分归类，对应每一个分类标准可以得到一个2乘2的归类表格。例如，如果我们如果考查20个不同的分类标准（从保守到激进），就能得到了20个2乘2的归类表格。对应每一个表格可以算出相应的真实风险比率与虚假风险比率。将两者由低到高排序后以虚假风险比率为X轴，以真实风险比率为Y轴数值画成的曲线就是接收者操作特征曲线（ROC）。图四显示了若干ROC曲线，有好的，有不理想的。

图四：

那么如何解读接收者操作特征曲线呢？首先我们注意到有一条从（0，0）到（1，1）的对角线，把图示的方块分成了一上一下两个三角形。任何落在方块下半部的那个三角形区域的ROC曲线是没有意义的，因为那个贯穿（0，0）和（1，1）点的对角线代表的是我们随机预测所会得到的ROC曲线，也就是说，如果我们什么模型都不要，靠随机翻硬币来决定一个个体是高风险的还是低风险的，那样翻上一万个人，我们得到的ROC曲线就会是那条对角线（真实高风险率和虚假高风险率是一半一半）。显而易见，那种靠翻硬币的预测模型是十分不靠谱的，而ROC曲线如果落在那条对角线之下，说明这个预测模型比翻硬币模型还要糟糕，自然是没有用的。图中的红色ROC曲线代表了一个十分优秀的预测模型，它表示这个模型的分类预测结果相当好。这是怎么看出来的呢？主要就是看AUC，即ROC曲线下的区域面积。这个面积越接近于1（1是这个方块的面积，也是AUC可能达到的最大值），ROC所代表的预测模型综合预测能力越强。这就是为什么我们称（0，1）这个角落为好角落，因为ROC曲线越贴近这个角落就越理想。但是单凭AUC还是不够的，我们还要看是否能在曲线上找到一个点有着足够高的真实高风险比率和足够低的虚假高风险比率，这个点所代表的分类标准就是最佳分类标准。（题外话：还有其他有效的衡量预测模型好坏的标准，本文就不赘述了。今后有机会，会在其他文章或讲座中提到）。

运用这些基本概念，现有的研究学术文章已经发表了根据AUC来判断SNP为基础的风险预测模型的精准程度了。研究结果表明使用SNP为基础的基因风险预测模型只在罕见的疾病类型中有着相对较好的预测能力，而在常见的疾病类型中的预测能力则差强人意。(Do C., etal., 2012)。这儿需要指出所谓好的预测能力也是相对的，因为不管在哪种疾病类型中，单纯的以SNP为基础的基因风险预测模型所获得的AUC值都不是很理想（小于0.8）。一般我们认为0.8-0.9是良好，0.9-1是优秀。

1. 遗传基因检测的保险业状况

美国的医疗服务费用体系是以保险业为主要框架结构的。在美国，私有医疗保险业务几乎覆盖了全美三分之二的人口。医疗保健支付者针对这些医疗服务，必须对何时以及如何支付做出决策以平衡控制不断增加的健保费用，同时，又能保证健保质量的最优化。

美国一家名为DNA Direct公司针对206家拥有50,000会员以上的医疗保险公司进行了一项市场调查。有66家对外公开了他们的保险条例，其中有 65家（98%）对遗传基因检测提供了保险服务。他们具体的保险范围如下：

表一：

来源：Michael D, et al. (2013), Genetic Testing InsuranceCoverage Trends, Personalized Medicine, 10(3):235-243

这儿可以看到，所有的保险公司都没有把“直接面对消费者的基因检测”和 “基因治疗”纳入到保险范围中去。这样的现象有其背后的复杂原因。保险业在制定保险条例时，制定者通常都是在有了充足证据的前提下开设保险业务的。2004年，美国疾病控制和预防中心（Centers for Disease Control and Prevention： CDC）针对如何评估遗传基因检测的安全性和有效性制定了一系列的标准（ACCE） ( Centers for Disease Control andPrevention, 2015)：

· 分析有效性（Analytic validity）：对感兴趣的基因检测究竟有多准确和可靠（比如前面提到的PPV,AUC标准等）。

· 临床有效性(Clinical validity)：用于检测或预测结果的方法的稳定性和准确性有多大（是否不同时间，同一检测方法给出的结果变动会很大？）。

· 临床实用性(Clinical utility)：有多大的可能，此检测能显著提高改善病人的状况。

· 相关的伦理，法律和社会影响(Ethical, legal and socialimplications)：此检测可能引发的一系列伦理，法律和社会影响。

针对于这四个标准，他们设计了44个问题来具体衡量各类遗传基因检测是否达到要求。感兴趣的读者可自行去此网站（http://www.cdc.gov/genomics/gtesting/ACCE/acce_proj.htm）查看细节。基因疗法现在还处于摸索研究阶段，还没有能完全达到并符合以上提到的所有标准。而直接面向消费者的基因检测服务，也面临类似同样的问题。好多基于全基因组关联研究的这些测试由于缺乏临床实用性而不能在临床实践中被推荐使用(Robson ME，et al., 2010) 。这里举一个来自23andMe（一家直接提供给消费者基因检测的大公司）的例子：一个消费者拿到的检测报告显示他在45到78岁之间患上冠状动脉疾病的风险是46.3%，而普通人的风险是46.8%。0.5%的差异在临床上几乎没有任何指导意义。相对于此，通过家庭病史的风险预测模型（另外一种风险预测模型，后文会提及），考虑到体重指数，生活方式的选择，胆固醇和血脂水平等的信息，此消费者反而能获得更多有指导意义的帮助(Skirton H.,et al., 2013)。以上这些至少可以部分解释为何保险业对此两项基因检测服务不愿意进行投保服务。

2. 公众对遗传基因检测的态度

普遍来说，公众对于遗传基因研究和新的基因技术是持积极态度的。虽然大多数人并不十分了解概率是如何被应用在遗传基因风险分类及预测上的，对遗传医疗保健专业人士所使用的技术语言也知之不详,但这不妨碍他们高度关注遗传基因检测(Condit C, 2010)。然而，这种积极态度是复杂的，并且因不同的基因研究，试验的用途，检验的临床效用，和遗传研究的应用领域（比如医疗领域相对于克隆领域）而有所不同。

一项研究显示公众态度对于“直接提供给消费者基因检测”的服务是相当积极的，但是真正决定去使用的却并不多（McBrideC.,et al., 2010）。除了以上提到的保险因素（即保险公司一分也不付，费用全得消费者自己掏腰包），公众对私人公司提供的此类服务并不十分信任。这种不信任主要存在于两方面，首先是对私人公司能否保证个人医疗信息的私密性存疑，其次是对通过私人公司获取检测结果的遗传咨询是否纯粹（不带有支持公司盈利的倾向性）有所顾虑。因此即使要做检测，公众也更有可能使用医生推荐的“直接提供给消费者基因检测”的服务而不是自己去找私人公司。（Critchley C., et al., 2014）。此外，遗传基因检测后续是否存在临床治疗方法（临床实用性）也在很大程度上影响着人们是否要使用此检测的决定。比如，存在可能治疗方法的遗传性乳腺癌和结肠癌做的遗传基因检测比例要高于目前没有可能治疗措施的亨廷顿氏舞蹈症(CameronL, Muller C, 2009)。然而，有意思的是，人们在新生儿筛查上对临床实用性却又不那么看重了，就算所能检测的疾病不存在有效的后续治疗方法，父母仍对使用遗传基因检测有着相当大的兴趣（Etchegary H., et al., 2012）。这可能是因为父母可以从新生儿筛查提供的基因信息上预先对孩子的出生及后面培养上可能出现的障碍做好心理准备，或者，他们可以用此信息来帮助今后的生育决定（Etchegary H.,et al., 2012）。

尽管各种各样的遗传基因检测给人们提供了对相当多疾病的风险预测评估，但是，科学研究没有发现人们在获得此类信息后对他们的健康行为有所改变。一项针对“直接提供给消费者基因检测”的研究显示，大部分使用过此服务的受访者说，他们并没有由于检测的结果而改变他们的生活方式或者健康管理(McGowanM., et al., 2010) 。一份针对5个临床实验的研究也表明DNA风险信息的提供无论对短期吸烟行为（小于6个月）的改变还是长期吸烟行为（大于6个月）的改变均无影响。目前，在获得了遗传基因检测结果后，人们唯一有所改变的行为是：当他们获取关于罕见基因突变相关的个人基因信息后，会去进行进一步的疾病检查，特别是具有遗传特性的癌症类疾病（Schneider K, Schmidtke J, 2014）。

综上所述，尽管遗传基因检测的风险信息可以作为健康行为改变的一条引线，它似乎并没有能单独对健康行为的改变及维持提供足够的动力。当然，众所周知，改变有害健康或某些不利健康的行为是非常困难的。个人往往需要更有针对性的健康指导，结合健康理念和外界环境的改变，在适度经济刺激的推动下才能长期摈弃不良健康习惯。感兴趣的读者可参见以前本文作者写的《可穿戴设备及其数据利用的再思考》。

3. 家族病史风险预测模型

相对于以研究基因相关性为基础的风险预测模型，还有一种更早被广泛应用在疾病风险预测上的模型：家族病史风险预测模型。2002年，美国疾病控制和预防中心（CDC）在确认家族病史是一个十分有效预测风险分类的工具但没有得到充分利用的原则基础上，推出了家族病史的公共卫生研究行动(Orlando LA,et al., 2013)。家庭成员共享基因，行为，生活方式和环境。所有这些综合在一起可能影响他们的健康和慢性疾病的风险。大多数人有一些慢性的家族健康史疾病（如，癌症，冠状动脉心脏疾病，以及糖尿病）和异常健康状况（如，高血压和高胆固醇血症）。如果血缘关系较近的家庭成员中有人患有慢性疾病，那么他/她本人会出现此类疾病的风险较高。而且，家族病史信息可能有助于揭示还未被发现的基因因素及环境对疾病的影响。家族病史评估已经被证实能用于鉴别常见慢性疾病的高风险人群。例如，研究显示，在心血管疾病风险评估上，通过使用收集到的家族病史资料，对高风险个体的鉴别能力提高了40% (Qureshi N., et al., 2009)。当然，家族病史风险预测模型也有其不足之处。它和基因风险预测模型正好相反，在常见的疾病类型中发挥出相对较好的风险预测效果，而在罕见的疾病类型中它的预测能力就不很理想了(Do C., etal., 2012)。

综上所述，家庭病史风险预测模型和基因风险预测模型在罕见或常见疾病中各有优势。他们互为补充。人们因而提出如果把这两种方法的结果结合起来，或者把基因信息和家庭病史同时利用起来建立新的风险预测模型将有助于我们更好地对疾病风险进行预测。这个研究方向目前还在探索实验阶段。

4. 展望未来

回到本文开篇提到的精准医疗。精准医疗其实并不是一个新的概念，但在近期十分受关注，因为计算工具和更好的大型生物数据库的发展，使得循证精准医学的研究变得真正可行了。

针对这一理念，美国国立卫生研究院在2015年4月20号发布了一项通告，寻求100万公众对相关研究的参与支持，并承诺收集到的数据将作为研究资源用于开发和验证新的方法以改善健康。比如，发展根据个体差异的临床实践，定制诊断，预防和治疗策略。参与者将被要求提供生物标本（可能包括：细胞群，蛋白质，代谢物，RNA和DNA的全基因组测序），以及行为和环境数据。这些都将与他们的电子健康记录（电子病历）相连接。参与者医疗信息的私密性将被严格保护。

如此大规模的研究可以最大限度地发挥其研究的价值，包括：1）大量的参与者数量不仅保证了常见疾病能有充足的研究数据，即使是以往受限于人数及信息的罕见疾病，在这种收集方式下也能得到合理的研究数据用于推进更深层次的研究; 2）以往采样人群中由于样本量太小而不具有研究代表性的特别人群，这次也可以获得足够数据来研究这些特殊人群与一般人群不同的健康差异性; 3）收集涵盖了广泛的年龄范围，提供从婴儿到老年疾病的所有信息; 4）提供了广泛的遗传背景和环境因素的信息; 5）大量的临床和实验室信息，并不限于任何单一疾病，还包括了患者自己报告的结果; 6）直接使用移动设备和可穿戴式传感器收集到的大量参与者饮食，生活习惯，生活环境等相关信息;等等(NIH,2015)。

由此可见，借着大数据技术及算法蓬勃发展的东风，基因检测已经进入了一个风云际会的时代。综合利用基因检测结果，家庭健康史，个体饮食，生活，运动，环境等信息，通过大量数据进一步建立更为个人化的健康风险预测模型，将对整个人类社会无论是个体健康，商业经济，还是环境改变等等领域产生广泛而深远的影响。在未来的时间片段里，这是否是一个支点，可以翘起整个地球？

（欢迎转载，注明作者和来源即可，愿意与Dr.2交流的请加微信号：2823095726）

浏览次数：7204次