- 临床研究的医学统计原理(三)
- 作者:杨如意|发布时间:2010-09-05|浏览量:1088次
归系数)。根据样本资料计算出来的回归系数b从理论上讲也存在抽样误差,需要做显著性检验,看其是否是从回归系数为零的总体中随机抽得。如果回归系数b是从回归系数为零的总体中随机抽得的可能性小于0.05或0.01,则可以拒绝无效假设,认为自变量与因变量之间的回归关系存在。
3.等级相关
等级相关资料的直线相关分析称等级相关。这也是一种非参数统计方法。分析两事物数量之间的直线关系时,对下列情况宜用等级相关:青海大学附属医院中医科杨如意
(1) 两事物的量不能按具体数值进行准确测量,只能按大小、程度、优劣排出若干等级,或者通过综合判断给出序号,例如肿瘤近期疗效的四等级评判方法所得到的资料、机体一般状况的KPS计分的十等级评判资料等;
(2) 两事物的量可以按具体数值进行准确测量,但是,总体数据的分布未知或已知不是正态分布,不能直接做直线相关分析的资料,例如肿瘤临床研究中经常遇到的肿瘤病人的年龄等资料;
(3) 只需要对两事物之间的关系做初步分析的情况下。
等级相关常用的分析方法有Spearman法和,Kendall法。两者的共同点包括:
(1)都是一个等级相关系数来说明两变量之间直线关系的方向和密切程度,即范围在[-1,0]和(0,+1)之间;
(2) 样本得到的相关系数是总体等级相关系数的估计值,要推断总体中两事物
之间有无相关性,则需要对相关系数做显著性检验;
两种方法的不同之处是相关系数的计算方法不同和显著性检验是所用的统计表不同。
五、 诊断方法可靠性的评价
由于近年来层出不穷的诊断设备、试验等方法用于肿瘤临床,尤其是影像学、病理学的免疫组化和肿瘤标志物等方面的发展更为突出。如何鉴别其临床价值呢?
(一)贝叶斯公式
首先是用金标准方法来区分是病人和不是病人,这种金标准方法医学统计学上约定为病理组织学诊断结果。这种金标准确定的病人和非病人被认为是真实的病人和真实的非病人,是被评价诊断方法来诊断病人,只会出现阳性和阴性两种结论。因而,被评价诊断方法诊断这组病人后会得到四个结果,即:(1)真阳性病人:真实的病人呈现阳性;(2)真阴性病人:真实的非病人呈现阴性;(3)假阴性病人:真实的病人呈现阴性;和(4)假阳性病人:真实的非病人呈现阳性。显然后两者属于错误。那么,一系列的评价诊断方法临床价值的指标
都是依据上述思路,针对后两者错误发生概率的大小而展开的。
贝叶斯(Bayes)公式是用于确定被评价诊断方法阳性结论时患病的概率有多大。是通过2*2四格表和先验概率来推算的。先验概率在人群研究中称为患病率,是由大样本流行病学调查到,临床研究中多从各种报道或参考书中获得,它不依赖于其它变量的变化而变化。
2 × 2四格表
被评价诊断
方法结论
病理组织学诊断结果
病人数
非病人数
合计
阳性
真阳性数
假阳性数
阳性数
阴性
假阴性数
真阴性数
阴性数
合计
真实病人数
真实非病人数
总数
灵敏度×先验概率
阳性结论对患病的概率=
灵敏度×先验概率+假阳性率×阳性预报值
(二)常用评价指标
1、灵敏度
在真实病人中被“被评价诊断方法”确实为阳性的概率,称为“被评价
诊断方法”的灵敏度,也称真阳性率。该指标反映了“被评价诊断方法”检出病例的能力。
2、特异度
真实非病人中被“被评价诊断方法”确定为阴性的概率就是“被评价诊断方
法”的特异度。即真阴性率。该指标反映了“被评价诊断方法”排除非病例的能力。
3、误诊率和漏诊率
假阳性数
误诊率 = 1 - 特异度 = ×100%
真实非病人数
假阴性数
漏诊率 = 1 - 灵敏度 = ×100%
真实病人数
4、约登指数(youden’s index.J)
J = 灵敏度 + 特异度 ? 1
约登指数的取值范围在(-1,+1)之间,其值越接近+1,诊断准确性越好。该指标优势在于综合了灵敏度和特异度两项指标,使得“被评价诊断方法”便于评价。
5、阳性预报值和阴性预报值
在实际临床科研工作中,经常会遇到并不知道病理诊断结果的时候,例如在
原发性肝细胞肝癌的诊断中是可以不做病理组织学诊断的。而“被评价诊断方法”的结论却常常容易得到。临床医生更想知道的是,诊断出现阳性结论时,接受检查者真正患病的概率有多大,阴性时,真正非患病的概率有多大。
阳性预报值是指“被评价诊断方法”阳性结论的人中患病的概率。
阴性预报值是指“被评价诊断方法”阴性结论的人中非患病的概率。
真实病人数
阳性预报值 = × 100%
阳性人数
真实非病人数
阴性预报值 = × 100%
阴性人数
二指标合称预报值。
预报值由“被评价诊断方法”的灵敏度、特异度和先验概率所决定。当先验概率确定时,随着灵敏度升高,而特异度下降,阴性预报值升高,阳性预报值下降。随着特异度升高,而灵敏度下降,阳性预测值增大,阴性预测变小。依据上述特征,临床工作中遇到灵敏度特别高而特异度较差的诊断(试验)方法时,若结论是阴性,医生就越相信病人不会是假阴性。反之,特异度越高,而灵敏度越低时,由于阳性测报值高而阴性预报值低,如果诊断(试验)结论是阳性者就越相信病人不会是假阳性。
当灵敏度和特异度确定时,阳性预报值随着先验概率的升高而升高,随着先验概率的下降而下降。阴性预报值则恰好相反。
(三)多个“被评价诊断方法”的联合诊断
临床实践中,许多“被评价诊断方法”的灵敏度和特异度并不高,尤其是大多数的肿瘤标志物和一些病理学的免疫组化指标,这就需要由两个或两个以上的方法联合在一起进行诊断。两种主要的联合形式是串联和并联。
串联是一系列“被评价诊断方法”均为阳性结论时,才考虑受检人为病人的诊断方法,只要有其中一个阴性结论,就列为非病人。串联将大幅度提高特意度和大幅降低灵敏度,因而导致误诊率下降和漏诊率上升。
并联则是使受检人同时接受多个“被评价诊断方法”的检查,其中出现任何一个阳性结论就将受检人划为病人,而所有检查均为阴性结论时才划为非病人。并联将大幅度提高灵敏度,而大幅度降低特异度,可使漏诊率大幅下降而误诊率大幅上升。
选用串联还是并联,需要考虑的因素只能是诊断出疾病后的治疗目的,而恶性肿瘤的诊断结论无论对受检人无论在心理上还是生理上都将是一个持久的摧残。一般认为多诊断方法应用时应先串联,首先排除把握大的非病人,再用并联,确诊把握比较大的真实病人,剩余病人则增加新诊断方法后再重复。
临床实际工作中,在对某个病人做出何种诊断,以及诊断后作出何种治疗的每一步,都存在概率问题(实施后的结局预测)和实施成本问题。决策树的引入,使得这种客观存在的各种可能性具体到一个假想的决策步骤和可能性预测的示意图,因形似树而得名。
六、多因素分析的基本思想
临床肿瘤学研究中,经常会遇到研究多个因素对某个观察指标的作用问题,有时还需要对多项观察指标进行综合分析。多因素分析是单因素分析的自然推广,是临床医学科研的重要工具。常用方法包括如下几项:
1、多因素方差分析
就是分析两个或两个以上因素对观察指标影响的统计方法。基本条件必须满
足各观察值独立正态分布和方差齐性。二因素方差分析是检验两个因素共同作用时,对某个观察指标是否存在相互作用??两个因素的作用是协同还是拮抗。例如:设计这样四组病人:第一组作为空白对照,第二组A药单用,第三组B药单用,第四组A、B两药之间的相互作用方式,是拮抗呢?还是协同?归结到统计学上是(1)检验不用A药(第一组和第三组)与用A药(第2组和第四组的总体均数是否相等;(2)证实用B药是否有作用,检验用 B药(第三、四组)与不同B药(第一、二组)的总体均数是否相等;(3)A、B两药的第四组疗效将大于单独使用A药的第二组和单独使用B药的第三组作用之和,当A、B拮抗时,相反之。
2、协方差分析
前已述及,多因素方差分析要求方差齐性,正态分布,所比较的各组均衡性
要求相对较高。然而,实际工作可能碰到均衡性达不到要求的资料,此时可造成个别对结果指标有影响的因素没能控制好,这时就可以考虑用协方差分析。总之,在比较两组或多组均数间的差别时,同时要消除一个或多个数量因子的干扰,可考虑用协方差分析。
在协方差分析中需要比较的因素称为因子。
需消除的数量因子称协变量。要求此变量是计量资料。
协方差分析的实质是方差分析与回归分析的结合,它利用协变量与观察指标间的线性回归关系扣除协变量的影响。
步骤:完全随机设计。二因子析因设计。第一步:检验协变量之间有无交互作用;第二步:检验协变量与观察指标间有无线性关系;第三步:扣除协变量后,检验各因子的主效应和交互效应。
3、多元线性回归分析
是研究一个因变量与多个自变量之间的关系。包括:(1)描述:用来描述某
些因素与某种因变因素之间的表面关系;(2)控制:通过建立因变量与有关自变量之间的回归方程,可以通过控制自变量来控制因变量;(3)预测:通过将自变量(此时称为预报因子)代入回归方程,对预报量(此时实际上是因变量)进行波动范围的估计。
4、多元Logistic回归
在临床研究中,当影响结果的混杂因素较多时,难以保证被比较两组间是否
具有可比性??即均衡性是否可靠,因此,会给分析结果带来不同程度的偏性。为了控制混杂因素,通常采用分层分析的方法来解决,即将每一个可能的混杂因素作为一个层,分出此层后面进行两组间的比较。但是,随着控制结果因素的增加,分层会被分得很细,每层每组的例数会变得很少而无法估计。多元Log istic回归能克服这些弱点。肿瘤临床研究中,为了确定甲方案与乙方案疗效孰伏孰劣时,在无法继续均衡检验时,或者两组不均衡是,可选用此方法。
5、多因素诊断方法
1)判别分析:当研究对象实际上已有明确的类别划分,但因各种原因造成难以直接获取对象所属类别信息时,用于判别任意一个被研究对象归属于哪一个总体的多变量的统计方法。临床上多用于鉴别诊断。判别分析可以分析出各种因素对判别的作用大小。
2)聚类分析:又称集群分析。该方法重在讨论事物的分类问题。当新事物出现后,在没有归类的历史评判标准的情况下,将事物按它们在性质上相似和相近程度进行分类,把一些相似或相近程度大的指标归为一类,把一些相互疏远的归为不同的类。
例如,对于男人与女人,判别标准十分清晰,当一个由男人做了变性手术后变成的女人,应如何归类呢?将使用判别分析,选取染色体鉴定这一个强作用指标,即可判定出来。再如,非何杰金氏恶性淋巴瘤的亚型分类,随着免疫组化技术的进步,分类方法有所改进,如何分清哪种是低度恶性,哪种是中、高度恶呢?
将使用聚类分析的方法。
七、生存分析
生存分析是研究特定人群生存过程的统计分析方法。对于急性病的疗效考核,一般可用治愈率或病死率,但是对于肿瘤,由于其预后不是短期内能明确的了的,需长期随访,获得疗后一定时期的生存、死亡情况,然后用生存分析方法做出统计判断。
生存时间有三个要素,即起点:一般指疗后即日;终点:是指研究结束之日或死亡之日,和时间尺度,用年、月、日来表示。这就是关于生存时间的全部信息,实际工作中,难以得到这种“完全”的生存时间资料,缺项的时间信息资料为不完全数据资料,能处理这类资料是生存分析的一大优势。
肿瘤临床研究经常遇到失访的情况,失访的定义包括由于搬迁等原因的真正意义上的失去联络,而病人仍然活着和由于意外而死亡,而非死于研究疾病或相关疾病(例如化疗相关性死亡、放疗相关性死亡等)的患者,以及在研究结束时仍然活着,且未失去联络的患者三种情况。这类不完全数据称为截尾数据。
生存时间是一个随机变量,其分布特征在肿瘤临床研究中,由于样本量小等原因,常不是标准的正态分布。因而多用某年生存率、中位生存时间、中位肿瘤进展时间、中位无瘤生存时间等来表示。可以按计量资料处理,也可以按计数资料处理。是判定疗效的中长期指标。
1、寿命表法:在大样本的生存分析资料中,应用较多的是寿命表法。原理是应用人口资料和死亡资料,假定同时出生一代人,按当地人口的年龄死亡概率来死亡,来反映这一假定的一代人的死亡规律。这种方法在肿瘤临床研究中仅见于超大型队列研究,平时少用。需编制寿命表。
1、 2、Kaplan-Meier法:该方法常用于肿瘤临床研究的生存分析,适宜于样本量较小资料的生存情况的原始资料,先计算出疗后生存到各时间段时的可能性(即各目的时间段点上的生存概率),然后用直接概率相乘法原理计算出各目的时间段点上的生存率。这种直接用概率乘法原理估计生存率的方法,是一种非参数估计。卡-迈氏曲线有以下三个特点:(1)曲线呈阶梯形:由于不能用斜直线【待续】