? 2 检验
主要内容
? ? 2 检验的基本思想 ? 独立样本列联表资料的 ? 2检验 ? 配对设计资料的? 2检验 ? 拟合优度的 ? 2 检验 ? 线性趋势 ? 2 检验 ? 四格表的Fisher确切概率法
分布
? 2分布
? 2 分布是一种连续型分布，可用于检验资料的实际频数 和按检验假设计算的理论频数是否相符问题
若有 ? 个相互独立的标准正态分布随机变量 Z 1 , Z 2 ,… , Z ? ，
则Z
2 1
?
Z
2 2
?
…
?
Z
2 ?
的分布称为服从自由度为?
的? 2 分布，记
为 ，即： ?
2 ?
?
2 ?
?
Z2 1
?
Z2?… 2
?
Z
2 ?
? 2 分布
用途
? 推断两个或两个以上总体率(或构成比)之间有无差别 ? 拟合优度检验 ? 推断两分类变量间有无相关关系
?2 检验基本思想
? 基本思想：实际频数和理论频数吻合的程度
? ? 2 检验的计算公式
(A ? T)2
?2 ? ?
T
A 为实际频数 (actual frequency) T 为理论频数(theoretical frequency)
例11.1 某研究者欲比较甲、乙两药治疗小儿上消化道出血的 效果，将90名患儿随机分为两组，一组采用甲药治疗，另一 组采用乙药治疗，一个疗程后观察结果，见表11.1。问两药治 疗小儿上消化道出血的有效率是否有差别？
表11.1甲、乙两药治疗小儿上消化道出血的效果
组别
有效
无效
合计
有效率(%)
甲药
27
18
45
60.00
乙药
40
5
45
88.89
合计
67
23
90
74.44
问题： 1.是否可用前面所学的方法进行统计推断？ 2.是否还有其它方法进行统计推断？
90名患儿 随机分组
甲药组 45人
乙药组 45人
Table. 病例分配随机表
编号
组别
编号
1
乙药
67
2
甲药
68
3
乙药
69
4
甲药
70
5
乙药
71
6
甲药
72
7
甲药
73
8
乙药
74
9
甲药
75
10
乙药
76
11
甲药
77
组别 甲药 乙药 乙药 甲药 乙药 甲药 甲药 甲药 乙药 乙药 甲药
患儿编号 1 2 3 4 5
.
.
Table. 结果记录表 处理 乙药 甲药 乙药 甲药 乙药
. .
疗效 有效 有效 无效 有效 无效
. .
例11.1的问题
甲、乙两药治疗小儿上消化道出血的效果
组别 甲药 乙药 合计
有效 27 40 67
无效 18 5 23
合计 45 45 90
有效率(%) 60.00 88.89 74.44
研究目的：比较两药有效率有无差别？
能否根据 88.89%>60.00%，认为乙药的 有效率大于甲药？
四格表基本格式
处理 有效 无效 合计
A组 a
b
a+b
B组 c
d
c+d
合计 a+c b+d
n
? 2 检验的基本思想
? 假设：两种药物的有效率相同 ? 则可以算得理论上的两种药物的有效率均
为67/90＝74.44％。
表11.1 两种药物有效率的比较
处理
有效 无效 合计
甲药
27
18
45
乙药
40
5
45
合计
67
23
90
有效率(％) － －
74.44
说明：理论上甲药与乙药有效率均为74.44%
表11.1 理论频数计算(what is “理论频 数”？)
处理
有效 无效 合计 有效率(％)
甲药 45? 0.7474 ? 33.5 11.5
乙药
33.5 11.5
45 * 74.44
45
74.44
合计
67
23
90
74.44
计算理论频数
? 按两组合计的有效率74.44％，推算理论频数：
甲药组有效人数为 甲药组无效人数为 乙药组有效人数为 乙药组无效人数为
67 45 ? ? 33.5
90
23 45? ? 11.5
90
67 45 ? ? 33.5
90
23 45 ? ? 11.5
90
T ? nR nC n
计算理论频数公式
T ? nR nC n
? nR 为相应行的合计 ? nC 为相应列的合计 ? n 为总例数。
? 如果假设成立，则实际频数和理论频数吻合， 即： ?( A ?T ) ? 0 对每一个格子有： A ? T ? 0
而本例实际上： 27－33.5＝-6.5 40－33.5＝ 6.5
18－11.5＝6.5 5－11.5＝-6.5
为消除符号的影响，用： ?( A ? T )2
考虑绝对数不能完全体现其对 ? 2 值的贡献：
(A ? T)2
?2 ? ?
T
考虑? 2 值受格子数多少的影响，引入
? ? (行数 -1)(列数 -1)
确定P值
? 如果检验成立，则实际数与理论数之差一般不会
很大，?2值应该很小.
? 实际频数与理论频数相差较大，即A与T相差很大，
此时?2值越大，相应的概率P越小。当P<0.05时，
有理由怀疑无效假设成立，拒绝H0。
? ?2与P值的对应关系可查?2界值表(附表9)。?2值愈
大，P值愈小。
对于例11.1：
? ? 2 ?
( A ? T )2
T
( 2 7 ? 3 3 .5 ) 2 (1 8 ? 1 1 .5 ) 2 ( 4 0 ? 3 3 .5 ) 2 ( 5 ? 1 1 .5 ) 2
?
?
?
?
3 3 .5
1 1 .5
3 3 .5
1 1 .5
? 9.870
? ?1
根据附表9，确定P值下结论。
例11.1具体步骤
1. 建立检验假设，确定检验水准
H0 ： ? 1
?
? 2
，即两种药物治疗小儿上消化道
出血的有效率相同
H1： ? 1
?
? 2
，即两种药物治疗小儿上消化道
出血的有效率不同
? ? 0.05
2. 计算 ? 2 值和自由度
将A与T的值代入公式，得
? ? 2 ?
( A ? T )2
T
( 2 7 ? 3 3 .5 ) 2 (1 8 ? 1 1 .5 ) 2 ( 4 0 ? 3 3 .5 ) 2 ( 5 ? 1 1 .5 ) 2
?
?
?
?
3 3 .5
1 1 .5
3 3 .5
1 1 .5
? 9.870
? ?1
3. 确定P值，作出统计推断
查附表9，得 P ? 0 .0 0 5 ，按 ? ? 0 .0 5水准，拒 绝H0，接受H1，差异有统计学意义，可以认为两种 药物治疗小儿上消化道出血的有效率不同，乙药的 有效率高于甲药。
四格表专用公式
?2 ?
(ad ? bc) 2 n
(a ? b)(c ? d )(a ? c)(b ? d )
? ?1
将例11.1数据代入专用公式
? 2 ? (27 ? 5 ? 18 ? 40)2 ? 90 ? 9.870
45 ? 45 ? 67 ? 23
? ?1
可见，与前面的基本公式计算结果相同。
四格表 ? 2值的校正
( A ? T ? 0.5)2
?2 ??
T
?2 ?
( ad ? bc ? n / 2) 2 n
(a ? b)(c ? d )(a ? c)(b ? d )
注：(1)连续性校正(correction for continuity )或Yates校正；
(2)如检验所得P值近于检验水准α时, 最好改用四格表 确切概率法。
四格表? 2值的校正
? T ? 5且n ? 40时, 不须校正； ? 1? T<5， 而n ? 40时， 需计算校正值, 或改
用四格表确切概率计算法； ? T<1或n<40时， 需用确切概率计算法。
例11.2
见教材137-138页，校正与未校正结果 的比较
R×C列联表资料的?2检验
? R×C列联表 ：R行、C列
? 包括2×2表（四格表）、R×2表（多个样本率的比较） 2×C 或R×C表（两个或多个构成比的比较）。
? 基本原理和检验步骤与四格表?2检验相似。
? 公式
? 2 ? n(? AR2C ? 1)
nR nC
多个样本率的比较
例11.3 某研究者欲比较A、B、C 三种方案治疗轻、中度高血压 的疗效，将年龄在50~70岁的240例轻、中度高血压患者随机等 分为3组，分别采用三种方案治疗。一个疗程后观察疗效，结果 见表11.4。问三种方案治疗轻、中度高血压的有效率有无差别？
表11.4 三种方案治疗轻、中度高血压的效果
方案
有效
无效
合计
A
74
6
80
B
58
22
80
C
71
9
80
合计
203
37
240
有效率(%) 92.50 72.50 88.75 84.58
1. 建立检验假设，确定检验水准
H0：? 1
?
? 2
?
? 3，即三种方案治疗轻、中度高血
压的有效率相同
H1：三种方案治疗轻、中度高血压的有效率不全 相同
? ? 0.05
2.计算 ? 2 值和自由度
将表11.4的数据代入公式，得：
? ? 2 ? n (
A2 ? 1)
nR nC
742
62
582
222
712
92
? 240 ? (
?
?
?
?
?
? 1)
80 ? 203 80 ? 37 80 ? 203 80 ? 37 80 ? 203 80 ? 37
? 13.868
v ? (3 ? 1)(2 ? 1) ? 2
3. 确定P值，作出统计推断
查附表9，得 P ? 0 .0 0 5 ，按0.05水准，拒绝H0 ， 接受H1，差异有统计学意义，可以认为三种方案治 疗轻、中度高血压的有效率不全相同。
两个或多个构成比的比较
教材139页例11.4 计算方法和检验步骤一样（略）
R×C列联表检验时的注意事项
1.计算? 2 值时，必须用绝对数，而不能用相对 数，因为 ? 2 值的大小与频数大小有关。
R×C列联表检验时的注意事项
2. ?2检验要求理论频数不宜太小，一般认为表中
不宜有1/5以上格子的理论频数小于5，或有一个 理论频数小于1。理论频数是否太小可以通过计算 最小理论频数(即最小行、列合计所对应格子的理 论频数)来判断。
理论频数太小有四种处理办法
? 增加样本例数以增大理论频数； ? 删去理论频数太小的行或列； ? 将太小理论频数所在行或列与性质相近的邻行邻列
中的实际频数合并, 使重新计算的理论频数增大； （专业角度判断） ? 用确切概率法。
R×C列联表检验时的注意事项
3.单向有序R×C列联表的统计处理
? 当效应按强弱(或优劣)分为若干个级别, 比如分为-、 ±、+、++、+++、 ++++等6个等级, 在比较各处理 组的效应有无差别时, 宜用秩和检验。
? 如作?2检验只说明各处理组效应的构成比有无差异。
分组 新药 对照药
合计
两种药物治疗某病的临床效果观察
痊愈
好转
无效
死亡
30
38
32
12
19
30
19
9
49
68
51
21
合计 112
77 189
R×C列联表检验时的注意事项
4.当多个样本率(或构成比)比较的检验, 结论为拒
绝检验假设, 只能认为各总体率(或总体构成比)之间总 的说来有差别, 但不能说明它们彼此间都有差别, 或某 两者间有差别。若想进一步了解哪两者的差异有统计 学意义，需要进行多个样本率(或构成比)的两两比较。 见例11.5
配对设计资料的 ?2 检验
甲
+ － 合计
表 11.8 配对四格表形式
乙
+
－
a
b
c
d
a+c
b+d
合计
a+b c+d
n
甲的阳性率= a ? b
n
乙的阳性率= a ? b n
甲、乙的阳性率之差=
a?b a?c ?
?
b?c
n
n
n
即a、d 不起作用，只需比较b与c之间的差异
配对设计四格表的 ? 2 检验公式
?2
?
(b ?
b ? c )2 2
?
(c ?
b ? c )2 2
?
(b ? c)2
b?c
b?c
b?c
2
2
? ?1
校正公式
? 当 b ? c ? 4 0 时，需作连续性校正，公式如下：
( b ? c ? 1)2
?2 ?
b?c
? ?1
例11.6 某研究者欲比较心电图和生化测定诊断低钾血症的
价值，分别采用两种方法对79名临床确诊的低钾血症患者进 行检查，结果见表11.9。问两种方法的检测结果是否不同？
表11.9 两种方法诊断低血钾的结果
心电图
＋ － 合计
生化测定
＋
－
45
25
4
5
49
30
合计
70 9
79
配对设计
? 同源配对：来源相同，予不同处理
如同一窝别同性别的小鼠 来自同一家庭的姐妹、双胞胎 同性别，同病情和年龄相近的病人配成一对…..
按
雌
雄
符合实验要求
、
的大白鼠
体
重
配
对
随机
T
对子 1
C
随机
T
对子 2
C
随机
T
对子 3
C
配对设计
? 自身配对 a. 同一对象给予两种不同处理 b. 同一对象处理前后
? 例11.6 某研究者欲比较心电图和生化测定 诊断低钾血症的价值，分别采用两种方法 对79名临床确诊的低钾血症患者进行检查 ，结果见表11.9。问两种方法的检测结果是 否不同？
患者编号 1 2 3 4 5
.
.
生化测定结果 + + + － +
. .
心电图结果 － + + － －
. .
例11.6 某研究者欲比较心电图和生化测定诊断低钾血症的
价值，分别采用两种方法对79名临床确诊的低钾血症患者进 行检查，结果见表11.9。问两种方法的检测结果是否不同？
表11.9 两种方法诊断低血钾的结果
心电图
＋ － 合计
生化测定
＋
－
45
25
4
5
49
30
合计
70 9
79
1. 建立检验假设，确定检验水准 H0 ：B ? C ，即两种方法的检测结果相同 H1： B ? C ，即两种方法的检测结果不同
? ? 0.05
2. 计算 ? 2值和自由度
本例 b ? c ? 29 ? 40 ，故用式校正公式计算：
( b ? c ? 1) 2 ( 2 5 ? 4 ? 1) 2
?2 ?
?
? 13.793
b?c
25 ? 4
v ?1
3. 确定P值，作出统计推断
查附表9，得 P ? 0 .0 0 5 ，按0.05水准，拒绝 H0 ，接受H1，差异有统计学意义，可以认为两 种方法的检测结果不同。
注意事项
比较两种诊断试验法诊断效能有无差异时, 要求所投入试验的检品是用标准法检出的阳性检 品。
拟合优度的? 2检验
基本思想：实际频数与理论频数的吻合程度。
用途：检验样本所代表的总体的频数分布是否符 合某一理论分布（正态、二项、Poisson)。 注意事项：样本含量要充分大，每个组段的理论 频数不能太小（小于5）。 实例：教材145页例11.8
线性趋势 ? 2检验
?2 ?
N ( N ? tZ ? T ? nZ ) 2
T (N
? T )(N ? nZ 2
2
? (? nZ ) )
? ?1
例11.9
年级 初一 初二 初三 高一 高二 高三 合计
调查人数(n) 144 148 135 157 168 139 891
表 11.13 某市不同年级中学生吸烟率
吸烟人数(t) 17 19 25 41 55 72
229
吸烟率(%) 11.81 12.84 18.52 26.11 32.74 51.80
分数(Z) 1 2 3 4 5 6
tZ 17 38 75 164 275 432 1001
nZ 144 296 405 628 840 834 3147
nZ2 144 592 1215 2512 4200 5004 13667
H 0 ：该市中学生吸烟率无随年级增加而增高的趋势 H1 ：该市中学生吸烟率有随年级增加而增高的趋势
? ? 0.05
?2 ?
N ( N ? tZ ? T ? nZ )2
T (N
? T )( N
?
nZ 2
? (?
2
nZ ) )
891 ? (891 ? 1001 ? 229 ? 3147 )2
?
? 75.788
229 ? (891 ? 229)(891 ? 13667 ? 3147 2 )
v ?1
查附表 9，得 P<0.005。按 ? ? 0.05 水准，拒绝 H 0 ，接
受 H1 。故可以认为该市中学生吸烟率有随年级增加而增高 的趋势。
学过的?2检验
? 独立样本列联表资料的 ? 2检验 ? 配对设计资料的? 2检验 ? 拟合优度的? 2 检验 ? 线性趋势 ? 2 检验
?2检验的基本步骤
? 建立检验假设，确定检验水准 ? 计算检验统计量(首先考察最小理论频数） ? 确定P值，作出统计推断
四格表资料的Fisher确切概率法
?适用条件
?四格表若有理论频数小于1, 或n<40时 ?用其它检验方法所得概率接近检验水准时
确切概率法基本思想
? 在四格表的周边合计不变的条件下, 用下式直接计 算表内四个数据的各种组合之概率。
? 式中a、b、c、d为四格表的实际频数
(a ? b)!(c ? d )!(a ? c)!(b ? d )! P?
a!b!c!d !n!
例11.10 某研究者欲了解某新药联合某常规药物治疗急性 重症胰腺炎的效果，将28例患者随机分为两组，试验组 采用新药+常规药物联合治疗，对照组仅采用常规药物 治疗，治疗10天后，疗效见表11.15。试问两种治疗方 案的有效率有无差别？
表11.15 两种治疗方案治疗急性重症胰腺炎的疗效
分组 试验组 对照组 合计
有效 12(a) 10(c) 22
无效 2(b) 4(d) 6
合计 14 14 28
有效率(%) 85.71 71.43 78.57
1. 建立检验假设，确定检验水准
H0：? 1
?
? 2
即两种治疗方案的有效率相等
H ： 1
? ??
1
2
即两种治疗方案的有效率不等
?=0.05
直接计算概率
? 在四格表的周边合计不变的条件下, 用公式直接计算表 内四个数据的各种组合之概率。
序号 1
有无 效效
86 14 0
P = 0.0080 1
表11.16 Fisher确切概率法计算用表
序号 2
序号 3
序号 4
序号 5*
有无 效效
有无 效效
有无 效效
有无 效效
95 13 1
P2 ? 0 .0 7 4 4
10 4 12 2
P ? 0.2418 3
11 3 11 3
P ? 0.3517 4
12 2 10 4
P ? 0.2418 5
序号 6
有无 效效
13 1 95
P ? 0.0744 6
序号 7
有无 效效
14 0 86
P = 0.0080 7
将小于等于原四格表概率（0.02418）的所有四 格表对应的概率相加，得到双侧概率为
P双 侧
?
P ?P ?P ?P ?P ?P
1
2
3
5
6
7
? 0.0080 ? 0.0744 ? 0.2418 ? 0.2418 ? 0.0744 ? 0.0080
? 0.6484
按0.05水准，不拒绝，差异无统计学意义，尚 不能认为两种治疗方案治疗急性重症胰腺炎的疗效 有差别。