伤城文章网 > 数学 > 【导与练】高考数学一轮复习 第9篇 第3节 变量间的相关关系与独立性检验课件 文 新人教版_图文

【导与练】高考数学一轮复习 第9篇 第3节 变量间的相关关系与独立性检验课件 文 新人教版_图文


第 3 节 变量间的相 关关系与独立性检验 基础梳理 考点突破 基础梳理 知识整合 1.变量间的相关关系 抓主干 固双基 (1)常见的两变量之间的关系有两类:一类是函数关系,另 一类是相关关系;与函数关系不同,相关关系是一种非确 定性关系. (2)从散点图上看,点分布在从左下角到右上角的区域内, 两个变量的这种相关关系称为正相关,点分布在左上角到 右下角的区域内,两个变量的相关关系为负相关. 质疑探究 1:相关关系与函数关系有何异同点? 提示:(1)相同点:两者均是指两个变量的关系. (2)不同点:①函数关系是一种确定的关系,相关关 系是一种非确定的关系. ②函数关系是一种因果关系,而相关关系不一定是 因果关系,也可能是伴随关系. 2.回归方程与回归分析 (1)线性相关关系与回归直线 如果散点图中点的分布从整体上看大致在一条直线附 近,就称这两个变量之间具有线性相关关系,这条直线 叫做回归直线. (2)回归方程 ①最小二乘法:求回归直线使得样本数据的点到回归 直线的距离的平方和最小的方法叫做最小二乘法. ? x+ a ? =b ②回归方程:方程 y ? 是两个具有线性相关关系 的变量的一组数据(x1,y1),(x2,y2),…,(xn,yn)的回归 ? 是待定数. 方程,其中 a ?, b n ? ( xi ? x)( yi ? y ) ? ? ? ? i ?1 ? b ? ? n 2 ? ( x ? x ) ? i ? i ?1 ? ? . ? ? y ? bx ? ?a ?x y i ?1 n i i ?1 2 i n i ? nx y 2 ? x ? nx , (3)回归分析 ①定义:对具有相关关系的两个变量进行统计分析的一种 常用方法. ②样本点的中心:在具有线性相关关系的数据(x1,y1), 1 (x2,y2),…,(xn,yn)中, x = (x1+…+xn), n 1 ? ,( x , y )称为样本点的 y = (y1+…+yn), a ? = y - bx n 中心. ③相关系数 a.r= ? ( x ? x)( y i ?1 i n i ? y) ? ( xi ? x) i ?1 n 2 2 ( y ? y ) ? i i ?1 n ; b.当 r>0 时,表明两个变量正相关; 当 r<0 时,表明两个变量负相关. r 的绝对值越接近于 1,表明两个变量的线性相关性越强.r 的 绝对值越接近于 0,表明两个变量之间相关性越弱.通常|r| 大于 0.75 时,认为两个变量有很强的线性相关性. 3.独立性检验 (1)分类变量 变量的不同 “值” 表示个体所属的不同类别,像这样的 变量称为分类变量. (2)列联表 列出两个分类变量的频数表,称为列联表.假设有两个 分类变量 X 和 Y,它们的取值分别为{x1,x2}和{y1,y2}, 其样本频数列联表(称为 2×2 列联表)为 2×2 列联表 y1 x1 x2 总计 a c a+c y2 b d b+d 总计 a+b c+d a+b+c+d 2 n ( ad ? bc ) 2 构造一个随机变量 K = ,其中 (a ? b)(a ? c)(b ? d )(c ? d ) n=a+b+c+d 为样本容量. (3)独立性检验 利用随机变量 K 来判断“两个分类变量有关系” 的方 法称为独立性检验. (4)独立性检验的步骤 2 ①计算随机变量 K 的观测值 k,查表确定临界值 k0: P(K ≥k0) k0 P(K ≥k0) k0 2 2 2 0.50 0.455 0.05 3.841 0.40 0.708 0.025 5.024 0.25 1.323 0.010 6.635 0.15 2.072 0.005 7.879 0.10 2.706 0.001 10.828 ②如果 k≥k0,就推断“X 与 Y 有关系”,这种推断犯错误 的概率不超过 P(K2≥k0);否则,就认为在犯错误的概率不 2 超过 P(K ≥k0)的前提下不能推断“X 与 Y 有关系”. 质疑探究 2:K2≥3.841 和 K2≥6.635 分别说明了什么 问题? 提示:独立性检验得出的结论带有概率性质,只能说结论 成立的概率有多大,而不能完全肯定一个结论,因此才出 现了临界值,3.841 和 6.635 就是两个常用的临界值,一 2 般认为当 K ≥3.841 时,则有 95%的把握说事件 A 与 B 有 2 关;当 K ≥6.635 时,则有 99%的把握说事件 A 与 B 有关. 双基自测 1.观察下列各图形. 其中两个变量 x、y 具有相关关系的图是( A ) (A)(1)(2) (B)(1)(4) (C)(3)(4) (D)(2)(3) 解析:由变量相关性定义,如果散点大部分分布 在一条直线附近就说两变量具有相关性,通过 观察(1)、(2)符合.故选 A. 2.(2013 珠海摸底考试)对 100 只小白鼠进行某 种激素试验,其中雄性小白鼠、雌性小白鼠对激 素的敏感情况统计得到列联表: 雄性 敏感 不敏感 总计 50 10 60 雌性 25 15 40 总计 75 25 100 2 n ( ad ? bc ) 2 由K= ≈5.56 (a ? b)(c ? d )(a ? c)(b ? d ) 附表: P(K ≥k0) k0 2 0.050 3.841 0.010 6.635 0.001 10.828 则下列说法正确的是( C ) (A)在犯错误的概率不超过 0.1%的前提下认为“对激 素敏感与性别有关” (B)在犯错误的概率不超过 0.1%的前提下认为“对激 素敏感与性别无关” (C)有 95%以上的把握认为“对激素敏感与性别有关” (D)有 95%以上的把握认为“对激素敏感与性别无关” 解析:由列联表可得 2 n ( ad ?

搜索更多“【导与练】高考数学一轮复习 第9篇 第3节 变量间的相关关系与独立性检验课件 文 新人教版_图文”

网站地图

All rights reserved Powered by 伤城文章网 5xts.com

copyright ©right 2010-2021。
伤城文章网内容来自网络,如有侵犯请联系客服。zhit325@126.com