伤城文章网 > 数学 > 随机抽样

随机抽样


1.我国水土流失面积已经从建国初期的150万平方公里发展到 90年代的179万平方公里,占国土面积的18.6%中科院的研究数 字表明,进入90年代,我国土地沙漠化的面积正以每年2460平方 公里的速度发展 2.全国矿山发展直接破坏森林面积大约105万公顷,破坏草地面 积26万公顷,占用耕地面积98万公顷,而恢复治理率仅为5%

笑一笑,十年少
一天,爸爸叫儿子去买一盒火柴,临出门前,爸爸 嘱咐儿子要买能划燃的火柴,儿子拿着钱出门了,过 了好一会儿,儿子才回到家。 “火柴能划燃吗?”爸爸问。 “都能划燃。” “你这么肯定?” 儿子递过一盒划过的火柴,兴奋地说:“我每根都 试过啦。”
问:这则笑话中,儿子采用的是什么调查方式?这 其中的全体是什么?这种调查方式好不好?

普查是通过调查总体来收集数据,调查的结果准 确,但普查往往工作量大,难度大,而且有些调查对 象不宜使用普查。从节约等方面考虑,一般从调查的 全体对象(总体)中按照一定的方法抽取一部分(样本), 进行调查或观测,获取数据,并以此对调查对象的某 一项或多项指标作出推断。这就是抽样调查,抽样调 查是通过调查样本来收集数据,抽查的工作量较小, 便于进行。但样本的抽取是否得当,直接关系到对总 体的估计的准确程度,为了获得较为准确的调查结果 抽样时要注意所选取样本的代表性。

在抽样调查时,什么样的样本才具有代表性.在抽 样时,如果抽样不当,那么调查的结果可能会出现 与实际情况不符,甚至是错误的结果,(课本p45 案例)导致对决策的误导.在抽样调查时,一定要 保证随机性原则,不能只图方便而只抽取“方便样 本”,尽可能地避免人为因素的干扰;并且要保证每 个个体以一定的概率被抽取到;同时,还要注意到 要尽可能地控制抽样调查中的误差。下面我们来研 究几个常见的抽样方法

定义:设一个总体含有N个个体。从中逐个 不放回的抽取n个个体作为样本(n ≤ N),且 每次抽取时各个个体被抽到的概率相等,就 称这样的抽样为简单随机抽样(simple random sampling)。

二、简单随机抽样的具体实施方法
(一)抽签法(抓阄法) 抽签法是先对总体N个抽样单元分别编上0到N-1 的号码,再制作与之相对应的N个号码签并充分摇 匀后,从中随机地抽取n个号码签(可以是一次抽 取n个号码签,也可以一次抽一个号码签,连续抽 n次),与抽中号码签的号码相同的n个个体即为被 抽中的个体,由其组成简单随机样本。

抽签发大家所熟悉的,如摸彩、摇奖、摇盘等,他就是 把总体中的N个个体的代号写在形状、大小相同的签上 (签可以是纸条、卡片、小球等),然后将这些签均匀 的搅拌,每次随机的抽取一个,在均匀搅拌,在进行下 一次抽取,如此下去,知道抽到预先设定的样本数。根 据实际需要,如果抽取后再放回,就称为有放回抽取, 如果每次抽取后不放回,就称无放回抽取。

利用转盘产生随机数是比较简单的,就是将转盘分成N等份分 别标上0,1,…,N-1,转动转盘指针指向的数字是几。我们就选几 号样品。

利用摸球产生随机数也是一样的,就是将N个形状、大小、质 地完全一样的球,分别标上0,1,…,N-1,放入一个不透明的容 器中进行摸球,摸到几号球,就抽取相应标号的个体,然后放 回,再进行下一次抽取。

(1)给调查对象中的每个个体编号; (2)准备抽签的工具,实施“抽签”; (3)对样本中的每一个个体进行测量或调查 为尽快让学生适应社会,某大学有 抽签的方法一般只用在总体容量 5万多人,学校决定每年随机抽取 比较小时,对于总体容量较大时, 50名大学生参加“三下乡”活动, 往往操作起来比较麻烦 这个总体容量大,不适合抽签法, 我们采用随机数法比较方便。

把总体中的N个个体一次编上0,1,…,N-1 的号码,然后利用工具(转盘、摸球、 随机数表、科学计算器、计算机)产生 随机数,产生的随机数是几,我们就选 几号个体,知道抽满规定的样本数。

我们来看一个具体的例子

例1总体由80个个体组成,利用随机数表随机的选取10个样本 一.给总体中的每个个体编号:0 1 2 3 … 79 二.因为它是一个两位数的总体,因此我 们选两列组成两位数。如8,9两列 三.从随机表中任取一行开始选数:如第10行 他们从上到下分别是:83 55 46 72 56 08 97 31 53 21 62 49 35 29 77 … 四.排除比编号还大的数,重复的号,只算一 次,因此83 97不能选,这样选取的10个样 本的编号分别为:55 46 72 56 08 31 53 21 62 49 然后对这10个样本进行调查

三、简单随机抽样的方法评估
1.简单随机抽样对总体不加任何限制,等概率地 从总体中直接抽取样本,是最简单、最单纯的 抽样技术,它具有计算简便的优点,是研究其 它复杂抽样技术的基础,也是比较各种抽样技 术之间估计效率的标准,同时,从理论上讲简 单随机抽样在各种抽样技术中是贯彻随机原则 最好的一种,并且数学性质很简单,是等概率 抽样的特殊类型。

? 2.因为是等概率抽取样本,所以要求总 体在所研究的主要标志上同质性或齐性 (共性)较好,也即总体要比较均匀;要 求样本容量要比较大,以保证样本对总 体具有充分的代表性。但是,在社会经 济现象中,这种均匀总体是很少见的。 因此,实际工作中很少单纯使用简单随 机抽样方法。

? 3.直接从总体中抽取样本,未能充分 利用关于总体的各种其它已知信息, 以有效地提高样本的代表性,并进而 提高抽样的估计效率。 ? 4.简单随机抽样要求在抽样前编制出 样本,并对每一个总体抽样个体进行 编号,而且当总体抽样单元的分布比 较分散时,样本也可能会比较分散, 这些都会给简单随机抽样方法的运用 造成许多的不便,甚至在某些情况下 无法使用

例2.为了解参加某种知识竞赛的1000名学生的 成绩,打算抽取容量为50的一个样本进行了解。 过程如下:
(1)随机将这1000名学生编号为0,1,2,3,??,999; (2)将总体按编号顺序平均分成50部分,每部分包含20个个体; (3)在第一部分的个体编号0,2,??,19中,利用简单随 机抽样抽取一个号码,比如13; (4)以13为起始号,每间隔20抽取一个号码,这样就 得到一个容量为50的样本:13,33,53,??,973, 993。

这样我们就得到一个容量为50的样本,这种抽样方法是 一种

系统抽样(systematic sampling)

将总体分成均衡的几个部分,然后按照 预先定出的规则,从每一部分抽取一个个体, 得到所需要的样本,这种抽样叫做系统抽样 (也称为机械抽样)。

系统抽样的步骤:
①采用随机的方式将总体中的个体编号。为简便起见,有 时可直接采用个体所带有的号码,如考生的准考证号、街 道上各户的门牌号,等等 ; ②整个的编号分段(即分成几个部分),要确定分段的间 n 隔k。当 (N为总体中的个体的个数,n为样本容量)是 N n n 整数时,k= ;当 不是整数时,通过从总体中剔除一 N N n , 些个体使剩下的总体中个体的个数N 能被n整除,这时k= ; N? ③在第一段用简单随机抽样确定起始的个体编号l; ④按照事先确定的规则抽取样本(通常是将l加上间隔k, 得到第2个编号l+k,第3个编号l+2k,这样继续下去,直到 获取整个样本)。

问题一 系统抽样中,每个个体被抽中的概率是否一样? 答:在上面的抽样中,由于在第一部分(编号为1—20) 中的起始号码是随机确定的,每个号码被抽取的概率都
1 等于 ,所以在抽取第1部分的个体前,其他各部分中 20 1

每个号码被抽取的概率也都是 20 。就是说,在这个系统 1 抽样中,每个个体被抽取的概率都是 。
20

讨论:若学生数变为1003人,在上述整个抽样过程中 每个个体被抽取的概率是否相等?
3 1、总体中的每个个体被剔除的概率是相等的 , 1003 1000 2、也就是每个个体不被剔除的概率相等 ; 1003 50 3、采用系统抽样时每个个体被抽取的概率都是 ; 1000

4、在整个抽样过程中每个个体被抽取的概率仍
1000 50 50 ? ? 相等,都是 。 1003 1000 1003

问题3 一个单位的职工500人,其中不到35岁的有125人, 35到49岁的有280人,50岁以上的有95人。为了了解这个 单位职工与身体状况有关的某项指标,要从中抽取一个容 量为100的样本。由于职工年龄与这项指标有关,试问: 应用什么方法抽取?能在500人中任意取100个吗?能将 100个份额均分到这三部分中吗? 分析:考察对象的特点是由具有明显差异的几部分组成。 当已知总体由差异明显的几部分组成时,为了使样本更充 分地反映总体的情况,常将总体分成几个部分,然后按照 各部分所占的比例进行抽样,这种抽样叫做“分层抽样” (stratified sampling),其中所分成的各部分叫做“层”。

问题 一个单位的职工500人,其中不到35岁的有125人,35 到49岁的有280人,50岁以上的有95人。为了了解这个单位职 工与身体状况有关的某项指标,要从中抽取一个容量为100的 样本。由于职工年龄与这项指标有关,试问:应用什么方法 抽取?能在500人中任意取100个吗?能将100个份额均分到这 三部分中吗?
解:(1)确定样本容量与总体的个体数之比100:500=1:5。 (2)利用抽样比确定各年龄段应抽取的个体数,依次

125 280 95 为 , , ,即25,56,19。 5 5 5
(3)利用简单随机抽样或系统抽样的方法,从各年龄段 分别抽取25,56。19人,然后合在一起,就是所抽取的 样本。

(1)分层抽样是等概率抽样,它也是公平的。用 分层抽样从个体为N的总体中抽取一个容量为n的 样本时,在整个抽样过程中每个个体被抽到的概 n 率相等,都等于 N 。 (2)分层抽样是建立在简单随机抽样或系统抽样 的基础上的,由于它充分利用了已知信息,因此 它获取的样本更具代表性,在实用中更为广泛。

类别

共同点

各自特点 从总体中逐个抽 取 按总体分成及部 分,按事先的规 则在个部分抽取

相互联系

适用范围 总体中个数较 少

简单随机 抽样 抽样过程中 系统抽样 每个个体被 抽取的概率 分层抽样 相等

起始部分才用 随机抽取

总体个数较多

将总体分成几层, 各层抽取时, 分成进行随机抽 采用简单随机 取 抽取

总体有明显的 层次差异

2005年9月1日起,教育部新颁布的 《普通高等学校管理规定》正式 实施,它将取代沿用了15年的旧《规定》。新规定删 除了原规定中“在校期间擅自结婚而未办理退学手续 的学生,作退学处理”的内容,对学生能否结婚不再 作特殊规定,大学生可以自由婚恋。针对人们不同的 看法,请你设计一个调查方案,并与同学交流


搜索更多“随机抽样”

网站地图

All rights reserved Powered by 伤城文章网 5xts.com

copyright ©right 2010-2021。
伤城文章网内容来自网络,如有侵犯请联系客服。zhit325@126.com