内容正文:
第九章 统计
第九章 统计
9.1 随机抽样
9.1.1 简单随机抽样(第一课时)
一
二
三
学习目标
了解全面调查相关的概念
了解抽样调查相关的概念
能够在一件事中判断全面调查与抽样调查
学习目标
章前导读
在现实生活中,我们经常会接触到各种统计数据,例如,人口总量、经济增长率、就业状况、物价指数、产品的合格率、商品的销售额、农作物的产量、人均水资源、居民人均年收入、电视台节目的收视率、学生的平均身高等.要正确阅读并理解这些数据,需要具备一些统计学的知识.
统计学:
是通过收集数据和分析数据来认识未知现象的一门科学.
那么,对于具体的统计问题,应如何收集数据?如何从所收集的数据提取信息来认识未知现象?这种认识一定正确?应如何正确解释统计的结果?
本章我们将在初中学过的统计与概率知识的基础上,通过进一步的学习,加深对这些问题的认识,并通过解决问题的实践,进一步学习数据分析的方法。
情景导入
2020年我国进行了第七次人口普查,对全国人口普遍地、逐户逐人地进行一次性调查登记.调查内容包括每位居民的姓名、性别、年龄、民族、受教育程度等.
这里,居民为调查对象,而居民的性别、年龄、民族、受教育程度等是要调查的指标.
统计的研究对象是数据,核心是通过数据分析研究和解决问题.
(准确掌握全国人口的数据,可为科学制定国民经济和社会发展规划及其其他方针政策提供依据. )
由于不同调查对象的指标值往往不同,它是一个变化的量,所以常把指标称为变量.
概念生成
全面调查
对每一个调查对象都进行调查的方法,称为全面调查,又称普查.
总体:在一个调查中,我们把调查对象的全体称为总体;
个体:组成总体的每一个调查对象称为个体;
(为了强调调查目的,也可把调查对象的某些指标的全体作为总体)
(把每一个调查对象的相应指标作为个体)
新知讲解
但是由于人口普查需要花费巨大的财力、物力,因而不宜经常进行. 为了及时掌握全国人口变动状况,我国每年还会进行一次人口变动情况的调查,就是根据抽取的居民情况来推断总体的人口变动情况.
抽样调查:根据一定目的,从总体中抽取一部分个体进行调查,并以此为依据对总体的情况作出估计和推断的调查方法,称为抽样调查;
样本:把从总体中抽取的那部分个体称为样本
样本量:样本中包含的个体数称为样本容量,简称样本量
新知探究
问题1 你能归纳出普查和抽样调查的各自特点吗?
1.普查的数据结果全面、准确,但花费的代价大、时间较长.
2.抽样调查的数据结果虽没有普查全面、准确,但具有花费少、效率高的特点,在总体规模较大的调查中,如果经费、时间上受限,那么抽样调查是比较合适的调查方法.
3.同时,在一些调查中,抽样调查具有不可替代的作用,抽样调查毁损性小.例如,检测一批灯泡的寿命,或一批种子的发芽率,或一批待售袋装牛奶的细菌数是否超标.
随着社会的发展,抽样调查的应用越来越广泛,下面我们研究两种基本抽样方法--简单随机抽样和分层抽样。
巩固练习
课本P177
解:(1) 总体是被调查的这个班级学生每周的体育锻炼时间;个体是这个班级的每一个学生每周的体育锻炼时间;适合用全面调查.
(2) 总体是这个地区全体居民结核病的发病情况;个体是这个地区每一位居民结核病的发病情况;适合用抽样调查.
(3) 总体是这批所有炮弹的杀伤半径;个体是这批炮弹中每一发炮弹的杀伤半径;适合用抽样调查.
(4) 总体是这个水库里的所有鱼;个体是这个水库里的每一条鱼;适合用抽样调查.
1. 在以下调查中,总体、个体各是什么? 哪些适合用全面调查? 哪些适合用抽样调查?
(1) 调查一个班级学生每周的体育锻炼时间;
(2) 调查一个地区结核病的发病率;
(3) 调查一批炮弹的杀伤半径;
(4) 调查一个水库所有鱼中草鱼所占的比例.
新知探究:简单随机抽样
问题2 抽查的目的是什么?
例如,抽样调查一批待售袋装牛奶的细菌数量是否超标,其目的是要了解整批牛奶的细菌含量是否超标,而不只是局限在抽查到的那几袋牛奶的情况.
因此,通过抽样调查了解总体的情况,自然希望抽取的样本数据能很好的反映总体的情况,即样本含有和总体基本相同的信息.
抽取出的样本要客观、公正、具有代表性.
问题3 抽取的样本具有什么特点?
抽查的目的是为了了解总体的情况.
新知探究:简单随机抽样
问题4 假设口袋中有红色和白色共1000个小球,除颜色外,小球的大小、质地完全相同,你能通过抽样调查的方法估计袋中红球所占的比例吗?
总体:
个体:
变量:
袋中所有小球
每一个小球
小球的颜色
我们可以从袋中随机摸出一个球,记录颜色后放回,摇匀后再摸出一个球,如此重复n次。
根据初中的概率知识可知,随着摸球次数的增加,摸到红球的频率会逐渐稳定于摸到红球的概率,即口袋中红球所占的比例。
因此,我们可以通过放回摸球,用频率估计出红球的比例.
但极端情况是每次摸到同一个小球。
这样的抽样结果误差较大
新知探究:简单随机抽样
问题4 假设口袋中有红色和白色共1000个小球,除颜色外,小球的大小、质地完全相同,你能通过抽样调查的方法估计袋中红球所占的比例吗?
追问 还有其他的方法吗?
我们还可以采用不放回摸球,即从袋中随机摸出一个球后不再放回袋中,每次摸球都在余下的球中随机摸取,这样就可以避免同一个小球被重复摸中.
特别地,当样本量n=1000时,不放回摸球已经把袋中的所有球取出,这就完全了解了袋中红球的比例,而有放回摸球一般还不能对袋中红球的比例做出准确的判断.
概念生成
简单随机抽样
一般地,设一个总体含有N(N为正整数)个个体,从中逐个抽取n(1≤n<N)个个体作为样本,
如果抽取是放回的,且每次抽取时总体内的各个个体被抽到的概率都相等,我们把这样的抽样方法叫做放回简单随机抽样.
如果抽取是不放回的,且每次抽取时总体内未进入样本的各个个体被抽到的概率是相等的,我们把这样的抽样方法叫做不放回简单随机抽样.
放回简单随机抽样和不放回简单随机抽样统称为简单随机抽样.通过简单随机抽样获得的样本称为简单随机样本.
从总体中,逐个不放回地随机抽取n个个体作为样本,一次性批量随机抽取n个个体作为样本,两种方法是等价的.
问题6 从定义中可以获知简单随机抽样有哪些特点?
问题5 放回简单随机抽样和不放回简单随机抽样哪个效率高?
不放回简单随机抽样的效率更高.
因此实践中人们更多采用不放回简单随机抽样. 除非特殊说明,本章所称的简单随机抽样指不放回简单随机抽样.
新知探究:简单随机抽样
①有限性:总体中个体数有限;
②逐一性:从总体中逐一抽取,这样便于在抽样试验中进行操作;
③等可能性:简单随机抽样是一种等可能抽样,在整个抽样过程中每个个体被抽取到的可能性相等,从而保证了这种抽样方式的公平性.
14
新知探究:简单随机抽样
解:(1)不是简单随机抽样. 虽然“一次性抽取”和“逐个抽取”不影响个体被抽到的可能性,但简单随机抽样要求的是“逐个抽取”;
(2)不是简单随机抽样. 因为简单随机抽样要求被抽取的样本总体的个数是有限的;
(3) 不是简单随机抽样. 因为这50名官兵是从中挑选出来最优秀的,每个个体被抽到的可能性不同,不符合简单随机抽样中“等可能抽样”的要求.
下面的抽样方法是简单随机抽样吗?为什么?
(1) 仓库中有1万支奥运火炬,从中一次抽取100支火炬进行质量检查;
(2) 某商品的市场调查员为了了解该商品在某日某超市的销售情况,在超市出口处随机向10个顾客询问是否购买了该商品
(3) 某连队从200名党员官兵中,挑选出50名最优秀的官兵赶赴灾区开展救灾工作.
典例解析
问题7 一家家具厂要为树人中学高一年级制作课桌椅,他们事先想了解全体高一年级学生的平均身高,以便设定可调节课桌椅的标准高度. 已知树人中学高一年级有712名学生,如果要通过简单随机抽样的方法调查高一年级学生的平均身高,应该怎么抽取样本?
总体:
个体:
变量:
树人中学全部高一年级学生
每一位学生
学生的身高
我们可以对高一年级进行简单随机抽样,用抽出的样本的平均身高估计高一年级学生的平均身高。
实现简单随机抽样的方法有很多,其中抽签法和随机数法是比较常用的两种简单随机抽样方法.
新知讲解
(1) 给712名学生编号,例如1~712进行编号;
(2) 把所有编号写在外观、质地等无差别的小纸片(也可以是卡片、小球等)上作为号签,并将这些小纸片放在一个不透明的盒里,充分搅拌;
(3) 从盒中不放回地逐个抽取号签,使与号签上的编号对应的学生进入样本,直到抽足样本所需要的人数.
抽签法
追问 为什么要给学生编号?编号用学号可以吗?
注意 (1) 编号是为了将每名学生能明确区分开.给学生编号时,可用用学号作为编号,因为学号与学生之间也是一一对应的.
但学号位数太多,操作不简便.
(2) 抽签法简单易行,但当总体较大时,操作起来比较麻烦. 因此,抽签法一般适用于总体中个体数不多的情形.
抽签法的步骤:
1.编号:将总体中的所有个体编号;
2.制签:并把号码写在形状、大小相同的号签上;
将号签放在一个不透明容器中,并搅拌均匀.
3.取样:每次从中不放回抽取一个号签,直到抽取到足够的样本量.
追问 抽签法的优缺点是什么?
优点:简单易行,当总体个数不多时,号签搅拌均匀很容易,个体有均等的机会被抽中,从而能保证样本的代表性.
缺点:当总体个数较多时,号签很难搅拌均匀,产生的样本代表性差的可能性很大.
抽签法一般适用于总体中个体数不多的情形
新知讲解
新知讲解
随机数法
(利用随机数工具产生的随机数进行抽样方法)
(1) 先给712名学生编号,例如001~712进行编号;
(4) 如果生成的随机数有重复,即同一编号被多次抽到,只保留第一次,其余全部剔除,再重新产生随机数,直到抽足样本所需要的人数.
(2) 用随机数工具产生001~712范围内的整数随机数,把产生的随机数作为抽中的编号,使与编号对应的学生进入样本;
(3) 重复上述过程,直到抽足样本所需要的人数;
随机数法的步骤:
1.编号:将总体中的所有个体编号;
2.选号:用随机数工具产生编号范围内的整数随机数;
3.取样:把产生的随机数作为抽中的编号,使与编号对应的个体进入样本.
新知讲解
问题8 随机数是如何产生的呢?
(1) 用随机试验产生随机数;
(2) 用信息技术生成随机数
① 用计算器生成随机数;
② 用电子表格软件生成随机数;
③ 用R统计软件生成随机数.
准备10个大小、质地一样的小球, 小球上分别写上数字0,1,2,· · · ,9, 把它们放入一个不透明的袋中. 从袋中有放回摸取3次, 每次摸取前充分搅拌, 并把第一、二、三次摸到的数字分别作为百、十、个位数, 这样就生成了一个三位随机数. 如果这个三位数在1~712范围内, 就代表对应编号的学生被选中, 否则舍弃编号. 这样产生的随机数可能会有重复.
(1)用随机试验生产随机数:
新知讲解
(2) 用信息技术生成随机数
① 用计算器生成随机数
进入计算器的计算模式(不同的计算器型号可能会有不同),调出生成随机数的函数并设置参数,例如RandInt,按“=”键即可生成1—712范围内的整数随机数.重复按“=”键,可以生成多个随机数.这样产生的随机数可能会有重复.
random随机的
integer
整数
新知讲解
(2) 用信息技术生成随机数
② 用电子表格软件生成随机数
在电子表格软件的任意单元格中输入“=RANDBETWEEN(1,712)”,即可生成一个1—712范围内的整数随机数.再利用电子表格软件的自动填充功能,可以快速生成大量的随机数.
新知讲解
(2) 用信息技术生成随机数
③ 用R统计软件生成随机数
在R软件的控制台中,输入“sample (1: 712, 50, replace=F) ”,按回车键,就可以得到50个1~712范围内的不重复的整数随机数(如右图).
R软件是免费的统计软件,该软件具有比较强大数据处理、绘图和分析等统计功能,在统计学研究和学习中被广泛使用.
随着信息技术的发展,人们越来越多地利用计算器、数学软件、统计软件等工具来生成随机数.尤其是一些统计软件,可以非常方便地按要求生成各种随机数.用信息技术工具产生随机数最大的优点是方便、快捷.
问题8 比较抽签法和随机数法,它们各有什么优点和缺点?
优点 缺点 适用范围
抽签法
随机
数法
简单易行
总体容量较大时,费时费力又操作不方便,可能导致抽样不公平.
操作简单易行,它很好地解决了用抽签法当总体中的个数较多时制签难的问题,
当总体量很大,样本量也很多时,对个体编号的工作量太大,即使用随机数表法操作仍然不方便.
适用于总体中个体数不多的情形
总体量较大,样本量较小的情形
新知探究
巩固练习
总体由编号为01,02, ,19,20的20个个体组成,利用下面的随机数
选取3个个体,则选出来的第3个个体的编号为( )
6572 0802 6314 0702 4369 9728 0198
3204 9234 4935 8200 3623 4869 6938
D
A. 08 B. 02 C. 63 D. 14
解析: 根据题意,依次读出的数据为08,02,14,
即选出来的第3个个体的编号为14.故选D.
新知探究
在重复试验中,试验次数越多,频率越接近概率的可能性越大.与此相似,用简单随机抽样的方法抽取样木,样本量越大,结果越准确。一般来说,样本量大的要比样本量小的好,增加样本量可以较好地提高估计的效果.
但在实际情况中,样本量会导致人力、费用、时间等成本的增加.
抽样调查中样本量的选择要根据实际问题的需要,并不一定是越大越好.
问题9 用简单随机抽样方法抽取样本,样本量是否越大越好?
在简单随机抽样调查中,当样本量和总体一样大时,就是全面调查了。
巩固练习
课本P177
2. 如图,由均匀材质制成的一个正20面体(每个面都是正三角形),将20个面平分成10组,第1组标上0,第2组标上1,‧‧‧,第10组标上9.
(1) 投掷正20面体,若把朝上一面的数字作为投掷结果,则出现0, 1, 2, ‧‧‧ , 9是等可能的吗?
(2) 三个正20面体分别涂上红、黄、蓝三种颜色,分别代表百位、十位、个位,同时投掷可以产生一个三位数(百位为0的也看作三位数),它是000~999范围内的随机数吗?
解:(1) 是等可能的;
(2) 是.
巩固练习
课本P177
3. 实验室的笼子里共有100只小白鼠,现要从中抽取10只作试验用. 下列两种情况是否属于简单随机抽样? 请说明理由.
(1) 每次不经任何挑选地抓一只,抓满10只为止;
(2) 将笼中的100只小白鼠按1~100编号,任意选出编号范围内的10个不重复数字,把相应编号的小白鼠作为试验用的小白鼠.
解:两种情况都属于简单随机抽样,因为每次抽取时总体内的各个个体被抽到的概率都相等.
巩固练习
课本P177
解:记[0,1)内的随机数为r.
设b为712r+1的整数部分,则b就是1~712范围内的整数随机数.
设a为100r+1的整数部分,则a就是1~100范围内的整数随机数.
解:随机抽样的优点是可以避免人为因素的干扰,使得样本更加客观.
缺点是不能充分利用已有的有关总体的信息.
4. 如果计算器只能生成[0,1)内的随机数,你有办法把它转化为1~100范围内的整数随机数吗?转化为1~712范围内的整数随机数呢?
5. 在抽样调查中,请你说说通过“随机”选择样本的优、缺点.
课堂小结
本节课你学会了哪些主要内容?
1.
$$