内容正文:
统计
5.1.1 数据的收集
学业标准
素养目标
1.了解总体、样本、样本容量的概念,了解数据的随机性.(难点)
2.通过实例,了解简单随机抽样、分层抽样的特点及适用范围,并能根据实际问题的特点,选择恰当的抽样方法解决问题.(重点)
1.通过对总体、样本、普查、抽样调查、简单随机抽样、分层抽样等概念的学习,主要培养学生数学抽象核心素养.
2.通过简单随机抽样和分层抽样的应用,提升学生数据分析等核心素养.
导学1
数据的收集、简单随机抽样
假设要在你们班(45人)选派5个人去参加某项活动,为了体现选派的公平性,你有什么办法确定具体人选?如何操作?假设要在你们校(假设4 000人)选派5个人去参加某项活动,如何选呢?
[提示] 用抽签法(抓阄法)确定人选,具体操作如下:用小纸条把每个同学的学号写下来,揉成小球放在盒子里,并搅拌均匀,然后随机从中逐个抽出5个学号,被抽到学号的同学即为参加活动的人选.对于后者,利用随机数法.
◎结论形成
1.普查和抽样调查
调查方式
普查
抽样调查
定义
对总体的每个个体都进行考查的方法称为普查
只抽取样本进行考查的方法称为抽样调查
适用范围
总体包含的个体总数不大或有特殊情况下
总体包含的个体总数较大或考查的方法具有破坏性、时间不允许、成本太高等
优点
能了解总体每个个体的情况,从而能准确地掌握总体的特征
迅速、及时、节约人力、物力、财力
缺点
成本太高,费时费力
结果具有不确定性
2.简单随机抽样
(1)定义及适用范围
简单随机抽样(也称为纯随机抽样)就是从总体中不加任何分组、划类、排队等,完全随机地抽取个体.简单随机抽样是其他各种抽样方法的基础.当总体的个体之间差异程度较小和总体中个体数目较少时,通常采用这种方法.
(2)常见的两种方法
常见的简单随机抽样方法有抽签法、随机数表法.
导学2
分层抽样
某地区有高中生2 400人,初中生10 900人,小学生11 000人.当地教育部门为了了解本地区中小学生的近视率及其形成原因,要从本地区的中小学生抽取1%的学生进行调查,为了抽样方便,能不能只从小学生或初中生或高中生中抽取中小学生总数的1%?你认为应当怎样获取样本才更为合理?
[提示] 不能,因为不同年龄阶段的学生的近视情况可能存在明显差异,为了使样本具有较好的代表性,应该分高中、初中、小学三个层次分别抽样.
◎结论形成
1.定义
一般地,如果相对于要考察的问题来说,总体可以分成有明显差别的、互不重叠的几部分时,每一部分可称为层,在各层中按层在总体中所占比例进行随机抽样的方法称为分层随机抽样(简称为分层抽样).
2.分层抽样的优点
通过分层抽样所得到的样本,一般更具有代表性,可以更准确地反映总体的特征,尤其是在层内个体相对同质而层间差异较大时更是如此.分层抽样在各层中抽样时,还可根据各层的特点灵活地选用不同的随机抽样方法.
1.判断正误(正确的打“√”,错误的打“×”)
(1)分层随机抽样适合个体有显著差异的总体.( )
(2)在1 000个球中有红球50个,从中抽取100个进行分析,如果用分层随机抽样的方法对球进行抽样,那么应抽红球5个.( )
(3)简单随机抽样、分层随机抽样两者的共同点是在抽样过程中每个个体被抽到的机会相等.( )
(4)任意抽样调查,均可使用抽签法.( )
答案 (1)√ (2)√ (3)√ (4)×
2.从某年级500名学生中抽取60名学生进行体重的统计分析,下列说法正确的是( )
A.500名学生是总体
B.每个被抽查的学生是个体
C.抽取的60名学生的体重是一个样本
D.抽取的60名学生的体重是样本容量
解析 本题抽取的是60名学生的体重,因此500名学生的体重是总体,每个学生的体重是个体,这60名学生的体重构成一个样本,样本的容量为60.
答案 C
3.某林场有树苗30 000棵,其中松树苗4 000棵.为调查树苗的生长情况,采用分层随机抽样的方法抽取一个容量为150的样本,则样本中松树苗的数量为( )
A.30 B.25
C.20 D.15
解析 样本中松树苗为4 000×=4 000×
=20(棵).
答案 C
4.已知某乡农田有山地8 000亩,丘陵12 000亩,平地24 000 亩,洼地4 000亩,现抽取农田480亩估计全乡农田粮食平均亩产量,则采用 方法抽样比较合理,其中山地应抽 亩.
解析 本题总体是由差异明显的几个层组成的,适合分层抽样的要求.山地应抽
480×=80(亩).
答案 分层抽样 80
题型一 简单随机抽样的应用
为了适应新高考改革,尽快推行不分文理科教学,为对比目前文理科学生考试情况,学校决定从80名文科同学中抽取10人,从300名理科同学中抽取50人.学校你能选择合适的方法设计抽样方案吗?试一试.
[解析] 文科同学抽样用抽签法,理科同学抽样用随机数表法,抽样过程如下:
(1)先抽取10名文科同学:
①将80名文科同学依次编号为1,2,3,…,80;
②将号码分别写在形状、大小均相同的纸片上,制成号签;
③把80个号签放入一个不透明的容器中,搅拌均匀,每次从中不放回地抽取一个号签,连续抽取10次;
④与号签上号码相对应的10名同学的考试情况就构成一个容量为10的样本.
(2)再抽取50名理科同学:
①将300名理科同学依次编号为001,002,…,300;
②从随机数表中任选一数字作为开始数字,任选一方向作为读数方向,比如下面是随机数表的一部分从第1列的数字1开始向右读(如图所示).每次读取三位,凡不在001~300中以及重复的数都跳过去,得到号码125,210,142,188,264,…;
③这50个号码所对应的同学的考试情况就构成一个容量为50的样本.
简单随机抽样方法中最常用的是抽签法和随机数表法,当总体中个体数目较多,制签和摇匀都有困难时,应当选用随机数表法.
[触类旁通]
1.在某次学习强国实践活动中,某单位共有50名志愿者参与了报名,现要从中随机抽出6人参加一项活动,请用抽签法进行抽样,并写出过程.
解析 第一步,将50名志愿者编号,号码为1,2,3,…,50.
第二步,将号码分别写在大小、形状、质地都相同的纸条上,揉成团,制成号签.
第三步,将所有号签放入一个不透明的箱子中,搅拌均匀.
第四步,一次取出1个号签,连取6次,并记录其编号.
第五步,将对应编号的志愿者选出即可.
题型二 分层抽样方案设计
一个单位有职工500人,其中不到35岁的有125人,35岁至49岁的有280人,50岁及50岁以上的有95人.为了了解这个单位职工与身体状态有关的某项指标,要从中抽取100名职工作为样本,职工年龄与这项指标有关,应该怎样抽取?
[解析] 用分层随机抽样来抽取样本,步骤如下:
(1)分层.按年龄将500名职工分成三层:不到35岁的职工;35岁至49岁的职工;50岁及50岁以上的职工.
(2)确定每层抽取个体的个数.抽样比为=,则在不到35岁的职工中抽取125×=25(人);
在35岁至49岁的职工中抽取280×=56(人);
在50岁及50岁以上的职工中抽取95×=19(人).
(3)在各层分别按随机数法抽取样本.
(4)汇总每层抽样,组成样本.
利用分层随机抽样抽取样本的操作步骤
(1)将总体按一定属性特征进行分层.
(2)计算各层的个体数与总体的个体数的比.
(3)按各层的个体数占总体的比确定各层应抽取的样本容量.
(4)在每一层进行抽样(可用简单随机抽样).
(5)最后将每一层抽取的样本汇总合成样本.
[触类旁通]
2.一批产品中有一级品100个,二级品60个,三级品40个,用分层随机抽样法从这批产品中抽取一个容量为20的样本.请利用分层随机抽样的方法抽取,写出抽样过程.
解析 第一步,确定抽样比.
因为100+60+40=200,所以=,
第二步,确定各层抽取的样本数.
一级品:100×=10,
二级品:60×=6,
三级品:40×=4.
第三步,采用简单随机抽样的方法,从各层分别抽取样本.
第四步,把抽取的个体组合在一起构成所需样本.
题型三 分层抽样中的计算问题(一题多变))
(1)某校有高级教师26人,中级教师104人,其他教师若干人.为了了解该校教师的工资收入情况,若按分层抽样从该校的所有教师中抽取56人进行调查,已知从其他教师中共抽取了16人,则该校共有教师 人.
(2)某企业共有1 600名职工,其中,老年、中年、青年职工的比例为2∶3∶5,现用分层抽样的方法从所有的职工中抽取一个样本容量为200的样本,那么从中年职工中抽取多少人?
[解析] (1)设该校其他教师有x人,则=,解得x=52,经检验,x=52是原方程的根,故全校教师共有26+104+52=182(人).
(2)根据分层抽样的方法步骤,可知按照一定比例抽取,样本容量为200,那么根据题意从中年职工中抽取的人数为200×=60.
[答案] (1)182 (2)略
[母题变式]
1.(变结论)若本例(2)条件不变,则青年职工抽取 人.
解析 青年职工的抽取人数为200×=100(人).
答案 100
2.(变条件)若把本例(2)中的职工的比例改为1∶6∶3,其他不变,应如何求解?
解析 中年职工的抽取人数为200×=120(人).
进行分层随机抽样的相关计算时,
常用到的两个关系
(1)=.
(2)总体中某两层的个体数之比等于样本中这两层抽取的个体数之比.
[触类旁通]
3.某网站针对“2025年法定节假日调休安排”提出的A,B,C三种放假方案进行了问卷调查,调查结果如下:
支持A方案
支持B方案
支持C方案
35岁以下的人数
200
400
800
35岁以上(含35岁)的人数
100
100
400
(1)从所有参与调查的人中,用分层抽样的方法抽取n人,已知从支持A方案的人中抽取了6人,求n的值;
(2)从支持B方案的人中,用分层抽样的方法抽取5人,这5人中在35岁以上(含35岁)的人数是多少?35岁以下的人数是多少?
解析 (1)由题意得
=,
解得n=40.
(2)35岁以下的人数为×400=4(人),35岁以上(含35岁)的人数为5-4=1(人).
知识落实
技法强化
1.数据的收集:普查与抽样调查.
2.简单随机抽样、分层抽样.
1.简单随机抽样的三个特点为总体有限、逐个抽取、等可能抽样.而分层抽样主要适用个体差异较大的抽样.简单随机抽样与分层随机抽样中每个个体入样均是等可能的.
2.解决分层抽样问题的关键是确定好对应各层的抽样比.
[必备知识·基础巩固]
1.从一个含有40个个体的总体中抽取一个容量为7的样本,将个体依次随机编号为01,02,…,40,从随机数表的第6行第8列开始,依次向右,到最后一列转下一行最左一列开始,直到取足样本,则获取的第4个样本编号为( )
(下面节选了随机数表第6行和第7行)
第6行 84 42 17 56 31 07 23 55 06 82 77 04 74 43 59 76 30 63 50 25 83 92 12 06
第7行 63 01 63 78 59 16 95 56 67 19 98 10 50 71 75 12 86 73 58 07 44 39 52 38
A.06 B.10 C.25 D.35
解析 找到第6行第8列的数开始向右读,第一个数是63,不成立,
第二个数10,成立,第三个数72,不成立,
第四个数35,成立,第五个数50,不成立,
这样依次读出结果:68,27,70,47,44,35,97,63,06,合适的数是27,35,06,
其中35前面已经出现,应舍掉,
故第四个数是06.故选A.
答案 A
2.现要完成下列3项抽样调查:
①从10盒酸奶中抽取3盒进行食品卫生检查.
②某学校有男、女学生各500名,为了解男、女学生在学习兴趣与业余爱好方面是否存在显著差异,拟从全体学生中抽取100名学生进行调查.
③某中学共有320名教职工,其中教师240名,行政人员32名,后勤人员48名,为了了解教职工对学校在校务公开方面的意见,拟抽取一个容量为40的样本.
较为合理的抽样方法的选择是( )
A.①简单随机抽样,②分层随机抽样,③分层随机抽样
B.①简单随机抽样,②分层随机抽样,③简单随机抽样
C.①分层随机抽样,②简单随机抽样,③分层随机抽样
D.①分层随机抽样,②抽签法,③简单随机抽样
解析 ①总体和样本量都很小,用简单随机抽样;②③总体由差异明显的几部分构成,用分层随机抽样.
答案 A
3.某校做了一次关于“感恩父母”的问卷调查,从8~10岁、11~12岁、13~14岁、15~16岁四个年龄段回收的问卷依次为120份、180份、240份、x份.因调查需要,从回收的问卷中按年龄段分层抽取容量为300的样本,其中在11~12岁学生问卷中抽取60份,则在15~16岁学生中抽取的问卷份数为( )
A.60 B.80
C.120 D.180
解析 11~12岁回收180份,其中在11~12岁学生问卷中抽取60份,则抽样比为.
∵从回收的问卷中按年龄段分层抽取容量为300的样本,∴从8~10岁、11~12岁、13~14岁、15~16岁四个年龄段回收的问卷总数为=900(份),则15~16岁回收问卷份数为x=900-120-180-240=360(份).
∴在15~16岁学生中抽取的问卷份数为360×=120(份).故选C.
答案 C
4.(多选题)下面的抽样方法不是分层随机抽样的是( )
A.在某年明信片销售活动中,规定每100万张为一个开奖组,通过随机抽取的方式确定号码的后四位为2709的为三等奖
B.某车间包装一种产品,在自动包装的传送带上,每隔30分钟抽一包产品,称其重量是否合格
C.某学校分别从行政人员、教师、后勤人员中抽取2人、14人、4人了解对学校机构改革的意见
D.用抽签法从10件产品中抽取3件进行质量检验
解析 A、B不是分层随机抽样,因为抽取的个体间的间隔是固定的;C是分层随机抽样,因为总体的个体有明显的层次;D是简单随机抽样.
答案 ABD
5.一支田径队有男运动员48人,女运动员36人,若用分层随机抽样的方法从该队的全体运动员中抽取一个容量为21的样本,则抽取男运动员的人数为 .
解析 设抽取男运动员人数为n,则=,
解之得n=12.
答案 12
6.将一个总体分为A,B,C三层,其个体数之比为5∶3∶2.若用分层抽样方法抽取容量为100的样本,则应从C中抽取 个个体.
解析 因为A,B,C三层个体数之比为5∶3∶2,又总体中每个个体被抽到的可能性相等,所以分层抽样应从C中抽取100×=20(个)个体.
答案 20
7.某商场有四类食品,其中粮食类、植物油类、运动性食品类及果蔬类分别有40种、10种、30种、20种,现从中抽取一个容量为20的样本进行食品安全检测.若采用分层随机抽样的方法抽取样本,则抽取的植物油类与果蔬类食品种数之和是 .
解析 分层随机抽样中,分层抽取时都按相同的抽样比来抽取,本题中抽样比为=,因此植物油类应抽取10×=2(种),果蔬类食品应抽取20×=4(种),因此从植物油和果蔬类食品中抽取的种数之和为2+4=6.
答案 6
8.某家电视台在因特网上征集某电视节目现场参与观众,报名的总人数为12 000人,分别来自4个城区,其中东城区2 400人,西城区4 600人,南城区3 800人,北城区1 200人,现要从中抽取60人参加现场节目,应当如何抽取?写出抽取过程.
解析 用分层抽样来抽取,步骤是:第一步,分层,按城区分为四层:东城区、西城区、南城区、北城区.第二步,确定抽样比,由于样本容量n=60,总体中个体总数N=12 000,故抽样比k===.第三步,按比例k=确定每层应抽取的个体数.在东城区抽取2 400×=12(人),在西城区抽取4 600×=23(人),在南城区抽取3 800×=19(人),在北城区抽取1 200×=6(人).第四步,各层分别用简单随机抽样法抽取样本,综合每层抽样,将各城区抽取的观众合在一起便得所抽取的60人.
[关键能力·综合提升]
9.(多选题)已知某地区有小学生120 000人,初中生75 000人,高中生55 000人,当地教育部门为了了解本地区中小学生的近视率,按小学生、初中生、高中生进行分层抽样,抽取一个容量为2 000的样本,得到小学生、初中生、高中生的近视率分别为30%,70%,80%.下列说法中正确的有( )
A.从高中生中抽取了440人
B.每名学生被抽到的概率为
C.估计该地区中小学生总体的平均近视率为60%
D.估计高中学生的近视人数约为44 000
解析 由题意,抽样比为=,则B正确;
从高中生中抽取了55 000×=440人,A正确;
高中生近视人数约为55 000×80%=44 000(人),D正确;
学生总人数为250 000(人),小学生占比为=,同理,初中生、高中生分别占比为,,在2 000的样本中,小学生、初中生和高中生分别抽取960人、600人和440人,则近视人数为960×30%+600×70%+440×80%=1 060(人),所以估计该地区中小学总体的平均近视率为=53%,C错误.
答案 ABD
10.某企业三月中旬生产A,B,C三种产品共3 000件,根据分层随机抽样的结果,企业统计员制作了如下的统计表格:
产品类别
A
B
C
产品数量/件
1 300
样本容量/件
130
由于不小心,表格中A,C产品的有关数据已被污染看不清楚,统计员记得A产品的样本容量比C产品的样本容量多10,根据以上信息,可得C的产品数量是 件.
解析 设样本容量为x,则×1 300=130,∴x=300.∴A产品和C产品在样本中共有300-130=170(件).设C产品的样本容量为y,则y+y+10=170,∴y=80.
∴C产品的数量为×80=800(件).
答案 800
11.有甲、乙两种产品共120件,现按一定的比例用分层随机抽样的方法共抽取10件进行产品质量调查,如果所抽取的甲产品的数量是乙产品的2倍还多1件,那么甲、乙产品的总件数分别为 、 .
解析 设抽取乙产品x件,则抽取甲产品2x+1件,由x+(2x+1)=10,得x=3.∴2x+1=7,∴甲产品为120×=84(件),乙产品为120×=36(件).
答案 84 36
12.一工厂生产了16 800件某种产品,它们分别来自甲、乙、丙3条生产线.为检查这批产品的质量,决定采用分层随机抽样(按比例分配样本量)的方法进行抽样.已知从甲、乙、丙3条生产线抽取的产品个数分别是a,b,c,且2b=a+c,则乙生产线生产了 件产品.
解析 设甲、乙、丙3条生产线各生产了T甲,T乙,T丙件产品,则a∶b∶c=T甲∶T乙∶T丙,即==.因为2b=a+c,
所以
所以T乙==5 600.
答案 5 600
13.某中学举行了为期3天的秋季体育运动会,同时进行全校精神文明擂台赛.为了解这次活动在全校师生中产生的影响,分别在全校500名教职员工、3 000名初中生、4 000名高中生中作问卷调查,如果要在所有答卷中抽出120份用于评估.
(1)应如何抽取才能得到比较客观的评价结论?
(2)要从3 000份初中生的答卷中抽取一个容量为48的样本,如果采用简单随机抽样,应如何操作?
解析 (1)由于这次活动对教职员工、初中生和高中生产生的影响不会相同,所以应当采取分层随机抽样的方法进行抽样.
因为样本容量为120,总体个数为500+3 000+4 000=7 500,则抽样比:=,所以有500×=8,3 000×=48,4 000×=64,
所以在教职员工、初中生、高中生中抽取的个体数分别是8,48,64.
分层随机抽样的步骤是
①分层:分为教职员工、初中生、高中生,共三层.
②确定每层抽取个体的个数:在教职员工、初中生、高中生中抽取的个体数分别是8,48,64.
③各层分别按简单随机抽样的方法抽取样本.
④综合每层抽样,组成样本.
这样便完成了整个抽样过程,就能得到比较客观的评价结论.
(2)由于简单随机抽样有两种方法:抽签法和随机数法.如果用抽签法,要做3 000个号签,费时费力,因此采用随机数法抽取样本,步骤是
①编号:将3 000份答卷都编上号码:0001,0002,0003,…,3000.
②在随机数表上随机选取一个起始位置.
③规定读取方向:向右连续取数字,以4个数为一组,如果读取的4位数大于3 000,则去掉,如果遇到相同号码则只取一个,这样一直到取满48个号码为止.
[核心价值·探索创新]
14.为了对某课题进行研究,分别从A,B,C三所高校中用分层抽样法抽取若干名教授组成研究小组,其中高校A有m名教授,高校B有72名教授,高校C有n名教授(其中0<m≤72≤n).
(1)若A,B两所高校中共抽取3名教授,B,C两所高校中共抽取5名教授,求m,n;
(2)若高校B中抽取的教授数是高校A和C中抽取的教授总数的,求三所高校的教授的总人数.
解析 (1)因为0<m≤72≤n,A,B两所高校中共抽取3名教授,所以B高校中抽取2人,所以A高校中抽取1人,C高校中抽取3人,所以==,
解得m=36,n=108.
(2)因为高校B中抽取的教授数是高校A和C中抽取的教授总数的,所以(m+n)=72,
解得m+n=108,所以三所高校的教授的总人数为m+n+72=180.
15.某单位最近组织了一次健身活动,活动分为登山组和游泳组,每个职工至多参加其中一组.在参加活动的职工中,青年人占42.5%,中年人占47.5%,老年人占10%.登山组的人数占参加活动总人数的,且该组中,青年人占50%,中年人占40%,老年人占10%.为了了解各组不同年龄层次的职工对本次活动的满意程度,需从参加活动的职工中抽取一个容量为200的样本进行调查.试确定:
(1)游泳组中,青年人、中年人、老年人分别所占的比例;
(2)游泳组中,青年人、中年人、老年人分别应抽取的人数.
解析 (1)设登山组人数为x,游泳组中,青年人、中年人、老年人各占比例分别为a,b,c,
则有=47.5%,
=10%,解得b=50%,c=10%,
故a=100%-50%-10%=40%,即游泳组中,青年人、中年人、老年人各占比例分别为40%,50%,10%.
(2)游泳组中,抽取的青年人数为
200××40%=60(人);
抽取的中年人数为200××50%=75(人);
抽取的老年人数为200××10%=15(人).
学科网(北京)股份有限公司
$