内容正文:
第1节 随机抽样、统计图表
1.了解获取数据的基本途径.
2.了解简单随机抽样的方法的含义,掌握两种简单随机抽样方法,掌握分层样本量比例分配的方法.
3.能根据实际问题的特点选择恰当的统计图表,体会使用统计图表的重要性.
[对应学生用书P223]
一、总体、个体、样本
调查对象的全体(或调查对象的某些指标的全体)称为总体,组成总体的每一个调查对象(或每一个调查对象的相应指标)称为个体,在抽样调查中,从总体中抽取的那部分个体称为样本,样本中包含的个体数称为样本容量,简称样本量.
二、简单随机抽样
1.定义:设一个总体含有N(N为正整数)个个体,从中逐个不放回地抽取n(1≤n<N)个个体作为样本,如果每次抽取时,总体中每个个体被抽到的概率都相等,这种抽样方法称为简单随机抽样.
2.方法:抽签法和随机数法是比较常用的两种方法.
三、分层随机抽样
1.定义:一般地,按一个或多个变量把总体划分成若干个子总体,每个个体属于且仅属于一个子总体,在每个子总体中独立地进行简单随机抽样,再把所有子总体中抽取的样本合在一起作为总样本,这样的抽样方法称为分层随机抽样,每一个子总体称为层.
2.比例分配:在分层随机抽样中,如果每层样本量都与层的大小成比例,那么称这种样本量的分配方式为比例分配.
3.平均数计算:在分层随机抽样中,如果层数分为2层,第1层和第2层包含的个体数分别为M和N,抽取的样本量分别为m和n,第1层和第2层的样本平均数分别为,,则样本平均数=+=+.
四、统计图表
1.作频率分布表和频率分布直方图的步骤
(1)求极差(即一组数据中最大值与最小值的差).
(2)决定组距与组数.
(3)将数据分组.
(4)列频率分布表.
(5)画频率分布直方图.
2.其他统计图表
(1)扇形图:直观描述各类数据占总数的比例.
(2)条形图和直方图:直观描述不同类别或分组数据的频数和频率.
(3)折线图:描述数据随时间的变化趋势.
1.简单随机抽样和分层随机抽样在抽样过程中每个个体被抽取的概率相等.
2.分层随机抽样是按比例抽样,每一层入样的个体数为该层的个体数乘抽样比.
3.在频率分布直方图中,中位数左边和右边的直方图的面积是相等的.
4.频率分布直方图中纵轴上的数据是各组的频率除以组距,不要和条形图混淆.
一、“教考衔接”例证
高考
真题
(2023·新课标Ⅱ卷)某学校为了解学生参加体育运动的情况,用比例分配的分层随机抽样方法作抽样调查,拟从初中部和高中部两层共抽取60名学生,已知该校初中部和高中部分别有400名和200名学生,则不同的抽样结果共有( )
A.C·C种 B.C·C种
C.C·C种 D.C·C种
追根
溯源
(人教A版必修第二册P189T5)一支田径队有男运动员56人,女运动员42人,按性别进行分层,用分层随机抽样的方法从全体运动员中抽出一个容量为28的样本.如果样本按比例分配,那么男、女运动员应各抽取多少名
发现
感悟
分层随机抽样多与其他知识结合考查,很少单独考查,但它是解题的切入点,特别是对抽样比的理解很重要,教材题与高考题均以体育运动为背景考查,与新课标倡导的“五育”精神接轨
二、教材典题改编
1.(北师版必修第一册P149“情境3”改编)从已经生产出来的10万个灯泡中随机抽取1 000个,以此来了解这10万个灯泡的寿命,在这一情境中,总体是指( )
A.这10万个灯泡
B.这10万个灯泡的寿命
C.抽取的1 000个灯泡
D.抽取的1 000个灯泡的寿命
答案:B
2.(人教A版必修第二册P198T1改编)如图是100位居民月均用水量的频率分布直方图,则月均用水量在[2,2.5)范围内的居民数为________.
答案:25
三、易误易混澄清
1.(不理解简单随机抽样中每个个体入样是等概率的)一个总体含有100个个体,用简单随机抽样法从该总体中抽取一个容量为5的样本,则指定的某个个体被抽到的概率为________.
答案: 解析:由题意得,指定的某个个体被抽到的概率为=.
2.(比例分配的分层随机抽样中找不准比例标准)某校有高一年级学生n名,其中男生数与女生数之比为6∶5,为了解学生的视力情况,现要求按比例分配的分层随机抽样法抽取一个样本容量为的样本,若样本中男生比女生多8名,则n=________.
答案:880 解析:依题意,男生抽取×=(名),女生抽取×=(名),所以-=8,解得n=880.
[对应学生用书P224]
考点一 简单随机抽样
1.(多选)下列抽样方法不是简单随机抽样的是( )
A.在机器传送带上抽取30件产品作为样本
B.从平面直角坐标系中抽取5个点作为样本
C.箱子里共有100个零件,从中不放回地逐个抽取10个零件进行质量检验
D.某可乐公司从仓库中的1 000箱可乐中一次性抽取20箱进行质量检查
AB 解析:选项A不是,因为传送带上的产品数量不确定;选项B不是,因为个体的数量无限;选项C是,因为满足简单随机抽样的定义;选项D是,因为一次性批量随机抽取和逐个不放回地随机抽取是等价的.
2.总体由编号01,02,…,29,30的30个个体组成.利用下面的随机数表选取6个个体,选取方法是从第1行的第6列和第7列数字开始由左到右依次选取两个数字,则选出来的第5个个体的编号为( )
第1行 78 16 62 32 08 02 62 42 62 52 53 69 97 28 01 98
第2行 32 04 92 34 49 35 82 00 36 23 48 69 69 38 74 81
A.19 B.25
C.26 D.27
B 解析:由随机数法可知,样本的前5个个体的编号分别为23,20,26,24,25,因此,选出的第5个个体的编号为25.
3.某校在一次期中作业检查中,对高一(6)班61位同学的作业进行抽样调查,先采用抽签法从中剔除一个人,再从余下的60人中随机抽取6人,下列说法正确的是( )
A.这种抽样方法对于被剔除的个体是不公平的,因为他失去了被抽到的机会
B.每个人被抽到的机会不相等
C.每个人在整个抽样过程中被抽到的机会相等,因为每个人被剔除的可能性相等,那么,不被剔除的机会也是相等的
D.由于采用了两步进行的抽样,所以无法判断每个人被抽到的可能性是多少
C 解析:由于第一次剔除时采用抽签法,对每个人来说可能性相等,然后随机抽取6人对每个人的机会也是相等的,所以总的来说每个人在整个抽样过程中被抽到的机会都是相等的.
简单随机抽样关注点
(1)简单随机抽样需满足:被抽取的样本总体的个体数有限;逐个抽取;等可能抽取.
(2)简单随机抽样一般有抽签法(适用于总体中个体数较少的情况)和随机数法(适用于总体中个体数较多的情况)两种常用方法.
考点二 分层随机抽样
[例1] (1)某学校为了了解学生参加体育运动的情况,用比例分配的分层随机抽样方法作抽样调查,拟从初中部和高中部两层共抽取60名学生,已知该校初中部和高中部分别有400名和200名学生,则在初中部和高中部抽取的人数分别为________.
(2)(2025·南昌模拟)从甲队60人,乙队40人中,按照分层随机抽样的方法从两队共抽取10人,进行一轮答题.相关统计情况如下:甲队答对题目的平均数为1,方差为1;乙队答对题目的平均数为1.5,方差为0.4,则这10人答对题目的方差为________.
答案:(1)40,20 (2)0.82 解析:(1)由题意,初中部和高中部学生人数之比为=,所以抽取的60名学生中初中部应有60×=40(人),高中部应有60×=20(人).
(2)根据题意,按照分层随机抽样的方法从甲队中抽取10×=6(人),从乙队中抽取10×=4(人),这10人答对题目的平均数为×(6×1+4×1.5)=1.2,所以这10人答对题目的方差为×{6×[1+(1-1.2)2]+4×[0.4+(1.5-1.2)2]}=0.82.
分层随机抽样中有关计算的方法
(1)抽样比==.
(2)在分层随机抽样中,如果第一层的样本量为m,平均值为x,方差为s;第二层的样本量为n,平均值为y,方差为s,
则样本的平均值为μ==x+y;方差为s2=[s+(x-μ)2]+[s+(y-μ)2].
训练1 (1)(2025·南通模拟)采用分层随机抽样方法对某校600名高三年级学生的身高(单位:cm)进行调查,估计得到该年级男生、女生和全体学生的平均身高分别为170.0,160.4,165.6,则该年级的男生人数约为( )
A.315 B.320
C.325 D.330
C 解析:设该年级的男生人数为x,则女生人数为600-x,则·170.0+·160.4=165.6,即170x+600×160.4-160.4x=165.6×600,即9.6x=600×(165.6-160.4)=600×5.2,所以x==325.
(2)为了解学生的课外阅读情况.某校采用比例分配的分层随机抽样的方法对高中三个年级的学生进行平均每周课外阅读时间(单位:h)的调查,所得样本数据如下:
年级
抽样人数
样本平均数
样本方差
高一
40
5
3.5
高二
30
x2
2
高三
30
3
s
已知高中三个年级的总样本平均数为4.1,总样本方差为3.14,则高二年级学生的样本平均数x2=________,高三年级学生的样本方差s=________.
答案:4 1.5 解析:由高中三个年级学生的总样本平均数为4.1,可得=4.1,解得x2=4;
因为总样本方差为3.14,所以×[3.5+(5-4.1)2]+×[2+(4-4.1)2]+×[s+(3-4.1)2]=3.14,
解得s=1.5.
考点三 统计图表
考向1 扇形图、条形图
[例2] (多选)某学校为了了解本校学生的上学方式,在全校范围内随机抽查部分学生,了解到上学方式主要有:A—结伴步行,B—自行乘车,C—家人接送,D—其他方式.并将收集的数据整理绘制成如图所示的两幅不完整的统计图.根据图中信息,下列说法正确的是( )
A.扇形图中D的占比最小
B.条形图中A和C一样高
C.无法计算扇形图中A的占比
D.估计该校一半的学生选择结伴步行或家人接送
ABD 解析:由条形图知,自行乘车上学的有42人,家人接送上学的有30人,其他方式上学的有18人,采用B,C,D三种方式上学的共90人.设结伴步行上学的有x人,由扇形图知,结伴步行上学与自行乘车上学的学生共占60%,所以=,解得x=30,故条形图中A,C一样高;扇形图中A的占比与C一样,都为25%;A和C共占50%,即估计该校一半的学生选择结伴步行或家人接送;扇形图中D的占比最小.
考向2 折线图
[例3] (多选)(2025·北京阶段模拟)汽车的“燃油效率”是指汽车每消耗1 L汽油行驶的里程,如图描述了甲、乙、丙三辆汽车在不同速度下的燃油效率情况.下列叙述中正确的是( )
A.消耗1 L汽油,乙车最多可行驶5 km
B.以相同速度行驶相同路程,三辆车中,甲车消耗汽油最少
C.甲车以80 km/h的速度行驶1 h,消耗10 L汽油
D.某城市机动车最高限速80 km/h,相同条件下,在该市用丙车比用乙车更省油
BD 解析:从题图中可以看出乙车的最高燃油效率大于5,故A错误;同样速度甲车消耗1 L汽油行驶的路程比乙车、丙车的多,所以行驶相同路程,甲车油耗最少,故B正确.甲车以80 km/h的速度行驶,1 L汽油行驶10 km,所以行驶1 h,即行驶80 km,消耗8 L汽油,故C错误;速度在80 km/h以下时,相同条件下每消耗1 L汽油,丙车行驶路程比乙车多,所以在该市用丙车比用乙车更省油,故D正确.
考向3 频率分布直方图
[例4] 随着新课程改革和高考综合改革的实施,高中教学以发展学生学科核心素养为导向,学习评价更关注学科核心素养的形成和发展.为此,某市于2024年举行第一届高中数学学科素养竞赛,竞赛结束后,为了评估该市高中学生的数学学科素养,从所有参赛学生中随机抽取1 000 名学生的成绩(单位:分)作为样本进行估计,将抽取的成绩整理后分成五组,依次记为[50,60),[60,70),[70,80),[80,90),[90,100],并绘制成如图所示的频率分布直方图.
(1)请补全频率分布直方图,并估计这1 000名学生成绩的平均数(同一组数据用该组区间的中点值作代表);
(2)该市决定对本次竞赛成绩排在前180名的学生给予表彰,授予“数学学科素养优秀标兵”称号,一名学生本次竞赛成绩为79分,请你判断该学生能否被授予“数学学科素养优秀标兵”称号.
解:(1)成绩在[60,70)的频率为1-(0.30+0.15+0.10+0.05)=0.40,补全的频率分布直方图如图.
样本的平均数=55×0.30+65×0.40+75×0.15+85×0.10+95×0.05=67.
(2)因为=0.18,
所以由频率分布直方图可以估计获得“数学学科素养优秀标兵”称号学生的最低成绩为
80-=78(分).
因为79>78,所以该学生能被授予“数学学科素养优秀标兵”称号.
频率分布直方图的相关结论
(1)直方图中各长方形的面积之和为1.
(2)直方图中纵轴表示,故每组样本的频率为组距×,即矩形的面积.
(3)直方图中每组样本的频数为频率×总数.
训练2 (1)(2025·开封模拟)某学校组建了演讲、舞蹈、合唱、绘画、英语协会五个社团,全校2 000名学生每人都参加且只参加其中两个社团,校团委从这2 000名学生中随机选取部分学生进行调查,并将调查结果绘制成如下不完整的两个统计图.
则选取的学生中,参加绘画社团的学生数为( )
A.20 B.30
C.40 D.45
A 解析:选取的学生中,参加合唱社团的比例为=35%,所以参加绘画社团的比例为1-20%-20%-15%-35%=10%,所以选取的学生中,参加绘画社团的学生数为×10%=20.
(2)(2025·重庆开学考试)近几年,我国新能源汽车行业呈现一片生机勃勃的景象.电动汽车因其智能性与操控感越来越被人们接受与认可,尤其是其辅助驾驶功能.某品牌电动汽车公司为了更好地了解车主使用辅助驾驶功能的情况,进行了问卷调查,从中抽取了100位车主进行抽样分析,分析100位车主在100次驾驶途中使用辅助驾驶功能的次数,得到如下频率分布直方图(60次以上的称为经常使用辅助驾驶功能),则下列结论错误的是( )
A.b=0.005
B.估计车主在100次驾驶途中使用辅助驾驶功能的次数的平均数低于70
C.从这100位车主中随机选取一位车主,则这位车主经常使用辅助驾驶功能的概率约为
D.按照“经常使用辅助驾驶功能”的人与“不经常使用辅助驾驶功能”的人进行分层随机抽样,从这100人中抽取12人,则在经常使用辅助驾驶功能的人中应抽取8人
D 解析:对于A,由频率分布直方图可得2b+0.015+0.020+0.025+0.030=0.1,故b=0.005,A正确;对于B,使用辅助驾驶功能的次数的平均数为45×0.005×10+55×0.020×10+65×0.025×10+75×0.030×10+85×0.015×10+95×0.005×10=69.5,故B正确;对于C,使用辅助驾驶功能的次数不少于60的频率为1-(0.005+0.020)×10=0.75,故C正确;对于D,“经常使用辅助驾驶功能”的人与“不经常使用辅助驾驶功能”的人的频率之比为∶=3∶1,故从这100人中抽取12人,则在经常使用辅助驾驶功能的人中应抽取×12=9(人),故D错误.
[课时训练(65)见P497]
学科网(北京)股份有限公司
$$