内容正文:
单元复习课件
第13章 统计
沪教版2020必修第三册·高二
学习内容导览
单元知识图谱
2
单元复习目标
1
3
考点串讲
针对训练
5
题型剖析
4
6
课堂总结
1.清晰界定统计中的基础概念,包括总体、个体、样本、样本容量,能准确区分不同情境下的总体与样本,避免概念混淆。掌握简单随机抽样、分层抽样的定义、适用条件及操作步骤,明确抽样方法的共性与差异,能根据总体特征选择合适的抽样方法。
3.熟记平均数、中位数、众数、方差、标准差的计算公式,明确各统计量的意义,能根据数据特点选择合适的统计量描述数据特征。
2.理解频率分布表、频率分布直方图、频率折线图、茎叶图的概念及各自特点,知晓不同统计图表的适用场景,如频率分布直方图用于展示数据分布规律,茎叶图便于保留原始数据并比较两组数据。
单元学习目标
单元知识图谱
调查方式 全面调查 抽样调查
定义 对每一个调查对象都进行____的方法,称为全面调查,又称普查 根据一定目的,从总体中__________
_____进行调查,并以此为依据对总体的情况作出估计和推断的调查方法
相关概念 总体:在一个调查中,我们把_________的全体称为总体.
个体:组成总体的每一个调查对象称为个体 样本:我们把从总体中抽取的______
_______称为样本.
样本量:样本中包含的_______称为样本量
调查
抽取一部分
个体
那部
分个体
个体数
调查对象
考点一、全面调查与抽样调查
考点串讲
1.简单随机抽样的概念:
放回简单随机抽样 不放回简单随机抽样
一般地,设一个总体含有N(N为正整数)个个体,从中_____抽取n(1≤n<N)个个体作为样本
如果抽取是放回的,且每次抽取时总体内的各个个体被抽到的概率都______,我们把这样的抽样方法叫做放回简单随机抽样 如果抽取是不放回的,且每次抽取时总体内_____________________被抽到的概率都相等,我们把这样的抽样方法叫做不放回简单随机抽样
简单随机抽样:放回简单随机抽样和不放回简单随机抽样统称为简单随机抽样.通过简单随机抽样获得的样本称为简单随机样本
逐个
相等
未进入样本的各个个体
考点二、简单随机抽样
单元学习目标
2.抽签法:先把总体中的个体编号,然后把所有编号写在外观、质地等无差别的小纸片(也可以是卡片、小球等)上作为号签,并将这些小纸片放在一个_______的盒里,充分_____.最后从盒中不放回地逐个抽取号签,使与号签上的编号对应的个体进入样本,直到抽足样本所需要的个体数.
3.随机数法:
(1)定义:先把总体中的个体编号,用随机数工具产生与总体中个体数量_____的整数随机数,把产生的随机数作为抽中的编号,并剔除_____的编号,直到抽足样本所需要的个体数.
(2)产生随机数的方法:①用随机试验生成随机数;②用信息技术生成随机数.
不透明
搅拌
相等
重复
考点二、简单随机抽样
考点串讲
[微提醒] 抽签法与随机数法的优缺点
抽样方法 优点 缺点 适用范围
抽签法 简单易行 总体容量较大时,操作起来比较麻烦 适用于总体中个体数不多的情形
随机数法 简单易行,很好地解决了总体量较大时用抽签法制签困难的问题 当总体量很大,样本量也很大时,利用随机数法抽取样本仍不方便 总体量较大,样本量较小的情形
考点二、简单随机抽样
考点串讲
分层随机抽样的定义:
一般地,按一个或多个变量把总体划分成若干个子总体,每个个体属于且仅属于一个子总体,在每个子总体中独立地进行_________抽样,再把所有子总体中抽取的样本__________作为总样本,这样的抽样方法称为分层随机抽样,每一个子总体称为层.
简单随机
合在一起
考点三、分层随机抽样
考点串讲
极差为一组数据中________________的差.
第二步,决定组距与组数.
第三步,将数据分组.
通常对组内数据取”__________区间,最后一组数据取闭区间.
最大值与最小值
左闭右开
制作频率分布表、画频率分布直方图.
第一步,求极差.
考点四、统计图表
1.频率分布表和频率分布直方图:可用于表示数据在不同区间上的分布情况;
考点串讲
考点四、统计图表
考点串讲
2.频率分布表的画法:
第一步:求极差,决定组数和组距,组距=组数(极差);
第二步:分组,通常对组内数值所在区间取左闭右开区间,最后一组取闭区间;
第三步:登记频数,计算频率,列出频率分布表.
3.频率分布直方图:反映样本频率分布的直方图(如图)
横轴表示样本数据,纵轴表示组距(频率),每个小矩形的
面积表示样本落在该组内的频率.
考点四、统计图表
考点串讲
4.频率分布折线图:连接频率分布直方图中各小长方形上端的中点,就得到频率分布折线图.
5.茎叶图:通常在数据量不大的情况下使用,其特点是保留了数据的原始信息;
6.散点图:可以考察两组数据的变化趋势.
考点四、统计图表
考点串讲
1.众数、中位数和平均数的定义:
(1)众数:一组数据中______________的数.
(2)中位数:一组数据按大小顺序排列后,处于_____位置的数.如果个数是偶数,则取______两个数据的平均数.
(3)平均数:一组数据的____除以数据个数所得到的数.
出现次数最多
中间
中间
和
考点五、统计估计
考点串讲
2.众数、中位数和平均数的比较:
名称 优点 缺点
平均数 与中位数相比,平均数反映出样本数据中更多的信息,对样本中的极端值更加敏感 任何一个数据的改变都会引起平均数的改变.数据越“离群”,对平均数的影响越大
中位数 不受少数几个极端数据(即排序靠前或靠后的数据)的影响 对极端值不敏感
众数 体现了样本数据的最大集中点 众数只能传递数据中的信息的很少一部分,对极端值不敏感
考点五、统计估计
考点串讲
3.样本的数字特征
数字特征 定义
众数 在一组数据中,出现次数最多的数据叫做这组数据的众数
中位数 将一组数据按大小依次排列,把处在最中间位置的一个数据(或最中间两个数据的平均数)叫做这组数据的中位数
平均数 样本数据的算术平均数,即
方差 其中s为标准差
考点五、统计估计
考点串讲
p%
考点五、统计估计
考点串讲
5.求百分位数的步骤:
可以通过下面的步骤计算一组n个数据的第p百分位数:
第1步,按从_______排列原始数据.
第2步,计算i=________.
第3步,若i不是整数,而大于i的比邻整数为j,则第p百分位数为第j项数据;若i是整数,则第p百分位数为第i项与第(i+1)项数据的_______.
小到大
n×p%
平均数
考点五、统计估计
考点串讲
题型一、统计的有关概念
1.在以下调查中,适合用普查的是( )
D
A.调查一批小包装饼干的卫生是否达标
B.调查一批袋装牛奶的质量
C.调查一批绳索的抗拉强度是否达到要求
D.调查一个班级的学生每天完成家庭作业所需要的时间
解析 普查适用总体数量较少以及破坏性不大的情况,显然A,B,C的调查对象不适用,对于D,
一个班级的学生人数相对较少,适用普查方式.故选D.
规律方法 普查与抽样调查的区别:普查是对每一个调查对象都进行调查的方法,而抽样调查是
根据一定目的,从总体中抽取一部分个体进行调查.
(1)普查的优点是资料全面,数据客观;缺点是当普查对象很多(大)时,耗费大量的人力、物力、
财力等,不易操作,且有些调查具有破坏性(如种子的发芽率等).
(2)抽样调查相对于普查具有花费少、效率高的特点,因而在某些调查中,具有不可替代的作用.
题型剖析
2.采用不放回抽取样本的方法,从一个含有5个个体的总体中抽取一个容量为2的样本,可能得到
的样本共有( )
A
A.10种 B.7种 C.9种 D.20种
解析 假设5个个体分别记为,,,,,容量为2的样本可能为,;,;,;,;,;,;,;,;,;
, ,共10种.故选A.
列举样本时需做到“不重不漏”,可以采用“字典序”有序进行.
3.一名交警在高速公路上随机观测了6辆车的行驶速度(单位:),然后做出了一份报告,调查
结果如表:
车序号 1 2 3 4 5 6
行驶速度 66 65 71 54 69 58
(1)交警采取的是______调查方式.
(2)为了强调调查目的,这次调查的样本是_________________,个体是____________________.
抽样
6辆车的行驶速度
每一辆车的行驶速度
解析 此种调查是抽样调查,调查对象的指标是车的行驶速度.
题型一、统计的有关概念
题型剖析
题型二、简单的随机抽样
4.关于简单随机抽样,下列说法正确的是( )
A
①它要求被抽取样本的总体的个数有限;②它是从总体中逐个地进行抽取;③不做特殊说明时,
它是一种不放回抽样;④它是一种等可能抽样.
A.①②③④ B.③④ C.①②③ D.①③④
解析 根据简单随机抽样的定义和性质知:
①它要求被抽取样本的总体的个数有限,正确;
②它是从总体中逐个地进行抽取,正确;
③不做特殊说明时,它是一种不放回抽样,正确;
④它是一种等可能抽样,正确.故选A.
题型剖析
5.简单随机抽样中,下列关于其中一个个体被抽中的可能性说法正确的是( )
C
A.与第几次抽样有关,第一次被抽到的可能性更大一些
B.与第几次抽样有关,最后一次被抽到的可能性更大一些
C.与第几次抽样无关,每次被抽到的可能性都相等
D.与第几次抽样有关,第一次被抽到的可能性更小一些
解析 在简单随机抽样中,每个个体每次被抽中的可能性都相等,与第几次抽样无关,A,B,D
错误,C正确.故选C.
6.对总数为200的一批零件,抽一个容量为的样本,若每个零件被抽到的可能性为,则为( )
A
A.50 B.100 C.25 D.120
解析 因为每个零件被抽到的可能性相等,所以由,解得.故选A.
题型二、简单的随机抽样
题型剖析
题型三、抽签法与随机数法
7.国家高度重视青少年心理健康问题,某校为了调查学生的心理健康状况,决定从每班随机抽取5
名学生进行调查.若某班有45名学生,将所有学生从01到45编号,从下面所给的随机数表的第2行
第9列的数开始,每次从左向右选取两个数字,则选取的第三个号码为( )
2512 6317 6323 2616 8045 6011 2432 5327 0941
1457 2042 5332 3732 2707 3607 7424 6762 4281
2191 3726 3890 0140 0523 2617 3014 2310 2118
C
A.32 B.37 C.27 D.07
解析 从随机数表第2行第9列的数开始,每次从左向右选取两个数字,去掉超过45和重复的号码,
选取的前3个号码依次为32,37,27,故选取的第三个号码为27.故选C.
利用随机数法进行随机抽样需注意以下问题:(1)正确确定随机数的起点;
(2)取出的数不能超过编号允许的范围;(3)取出的数不能重复出现.
题型剖析
题型四、分层随机抽样
8. 某工厂生产,,三种不同型号的产品,产量之比为.现用比例分配的分层随机抽样方法
抽取一个容量为的样本,若样本中种型号的产品有16件,则样本容量 ( )
C
A.40 B.60 C.80 D.100
解析 设A种型号的产品有件.
因为A,B,C三种不同型号的产品产量之比为,
所以B种型号的产品有件,C种型号的产品有件.
由已知可得,所以.故选C.
规律方法:样本中各层的比例和总体中各层的比例一致,据此可求出各层的样本量或样本容量.
题型剖析
9.现有以下两项调查:①从10台冰箱中抽取3台进行质量检查;②某社区有600户家庭,其中高
收入家庭180户,中等收入家庭360户,低收入家庭60户,为了调查家庭购买力的某项指标,拟
抽取一个容量为30的样本.则完成这两项调查最适宜采用的抽样方法分别是( )
C
A.①②都采用简单随机抽样 B.①②都采用分层随机抽样
C.①采用简单随机抽样,②采用分层随机抽样 D.①采用分层随机抽样,②采用简单随机抽样
题型四、分层随机抽样
解析 ①的总体中的个体数较少,宜采用简单随机抽样,②中600户家庭中收入存在较大差异,
层次比较明显,宜采用分层随机抽样.故选C.
规律方法 抽样方法的选取
(1)看总体是否由差异明显的几个部分组成.若是,则选用分层随机抽样;否则,考虑用简单随机抽样.
(2)看总体容量和样本容量的大小.当总体容量较小时,采用抽签法;当总体容量较大、样本容量较
小时,采用随机数法.
简单来说,总体容量小,简单随机抽样;总体差异明显,分层随机抽样.在实际抽样中,为了使样本
具有代表性,通常要同时使用几种抽样方法.
题型剖析
题型五、频率分布表
10.一个样本容量为600的频数分布表不小心被损坏了一部分.若样本中数据在内的频率为
,则样本中数据在 内的个数为( )
C
A.225 B.295 C.235 D.305
解析 因为数据在内的频率为,所以数据在内的频数为,
故样本中数据在内的个数为.故选C.
规律方法 在频率分布表中,将样本数据按照特征分成若干个小组,各组内的数据的个数为该组
的频数,且频数频率 样本容量.
题型剖析
题型六、频率分布直方图
11.某校调查了400名学生每周的自习时间(单位:时),发现他们的自习时间都在区间内,
将所得的数据分成5组: ,, ,制成了如图所示的频率
分布直方图,则自习时间在区间 内的人数为( )
A
A.240 B.180 C.96 D.80
解析 由频率分布直方图可知,自习时间在区间内的频率为,
所以自习时间在区间内的人数为.故选A.
题型剖析
题型七、茎叶图
12.某校高二年级为选拔参加数学竞赛的学生组织了一次考试,最后选出13名男生和7名女生,这20名学生的考试成绩如茎叶图所示(单位:分),学校规定:成绩不低于130分的人到班培训,低于130分的人到班培训,如果用分层抽样的方法从到班的人和到班的人中共选取5人,则5人中到班的有 人.
解:由题意结合茎叶图的数据可知,这20名学生有8人到A班培训,12人到B班培训,
根据分层抽样的定义知:5人中到A班的有人人,故答案为:2.
题型剖析
题型八、散点图
13.绘制散点图:根据一般经验,很多数据之间具有一定的相关性,例如身高与体重、收入与支出等,我们可以通过绘制散点图,来展示这种相关性.
选择身高作为横坐标,体重作为 ,在直角坐标系中绘制出相应的 ,就得到了身高和体重的散点图.
纵坐标 点
题型剖析
题型九、众数、中位数、平均数
14.已知甲、乙两支篮球队各6名队员某场比赛的得分数据(单位:分)从小到大排列为甲队:7,12,
12,20,,31;乙队:8,9,,19,25,28.这两组数据的中位数相等,且平均数也相
等,则和的值分别为( )
C
A.2和3 B.0和2 C.0和3 D.2和4
解析 由题意得甲的平均数为,
乙的平均数为,
而甲的中位数为,所以乙的中位数为,得,
所以,得.故选C.
特别注意 计算中位数与百分位数时应该首先将数据按照从小到大的顺序排好.
题型剖析
题型十、方差与标准差
15.共同富裕是全体人民通过辛勤劳动和相互帮助最终达到丰衣足食的生活水平,是消除两极分化和
贫穷基础上的普遍富裕.请你运用数学学习中所学的统计知识加以分析,下列关于个人收入的统计量中,
最能体现共同富裕要求的是( )
D
A.平均数小,方差大 B.平均数小,方差小 C.平均数大,方差大 D.平均数大,方差小
解析 方差反映的是一组数据的波动情况,方差越大说明数据偏离平均水平的程度越大,平均数
是整体的平均水平,是一组数据的集中程度的刻画,所以最能体现共同富裕要求的是平均数大,
方差小.故选D.
规律方法 标准差、方差描述了一组数据围绕平均数波动的大小.标准差或方差越大,数据的离散
程度越大;标准差或方差越小,数据的离散程度越小.
题型剖析
16.如图所示的四组数据,标准差最小的是( )
A
A. B. C. D.
解析 对A,,,所以;对B,,,所以;
对C,,,所以;对D,,,所以.
所以标准差最小的是A.故选A.
此题由左右对称性可直观得到均值都是25,对于方差而言,数据集中在均值附近越多,
方差越小,数据集中在均值附近越少,方差越大,可定性分析得A的方差最小.
题型十、方差与标准差
题型剖析
题型十一、百分位数
17.某班在体育课上组织趣味游戏,统计了第一组14名学生的最终得分:13,10,12,17,9,12,
8,9,11,14,15,12,10,12.这组数据的第80百分位数是( )
D
A.12 B.13 C.13.5 D.14
解析 由题意,将14名学生的最终得分从小到大排序:8,9,9,10,10,11,12,12,12,1
2,13,14,15,17,
又由,所以这组数据的第80百分位数为第12个数,即为14.故选D.
计算一组个数据的第百分位数的一般步骤:
第1步,按照从小到大排列原始数据.
第2步,计算.
第3步,若不是整数,而大于的比邻整数为,则第百分位数为第项数据;若是整数,则第
百分位数为第项与第 项数据的平均数.
题型剖析
1.(23-24高二上·上海·期末)某同学将观察学校柚子树生长习性作为自主研究课题,他观察了校园内6株柚子树成熟结果个数(两位数)并用茎叶图(如图所示)做了记录,则这6株柚子树成熟结果个数的中位数为( )
A.21 B.21.5 C.22 D.22.5
解:由茎叶图知,这6株柚子树成熟结果个数的中位数为.
故选:B
针对训练
2.嫦娥五号的成功发射,实现了中国航天史上的五个“首次”,某中学为此举行了“讲好航天故
事”演讲比赛.若将报名的30位同学编号为01,02, ,30,利用下面的随机数表来决定他们的
出场顺序,选取方法是从随机数表第1行的第5列和第6列数字开始由左到右依次选取两个数字,
重复的跳过,则选出来的第6个个体的编号为( )
45 67 32 12 12 31 02 01 04
52 15 20 01 12 51 29 32 04
92 34 49 35 82 00 36 23 48
69 69 38 74 81
B
A.12 B.20 C.29 D.23
解析 依次从数表中读出的有效编号为12,02,01,04,15,20,得到选出来的第6个个体的
编号为20,故选B.
针对训练
35
3.[河南南阳2023高一期末] 甲、乙、丙三人投掷飞镖,他们的成绩(环数)如下面的频数条形统
计图所示.则甲、乙、丙三人训练成绩的方差,,的大小关系是( )
A
A. B. C. D.
解析 根据方差表示数据稳定程度,越稳定方差越小,甲、乙、丙三人数据中,丙集中在6环,
乙平均分散,甲分散在两边,所以丙最稳定,方差最小;甲最不稳定,方差最大.故选A.
名师点拨方差用于刻画数据的“波动程度”,方差越小越稳定,越大越波动,此题可以结合图形
特征,数据集中在平均数附近的一组方差较小,分散到两端的方差较大.
针对训练
36
4.(22-23高二上·上海闵行·期末)甲、乙两名运动员5场比赛得分的茎叶图如图所示已知甲得分的极差为32,乙得分的众数为26,则 .
解:由茎叶图可知,甲的最低得分为6分,由甲得分的极差为32,可知,甲的最高得分为,所以的值为8,
乙得分的众数为26,所以的值为6,
所以.
故答案为:
针对训练
5.某班40名学生,在一次考试中统计所得平均分为80分,方差为70,后来发现有两名同学的成
绩有误,甲实得80分错记为60分,乙实得70分错记为90分,则更正后的方差为____.
60
解析 因为甲实得80分,记为60分,少记20分,乙实得70分,记为90分,多记20分,所以总分
没有变化,因此更正前后的平均分没有变化,都是80分.
设甲、乙以外的其他同学的成绩分别为,, ,,
因为更正前的方差为70,
所以,
所以,
则更正后的方差
,
所以更正后的方差为60.
针对训练
38
简单随机抽样和分层随机抽样的联系和区别
抽样方法 步骤 特点 区别与联系
简单随 机抽样 抽签
法 编号;搅拌均匀;不放回
地逐个抽取 简单易行,适用于
总体个数不多时 步骤基本相同,每 个个体被抽到的概 率相等
随机
数法 编号;用随机数工具产生
随机数;根据随机数抽取 方便快捷、总体个
数较多时
分层随机抽样 分层;计算各层样本个 数;各层独立抽样;获得 样本 每层样本量都与层 的大小成比例(比 例分配) 每层都抽样,各层
都是独立、简单随 机抽样,能有效避 免“极端样本”
分层随机抽样的认识和理解
课堂总结
平均数、中位数、众数
样本百分位数
(中位数、四分位数)
频率分布表、频率分布直方图、 条形图、扇形图、折线图、
如何观 察数据 特征
样本离散程度
样本集中趋势
样本位置信息
样本取值规律
总体取值规律 估计 总体位置信息
总体集中趋势 总体离散程度
方差、标准差、极差
如何利用样本数据特征估计总体数据特征,并解决相关问题
课堂总结
第五步,画频率分布直方图.
画图时,以横轴表示分组,纵轴(小长方形的高度)表示.
第四步,列频率分布表.
计算各小组的频率,例如第一小组的频率是,作出频率分布表,表格形式如下:
4.百分位数:
(1)把n个样本数据按从小到大排序,得到第p个和第(p+1)个数据分别为a,b,区间(a,b)内的任意一个数,都能把样本数据分成符合要求的两部分.一般地,我们取这两个数的平均数=c,并称此数为这组数据的第p百分位数,或p%分位数.
(2)一般地,一组数据的第p百分位数是这样一个值,它使得这组数据中至少有____的数据小于或等于这个值,且至少有(100-p)%的数据大于或等于这个值.
$