内容正文:
9.2 用样本估计总体
目录
知识点一:总体取值规律的估计 2
题型1:频率分布直方图的完善及有关计算 2
知识点二:其他常见统计图 5
题型2:其他统计图表的信息读取问题 5
知识点三:总体百分位数的估计 10
题型3:总体百分位数的计算 10
知识点四:总体集中趋势的估计 11
题型4:平均数、中位数、众数的计算及应用 11
知识点五:总体离散程度的估计 12
题型5:方差、标准差的计算及应用 14
题型6:数字特征的综合应用 15
题型7:频率分布直方图的综合问题 17
题型8: 折线图、扇形图、条形图的综合问题 24
知识点一:总体取值规律的估计
1. 制作频率分布表、画频率分布直方图的步骤
(1) 求极差:极差为一组数据中最大值与最小值的差;
(2)
决定组距与组数:组距与组数的确定没有固定的标准,一般数据的个数越多,所分组数越多.当样本容量不超过100时,常分成5~12组,且组距=.为方便起见,一般取等长组距,并且组距应力求“取整”;
(3) 将数据分组:通常对组内数值所在左闭右开区间,最后一组左右都取闭区间;
(4)
列频率分布表:计算各小组的频率,第i组的频率=;
(5)
画频率分布直方图:以横轴表示分组,纵轴表示的值,分别画出矩形.
2. 频率分布直方图的特点
(1)
图中每个小矩形的面积表示相应各组的频率,即小矩形的面积=组距×=频率.
(2) 各小矩形的面积之比等于频率之比,也等于各小矩形的高度之比.
(3) 各小矩形的面积的总和等于1.
题型1:频率分布直方图的完善及有关计算
【例1.1.】
从某网络平台推荐的影视作品中抽取部,统计其评分数据,将所得个评分数据分为组:、、、,并整理得到如下的频率分布直方图,则评分在区间内的影视作品数量是( )
A. B. C. D.
【例1.2.】 为了让学生了解环保知识,增强环保意识,某中学举行了一次环保知识竞赛,共有900名学生参加了这次竞赛.为了解本次竞赛的成绩情况,从中抽取了部分学生的成绩(得分均为整数,满分为100分)进行统计.请根据尚未完成的频率分布表和频数分布直方图,解答下列问题.
分组
频数
频率
4
0.08
0.16
0.20
16
合计
50
1.00
(1)填充频率分布表的空格(将答案直接填在表格内);
(2)补全频数分布直方图;
(3)若成绩在75.5~85.5分的学生获得二等奖,问获得二等奖的学生约为多少人?
【例1.3.】 某校高一年级期末统一测试,随机抽取一部分学生的数学成绩,分组统计如下表.
分组
频数
频率
3
0.03
3
0.03
37
0.37
m
n
15
0.15
合计
M
N
(1)求出表中的值,并根据表中所给数据在给出的坐标系中画出频率直方图;
(2)若全校参加本次考试的学生有600人,试估计这次测试中全校成绩在90分以上的人数.
【例1.4.】
某城市户居民的月平均用电量单位:度,以,,,分组的频率分布直方图如图.
(1)求直方图中的值;
(2)在这户居民中,月平均用电量不低于度的有多少户?
(3)在月平均用电量为,的四组用户中,用分层抽样的方法抽取户居民,则月平均用电量在的用户中应抽取多少户?
知识点二:其他常见统计图
除了频率分布直方图之外,我们还学过条形图、扇形图、折线图、频数分布直方图等.
(1) 不同的统计图在表示数据上有不同的特点.例如,条形图和直方图主要用于直观描述不同类别或分组数据的频数和频率,扇形图主要用于直观描述各类数据占总数的比例,折线图主要用于描述数据随时间的变化趋势.
(2)不同的统计图适用的数据类型也不同.如条形图适用于描述离散型的数据,直方图适用于描述连续性数据.
题型2:其他统计图表的信息读取问题
【例2.1.】
某只股票近个交易日的价格如下:
天数
股价/元
下列几种统计图中,表示上面的数据较合适的是( )
A.柱形图
B.扇形图
C.折线图
D.茎叶图
【例2.2.】 世界人口变化情况的三幅统计图如图所示.
【例2.3.】 下列结论中错误的是( )
A.从折线图能看出世界人口的总量随着年份的增加而增加
B.2050年亚洲人口比其他各洲人口的总和还要多
C.1957年到2050年各洲中北美洲人口增长速度最慢
D.2050年南美洲及大洋洲人口之和与欧洲人口基本持平
【例2.4.】
南丁格尔玫瑰图是由近代护理学和护士教育创始人南丁格尔设计的,图中每个扇形圆心角都是相等的,半径长短表示数量大小.某机构统计了近几年中国知识付费用户数量(单位:亿人次),并绘制成南丁格尔玫瑰图(如图所示),根据此图,以下说法错误的是( )
A.2015年至2022年,知识付费用户数量逐年增加
B.2015年至2022年,知识付费用户数量逐年增加量2018年最多
C.2015年至2022年,知识付费用户数量的逐年增加量逐年递增
D.2022年知识付费用户数量超过2015年知识付费用户数量的10倍
【例2.5.】 下图为2012年─2021年我国电子信息制造业企业和工业企业利润总额增速情况折线图,根据该图,下列结论正确的是( )
A.2012年─2021年电子信息制造业企业利润总额逐年递增
B.2012年─2021年工业企业利润总额逐年递增
C.2012年─2017年电子信息制造业企业利润总额均较上一年实现增长,且其增速均快于当年工业企业利润总额增速
D.2012年─2021年工业企业利润总额增速的均值大于电子信息制造业企业利润总额增速的均值
【例2.6.】 汽车的“燃油效率”是指汽车每消耗1升汽油行驶的里程,下图描述了甲、乙、丙三辆汽车在不同速度下的燃油效率情况. 下列叙述中正确的是
A.消耗1升汽油,乙车最多可行驶5千米
B.以相同速度行驶相同路程,三辆车中,甲车消耗汽油最多
C.甲车以80千米/小时的速度行驶1小时,消耗10升汽油
D.某城市机动车最高限速80千米/小时. 相同条件下,在该市用丙车比用乙车更省油
【例2.7.】 某市为提倡节约用水,准备实行自来水“阶梯计费”方式,用户用水不超出基本用水量的部分享受基本价格,超出基本用水量的部分实行超价收费,为更好地决策,自来水公司随机抽取了部分用户的用水量数据,并绘制了如图不完整的统计图(每组数据包括右端点但不包括左端点),请你根据统计图解答下列问题:
用户用水量频数直方图 用户用水量扇形统计图
(1)此次抽样调查的样本容量是________;
(2)补全频数分布直方图,求扇形图中“15吨~20吨”部分的圆心角的度数;
(3)如果自来水公司将基本用水量定为每户25吨,那么该地区6万用户中约有多少用户的用水全部享受基本价格.
【例2.8.】 共享单车入驻某城区5年以来,因其“绿色出行,低碳环保”的理念而备受人们的喜爱,值此5周年之际,某机构为了了解共享单车使用者的年龄段、使用频率、满意度等三个方面的信息,在全市范围内发放10000份调查问卷,回收到有效问卷6300份,现从中随机抽取160份,分别对使用者的年龄段、26~35岁使用者的使用频率、26~35岁使用者的满意度进行汇总,得到如下三个表格:
表(一)
使用者年龄段
25岁以下
26岁~35岁
36岁~45岁
45岁以上
人数
40
80
20
20
表(二)
使用频率
0~6次/月
7~14次/月
15~22次/月
23~31次/月
人数
10
20
40
10
表(三)
满意度
非常满意(10)
满意(9)
一般(8)
不满意(7)
人数
30
20
20
10
(1)依据上述表格完成下列三个统计图形:
(2)某城区现有常住人口80万,请用样本估计总体的思想,试估计年龄在26岁~35岁之间,每月使用共享单车在7~14次的人数.
知识点三:总体百分位数的估计
1. 第p百分位数的定义
一般地,一组数据的第p百分位数是这样一个值,它使得这组数据中至少有p%的数据小于或等于这个值,且至少有(100-p)%的数据大于或等于这个值.
2. 计算一组n个数据的第p百分位数的步骤
第1步,按从小到大排列原始数据.
第2步,计算i=n×p%.
第3步,若i不是整数,而大于i的比邻整数为j,则第p百分位数为第j项数据;
若i是整数,则第p百分位数为第i项与第(i+1)项数据的平均数.
3. 四分位数
常用的分位数有第25百分位数、第50百分位数、第75百分位数,这三个分位数把一组由小到大排列后的数据分成四等份,因此称为四分位数.其中第25百分位数也称为第一四分位数或下四分位数等,第75百分位数也称为第三四分位数或上四分位数等.
题型3:总体百分位数的计算
【例3.1.】
某校高一年级18个班参加艺术节合唱比赛,通过简单随机抽样,获得了10个班的比赛得分如下:91,89,90,92,94,87,93,96,91,85,则这组数据的分位数为( )
A.93 B.93.5 C.94 D.94.5
【例3.2.】 为深入推进“五育”并举,促进学生身心全面和谐发展,某校于上周六举办跳绳比赛.现通过简单随机抽样获得了22名学生在1分钟内的跳绳个数如下(单位:个):
估计该校学生在1分钟内跳绳个数的第65百分位数为( )
A.124 B. C. D.
【例3.3.】
已知一组数据的上四分位数是,则的取值范围为( )
A. B. C. D.
【例3.4.】 某同学在一次数学测试中的成绩是班级第三名(假设测试成绩两两不同),成绩处于第90百分位数,则该班级的人数可能为( )
A.15 B.25 C.30 D.35
知识点四:总体集中趋势的估计
1. 众数、中位数、平均数的定义
(1) 众数
一组数据中重复出现次数最多的数据(即频率最大值对应的数据样本)叫做这组数据的众数.
众数体现了样本数据的最大集中点,只能传递数据中的信息的很少一部分,当一组数据中有不少数据重复出现时,众数往往更能反映问题。
(2) 中位数
把一组数据按从小到大的顺序排列,处在中间的一个数据(或最中间两个数据的平均数)叫做这组数据的中位数.
中位数仅与数据的排列位置有关,某些数据的变动对中位数没有影响。中位数可能在所给的数据中,也可能不在所给的数据中。当一组数据中的个别数据变动较大时,可用中位数描述其集中趋势。
(3) 平均数
如果个数,那么叫做这个数的平均数.
任何一个数据的改变都会引起平均数的改变.数据越“离群”,对平均数的影响越大
题型4:平均数、中位数、众数的计算及应用
方法提炼
求平均数的方法:
(1)
定义法:已知为个数据,那么这个数的平均数为。
(2)
新数据法:如果一组数的平均数为,则一组数的平均数为.
(3)
加权平均数法:样本中,数据有个,有个,有个,则 .
(4)
频率法:若取值为的频率分别为,则其平均数.
【例4.1.】 某射击运动员连续射击5次,命中的环数(环数为整数)形成的一组数据中,中位数为8,唯一的众数为9,极差为3,则该组数据的平均数为( )
A. B. C.8 D.
【例4.2.】
已知甲、乙两支篮球队各6名队员某场比赛的得分数据(单位:分)从小到大排列为如下:甲队:7,12,12,20,,31;乙队:8,9,19,,25,28.这两组数据的中位数相等,且平均值也相等,则x和y的值分别为( )
A.2和3 B.0和2 C.0和3 D.2和4
【例4.3.】 如果一组数据的中位数比平均数小很多,下面叙述一定错误的是( )
A.数据中可能有异常值 B.数据中众数可能和中位数相同
C.数据中可能有极端大的值 D.这组数据是近似对称的
【例4.4.】 (多选)已知一组数据丢失了其中一个大于3的数据,剩下的六个数据分别是3,3,5,3,6,11,若这组数据的平均数与众数的和是中位数的2倍,则丢失的数据可能是( )
A.4 B.12 C.18 D.20
知识点五:总体离散程度的估计
1. 平均距离
假设一组数据是用表示这组数据的平均值。到的距离分别为那么这组数据到的“平均距离”为.
2. 方差与标准差
标准差、方差刻画了数据的离散程度或波动幅度,标准差越大,数据的离散程度越大;标准差越小,数据的离散程度越小.在刻画数据的分散程度上,方差和标准差是一样的.但在解决实际问题中,一般多采用标准差.
(1) 标准差
标准差是数据到平均数的一种平均距离,由于式子中有绝对值,运算不太方便,因此通常改用如下公式来计算标准差:
(2) 方差
基本公式:
简化计算公式:
3. 总体方差、总体标准差
如果总体中所有个体的变量值分别为,总体平均数为,则称为总体方差,为总体标准差.如果总体的个变量值中,不同的值共有个,记为,,其中出现的频数为,则总体方差为.
4. 样本方差、样本标准差
如果一个样本中个体的变量值分别为,样本平均数为,则称为样本方差,为样本标准差.
5. 分层随机抽样的方差
(1) 两层构成样本的方差
设样本的平均数为,方差为,权重为,样本的平均数为,方差为,权重为,则样本的平均数为,方差为.
(2)
层构成样本的方差
设样本中不同层的平均数分别为为,方差分别为,相应的权重分别为,则这个样本的方差为,其中为样本平均数.
题型5:方差、标准差的计算及应用
方法提炼
(1)
数据的方差为,则数据的方差为.
(2) 标准差(方差)的两个作用:①标准差(方差)越大,数据的离散程度越大;标准差(方差)越小,数据的离散程度越小.②在实际应用中,常常把平均数与标准差结合起来进行决策。在平均数相等的情况下,比较方差或标准差以确定稳定性。
【例5.1.】
若一组数据m,n,9,8,10的平均数为9,方差为2,则 .
【例5.2.】
已知样本,,的平均数为2,方差为1,则,,的平均数为 .
【例5.3.】
已知数据,,…,的平均数和方差分别为4,10,那么数据,,…,的平均数和方差分别为( )
A., B.1, C., D.,
【例5.4.】
为了迎接2025年第九届亚冬会的召开,某班组织全班学生开展有关亚冬会知识的竞赛活动.已知该班男生35人,女生25人.根据统计分析,男生组成绩和女生组成绩的方差分别为,该班成绩的方差为,则下列结论中一定正确的是( )
A. B.
C. D.
【例5.5.】 某校教师男女人数之比为5:4,该校所有教师进行1分钟限时投篮比赛.现记录了每个教师1分钟命中次数,已知男教师命中次数的平均数为17,方差为16,女教师命中次数的平均数为8,方差为16,那么全体教师1分钟限时投篮次数的方差为 .
【例5.6.】
若一组样本数据的平均数为10,另一组样本数据的方差为8,则两组样本数据合并为一组样本数据后的平均数是 ,方差是 .
【例5.7.】
如图,一组数据,的平均数为5,方差为,去除,这两个数据后,平均数为,方差为,则( )
A., B., C., D.,
【例5.8.】
已知15个数,,…,的平均数为6,方差为9,现从中剔除,,,,这5个数,且剔除的这5个数的平均数为8,方差为5,则剩余的10个数,,…,的方差 .
【例5.9.】 已知一组样本数据共有9个数,其平均数为8,方差为12.将这组样本数据增加一个数据后,所得新的样本数据的平均数为9,则新的样本数据的方差为( )
A.18.2 B.19.6 C.19.8 D.21.4
题型6:数字特征的综合应用
【例6.1.】
(多选)下列统计量中,能度量样本的离散程度的是( )
A.样本的标准差 B.样本的中位数
C.样本的极差 D.样本的平均数
【例6.2.】 演讲比赛共有9位评委分别给出某选手的原始评分,评定该选手的成绩时,从9个原始评分中去掉1个最高分、1个最低分,得到7个有效评分.7个有效评分与9个原始评分相比,不变的数字特征是
A.中位数 B.平均数
C.方差 D.极差
【例6.3.】 (多选)某企业协会规定:企业员工一周7天要有一天休息,另有一天的工作时间不超过4小时,且其余5天的工作时间均不超过8小时(每天的工作时间以整数小时计),则认为该企业“达标”.请根据以下企业上报的一周7天的工作时间的数值特征,判断其中无法确保“达标”的企业有( )
A.甲企业:均值为5,中位数为8
B.乙企业:众数为6,中位数为6
C.丙企业:众数和均值均为5,下四分位数为4,上四分位数为8
D.丁企业:均值为5,方差为6
【例6.4.】
(多选)若是样本数据的平均数,则( )
A.的极差等于的极差
B.的平均数等于的平均数
C.的中位数等于的中位数
D.的标准差大于的标准差
【例6.5.】
(多选)有一组样本数据,其中是最小值,是最大值,则( )
A.的平均数等于的平均数
B.的中位数等于的中位数
C.的标准差不小于的标准差
D.的极差不大于的极差
【例6.6.】
在一次数学模考中,从甲、乙两个班各自抽出10个人的成绩,甲班的十个人成绩分别为,乙班的十个人成绩分别为.假设这两组数据中位数相同、方差也相同,则把这20个数据合并后( )
A.中位数一定不变,方差可能变大
B.中位数可能改变,方差可能变大
C.中位数一定不变,方差可能变小
D.中位数可能改变,方差可能变小
【例6.7.】 甲、乙两人进行射击比赛,分别对同一目标各射击10次,其成绩(环数)如下:
甲的环数
7
7
10
6
10
8
7
9
7
9
乙的环数
7
8
8
9
8
7
7
9
8
9
下列说法正确的是( )
A.甲的平均数大于乙的平均数 B.甲的中位数等于乙的中位数
C.甲、乙的众数都是7 D.乙的成绩更稳定
【例6.8.】
一组数据按从小到大的顺序排列为2,4,m,12,16,17,若该组数据的中位数是极差的,则该组数据的第40百分位数是( )
A.4 B.5 C.6 D.9
【例6.9.】 (多选)下列说法正确的是( )
A.一组样本数据的方差,则这组样本数据的总和为60
B.数据13,27,24,12,14,30,15,17,19,23的第70百分位数是23
C.若一个样本容量为8的样本的平均数是5,方差为2.现样本中又加入一个新数据5,此时样本的平均数不变,方差变大
D.若样本数据的标准差为8,则数据的标准差为16
【例6.10.】
(多选)若甲组样本数据(数据各不相同)的平均数为3,乙组样本数据的平均数为5,下列说错误的是( )
A.的值不确定
B.乙组样本数据的方差为甲组样本数据方差的2倍
C.两组样本数据的极差可能相等
D.两组样本数据的中位数可能相等
【例6.11.】 某校积极开展“戏曲进校园”活动,为了解该校各班参加戏曲兴趣小组的人数,从全校随机抽取5个班级,把每个班级参加该小组的人数作为样本数据.已知样本平均数为7,样本标准差为2,且样本数据互不相等,则该样本数据的极差为( )
A.3 B.4 C.5 D.6
题型7:频率分布直方图的综合问题
方法提炼
频率分布直方图中的平均数、中位数和众数
(1)平均数:在频率分布直方图中,样本平均数可以用每个小矩形底边中点的横坐标与小矩形的面积的乘积之和近似代替.
(2)中位数:在频率分布直方图中,中位数左边和右边的直方图的面积应该相等.
(3)众数:众数是最高小矩形底边的中点所对应的数据.
【例7.1.】 为了了解小学生的体能情况,抽取了某小学四年级100名学生进行一分钟跳绳次数测试,将所得数据整理后,绘制如下频率分布直方图.根据此图,下列结论中错误的是( )
A.
B.估计该小学四年级学生的一分钟跳绳的平均次数超过125
C.估计该小学四年级学生的一分钟跳绳次数的中位数约为119
D.四年级学生一分钟跳绳超过125次以上优秀,则估计该小学四年级优秀率为35%
【例7.2.】 少年强则国强,少年智则国智.党和政府一直重视青少年的健康成长,出台了一系列政策和行动计划,提高学生身体素质.为了加强对学生的营养健康监测,某校在3000名学生中,抽查了100名学生的体重数据情况.根据所得数据绘制样本的频率分布直方图如图所示,则下列结论正确的是( )
A.样本的众数为65 B.样本的第80百分位数为72.5
C.样本的平均值为67.5 D.该校学生中低于的学生大约为1000人
【例7.3.】 (多选)如图所示,下列频率分布直方图显示了三种不同的分布形态.图(1)形成对称形态,图(2)形成“右拖尾”形态,图(3)形成“左拖尾”形态,根据所给图作出以下判断,正确的是( )
A.图(1)的平均数中位数众数
B.图(2)的平均数<众数<中位数
C.图(2)的众数中位数<平均数
D.图(3)的平均数中位数众数
【例7.4.】 (多选)下图是样本甲与样本乙的频率分布直方图,下列说法判断正确的是( )
A.样本乙的极差一定大于样本甲的极差
B.样本乙的众数一定大于样本甲的众数
C.样本乙的方差一定小于样本甲的方差
D.样本甲的中位数一定小于样本乙的中位数
【例7.5.】 从某企业生产的某种产品中抽取100件,测量这些产品的一项质量指标值,由测量表得如下频数分布表:
质量指标值分组
频数
6
26
38
22
8
(1)在下表中作出这些数据的频率分布直方图;
(2)估计这种产品质量指标值的平均数及方差(同一组中的数据用该组区间的中点值作代表);
(3)已知在这些数据中,质量指标值落在区间内的产品的质量指标值的平均数为94,方差为40,所有这100件产品的质量指标值的平均数为100,方差为202,求质量指标值在区间内的产品的质量指标值的方差.
【例7.6.】
某中学为了学生的身心健康,加强食堂用餐质量(简称“美食”)的过程中,后勤部门需了解学生对“美食”工作的认可程度,若学生认可系数不低于0.85,“美食”工作按原方案继续实施,否则需进一步整改.为此该部门随机调查了600名学生,根据这600名学生对“美食”工作认可程度给出的评分,分成,,,,五组,得到如图所示的频率分布直方图.
(1)求直方图中的值和第60百分位数;
(2)为了解部分学生给“美食”工作评分较低的原因,该部门从评分低于80分的学生中用分层抽样的方法随机选取30人进行座谈,求应选取评分在的学生人数;
(3)根据你所学的统计知识,结合认可系数,判断“美食”工作是否需要进一步整改,并说明理由.
【例7.7.】
为了了解某次竞赛成绩情况,从中抽取了部分学生的成绩x(单位:分,得分取正整数,满分为100分)作为样本进行统计将成绩进行整理后,分为五组(,,,,),其中第1组频数的平方等于第2组、第4组频数之积,请根据下面尚未完成的频率分布直方图(如图所示)解决下列问题:
(1)求a,b的值;
(2)若根据这次成绩,学校准备淘汰80%的同学,仅留20%的同学进入下一轮竞赛请问晋级分数线划为多少合理?
(3)某老师在此次竞赛成绩中抽取了10名学生的分数:,,,…,,已知这10个分数的平均数,标准差,若剔除其中的95和85这两个分数,求剩余8个分数的平均数与方差.
【例7.8.】 某研究小组经过研究发现某种疾病的患病者与未患病者的某项医学指标有明显差异,经过大量调查,得到如下的患病者和未患病者该指标的频率分布直方图:
利用该指标制定一个检测标准,需要确定临界值c,将该指标大于c的人判定为阳性,小于或等于c的人判定为阴性.此检测标准的漏诊率是将患病者判定为阴性的概率,记为;误诊率是将未患病者判定为阳性的概率,记为.假设数据在组内均匀分布,以事件发生的频率作为相应事件发生的概率.
(1)当漏诊率%时,求临界值c和误诊率;
(2)设函数,当时,求的解析式,并求在区间的最小值.
【例7.9.】 某中学新建了学校食堂,每天有近2000名学生在学校食堂用午餐,午餐开放时间约40分钟,食堂制作了三类餐食,第一类是选餐,学生凭喜好在做好的大约6种菜和主食米饭中任意选购;第二类是套餐,已按配套好菜色盛装好,可直接取餐;第三类是面食,如煮面、炒粉等,为了更合理地设置窗口布局,增加学生的用餐满意度,学校学生会在用餐的学生中对就餐选择、各类餐食的平均每份取餐时长以及可接受等待时间进行问卷调查,并得到以下的统计图表.
类别
选餐
套餐
面食
选择人数
50
30
20
平均每份取餐时长(单位:分钟)
2
0.5
1
已知饭堂的售饭窗口一共有20个,就餐高峰期时有200名学生在等待就餐.
(1)根据以上的调查统计,如果设置12个选餐窗口,4个套餐窗口,4个面食窗口,就餐高峰期时,假设大家在排队时自动选择较短的队伍等待(即各类餐食的窗口前队伍长度各自相同),问:选择选餐的同学最长等待时间是多少?这能否让80%的同学感到满意(即在接受等待时长内取到餐)?
(2)根据以上的调查统计,从等待时长和公平的角度上考虑,如何设置各类售饭窗口数更优化,并给出你的求解过程.
【例7.10.】 某公司计划购买1台机器,该种机器使用三年后即被淘汰.机器有一易损零件,在购进机器时,可以额外购买这种零件作为备件,每个200元.在机器使用期间,如果备件不足再购买,则每个500元.现需决策在购买机器时应同时购买几个易损零件,为此搜集并整理了100台这种机器在三年使用期内更换的易损零件数,得下面柱状图:
记x表示1台机器在三年使用期内需更换的易损零件数,y表示1台机器在购买易损零件上所需的费用(单位:元),表示购机的同时购买的易损零件数.
(Ⅰ)若=19,求y与x的函数解析式;
(Ⅱ)若要求“需更换的易损零件数不大于”的频率不小于0.5,求的最小值;
(Ⅲ)假设这100台机器在购机的同时每台都购买19个易损零件,或每台都购买20个易损零件,分别计算这100台机器在购买易损零件上所需费用的平均数,以此作为决策依据,购买1台机器的同时应购买19个还是20个易损零件?
题型8: 折线图、扇形图、条形图的综合问题
【例8.1.】 (多选)近年来,我国人口老龄化持续加剧,为改善人口结构,保障国民经济可持续发展,国家出台了一系列政策,如2016年起实施全面两孩生育政策,2021年起实施三孩生育政策等.根据下方的统计图,下列结论正确的是( )
2010至2022年我国新生儿数量折线图
A.2010至2022年每年新生儿数量的平均数高于1400万
B.2010至2022年每年新生儿数量的第一四分位数低于1400万
C.2015至2022年每年新生儿数量呈现先增加后下降的变化趋势
D.2010至2016年每年新生儿数量的方差大于2016至2022年每年新生儿数量的方差
【例8.2.】
空气质量指数是反映空气质量状况的指数,其对应关系如下表:
指数值
空气质量
优
良
轻度污染
中度污染
重度污染
严重污染
为监测某化工厂排放废气对周边空气质量指数的影响,某科学兴趣小组在校内测得10月1日—20日指数的数据并绘成折线图如下:
下列叙述正确的是( )
A.这天中指数值的中位数略大于
B.这天中的空气质量为优的天数占
C.10月4日到10月11日,空气质量越来越好
D.总体来说,10月中旬的空气质量比上旬的空气质量好
【例8.3.】 下图是我国跨境电商在2016~2022年的交易规模与增速图,由图可以知道下列结论正确的是( )
A.这7年我国跨境电商交易规模的平均数为8.0万亿元
B.这7年我国跨境电商交易规模的增速越来越大
C.这7年我国跨境电商交易规模的极差为7.6万亿元
D.图中我国跨境电商交易规模的6个增速的中位数为13.8%
【例8.4.】
某高中为了解学生课外知识的积累情况,随机抽取名同学参加课外知识测试,测试共道题,每答对一题得分,答错得分.已知每名同学至少能答对道题,得分不少于分记为及格,不少于分记为优秀,测试成绩百分比分布图如图所示,则下列说法正确的是( )
A.该次课外知识测试及格率为
B.该次课外知识测试得满分的同学有名
C.该次测试成绩的中位数大于测试成绩的平均数
D.若该校共有名学生,则课外知识测试成绩能得优秀的同学大约有名
【例8.5.】 (多选)下图为2024年中国大学生使用APP偏好及目的统计图,根据统计图,下列关于2024年中国大学生使用APP的结论正确的是( )
A.超过的大学生更爱使用购物类APP
B.超过半数的大学生使用APP是为了学习与生活需要
C.使用APP偏好情况中7个占比数字的极差是
D.APP使用目的中6个占比数字的分位数是
(
1
)
学科网(北京)股份有限公司
$$
9.2 用样本估计总体
目录
知识点一:总体取值规律的估计 2
题型1:频率分布直方图的完善及有关计算 2
知识点二:其他常见统计图 7
题型2:其他统计图表的信息读取问题 7
知识点三:总体百分位数的估计 14
题型3:总体百分位数的计算 15
知识点四:总体集中趋势的估计 16
题型4:平均数、中位数、众数的计算及应用 17
知识点五:总体离散程度的估计 19
题型5:方差、标准差的计算及应用 20
题型6:数字特征的综合应用 25
题型7:频率分布直方图的综合问题 32
题型8: 折线图、扇形图、条形图的综合问题 42
知识点一:总体取值规律的估计
1. 制作频率分布表、画频率分布直方图的步骤
(1) 求极差:极差为一组数据中最大值与最小值的差;
(2)
决定组距与组数:组距与组数的确定没有固定的标准,一般数据的个数越多,所分组数越多.当样本容量不超过100时,常分成5~12组,且组距=.为方便起见,一般取等长组距,并且组距应力求“取整”;
(3) 将数据分组:通常对组内数值所在左闭右开区间,最后一组左右都取闭区间;
(4)
列频率分布表:计算各小组的频率,第i组的频率=;
(5)
画频率分布直方图:以横轴表示分组,纵轴表示的值,分别画出矩形.
2. 频率分布直方图的特点
(1)
图中每个小矩形的面积表示相应各组的频率,即小矩形的面积=组距×=频率.
(2) 各小矩形的面积之比等于频率之比,也等于各小矩形的高度之比.
(3) 各小矩形的面积的总和等于1.
题型1:频率分布直方图的完善及有关计算
【例1.1.】
从某网络平台推荐的影视作品中抽取部,统计其评分数据,将所得个评分数据分为组:、、、,并整理得到如下的频率分布直方图,则评分在区间内的影视作品数量是( )
A. B. C. D.
【答案】D
【详解】由频率分布直方图可知,评分在区间内的影视作品数量为.
故选:D.
【例1.2.】 为了让学生了解环保知识,增强环保意识,某中学举行了一次环保知识竞赛,共有900名学生参加了这次竞赛.为了解本次竞赛的成绩情况,从中抽取了部分学生的成绩(得分均为整数,满分为100分)进行统计.请根据尚未完成的频率分布表和频数分布直方图,解答下列问题.
分组
频数
频率
4
0.08
0.16
0.20
16
合计
50
1.00
(1)填充频率分布表的空格(将答案直接填在表格内);
(2)补全频数分布直方图;
(3)若成绩在75.5~85.5分的学生获得二等奖,问获得二等奖的学生约为多少人?
【详解】(1)补全频率分布表如下:
分组
频数
频率
4
0.08
8
0.16
10
0.20
16
0.32
12
0.24
合计
50
1.00
(2)频数分布直方图如下图所示:
(3)成绩在75.5~80.5分的学生占70.5~80.5分的学生的,
因为成绩在70.5~80.5分的学生频率为0.20,
所以成绩在75.5~80.5分的学生频率为0.10.
成绩在80.5~85.5分的学生占80.5~90.5分的学生的.
因为成绩在80.5~90.5分的学生频率为0.32,
所以成绩在80.5~85.5分的学生频率为0.16,
所以成绩在75.5~85.5分的学生频率为0.26.
∵有900名学生参加了这次竞赛,
∴该校获得二等奖的学生有:0.26×900=234,
∴该校获得二等奖的学生有234人.
【例1.3.】 某校高一年级期末统一测试,随机抽取一部分学生的数学成绩,分组统计如下表.
分组
频数
频率
3
0.03
3
0.03
37
0.37
m
n
15
0.15
合计
M
N
(1)求出表中的值,并根据表中所给数据在给出的坐标系中画出频率直方图;
(2)若全校参加本次考试的学生有600人,试估计这次测试中全校成绩在90分以上的人数.
【详解】(1)由频率分布表得,
所以,,
频率直方图如图所示,
(2)
由题意,知全校成绩在90分以上的学生的人数约为.
【例1.4.】
某城市户居民的月平均用电量单位:度,以,,,分组的频率分布直方图如图.
(1)求直方图中的值;
(2)在这户居民中,月平均用电量不低于度的有多少户?
(3)在月平均用电量为,的四组用户中,用分层抽样的方法抽取户居民,则月平均用电量在的用户中应抽取多少户?
【详解】(1)由频率分布直方图,得,解得,
所以直方图中x的值是.
(2)月平均用电量为的用户有户,
月平均用电量为的用户有户,
月平均用电量为的用户有户,
月平均用电量为的用户有户,
所以月平均用电量不低于度的有户.
(3)由(2)可知,抽取比例为,
所以月平均用电量在的用户中应抽取户.
知识点二:其他常见统计图
除了频率分布直方图之外,我们还学过条形图、扇形图、折线图、频数分布直方图等.
(1) 不同的统计图在表示数据上有不同的特点.例如,条形图和直方图主要用于直观描述不同类别或分组数据的频数和频率,扇形图主要用于直观描述各类数据占总数的比例,折线图主要用于描述数据随时间的变化趋势.
(2)不同的统计图适用的数据类型也不同.如条形图适用于描述离散型的数据,直方图适用于描述连续性数据.
题型2:其他统计图表的信息读取问题
【例2.1.】
某只股票近个交易日的价格如下:
天数
股价/元
下列几种统计图中,表示上面的数据较合适的是( )
A.柱形图
B.扇形图
C.折线图
D.茎叶图
【答案】C
【详解】柱形图主要用来比较每天股价的最大值和最小值,开盘价和收盘价,也有一定的表示趋势的作用;
扇形图主要用来表示价格区间的比例关系,用扇形面积比较彼此之间的比例很直观,但不能表示股价的趋势和波动情况;
折线图则能有效地表示出每天的股价波动情况和趋势;
茎叶图可以收集所以的原始数据,便于随时填写,也能看出主干上数据的多少,但不能表示股价波动的情况;
通过以上比较,作如图的折线图,我们比较直观地看出此股票在这天中,
其价格总体是一个上升趋势,也可以看出每天的变化,
∴用折线图表示不断变化的数据,是有优越性的;
故选:C.
【例2.2.】 世界人口变化情况的三幅统计图如图所示.
【例2.3.】 下列结论中错误的是( )
A.从折线图能看出世界人口的总量随着年份的增加而增加
B.2050年亚洲人口比其他各洲人口的总和还要多
C.1957年到2050年各洲中北美洲人口增长速度最慢
D.2050年南美洲及大洋洲人口之和与欧洲人口基本持平
【答案】C
【详解】由折线图可以看出世界人口的总量随着年份的增加而增加,故A正确:
由扇形统计图可知2050年亚洲人口比其他各洲人口的总和还要多,故B正确:
由条形统计图可知2050年欧洲人口与南美洲及大洋洲人口之和基本持平,故D正确:
三幅统计图并不能得到各个洲人口增长速度的快慢,故C错误.
故选:C.
【例2.4.】
南丁格尔玫瑰图是由近代护理学和护士教育创始人南丁格尔设计的,图中每个扇形圆心角都是相等的,半径长短表示数量大小.某机构统计了近几年中国知识付费用户数量(单位:亿人次),并绘制成南丁格尔玫瑰图(如图所示),根据此图,以下说法错误的是( )
A.2015年至2022年,知识付费用户数量逐年增加
B.2015年至2022年,知识付费用户数量逐年增加量2018年最多
C.2015年至2022年,知识付费用户数量的逐年增加量逐年递增
D.2022年知识付费用户数量超过2015年知识付费用户数量的10倍
【答案】C
【详解】对于A,由图可知,2015年至2022年,知识付费用户数量逐年增加,故A说法正确;
对于B和C,知识付费用户数量的逐年增加量分别为:2016年,;
2017年,;2018年,;
2019年,;2020年,;
2021年,;2022年,;
则知识付费用户数量逐年增加量2018年最多,知识付费用户数量的逐年增加量不是逐年递增,故B说法正确,C说法错误;
对于D,由,则2022年知识付费用户数量超过2015年知识付费用户数量的10倍,故D说法正确.
综上,说法错误的选项为C.
故选:C
【例2.5.】 下图为2012年─2021年我国电子信息制造业企业和工业企业利润总额增速情况折线图,根据该图,下列结论正确的是( )
A.2012年─2021年电子信息制造业企业利润总额逐年递增
B.2012年─2021年工业企业利润总额逐年递增
C.2012年─2017年电子信息制造业企业利润总额均较上一年实现增长,且其增速均快于当年工业企业利润总额增速
D.2012年─2021年工业企业利润总额增速的均值大于电子信息制造业企业利润总额增速的均值
【答案】C
【详解】对于A,2018年电子信息制造业企业利润总额增速为负数,从2017到2018利润总额下降,故A不正确;
对于B,2015年工业企业利润总额增速为负数,从2014到2015利润总额下降,2019年工业企业利润总额增速为负数,从2018到2019利润总额下降,故B不正确;
对于C,2012年─2017年电子信息制造业企业利润总额增速均为正数,所以利润总额均较上一年实现增长,且其增速均大于当年工业企业利润总额增速,故C正确;
对于D,2012年─2021年工业企业利润总额增速的均值为,2012年─2021年电子信息制造业企业利润总额增速的均值为,,故D不正确.
故选:C
【例2.6.】 汽车的“燃油效率”是指汽车每消耗1升汽油行驶的里程,下图描述了甲、乙、丙三辆汽车在不同速度下的燃油效率情况. 下列叙述中正确的是
A.消耗1升汽油,乙车最多可行驶5千米
B.以相同速度行驶相同路程,三辆车中,甲车消耗汽油最多
C.甲车以80千米/小时的速度行驶1小时,消耗10升汽油
D.某城市机动车最高限速80千米/小时. 相同条件下,在该市用丙车比用乙车更省油
【答案】D
【详解】解:对于A,由图象可知当速度大于40km/h时,乙车的燃油效率大于5km/L,
∴当速度大于40km/h时,消耗1升汽油,乙车的行驶距离大于5km,故A错误;
对于B,由图象可知当速度相同时,甲车的燃油效率最高,即当速度相同时,消耗1升汽油,甲车的行驶路程最远,
∴以相同速度行驶相同路程,三辆车中,甲车消耗汽油最少,故B错误;
对于C,由图象可知当速度为80km/h时,甲车的燃油效率为10km/L,
即甲车行驶10km时,耗油1升,故行驶1小时,路程为80km,燃油为8升,故C错误;
对于D,由图象可知当速度小于80km/h时,丙车的燃油效率大于乙车的燃油效率,
∴用丙车比用乙车更省油,故D正确
故选D.
【例2.7.】 某市为提倡节约用水,准备实行自来水“阶梯计费”方式,用户用水不超出基本用水量的部分享受基本价格,超出基本用水量的部分实行超价收费,为更好地决策,自来水公司随机抽取了部分用户的用水量数据,并绘制了如图不完整的统计图(每组数据包括右端点但不包括左端点),请你根据统计图解答下列问题:
用户用水量频数直方图 用户用水量扇形统计图
(1)此次抽样调查的样本容量是________;
(2)补全频数分布直方图,求扇形图中“15吨~20吨”部分的圆心角的度数;
(3)如果自来水公司将基本用水量定为每户25吨,那么该地区6万用户中约有多少用户的用水全部享受基本价格.
【详解】(1);
(2)用水15~20吨的户数为100-10-36-24-8=22(户),
“15~20吨”部分的圆心角的度数为
(3)(万户)
所以该地区6万用户中约有4.08万户的用水全部享受基本价格.
【例2.8.】 共享单车入驻某城区5年以来,因其“绿色出行,低碳环保”的理念而备受人们的喜爱,值此5周年之际,某机构为了了解共享单车使用者的年龄段、使用频率、满意度等三个方面的信息,在全市范围内发放10000份调查问卷,回收到有效问卷6300份,现从中随机抽取160份,分别对使用者的年龄段、26~35岁使用者的使用频率、26~35岁使用者的满意度进行汇总,得到如下三个表格:
表(一)
使用者年龄段
25岁以下
26岁~35岁
36岁~45岁
45岁以上
人数
40
80
20
20
表(二)
使用频率
0~6次/月
7~14次/月
15~22次/月
23~31次/月
人数
10
20
40
10
表(三)
满意度
非常满意(10)
满意(9)
一般(8)
不满意(7)
人数
30
20
20
10
(1)依据上述表格完成下列三个统计图形:
(2)某城区现有常住人口80万,请用样本估计总体的思想,试估计年龄在26岁~35岁之间,每月使用共享单车在7~14次的人数.
【详解】(1)
(2)由表(一)可知年龄在26岁~35岁之间的有80人,占总抽取人数的,所以80万人口中年龄在26岁~35岁之间的约有(万人).
由表(二)可知,年龄在26岁~35岁之间每月使用共享单车在7~14次之间的有20人,占总抽取人数的,所以年龄在26岁~35岁之间的40万人中,每月使用共享单车在7~14次之间的约有(万人)
知识点三:总体百分位数的估计
1. 第p百分位数的定义
一般地,一组数据的第p百分位数是这样一个值,它使得这组数据中至少有p%的数据小于或等于这个值,且至少有(100-p)%的数据大于或等于这个值.
2. 计算一组n个数据的第p百分位数的步骤
第1步,按从小到大排列原始数据.
第2步,计算i=n×p%.
第3步,若i不是整数,而大于i的比邻整数为j,则第p百分位数为第j项数据;
若i是整数,则第p百分位数为第i项与第(i+1)项数据的平均数.
3. 四分位数
常用的分位数有第25百分位数、第50百分位数、第75百分位数,这三个分位数把一组由小到大排列后的数据分成四等份,因此称为四分位数.其中第25百分位数也称为第一四分位数或下四分位数等,第75百分位数也称为第三四分位数或上四分位数等.
题型3:总体百分位数的计算
【例3.1.】
某校高一年级18个班参加艺术节合唱比赛,通过简单随机抽样,获得了10个班的比赛得分如下:91,89,90,92,94,87,93,96,91,85,则这组数据的分位数为( )
A.93 B.93.5 C.94 D.94.5
【答案】B
【详解】将比赛得分从小到大重新排列:85,87,89,90,91,91,92,93,94,96,
因为,
所以这组数据的分位数第8个数与第9个数的平均值,即.
故选:B.
【例3.2.】 为深入推进“五育”并举,促进学生身心全面和谐发展,某校于上周六举办跳绳比赛.现通过简单随机抽样获得了22名学生在1分钟内的跳绳个数如下(单位:个):
估计该校学生在1分钟内跳绳个数的第65百分位数为( )
A.124 B. C. D.
【答案】C
【详解】解:因为,22名学生的跳绳成绩从小到大第15个数为,
所以,该校学生在1分钟内跳绳个数的第65百分位数为
故选:C
【例3.3.】
已知一组数据的上四分位数是,则的取值范围为( )
A. B. C. D.
【答案】C
【详解】在五个数中,上四分位数为第二大的数,故中第二大的数是,所以.
故选:C.
【例3.4.】 某同学在一次数学测试中的成绩是班级第三名(假设测试成绩两两不同),成绩处于第90百分位数,则该班级的人数可能为( )
A.15 B.25 C.30 D.35
【答案】B
【解析】设班级人数为x人,由题意,,解得,
又,结合选项可得,该班级的人数可能为25.
故选:B
知识点四:总体集中趋势的估计
1. 众数、中位数、平均数的定义
(1) 众数
一组数据中重复出现次数最多的数据(即频率最大值对应的数据样本)叫做这组数据的众数.
众数体现了样本数据的最大集中点,只能传递数据中的信息的很少一部分,当一组数据中有不少数据重复出现时,众数往往更能反映问题。
(2) 中位数
把一组数据按从小到大的顺序排列,处在中间的一个数据(或最中间两个数据的平均数)叫做这组数据的中位数.
中位数仅与数据的排列位置有关,某些数据的变动对中位数没有影响。中位数可能在所给的数据中,也可能不在所给的数据中。当一组数据中的个别数据变动较大时,可用中位数描述其集中趋势。
(3) 平均数
如果个数,那么叫做这个数的平均数.
任何一个数据的改变都会引起平均数的改变.数据越“离群”,对平均数的影响越大
题型4:平均数、中位数、众数的计算及应用
方法提炼
求平均数的方法:
(1)
定义法:已知为个数据,那么这个数的平均数为。
(2)
新数据法:如果一组数的平均数为,则一组数的平均数为.
(3)
加权平均数法:样本中,数据有个,有个,有个,则 .
(4)
频率法:若取值为的频率分别为,则其平均数.
【例4.1.】 某射击运动员连续射击5次,命中的环数(环数为整数)形成的一组数据中,中位数为8,唯一的众数为9,极差为3,则该组数据的平均数为( )
A. B. C.8 D.
【答案】B
【详解】依题意这组数据一共有个数,中位数为,则从小到大排列的前面有个数,后面也有个数,
又唯一的众数为,则有两个,其余数字均只出现一次,则最大数字为,
又极差为,所以最小数字为,
所以这组数据为、、、、,
所以平均数为.
故选:B
【例4.2.】
已知甲、乙两支篮球队各6名队员某场比赛的得分数据(单位:分)从小到大排列为如下:甲队:7,12,12,20,,31;乙队:8,9,19,,25,28.这两组数据的中位数相等,且平均值也相等,则x和y的值分别为( )
A.2和3 B.0和2 C.0和3 D.2和4
【答案】C
【详解】由题意得甲的平均数为,
乙的平均数为,
而甲的中位数为,故乙的中位数为,即,
故,
故选:C
【例4.3.】 如果一组数据的中位数比平均数小很多,下面叙述一定错误的是( )
A.数据中可能有异常值 B.数据中众数可能和中位数相同
C.数据中可能有极端大的值 D.这组数据是近似对称的
【答案】D
【详解】一组数据的中位数比平均数小很多,说明数据中可能有偏大或偏小的值,即可能有异常值,故A选项不符合题意;
一组数据的中位数比平均数小很多,可能众数和中位数相同,故B选项不符合题意;
一组数据的中位数比平均数小很多,说明数据中可能有偏大或偏小的值,故C选项不符合题意;
若这组数据是近似对称的,不会出现数据的中位数比平均数小很多,故D选项符合题意.
故选:D.
【例4.4.】 (多选)已知一组数据丢失了其中一个大于3的数据,剩下的六个数据分别是3,3,5,3,6,11,若这组数据的平均数与众数的和是中位数的2倍,则丢失的数据可能是( )
A.4 B.12 C.18 D.20
【答案】AC
【解析】设丢失的数据为,则这七个数据的平均数为,众数是3,
若,则中位数为,此时,解得;
若,则中位数为5,此时,解得.
综上所述,丢失的数据可能是4,18.
故选:AC.
知识点五:总体离散程度的估计
1. 平均距离
假设一组数据是用表示这组数据的平均值。到的距离分别为那么这组数据到的“平均距离”为.
2. 方差与标准差
标准差、方差刻画了数据的离散程度或波动幅度,标准差越大,数据的离散程度越大;标准差越小,数据的离散程度越小.在刻画数据的分散程度上,方差和标准差是一样的.但在解决实际问题中,一般多采用标准差.
(1) 标准差
标准差是数据到平均数的一种平均距离,由于式子中有绝对值,运算不太方便,因此通常改用如下公式来计算标准差:
(2) 方差
基本公式:
简化计算公式:
3. 总体方差、总体标准差
如果总体中所有个体的变量值分别为,总体平均数为,则称为总体方差,为总体标准差.如果总体的个变量值中,不同的值共有个,记为,,其中出现的频数为,则总体方差为.
4. 样本方差、样本标准差
如果一个样本中个体的变量值分别为,样本平均数为,则称为样本方差,为样本标准差.
5. 分层随机抽样的方差
(1) 两层构成样本的方差
设样本的平均数为,方差为,权重为,样本的平均数为,方差为,权重为,则样本的平均数为,方差为.
(2)
层构成样本的方差
设样本中不同层的平均数分别为为,方差分别为,相应的权重分别为,则这个样本的方差为,其中为样本平均数.
题型5:方差、标准差的计算及应用
方法提炼
(1)
数据的方差为,则数据的方差为.
(2) 标准差(方差)的两个作用:①标准差(方差)越大,数据的离散程度越大;标准差(方差)越小,数据的离散程度越小.②在实际应用中,常常把平均数与标准差结合起来进行决策。在平均数相等的情况下,比较方差或标准差以确定稳定性。
【例5.1.】
若一组数据m,n,9,8,10的平均数为9,方差为2,则 .
【答案】4
【详解】根据题意得平均数,
方差,
所以,且,解得或
所以.
故答案为:4.
【例5.2.】
已知样本,,的平均数为2,方差为1,则,,的平均数为 .
【答案】5
【详解】由题意知,,所以,
由,得,
所以.
故答案为:5
【例5.3.】
已知数据,,…,的平均数和方差分别为4,10,那么数据,,…,的平均数和方差分别为( )
A., B.1, C., D.,
【答案】D
【详解】设数据,,…,的平均数和方差分别为和,
则数据,,…,的平均数为,方差为,
得,,
故选:D.
【例5.4.】
为了迎接2025年第九届亚冬会的召开,某班组织全班学生开展有关亚冬会知识的竞赛活动.已知该班男生35人,女生25人.根据统计分析,男生组成绩和女生组成绩的方差分别为,该班成绩的方差为,则下列结论中一定正确的是( )
A. B.
C. D.
【答案】D
【详解】设该班男生组成绩和女生组成绩的平均分分别为,,两个班的总的平均分为,
则
,
故选:D.
【例5.5.】 某校教师男女人数之比为5:4,该校所有教师进行1分钟限时投篮比赛.现记录了每个教师1分钟命中次数,已知男教师命中次数的平均数为17,方差为16,女教师命中次数的平均数为8,方差为16,那么全体教师1分钟限时投篮次数的方差为 .
【答案】
【详解】设男女人数分别为,则男女教师总命中次数分别为、,
所以全体教师平均命中次数为,
若男教师命中次数为,女教师命中次数为,
所以,,
全体教师1分钟限时投篮次数的方差为,则
,
所以.
故答案为:
【例5.6.】
若一组样本数据的平均数为10,另一组样本数据的方差为8,则两组样本数据合并为一组样本数据后的平均数是 ,方差是 .
【答案】
【详解】由题意可知,数据的平均数为,
所以,则,
所以数据、、、的平均数为,
方差为,
所以,
将两组数据合并后,得到新数据,
则其平均数为,
方差为.
故答案为:;.
【例5.7.】
如图,一组数据,的平均数为5,方差为,去除,这两个数据后,平均数为,方差为,则( )
A., B., C., D.,
【答案】D
【详解】由题意可得:,则,
故,
∵是波幅最大的两个点的值,则去除,这两个数据后,整体波动性减小,故.
故选:D.
【例5.8.】
已知15个数,,…,的平均数为6,方差为9,现从中剔除,,,,这5个数,且剔除的这5个数的平均数为8,方差为5,则剩余的10个数,,…,的方差 .
【答案】8
【详解】由题意知,,,
所以,
所以剩余的10个数的平均数为.
根据方差公式得,
,,
即,,
所以,
所以剩余的10个数的方差为.
故答案为:8.
【例5.9.】 已知一组样本数据共有9个数,其平均数为8,方差为12.将这组样本数据增加一个数据后,所得新的样本数据的平均数为9,则新的样本数据的方差为( )
A.18.2 B.19.6 C.19.8 D.21.4
【答案】C
【详解】设增加的数为,原来的9个数分别为,
则,,
所以,
又因为,即,
所以,
故选:C.
题型6:数字特征的综合应用
【例6.1.】
(多选)下列统计量中,能度量样本的离散程度的是( )
A.样本的标准差 B.样本的中位数
C.样本的极差 D.样本的平均数
【答案】AC
【详解】由标准差的定义可知,标准差考查的是数据的离散程度;
由中位数的定义可知,中位数考查的是数据的集中趋势;
由极差的定义可知,极差考查的是数据的离散程度;
由平均数的定义可知,平均数考查的是数据的集中趋势;
故选:AC.
【例6.2.】 演讲比赛共有9位评委分别给出某选手的原始评分,评定该选手的成绩时,从9个原始评分中去掉1个最高分、1个最低分,得到7个有效评分.7个有效评分与9个原始评分相比,不变的数字特征是
A.中位数 B.平均数
C.方差 D.极差
【答案】A
【详解】设9位评委评分按从小到大排列为.
则①原始中位数为,去掉最低分,最高分,后剩余,
中位数仍为,A正确.
②原始平均数,后来平均数
平均数受极端值影响较大,与不一定相同,B不正确
③
由②易知,C不正确.
④原极差,后来极差可能相等可能变小,D不正确.
【例6.3.】 (多选)某企业协会规定:企业员工一周7天要有一天休息,另有一天的工作时间不超过4小时,且其余5天的工作时间均不超过8小时(每天的工作时间以整数小时计),则认为该企业“达标”.请根据以下企业上报的一周7天的工作时间的数值特征,判断其中无法确保“达标”的企业有( )
A.甲企业:均值为5,中位数为8
B.乙企业:众数为6,中位数为6
C.丙企业:众数和均值均为5,下四分位数为4,上四分位数为8
D.丁企业:均值为5,方差为6
【答案】ABD
【详解】甲企业每周7天的工作时间可以为:9,8,8,8,2,0,0,满足均值为5,中位数为8,故不达标,故A正确;
乙企业:众数为6,中位数为6,满足条件的7天工作时间可以为:6,6,6,6,6,6,6,故不达标,故B正确;
丙企业:众数和均值均为5,下四分位数为4,上四分位数为8,
设7天的工作时间为:4,5,5,8,a,b,c,,与众数矛盾,,为使众数为5,成立,故丙企业达标,故C错误;
丁企业:均值为5,方差为6,7天的工作时间可以为,故D正确.
故选:ABD
【例6.4.】
(多选)若是样本数据的平均数,则( )
A.的极差等于的极差
B.的平均数等于的平均数
C.的中位数等于的中位数
D.的标准差大于的标准差
【答案】AB
【详解】对于A,样本数据的平均数为,则,故的极差等于的极差,故A正确;
对于B,数据的平均数,故B正确;
对于C,如果是按从小到大排列,则的中位数为,不一定等于的中位数,故C错误;
对于D,的方差,
而的方差,
但当时两组数据的方差相等,其标准差也相等,故D错误.
故选:AB.
【例6.5.】
(多选)有一组样本数据,其中是最小值,是最大值,则( )
A.的平均数等于的平均数
B.的中位数等于的中位数
C.的标准差不小于的标准差
D.的极差不大于的极差
【答案】BD
【详解】对于选项A:设的平均数为,的平均数为,
则,
因为没有确定的大小关系,所以无法判断的大小,
例如:,可得;
例如,可得;
例如,可得;故A错误;
对于选项B:不妨设,
可知的中位数等于的中位数均为,故B正确;
对于选项C:举反例说明,例如:,则平均数,
标准差,
,则平均数,
标准差,显然,即,
所以的标准差不小于的标准差,这一论断不成立,故C错误;
对于选项D:不妨设,
则,当且仅当时,等号成立,故D正确;
故选:BD.
【例6.6.】
在一次数学模考中,从甲、乙两个班各自抽出10个人的成绩,甲班的十个人成绩分别为,乙班的十个人成绩分别为.假设这两组数据中位数相同、方差也相同,则把这20个数据合并后( )
A.中位数一定不变,方差可能变大
B.中位数可能改变,方差可能变大
C.中位数一定不变,方差可能变小
D.中位数可能改变,方差可能变小
【答案】A
【详解】不妨设,
则的中位数为,的中位数为,
因为,所以或,
则合并后的数据中位数是或者,所以中位数不变.
设第一组数据的方差为,平均数为,第二组数据的方差为,平均数为,
合并后总数为20,平均数为,方差为,
如果均值相同则方差不变,如果均值不同则方差变大.
故选:A.
【例6.7.】 甲、乙两人进行射击比赛,分别对同一目标各射击10次,其成绩(环数)如下:
甲的环数
7
7
10
6
10
8
7
9
7
9
乙的环数
7
8
8
9
8
7
7
9
8
9
下列说法正确的是( )
A.甲的平均数大于乙的平均数 B.甲的中位数等于乙的中位数
C.甲、乙的众数都是7 D.乙的成绩更稳定
【答案】D
【详解】计算得甲、乙的平均数都是8,故A错误;
甲从小到大进行排序:6,7,7,7,7,8,9,9,10,10,
乙从小到大进行排序,7,7,7,8,8,8,8,9,9,9,
所以甲的中位数是7.5,而乙的中位数是8,故B错误;
乙的众数是8,故C错误;
甲的方差为,
乙的方差为,
所以乙的方差小,所以乙的成绩更稳定,故D正确.
故选:D
【例6.8.】
一组数据按从小到大的顺序排列为2,4,m,12,16,17,若该组数据的中位数是极差的,则该组数据的第40百分位数是( )
A.4 B.5 C.6 D.9
【答案】C
【详解】根据题意,数据按从小到大的顺序排列为2,4,m,12,16,17,
则极差为,故该组数据的中位数是,
数据共6个,故中位数为,解得,
因为,所以该组数据的第40百分位数是第3个数6,
故选:C.
【例6.9.】 (多选)下列说法正确的是( )
A.一组样本数据的方差,则这组样本数据的总和为60
B.数据13,27,24,12,14,30,15,17,19,23的第70百分位数是23
C.若一个样本容量为8的样本的平均数是5,方差为2.现样本中又加入一个新数据5,此时样本的平均数不变,方差变大
D.若样本数据的标准差为8,则数据的标准差为16
【答案】AD
【详解】对于A,由方差的公式可知,该组数据的平均数是3,这组样本数据的总和为,A正确;
对于B,数据13,27,24,12,14,30,15,17,19,23共10个数,
从小到大排列为12,13,14,15,17,19,23,24,27,30,由于,
故选择第7和第8个数的平均数作为第70百分位数,即,
所以第70百分位数是23.5,故B错误;
对于C,某8个数的平均数为5,方差为2,现又加入一个新数据5,
设此时这9个数的平均数为,方差为,则,故C错误.
对于D,样本数据,,,的标准差为8,故数据,,,的标准差为,故D正确;
故选:AD.
【例6.10.】
(多选)若甲组样本数据(数据各不相同)的平均数为3,乙组样本数据的平均数为5,下列说错误的是( )
A.的值不确定
B.乙组样本数据的方差为甲组样本数据方差的2倍
C.两组样本数据的极差可能相等
D.两组样本数据的中位数可能相等
【答案】ABC
【详解】对选项A,由题意可知,,故A错误;
对选项B,易知乙组样本数据的方差为甲组样本数据方差的倍,故B错误;
对选项C,不妨设,
则甲组数据的极差为,
乙组数据的极差为,
又已知甲组数据各不相同,
所以两组样本数据的极差不相等,故C错误;
对选项D,设甲组样本数据的中位数为,
则乙组样本数据的中位数为,
当时,,
所以两组样本数据的中位数可能相等,故D正确.
故选:ABC.
【例6.11.】 某校积极开展“戏曲进校园”活动,为了解该校各班参加戏曲兴趣小组的人数,从全校随机抽取5个班级,把每个班级参加该小组的人数作为样本数据.已知样本平均数为7,样本标准差为2,且样本数据互不相等,则该样本数据的极差为( )
A.3 B.4 C.5 D.6
【答案】D
【详解】不妨设该五个班级的样本数据分别为,且,
则依题意有,
化简得
易知,
又易知五个数据减7的平方数为整数,五个数的绝对值不超过4,
当时,,由数据为整数且均不相同得不成立,
当时,,由数据为整数且均不相同得该四个平方数只能为,则,符合题意,此时极差为6;
当时,,由数据为整数且均不相同得不成立;
综上,五组数据的极差为6.
故选:D
题型7:频率分布直方图的综合问题
方法提炼
频率分布直方图中的平均数、中位数和众数
(1)平均数:在频率分布直方图中,样本平均数可以用每个小矩形底边中点的横坐标与小矩形的面积的乘积之和近似代替.
(2)中位数:在频率分布直方图中,中位数左边和右边的直方图的面积应该相等.
(3)众数:众数是最高小矩形底边的中点所对应的数据.
【例7.1.】 为了了解小学生的体能情况,抽取了某小学四年级100名学生进行一分钟跳绳次数测试,将所得数据整理后,绘制如下频率分布直方图.根据此图,下列结论中错误的是( )
A.
B.估计该小学四年级学生的一分钟跳绳的平均次数超过125
C.估计该小学四年级学生的一分钟跳绳次数的中位数约为119
D.四年级学生一分钟跳绳超过125次以上优秀,则估计该小学四年级优秀率为35%
【答案】B
【详解】根据题意可得,可得,故A正确;
根据频率分布直方图可得其平均数为
,所以B错误;
由频率分布直方图可知,,而,
所以中位数落在区间内,设中位数为,则,可得,所以C正确;
由图可知,超过125次以上的频率为,所以优秀率为35%,即D正确.
故选:B
【例7.2.】 少年强则国强,少年智则国智.党和政府一直重视青少年的健康成长,出台了一系列政策和行动计划,提高学生身体素质.为了加强对学生的营养健康监测,某校在3000名学生中,抽查了100名学生的体重数据情况.根据所得数据绘制样本的频率分布直方图如图所示,则下列结论正确的是( )
A.样本的众数为65 B.样本的第80百分位数为72.5
C.样本的平均值为67.5 D.该校学生中低于的学生大约为1000人
【答案】B
【详解】由频率分布直方图可得众数为,A错误;
平均数为,C错误;
因为体重位于的频率分别为,
因为,
所以第80百分位数位于区间内,设第80百分位数为,
则,
所以,即样本的第80百分位数为72.5,B正确;
样本中低于的学生的频率为,
所以该校学生中低于的学生大约为,D错误;
故选:B.
【例7.3.】 (多选)如图所示,下列频率分布直方图显示了三种不同的分布形态.图(1)形成对称形态,图(2)形成“右拖尾”形态,图(3)形成“左拖尾”形态,根据所给图作出以下判断,正确的是( )
A.图(1)的平均数中位数众数
B.图(2)的平均数<众数<中位数
C.图(2)的众数中位数<平均数
D.图(3)的平均数中位数众数
【答案】ACD
【分析】图(1)的分布直方图是对称的,所以平均数=中位数=众数,故A正确;
图(2)众数最小,右拖尾平均数大于中位数,故B错误,C正确;
图(3)左拖尾众数最大,平均数小于中位数,故D正确.
故选:ACD.
【例7.4.】 (多选)下图是样本甲与样本乙的频率分布直方图,下列说法判断正确的是( )
A.样本乙的极差一定大于样本甲的极差
B.样本乙的众数一定大于样本甲的众数
C.样本乙的方差一定小于样本甲的方差
D.样本甲的中位数一定小于样本乙的中位数
【答案】BCD
【详解】对于A,甲的数据介于[1.5,7.5]之间,极差小于或等于6;乙的数据分布于[2.5,8.5],极差小于或等于6;从而甲和乙的极差可能相等,A错误;
对于B,根据频率分布直方图可知,甲的众数介于[2.5,5.5)之间,乙的众数介于(5.5,6.5],乙的众数大于甲的众数,B正确;
对于C,甲的数据比较分散,乙的数据比较集中,因此乙的方差小于甲的方差,C正确;
对于D,甲的各组频率依次为:,其中位数位于[3.5,4.5)之间,
乙的各组频率依次为:,其中位数位于[5.5,6.5)之间,
所以甲的中位数小于乙的中位数,D正确.
故选:BCD
【例7.5.】 从某企业生产的某种产品中抽取100件,测量这些产品的一项质量指标值,由测量表得如下频数分布表:
质量指标值分组
频数
6
26
38
22
8
(1)在下表中作出这些数据的频率分布直方图;
(2)估计这种产品质量指标值的平均数及方差(同一组中的数据用该组区间的中点值作代表);
(3)已知在这些数据中,质量指标值落在区间内的产品的质量指标值的平均数为94,方差为40,所有这100件产品的质量指标值的平均数为100,方差为202,求质量指标值在区间内的产品的质量指标值的方差.
【详解】(1)由题意可知,分组,,,,,对应的频率分别为.
则频率分布直方图如下图所示:
(2)质量指标值的样本平均数为
.
质量指标值的样本方差为
(3)由题,质量指标值落在区间内的产品有70件,
设质量指标值分别为,则平均数为,方差为,
质量指标值落在区间内的产品有30件,
设质量指标值分别为,则平均数为,方差为,
设这100件产品的质量指标值的平均数为,
方差为,则,
所以,又因为,则,
又因为,则,
所以
【例7.6.】
某中学为了学生的身心健康,加强食堂用餐质量(简称“美食”)的过程中,后勤部门需了解学生对“美食”工作的认可程度,若学生认可系数不低于0.85,“美食”工作按原方案继续实施,否则需进一步整改.为此该部门随机调查了600名学生,根据这600名学生对“美食”工作认可程度给出的评分,分成,,,,五组,得到如图所示的频率分布直方图.
(1)求直方图中的值和第60百分位数;
(2)为了解部分学生给“美食”工作评分较低的原因,该部门从评分低于80分的学生中用分层抽样的方法随机选取30人进行座谈,求应选取评分在的学生人数;
(3)根据你所学的统计知识,结合认可系数,判断“美食”工作是否需要进一步整改,并说明理由.
【详解】(1)由图可知:,
解得.
因为,内的频率为,内的频率为,
所以,第60百分位数位于区间内,设为,
则,
所以,第60百分位数为85.
(2)低于80分的学生中三组学生的人数比例为,
则应选取评分在的学生人数为:(人).
(3)由图可知,认可程度平均分为:
,
所以,“美食”工作需要进一步整改.
【例7.7.】
为了了解某次竞赛成绩情况,从中抽取了部分学生的成绩x(单位:分,得分取正整数,满分为100分)作为样本进行统计将成绩进行整理后,分为五组(,,,,),其中第1组频数的平方等于第2组、第4组频数之积,请根据下面尚未完成的频率分布直方图(如图所示)解决下列问题:
(1)求a,b的值;
(2)若根据这次成绩,学校准备淘汰80%的同学,仅留20%的同学进入下一轮竞赛请问晋级分数线划为多少合理?
(3)某老师在此次竞赛成绩中抽取了10名学生的分数:,,,…,,已知这10个分数的平均数,标准差,若剔除其中的95和85这两个分数,求剩余8个分数的平均数与方差.
【详解】(1)由题意知,所以,解得,
又,解得.
所以,,
(2)成绩落在内的频率为:,
落在内的频率为:,
设第80百分位数为m,则,
解得,所以晋级分数线划为78分合理.
(3),故:.
又,,
剔除其中的95和85两个分数,设剩余8个数为,,,…,,
平均数与标准差分别为,,
则剩余8个分数的平均数:;
方差:.
【例7.8.】 某研究小组经过研究发现某种疾病的患病者与未患病者的某项医学指标有明显差异,经过大量调查,得到如下的患病者和未患病者该指标的频率分布直方图:
利用该指标制定一个检测标准,需要确定临界值c,将该指标大于c的人判定为阳性,小于或等于c的人判定为阴性.此检测标准的漏诊率是将患病者判定为阴性的概率,记为;误诊率是将未患病者判定为阳性的概率,记为.假设数据在组内均匀分布,以事件发生的频率作为相应事件发生的概率.
(1)当漏诊率%时,求临界值c和误诊率;
(2)设函数,当时,求的解析式,并求在区间的最小值.
【详解】(1)依题可知,左边图形第一个小矩形的面积为,所以,
所以,解得:,
.
(2)当时,
;
当时,
,
故,
所以在区间的最小值为.
【例7.9.】 某中学新建了学校食堂,每天有近2000名学生在学校食堂用午餐,午餐开放时间约40分钟,食堂制作了三类餐食,第一类是选餐,学生凭喜好在做好的大约6种菜和主食米饭中任意选购;第二类是套餐,已按配套好菜色盛装好,可直接取餐;第三类是面食,如煮面、炒粉等,为了更合理地设置窗口布局,增加学生的用餐满意度,学校学生会在用餐的学生中对就餐选择、各类餐食的平均每份取餐时长以及可接受等待时间进行问卷调查,并得到以下的统计图表.
类别
选餐
套餐
面食
选择人数
50
30
20
平均每份取餐时长(单位:分钟)
2
0.5
1
已知饭堂的售饭窗口一共有20个,就餐高峰期时有200名学生在等待就餐.
(1)根据以上的调查统计,如果设置12个选餐窗口,4个套餐窗口,4个面食窗口,就餐高峰期时,假设大家在排队时自动选择较短的队伍等待(即各类餐食的窗口前队伍长度各自相同),问:选择选餐的同学最长等待时间是多少?这能否让80%的同学感到满意(即在接受等待时长内取到餐)?
(2)根据以上的调查统计,从等待时长和公平的角度上考虑,如何设置各类售饭窗口数更优化,并给出你的求解过程.
【详解】(1)由题意得,就餐高峰期时选择选餐的总人数为人;
这100人平均分布在12个选餐窗口,平均每个窗口等待就餐的人数为人,
所以选择选餐同学的最长等待时间为分钟,
由可接受等待时长的频率分布直方图可知,分组为的频率分别为,
所以可接受等待时长在15分钟以上的同学占,
故设置12个选餐窗口,4个套餐窗口,4个面食窗口,不能让80%的同学感到满意;
(2)假设设置m个选餐窗口,n个套餐窗口,k个面食窗口,则各队伍的同学最长等待时间如下:
类别
选餐
套餐
面食
高峰期就餐总人数
100
60
40
各队伍长度(人)
最长等待时间(分钟)
依题意,从等待时长和公平的角度上考虑,则要求每个队伍的最长等待时间大致相同,
即得,即有,
而,故,
因此建议设置选餐、套餐、面食三个类别的窗口数分别为个.
【例7.10.】 某公司计划购买1台机器,该种机器使用三年后即被淘汰.机器有一易损零件,在购进机器时,可以额外购买这种零件作为备件,每个200元.在机器使用期间,如果备件不足再购买,则每个500元.现需决策在购买机器时应同时购买几个易损零件,为此搜集并整理了100台这种机器在三年使用期内更换的易损零件数,得下面柱状图:
记x表示1台机器在三年使用期内需更换的易损零件数,y表示1台机器在购买易损零件上所需的费用(单位:元),表示购机的同时购买的易损零件数.
(Ⅰ)若=19,求y与x的函数解析式;
(Ⅱ)若要求“需更换的易损零件数不大于”的频率不小于0.5,求的最小值;
(Ⅲ)假设这100台机器在购机的同时每台都购买19个易损零件,或每台都购买20个易损零件,分别计算这100台机器在购买易损零件上所需费用的平均数,以此作为决策依据,购买1台机器的同时应购买19个还是20个易损零件?
【详解】试题分析:(Ⅰ)分x19及x>19,分别求解析式;(Ⅱ)通过频率大小进行比较;(Ⅲ)分别求出n=19,n=20时所需费用的平均数来确定.
试题解析:(Ⅰ)当时,;当时,,所以与的函数解析式为.
(Ⅱ)由柱状图知,需更换的零件数不大于18的频率为0.46,不大于19的频率为0.7,故的最小值为19.
(Ⅲ)若每台机器在购机同时都购买19个易损零件,则这100台机器中有70台在购买易损零件上的费用为3 800,20台的费用为4 300,10台的费用为4 800,因此这100台机器在购买易损零件上所需费用的平均数为.
若每台机器在购机同时都购买20个易损零件,则这100台机器中有90台在购买易损零件上的费用为4 000,10台的费用为4 500,因此这100台机器在购买易损零件上所需费用的平均数为.
题型8: 折线图、扇形图、条形图的综合问题
【例8.1.】 (多选)近年来,我国人口老龄化持续加剧,为改善人口结构,保障国民经济可持续发展,国家出台了一系列政策,如2016年起实施全面两孩生育政策,2021年起实施三孩生育政策等.根据下方的统计图,下列结论正确的是( )
2010至2022年我国新生儿数量折线图
A.2010至2022年每年新生儿数量的平均数高于1400万
B.2010至2022年每年新生儿数量的第一四分位数低于1400万
C.2015至2022年每年新生儿数量呈现先增加后下降的变化趋势
D.2010至2016年每年新生儿数量的方差大于2016至2022年每年新生儿数量的方差
【答案】AC
【详解】对于A,由折线图可知:2010至2022年每年新生儿数量13个数据中有2010至2018年的数量(9个)均高于1500万,3个数据低于1400万,根据数据之间的差距可得 2010至2022年每年新生儿数量的平均数高于1400万,故选项A正确;
对于B,由图可知共有13个数据,因为,所以第一四分位数是按照从小到大排列的数据的第4个数据,由折线图可知,第4个数据为2019年新生儿的数量,其值大于1400万,故选项B错误;
对于C,由折线图可知2015至2022年每年新生儿数量呈现先增加后下降的变化趋势,故选项C正确;
对于D,由折线图可知:2010至2016年每年新生儿数量的波动比2016至2022年每年新生儿数量的波动小,所以2010至2016年每年新生儿数量的方差小于2016至2022年每年新生儿数量的方差,故选项D错误,
故选:AC.
【例8.2.】
空气质量指数是反映空气质量状况的指数,其对应关系如下表:
指数值
空气质量
优
良
轻度污染
中度污染
重度污染
严重污染
为监测某化工厂排放废气对周边空气质量指数的影响,某科学兴趣小组在校内测得10月1日—20日指数的数据并绘成折线图如下:
下列叙述正确的是( )
A.这天中指数值的中位数略大于
B.这天中的空气质量为优的天数占
C.10月4日到10月11日,空气质量越来越好
D.总体来说,10月中旬的空气质量比上旬的空气质量好
【答案】B
【详解】由折线图知以上有个,以下有个,中位数是两边两个数的均值,观察比的数离远点,
因此两者均值大于但小于150,A错;
空气质量为优的有天,占,B正确;
10月4日到10月11日,空气质量越来越差,C错;
10月上旬的空气质量指数值在以下的多,
中旬的空气质量指数值在以上的多,
上旬的空气质量比中旬的空气质量好,D错.
故选:B.
【例8.3.】 下图是我国跨境电商在2016~2022年的交易规模与增速图,由图可以知道下列结论正确的是( )
A.这7年我国跨境电商交易规模的平均数为8.0万亿元
B.这7年我国跨境电商交易规模的增速越来越大
C.这7年我国跨境电商交易规模的极差为7.6万亿元
D.图中我国跨境电商交易规模的6个增速的中位数为13.8%
【答案】D
【详解】对于,由图可知:这7年我国跨境电商交易规模的平均数为:
万亿元,故选项错误;
对于,由图可知:交易规模的增速并不是越来越大,故选项错误;
对于,由图可知:这7年我国跨境电商交易规模的极差为,故选项错误,
对于,由图可知:6个增速的中位数为和的平均数,即,故选项正确,
故选:.
【例8.4.】
某高中为了解学生课外知识的积累情况,随机抽取名同学参加课外知识测试,测试共道题,每答对一题得分,答错得分.已知每名同学至少能答对道题,得分不少于分记为及格,不少于分记为优秀,测试成绩百分比分布图如图所示,则下列说法正确的是( )
A.该次课外知识测试及格率为
B.该次课外知识测试得满分的同学有名
C.该次测试成绩的中位数大于测试成绩的平均数
D.若该校共有名学生,则课外知识测试成绩能得优秀的同学大约有名
【答案】C
【详解】由图知,及格率为,故A错误.
该测试满分同学的百分比为,即有名,B错误.
由图知,中位数为分,平均数为分,故C正确.
由题意,名学生成绩能得优秀的同学有,故D错误.
故选:C
【例8.5.】 (多选)下图为2024年中国大学生使用APP偏好及目的统计图,根据统计图,下列关于2024年中国大学生使用APP的结论正确的是( )
A.超过的大学生更爱使用购物类APP
B.超过半数的大学生使用APP是为了学习与生活需要
C.使用APP偏好情况中7个占比数字的极差是
D.APP使用目的中6个占比数字的分位数是
【答案】AC
【详解】对于选项A,根据图表知,大学生使用购物类APP占比为,所以选项A正确,
对于选项B,根据图表知,大学生使用APP是为了学习与生活需要的占比为,所以选项B错误,
对于选项C,根据图表知,使用APP偏好情况中7个占比数字的极差是,所以选项C正确,
对于选项D,根据图表知,APP使用目的中6个占比数字从小排到大分别为,
又,所以分位数是,故选项D错误.
故选:AC.
(
1
)
学科网(北京)股份有限公司
$$