内容正文:
第15讲 用样本估计总体
目录
题型归纳 1
题型01 根据条形统计图、折线统计图和扇形统计图解决实际问题 3
题型02 根据频率分布表解决实际问题 6
题型03 由频率分布直方图计算频率、频数、样本容量、总体容量 8
题型04 总体百分位数的估计 9
题型05 计算几个数的众数、中位数和平均数 9
题型06 根据频率分布直方图估计中位数、平均数 10
题型07 根据平均数求参数 11
题型08 众数、平均数、中位数的比较 12
题型09 计算几个数据的极差、方差、标准差 13
题型10 根据方差、标准差求参数 14
题型11 各数据同时加减、乘除同一数对方差的影响 15
题型12 估计总体的方差、标准差 15
分层练习 17
夯实基础 17
能力提升 20
知识点01频率分布直方图
(1)列出样本数据的频率分布表和频率分布直方图的步骤:
①计算极差:找出数据的最大值与最小值,计算它们的差;
②决定组距与组数:当样本容量不超过100时,按照数据的多少分成5~12组,且;
③将数据分组:通常对组内数值所在区间区左闭右开区间,最后一组取闭区间;也可以将样本数据多取一位小数分组.
④列频率分布表:对落入各小组的数据累计,算出各小数的频数,除以样本容量,得到各小组的频率.
⑤绘制频率分布直方图:以数据的值为横坐标,以的值为纵坐标绘制直方图。
(2)频率分布直方图的特点:
①,
②个小长方形的面积等于1,
③.
(3)频率分布折线图:将频率分布直方图各个长方形上边的中点用线段连接起来,就得到频率分布折线图,
一般把折线图画成与横轴相连,所以横轴左右两端点没有实际意义.
(4)总体密度曲线:样本容量不断增大时,所分组数不断增加,分组的组距不断缩小,
频率分布直方图可以用一条光滑曲线来描绘,这条光滑曲线就叫做总体密度曲线.
总体密度曲线精确地反映了一个总体在各个区域内取值的规律.
知识点02总体百分位数的估计
(1)第p百分位数的定义:一般地,一组数据的第p百分位数是这样一个值,它使得这组数据中至少有p%的数据小于或等于这个值,且至少有(100-p)%的数据大于或等于这个值.
(2)计算一组n个数据的第p百分位数的步骤
第1步,按从小到大排列原始数据.
第2步,计算i=n×p%.
第3步,若i不是整数,而大于i的比邻整数为j,则第p百分位数为第j项数据;
若i是整数,则第p百分位数为第i项与第(i+1)项数据的平均数.
知识点03总体集中趋势的估计
(1)众数:在样本数据中,出现次数最多的那个数据;
(2)中位数:将样本数据按大小顺序排列,若数据的个数为奇数,则最中间的数据为中位数,
若样本数据个数为偶数,则取中间两个数据的平均数作为中位数。
(3)平均数:设样本的数据为,则样本的算术平均数为;
(4)平均数相关结论:
①如果两组数和的平均数分别是和,
则一组数的平均数是;
②如果一组数的平均数为,则一组数的平均数为。
③如果一组数的平均数为,则一组数的平均数为
④根据频率分布直方图求平均数、中位数和众数
平均数:在频率分布直方图中,样本平均数可以用每个小矩形底边中点的横坐标与小矩形的面积的乘积之和近似代替.
中位数:在频率分布直方图中,中位数左边和右边的直方图的面积应该相等.
众数:众数是最高小矩形底边的中点所对应的数据.
知识点04总体离散程度的估计
用样本的标准差估计总体的标准差
(1)数据的离散程度可以用极差、方差或标准差来描述;
(2)极差(又叫全距)是一组数据的最大值和最小值之差,反映一组数据的变动幅度;
(3)样本方差描述了一组数据围绕平均数波动的大小;
一般地,设样本的数据为,样本的平均数为,
定义样本方差为;
简化公式:=
(方差等于原数据平方的平均数减去平均数的平方)
(4)样本的标准差是方差的算术平方根.
样本标准差.
标准差越大数据离散程度越大,数据家分散;标准差越小,数据集中在平均数周围.
(5)方差相关结论:
①如果一组数的方差为,则一组数的方差为;
②如果一组数的方差为,则一组数的方差为。
题型01根据条形统计图、折线统计图和扇形统计图解决实际问题
【例1】(23-24高一下·贵州铜仁·期中)年3月,树人中学组织三个年级的学生进行党史知识竞赛.经统计,得到前名学生分布的饼状图(如图)和前名中高一学生排名分布的频率条形图(如图),则下列命题错误的是( )
A.成绩前名的人中,高一人数比高二人数多30人
B.成绩第1-名的人中,高一人数不超过一半
C.成绩第1-50名的50人中,高三最多有32人
D.成绩第51-名的50人中,高二人数比高一的多
【变式1】(23-24高一上·湖南邵阳·期中)近五年来,国内生产总值从54万亿元增加到82.7万亿元,年均增长,占世界经济比重从提高到左右,对世界经济增长贡献率超过,居民消费价格年均上涨,保持较低水平.在2018年2月国家统计局发布了《2017年国民经济和社会发展统计公报》中“2017年居民消费价格月度涨跌幅度”的折线图如图:
说明:在统计学中,同比是指本期统计数据与上一年同期统计数据相比较,
例如:2017年12月与2016年12月相比较;同比增长率=(本期数-同期数)÷同期数.
环比是指本期统计数据与上期统计数据相比较,例如2017年12月与2017年11月相比较:环比增长率=(本期数一上期数)÷上期数×.
根据上述信息,下列结论中错误的是( )
A.从2017年每月的环比增长率看,2017年每月居民消费价格逐月比较有涨有跌
B.从2017年每月的环比增长率看,2017年每月居民消费价格逐月比较1月涨幅最大
C.从2017年每月的同比增长率看,2017年每月居民消费价格与2016年同期比较有涨有跌
D.从2017年每月的同比增长率看,2017年每月居民消费价格与2016年同期比较1月涨幅最大
【变式2】(23-24高一下·广西玉林·期中)某学校组建了演讲,舞蹈,航模,合唱,机器人五个社团,全校所有学生每人都参加且只参加其中一个社团,校团委将统计结果绘制成如下两个不完整的统计图,则合唱社团的人数占全体学生人数的百分比为 .
【变式3】(20-21高一下·海南·期末)某人对自己退休前后的工资分配做了详细的规划,各类费用的占比如下面的条形图和扇形图所示:
若他退休前每月工资为9600元,退休后每月储蓄的金额比退休前每月储蓄的金额少1680元,则他退休后每月工资为 元.
题型02 根据频率分布表解决实际问题
【例2】(21-22高一下·新疆乌鲁木齐·期末)一个容量100的样本,其数据的分组与各组的频数如下表
组别
频数
12
13
24
15
16
13
7
则样本数据落在上的频率为( )
A.0.42 B.0.39 C.0.52 D.0.64
【变式1】(23-24高一下·广西·阶段练习)一个样本容量为600的频数分布表不小心被损坏了一部分.若样本中数据在内的频率为0.75,则样本中的数据在内的个数为( )
A.225 B.295 C.235 D.305
【变式2】(22-23高一上·北京顺义·期末)下表是某班10个学生的一次测试成绩,对单科成绩分别评等级:
学生学号
1
2
3
4
5
6
7
8
9
10
数学成绩
140
136
136
135
134
133
128
127
124
语文成绩
102
110
111
126
102
134
97
95
98
在这10名学生中,已知数学成绩为“A等”的有8人,语文成绩为“A等”的有7人,数学与语文两科成绩全是“A等”的有6人,则下列说法中,所有正确说法的序号是 .
①当时,;
②当时,;
③恰有1名学生两科均不是“A等”;
④学号1~6的学生两科成绩全“A等”.
【变式3】(21-22高一下·湖北恩施·期末)某农户从一批待售的苹果中随机抽取100个,对样本中每个苹果称重,数据如下表.
质量(单位,千克)
[0.08,0.09)
[0.09,0.1)
[0.1,0.11)
[0.11,0.12)
[0.12,0.13)
[0.13,0.14]
个数
10
10
20
40
15
5
若将这批苹果按质量大小进行分级,质量不小于0.12千克的苹果为一级果;质量不小于0.1千克且小于0.12千克的苹果为二级果;质量在0.1千克以下的苹果为三级果.
(1)根据以上抽样调查数据,能否认为这批苹果符合“二级果和一级果的数量之和至少要占全部产品的70%”的规定?
(2)若将这批苹果按等级出售,一级果的售价为10元/千克;二级果的售价为8元/千克;三级果的售价为6元/千克经估算,这批苹果有150000个,请问该批苹果的销售收入约为多少元?(问一组中的数据用该组区间的中点值作代表)
题型03 由频率分布直方图计算频率、频数、样本容量、总体容量
【例3】(23-24高一下·山东青岛·期末)如果一组数据的频率分布直方图在右边“拖尾”,则下列说法一定错误的是( )
A.数据中可能存在极端大的值 B.这组数据是不对称的
C.数据中众数一定不等于中位数 D.数据的平均数大于中位数
【变式1】(23-24高一下·湖南邵阳·期末)某校高一年级有800名学生选学物理,将某次联考的物理成绩绘制成的频率分布直方图如图所示,则高一年级这次联考的物理成绩位于区间的人数约为( )
A.200 B.220 C.240 D.260
【变式2】(24-25高一上·江西·期末)某校60名同学数学竞赛的成绩(满分:100分)均在之间,进行适当分组后(每组为左闭右开区间),画出频率分布直方图如图所示,若从这60名参赛者中随机选取1人,试估计其成绩在的概率为 .
【变式3】(23-24高一下·广东潮州·期末)某校为了解全校高中学生五一小长假参加实践活动的情况,抽查了100名学生,统计他们假期参加实践活动的时间,绘成的频率分布直方图如图所示.这100名学生中参加实践活动时间在4~10小时内的人数为 .
题型04 总体百分位数的估计
【例4】(24-25高一上·湖南邵阳·期末)数据53,62,78,67,98,32,42,12,90的第三四分位数是( )
A.67 B.42 C.62 D.78
【变式1】(24-25高一上·广西钦州·期末)我国2024年4月至11月太阳能发电量同比增长速度依次为21.4%,29.1%,18.1%,16.4%,21.7%,12.7%,12.6%,10.3%,则这组数据的75%分位数为( )
A.21.55% B.21.65% C.21.4% D.21.7%
【变式2】(24-25高一上·江西·期末)已知一组数据、、、、、、、,这组数据的分位数是 .
【变式3】(24-25高一上·陕西汉中·期末)数据1,2,3,4,5,6,7,8的分位数为 .
题型05 计算几个数的众数、中位数和平均数
【例5】(20-21高一下·陕西宝鸡·期中)某学生所得分数为、、、、、、,这组数据的众数是( )
A. B. C. D.
【变式1】(23-24高一下·吉林·期末)已知样本数据:6,5,7,8,9,6,则这组样本数据的中位数为( )
A.6 B.6.5 C.7 D.7.5
【变式2】(23-24高一下·天津滨海新·期末)已知一组样本数据:3,4,4,4,6,6,7,8,8,则该组样本数据的众数为 ,中位数为 .
【变式3】(23-24高一下·吉林白城·期末)如图所示,某学校高一(1)班期中考试成绩的统计图.根据该图可估计,这次考试的平均成绩为 分.
题型06 根据频率分布直方图估计中位数、平均数
【例6】(23-24高一下·河北张家口·期末)某时间段公路上车速的频率分布直方图如图所示,则( )
A. B.车速的众数估计值是70
C.车速的平均数估计值大于其中位数的估计值 D.车速的中位数估计值是62.5
【变式1】(23-24高一下·山东济南·期末)如图,已知某频率分布直方图形成“右拖尾”形态,则下列结论正确的是( )
A.众数平均数中位数 B.众数中位数平均数
C.众数平均数中位数 D.中位数平均数众数
【变式2】(23-24高一下·四川达州·期末)在某次考试成绩中随机抽取50个,成绩均在之间,将这些成绩共分成五组:,,,,,得到如图所示的频率分布直方图,由图中数据估计总体的众数和中位数(中位数精确到个位)分别是( ).
A.65,70 B.65,71 C.65,72 D.65,73
【变式3】(23-24高一下·云南大理·期末)平均数、中位数和众数都是刻画一组数据的集中趋势的信息,它们的大小关系和数据分布的形态有关.在下图分布形态中,分别对应这组数据的中位数、平均数和众数,则的大小关系为 .
题型07 根据平均数求参数
【例7】(23-24高一下·广西南宁·期末)高二(1)班有40名学生,其中男生有16名,已知男生平均体重为,总平均体重为,则女生的平均体重约为( )
A. B. C. D.
【变式1】(22-23高一下·河北沧州·期末)一组数据,5,6,7,7,8,11,12的平均数为8,则这组数据的中位数为( )
A.6.5 B.7 C.7.5 D.8
【变式2】(21-22高一上·辽宁营口·期末)某班有30名男生,20名女生,其中男生平均身高为,全班平均身高为,女生的平均身高为 .
【变式3】(20-21高一下·江西南昌·期末)马芸的某次语数外考试成绩都是两位数,成绩单被色彩笔弄脏,只能看到语文十位数字是8,数学成绩个位数字是7,英语成绩95,若他平均成绩是93,则他的数学成绩是 .
题型08 众数、平均数、中位数的比较
【例8】(22-23高一下·广东东莞·期末)平均数和中位数都描述了数据的集中趋势,它们的大小关系和数据分布的形态有关.下面四幅频率分布直方图中,最能说明平均数大于中位数的是( )
A. B.
C. D.
【变式1】(20-21高一下·河北·期末)某校举行校园歌手大赛,6位评委对某选手的评分分别为9.2,9.5,8.8,9.9,8.9,9.5,设该选手得分的平均数为x,中位数为y,众数为z,则( )
A. B. C. D.
【变式2】(20-21高一·全国)下列数字特征一定会在原始数据中出现的是( )
A.众数 B.中位数 C.平均数 D.都不会
【变式3】(21-22高一上·湖南长沙·期末)为了落实习主席提出“绿水青山就是金山银山”的环境治理要求.某市政府积极鼓励居民节约用水.计划调整居民生活用水收费方案.拟确定一个合理的月用水量标准x(吨).一位居民的月用水量不超过x的部分按平价收费.超出x的部分按议价收费.为了了解居民用水情况.通过抽样.获得了某年200位居民每人的月均用水量(单位:吨).将数据按照[0.1).[1.2).….[8.9)分成9组.制成了如图所示的频率分布直方图.其中0.4a=b.
(1)求直方图中a.b的值.并由频率分布直方图估计该市居民用水量的众数;
(2)若该市政府希望使85%的居民每月的用水量不超过标准x(吨).估计x的值.
题型09 计算几个数据的极差、方差、标准差
【例9】(23-24高一下·浙江宁波·期中)甲乙丙丁四位同学各掷5次骰子并记录点数,方差最大的是( )
甲:4 5 4 5 5 乙:4 2 3 4 3
丙:2 3 2 3 4 丁:6 1 2 6 1
A.甲 B.乙 C.丙 D.丁
【变式1】(24-25高一上·江西·期末)已知四个不同的实数,,,,其中,,的方差为,,,的方差为,若,则( )
A. B.
C. D.
【变式2】(24-25高一上·山东潍坊·期末)已知一组数据的标准差为3,且,则的方差为 .
【变式3】(23-24高一下·广东广州·期末)已知总体划分为2层,通过分层随机抽样,第层抽取的样本量、样本均值和样本方差分别为.记总样本数据的均值为,总样本数据的方差为.
(1)写出与的计算公式(直接写出结果,不需证明);
(2)某学校有高中学生500人,其中男生300人,女生200人.现采用分层随机抽样的方法抽取样本,并观测样本的指标值(单位:),计算得男生样本的均值为172.5,方差为16,女生样本的均值为162.5,方差为30.
(i)如果已知男、女样本量按比例分配,试计算出总样本的均值与方差;
(ii)如果已知男、女的样本量都是50,试计算出总样本的均值与方差,此时将它们分别作为总体的均值与方差的估计合适吗?请说明理由.
题型10 根据方差、标准差求参数
【例10】(20-21高一下·湖北十堰·期末)已知一组数据的平均数是方差是且这组数据的平方和是这组数据和的平方的,则这组数据的个数是( )
A. B. C. D.
【变式1】(20-21高一下·河南平顶山·期末)设样本数据1,3,,,9的平均数为5,方差为8,则此样本的中位数为( )
A.3 B.4 C.5 D.6
【变式2】(22-23高一下·福建福州·期末)若10个数据的平均数是2,标准差是2,则这10个数据的平方和是 .
【变式3】(22-23高一下·湖北武汉·期末)已知一组数据,,,的平均值为,,删去一个数之后,平均值没有改变,方差比原来大4,则这组数据的个数 .
题型11 各数据同时加减、乘除同一数对方差的影响
【例11】(24-25高一上·江西景德镇·期末)已知一组数,,,的平均数是,方差,则数据,,,的平均数和方差分别为( )
A.11,4 B.8,8 C.11,8 D.4,2
【变式1】(23-24高一下·湖北武汉·期末)已知一组样本数据,,…,()的方差为1.2,则,,⋯,的方差为( ).
A.5 B.6 C.25 D.30
【变式2】(24-25高一上·湖南邵阳·期末)若数据,,…,的方差为3,则数据,,…,的标准差为 .
【变式3】(24-25高一上·甘肃兰州·期末)若的方差为4,且,则新数据的标准差为 .
题型12 估计总体的方差、标准差
【例12】(23-24高一上·浙江绍兴·期末)某校组织高一1班,2班开展数学竞赛,1班40人,2班30人,根据统计分析,两班成绩的方差分别为,.记两个班总成绩的方差为,则( )
A. B. C. D.
【变式1】(22-23高一下·河南开封·期末)在连续六次数学考试中,甲、乙两名同学的考试成绩情况如图,则( )
A.甲同学最高分与最低分的差距低于30分
B.乙同学的成绩一直在上升
C.乙同学六次考试成绩的平均分高于120分
D.甲同学六次考试成绩的方差低于乙同学
【变式2】(23-24高一下·河北张家口·期末)为了解某高中学校暑假学生学习情况,采用分层抽样对该校高中三个年级学生平均每天学习时间(单位:小时)进行统计,得到样本数据如下:
年级
抽样人数
样本平均值
样本方差
高一
30
3
1.5
高二
30
4
2
高三
40
5
3.5
根据上述数据,估计该校三个年级学生平均每天学习时间的方差为 .
【变式3】(20-21高一下·湖北武汉·期末)某中学为了贯策教育部对学生的五项管理中的体质管理,对高一年级学生身高进行调查,在调查中,采用样本量比例分配的分层随机抽样,如果不知道样本数据,只知道抽取了男34人,其平均数和方差分别为170.5和15,抽取了女生16人,其平均数和方差分别为160.5和35.
(1)由这些数据计算总样本的平均数;
(2)由这些数据计算出总样本的方差,并对高一年级全体学生的身高方差作出估计.
参考数据:
【夯实基础】
一、单选题
1.(23-24高一下·浙江金华·期中)数据1,2,3,4,5,6,7,8,9,10的第75百分位数为( )
A.7 B.7.5 C.8 D.8.5
2.(24-25高二上·四川成都·期中)2024年度最具幸福感城市调查推选活动于9月16日正式启动,在100个地级及以上的候选城市名单中,成都市入选.“幸福感指数”是指某个人主观地评价他对自己目前生活状态满意程度的指标,常用区间内的一个数来表示,该数越接近10表示满意度越高,现随机抽取10位成都市居民,他们的幸福感指数分别为4,5,6,7,7,7,8,8,9,9,则下列说法错误的是( )
A.该组数据的第60百分位数为7.5 B.该组数据的极差为5
C.该组数据的平均数为7.5 D.该组数据的中位数为7
3.(21-22高一上·辽宁沈阳·期末)若样本的平均数为10,方差为20,则样本的平均数和方差分别为( )
A.20,35 B.20,40 C.15,75 D.15,80
4.(23-24高一下·北京通州·期中)已知样本数据为:,,,,,,,,,. 去掉一个最大值和一个最小值后的数据与原来的数据相比,下列数字特征的值一定不变的是( )
A.平均数 B.众数 C.极差 D.中位数
二、多选题
5.(24-25高一上·安徽宿州·期末)2021年某地居民人均可支配收入的构成比例如图所示,已知该地居民人均经营净收入为5250元,则( )
A.2021年该地居民人均经营净收入占居民人均可支配收入的21%
B.2021年该地居民人均可支配收入为25000元
C.2021年该地居民人均转移净收入低于人均经营净收入
D.2021年该地居民人均工资性收入比人均转移净收入多6750元
6.(24-25高一上·河南驻马店·期末)某卫星主要用于开展低轨星座系统新技术试验,其主要功能用于记录飞行过程中观测到的低轨行星的数目,已知该卫星连续7天内观测到的低轨行星数目分别为:9,13,12,12,14,10,14,则这组样本数据的( )
A.极差是5 B.众数是12
C.均值是12 D.50%分位数是12.5
三、填空题
7.(23-24高一下·浙江杭州·期末)在对树人中学高一年级学生身高的调查中,采用样本比例分配的分层随机抽样,如果不知道样本数据,只知道抽取了男生20人,其平均数和方差分别为170和10,抽取了女生30人,其平均数和方差分别为160和15.则估计出总样本的方差为 .
8.(24-25高一上·四川·期中)某校举行校园歌手大赛,5名参赛选手的得分分别是9,8.7,9.3,x,8.5,已知这5名参赛选手得分的平均数为9,则这5名参赛选手得分的方差为 .
四、解答题
9.(20-21高一下·浙江宁波·期中)某校对120名考生的数学竞赛成绩进行统计,分成五组,得到如图所示频率分布直方图.
(1)求图中的值;
(2)估计该校学生数学竞赛成绩的平均数;
(3)估计该校学生数学竞赛成绩的第80百分位数落在哪一组.
10.(21-22高一上·山东潍坊·期末)某大学为了解学生对两家餐厅的满意度情况,从在两家餐厅都用过餐的学生中随机抽取了100人,每人分别对这两家餐厅进行满意指数打分(满意指数是指学生对餐厅满意度情况的打分,分数设置为分.根据打分结果按,分组,得到如图所示的频率分布直方图,其中餐厅满意指数在中有30人.
(1)求餐厅满意指数频率分布直方图中的值;
(2)利用样本估计总体的思想,估计餐厅满意指数和餐厅满意指数的平均数及方差(同一组中的数据用该组区间中点值作代表);
参考公式:,其中为的平均数,分别为对应的频率.
(3)如果一名新来同学打算从两家餐厅中选择一个用餐,你建议选择哪个餐厅?说明理由.
【能力提升】
一、单选题
1.(23-24高一下·贵州毕节·期末)某研究小组为了解某市高中生自主阅读情况,随机调查了2000名学生的每周自主阅读时间,按照时长(单位:小时)分成五组:,得到如图所示的频率分布直方图,其中每周自主阅读时间不低于8小时的频率为0.3.则以下说法中错误的是( )
A.
B.估计样本数据的第60百分位数值是7.5小时
C.样本的极差介于6小时至10小时之间
D.估计这2000名学生每周自主阅读时间的平均值是6.5小时
2.(23-24高一下·黑龙江大庆·期末)一个同学投掷10次骰子,记录出现的点数,根据统计结果,在下列情况中一定不能出现点数6的是( )
A.平均数为3,中位数为4
B.中位数为4,众数为3
C.平均数为2,方差为2.1
D.中位数为3,方差为0.85
3.(23-24高一下·青海·期末)某篮球运动员进行投篮训练,共进行了10组,每组投篮55次,每组投篮命中的个数分别为m,n,48,47,48,50,45,47,49,50.已知这组数据的平均数为48,方差为7,则( )
A.10 B. C. D.5
4.(21-22高一下·天津和平·期中)日前,十九大代表、奥运冠军——魏秋月老师在升旗仪式上为耀华师生上了一堂生动的体育思政课,并为耀华排球社的同学们带来了魏秋月名师工作室团队的专业技术指导.其间对同学们垫排球的手势技术动作进行了特别指导.之后排球社的同学为训练动作组织了垫排球比赛,以下为排球社50位同学的垫球个数所做的频率分布直方图,所有同学垫球数都在5-40之间.估计垫球数的样本数据的75%分位数是( )
A.25 B.26 C.27 D.28
二、多选题
5.(24-25高一上·陕西汉中·期末)某地发起“寻找绿色合伙人——低碳生活知识竞赛”活动,从参赛选手的答卷中随机抽取了100份,将成绩分成6组,第1组为,第2组为,…,第6组为,画出如图所示的频率分布直方图,则( )
A.
B.第6组有15个样本
C.从第5,6组中,按组别分层抽取6个样本,则应在第5组抽取3个样本
D.估计参赛选手成绩的中位数在内
6.(24-25高一上·山东日照·期末)已知一组样本数据:2,2,0,2,4,1,3,则下列关于该组样本数据说法正确的是( )
A.极差是4 B.众数不等于平均数
C.方差是 D.分位数是3
三、填空题
7.(24-25高二上·安徽阜阳·期中)某高一班级有40名学生,在一次物理考试中统计出平均分数为70,方差为95,后来发现有2名同学的成绩有误,甲实得70分却记为50分,乙实得60分却记为80分,则更正后的方差是 .
8.(24-25高一上·辽宁沈阳·期末)已知一组数据丢失了其中一个,剩下的六个数据分别是、、、、、,若这组数据的平均数与众数的和是中位数的倍,则丢失数据的所有可能值构成的集合为 .
四、解答题
9.(24-25高一上·江西南昌·期末)随着手机和网络的普及,外卖行业得到迅速的发展.某外卖平台为了解某地区用户对其提供的服务的满意度,随机调查了个用户,得到用户的满意度评分,系统自动将评分按从大到小顺序排列如下:
用户编号
评分
用户编号
评分
用户编号
评分
用户编号
评分
01
97
11
86
21
81
31
76
02
96
12
86
22
81
32
76
03
95
13
85
23
81
33
76
04
93
14
85
24
80
34
75
05
92
15
84
25
79
35
74
06
91
16
84
26
79
36
74
07
89
17
83
27
78
37
73
08
89
18
83
28
78
38
72
09
88
19
82
29
78
39
66
10
88
20
82
30
77
40
63
(1)请你估计该地区所有用户评分的,分位数;
(2)若从这个用户中抽取一个容量为的样本,有一个数据不小心丢失了,抽到的其他个用户的评分分别为,且这个数据的平均数,记这个数据的方差为,若用户的满意度评分在内,则满意度等级为“级”,试用样本估计总体的思想,根据所抽到的个数据,估计该地区满意度等级为“级”的用户所占的百分比.
(3)平台为拓展客流,开发了一个新的评价系统.把(2)中样本的平均数和方差作为老评价系统的数据,且老系统的总数据占两个系统所有数据总和的新系统得出的评分平均数为89分,方差为12.据此计算新老系统所有评分的方差.
附:;参考数据:,,.
10.(24-25高一上·辽宁大连·期末)某公司生产A、B两种型号电动汽车电机,为了了解电机的某项指标,从这两种电机中各抽取100台进行检测,获得该项指标的频率分布直方图,如图所示:
假设数据在组内均匀分布,以样本估计,以事件发生的频率作为相应事件发生的概率.
(1)估计B型电机该项指标的平均值(同一组数据用该组区间中点值为代表);
(2)从A型电机指标在内采用分层抽样方式抽取2件,B型电机指标在内采用分层抽样方式抽取4件,再从这6件中任意抽取2件,求指标在和内各抽取1件的概率;
(3)根据检测结果确定该项指标的一个临界值m,且,某汽车厂准备用A、B两种型号电机生产C牌和D牌汽车各1万辆,有以下两种方案可供选择:
方案一:将A型电机用于生产C牌汽车,其中该指标小于等于临界值m的电机会导致每台汽车损失7000元;将B型电机用于生产D牌汽车,其中该指标大于等于临界值m的电机会导致每台汽车损失3000元;
方案二:重新检测所用的电机,会避免方案一的损失费用,但检测费用共需1010万元.请从汽车厂节约成本的角度考虑,选择合理的方案,并说明理由.
11.(24-25高一上·陕西·期末)某市为提高市民对文明城市创建的认识,举办了“创建文明城市”知识竞赛,从所有答卷中随机抽取100份作为样本,将样本的成绩(满分100分,成绩均为不低于40分的整数)分成六组:,,,,,,得到如图所示的频率分布直方图.
(1)求频率分布直方图中的值与样本成绩的第80百分位数;
(2)在样本答卷成绩为,,的三组市民中,用分层抽样的方法抽取13个,则样本的答卷成绩在中的市民应抽取多少个?
(3)若落在的平均成绩是57,方差是2,落在的平均成绩为69,方差是5,求这两组成绩的总平均数和总方差.
原创精品资源学科网独家享有版权,侵权必究!学科网(北京)股份有限公司6
学科网(北京)股份有限公司
$$
第15讲 用样本估计总体
目录
题型归纳 1
题型01 根据条形统计图、折线统计图和扇形统计图解决实际问题 3
题型02 根据频率分布表解决实际问题 8
题型03 由频率分布直方图计算频率、频数、样本容量、总体容量 12
题型04 总体百分位数的估计 14
题型05 计算几个数的众数、中位数和平均数 16
题型06 根据频率分布直方图估计中位数、平均数 18
题型07 根据平均数求参数 21
题型08 众数、平均数、中位数的比较 24
题型09 计算几个数据的极差、方差、标准差 26
题型10 根据方差、标准差求参数 30
题型11 各数据同时加减、乘除同一数对方差的影响 32
题型12 估计总体的方差、标准差 34
分层练习 38
夯实基础 38
能力提升 45
知识点01频率分布直方图
(1)列出样本数据的频率分布表和频率分布直方图的步骤:
①计算极差:找出数据的最大值与最小值,计算它们的差;
②决定组距与组数:当样本容量不超过100时,按照数据的多少分成5~12组,且;
③将数据分组:通常对组内数值所在区间区左闭右开区间,最后一组取闭区间;也可以将样本数据多取一位小数分组.
④列频率分布表:对落入各小组的数据累计,算出各小数的频数,除以样本容量,得到各小组的频率.
⑤绘制频率分布直方图:以数据的值为横坐标,以的值为纵坐标绘制直方图。
(2)频率分布直方图的特点:
①,
②个小长方形的面积等于1,
③.
(3)频率分布折线图:将频率分布直方图各个长方形上边的中点用线段连接起来,就得到频率分布折线图,
一般把折线图画成与横轴相连,所以横轴左右两端点没有实际意义.
(4)总体密度曲线:样本容量不断增大时,所分组数不断增加,分组的组距不断缩小,
频率分布直方图可以用一条光滑曲线来描绘,这条光滑曲线就叫做总体密度曲线.
总体密度曲线精确地反映了一个总体在各个区域内取值的规律.
知识点02总体百分位数的估计
(1)第p百分位数的定义:一般地,一组数据的第p百分位数是这样一个值,它使得这组数据中至少有p%的数据小于或等于这个值,且至少有(100-p)%的数据大于或等于这个值.
(2)计算一组n个数据的第p百分位数的步骤
第1步,按从小到大排列原始数据.
第2步,计算i=n×p%.
第3步,若i不是整数,而大于i的比邻整数为j,则第p百分位数为第j项数据;
若i是整数,则第p百分位数为第i项与第(i+1)项数据的平均数.
知识点03总体集中趋势的估计
(1)众数:在样本数据中,出现次数最多的那个数据;
(2)中位数:将样本数据按大小顺序排列,若数据的个数为奇数,则最中间的数据为中位数,
若样本数据个数为偶数,则取中间两个数据的平均数作为中位数。
(3)平均数:设样本的数据为,则样本的算术平均数为;
(4)平均数相关结论:
①如果两组数和的平均数分别是和,
则一组数的平均数是;
②如果一组数的平均数为,则一组数的平均数为。
③如果一组数的平均数为,则一组数的平均数为
④根据频率分布直方图求平均数、中位数和众数
平均数:在频率分布直方图中,样本平均数可以用每个小矩形底边中点的横坐标与小矩形的面积的乘积之和近似代替.
中位数:在频率分布直方图中,中位数左边和右边的直方图的面积应该相等.
众数:众数是最高小矩形底边的中点所对应的数据.
知识点04总体离散程度的估计
用样本的标准差估计总体的标准差
(1)数据的离散程度可以用极差、方差或标准差来描述;
(2)极差(又叫全距)是一组数据的最大值和最小值之差,反映一组数据的变动幅度;
(3)样本方差描述了一组数据围绕平均数波动的大小;
一般地,设样本的数据为,样本的平均数为,
定义样本方差为;
简化公式:=
(方差等于原数据平方的平均数减去平均数的平方)
(4)样本的标准差是方差的算术平方根.
样本标准差.
标准差越大数据离散程度越大,数据家分散;标准差越小,数据集中在平均数周围.
(5)方差相关结论:
①如果一组数的方差为,则一组数的方差为;
②如果一组数的方差为,则一组数的方差为。
题型01根据条形统计图、折线统计图和扇形统计图解决实际问题
【例1】(23-24高一下·贵州铜仁·期中)年3月,树人中学组织三个年级的学生进行党史知识竞赛.经统计,得到前名学生分布的饼状图(如图)和前名中高一学生排名分布的频率条形图(如图),则下列命题错误的是( )
A.成绩前名的人中,高一人数比高二人数多30人
B.成绩第1-名的人中,高一人数不超过一半
C.成绩第1-50名的50人中,高三最多有32人
D.成绩第51-名的50人中,高二人数比高一的多
【答案】D
【知识点】根据扇形统计图解决实际问题、根据条形统计图解决实际问题
【分析】求得前名的人中,高一人数和高二人数判断选项A;求得成绩第1-名的人中,高一人数判断选项B;求得成绩第1-50名的50人中,高三最多有多少人判断选项C;求得成绩第51-名的50人中,高二人数与高一人数的关系判断选项D.
【详解】由饼状图,成绩前名的人中,高一人数比高二人数多
(人).故选项A判断正确;
由条形图知,成绩第1-100名的人中,前和后人数相等,
因此高一人数为,故选项B判断正确;
成绩第1-50名的50人中,高一人数为,
因此高三最多有32人. 故选项C判断正确;
成绩第51-名的50人中,高二人数无法确定,故选项D判断错误.
故选:D
【变式1】(23-24高一上·湖南邵阳·期中)近五年来,国内生产总值从54万亿元增加到82.7万亿元,年均增长,占世界经济比重从提高到左右,对世界经济增长贡献率超过,居民消费价格年均上涨,保持较低水平.在2018年2月国家统计局发布了《2017年国民经济和社会发展统计公报》中“2017年居民消费价格月度涨跌幅度”的折线图如图:
说明:在统计学中,同比是指本期统计数据与上一年同期统计数据相比较,
例如:2017年12月与2016年12月相比较;同比增长率=(本期数-同期数)÷同期数.
环比是指本期统计数据与上期统计数据相比较,例如2017年12月与2017年11月相比较:环比增长率=(本期数一上期数)÷上期数×.
根据上述信息,下列结论中错误的是( )
A.从2017年每月的环比增长率看,2017年每月居民消费价格逐月比较有涨有跌
B.从2017年每月的环比增长率看,2017年每月居民消费价格逐月比较1月涨幅最大
C.从2017年每月的同比增长率看,2017年每月居民消费价格与2016年同期比较有涨有跌
D.从2017年每月的同比增长率看,2017年每月居民消费价格与2016年同期比较1月涨幅最大
【答案】C
【知识点】根据折线统计图解决实际问题
【分析】由折线图中数据分析,选出答案.
【详解】A选项,由折线图知,从2017年每月的环比增长率看,有正值,也有负值,
故2017年每月居民消费价格逐月比较有涨有跌,A选项说法正确;
B选项,从2017年每月的环比增长率看,1.0为最大值,
即2017年每月居民消费价格逐月比较1月涨幅最大,B说法正确;
C选项,从2017年每月的同比增长率看,都是正值,
故2017年每月居民消费价格与2016年同期比较只有涨,没有跌,C错误;
D选项,从2017年每月的同比增长率看,2.5为最大值,
故2017年每月居民消费价格与2016年同期比较1月涨幅最大,D说法正确.
故选:C
【变式2】(23-24高一下·广西玉林·期中)某学校组建了演讲,舞蹈,航模,合唱,机器人五个社团,全校所有学生每人都参加且只参加其中一个社团,校团委将统计结果绘制成如下两个不完整的统计图,则合唱社团的人数占全体学生人数的百分比为 .
【答案】
【知识点】根据扇形统计图解决实际问题、根据条形统计图解决实际问题
【分析】根据直方图和饼图中数据求总人数,再由合唱社团人数求其百分比即可.
【详解】由统计图知,演讲社团共有50人,占比,则总人数为人,
又合唱社团共有200人,占比为.
故答案为:
【变式3】(20-21高一下·海南·期末)某人对自己退休前后的工资分配做了详细的规划,各类费用的占比如下面的条形图和扇形图所示:
若他退休前每月工资为9600元,退休后每月储蓄的金额比退休前每月储蓄的金额少1680元,则他退休后每月工资为 元.
【答案】8000
【知识点】根据条形统计图解决实际问题、根据扇形统计图解决实际问题
【分析】先利用退休前每月工资算出退休前每月储蓄金额,再算出退休后每月储蓄的金额,最后利用退休后储蓄比例算出退休后工资.
【详解】退休前每月储蓄的金额为元,
退休后每月储蓄的金额为2880-1680=1200元,
退休后每月工资为元,
故答案为:8000.
题型02 根据频率分布表解决实际问题
【例2】(21-22高一下·新疆乌鲁木齐·期末)一个容量100的样本,其数据的分组与各组的频数如下表
组别
频数
12
13
24
15
16
13
7
则样本数据落在上的频率为( )
A.0.42 B.0.39 C.0.52 D.0.64
【答案】D
【知识点】根据频率分布表解决实际问题
【分析】由频数分布表可直接计算求得结果.
【详解】由频数分布表知:样本数据落在内的频率为.
故选:D.
【变式1】(23-24高一下·广西·阶段练习)一个样本容量为600的频数分布表不小心被损坏了一部分.若样本中数据在内的频率为0.75,则样本中的数据在内的个数为( )
A.225 B.295 C.235 D.305
【答案】C
【知识点】根据频率分布表解决实际问题
【分析】根据题设条件求出数据在内的频数,去掉内的频数即得.
【详解】因为数据在内的频率为0.75,所以数据在内的频数为,
故样本中数据在内的个数为.
故选:C.
【变式2】(22-23高一上·北京顺义·期末)下表是某班10个学生的一次测试成绩,对单科成绩分别评等级:
学生学号
1
2
3
4
5
6
7
8
9
10
数学成绩
140
136
136
135
134
133
128
127
124
语文成绩
102
110
111
126
102
134
97
95
98
在这10名学生中,已知数学成绩为“A等”的有8人,语文成绩为“A等”的有7人,数学与语文两科成绩全是“A等”的有6人,则下列说法中,所有正确说法的序号是 .
①当时,;
②当时,;
③恰有1名学生两科均不是“A等”;
④学号1~6的学生两科成绩全“A等”.
【答案】①③④
【知识点】根据频率分布表解决实际问题
【分析】根据各科成绩排名及“A等”成绩的人数,分别讨论、、时数学成绩为“A等”的情况,、、时语文成绩为“A等”的情况,
最后再结合符合的情况分类讨论数学与语文成绩全是“A等”的情况,即可得出所有符合的情形,最后依次对各序号判断即可.
【详解】当,数学成绩为“A等”的8人从高到低为号;
当,数学成绩为“A等”不为8人,不合题意;
当,数学成绩为“A等”的8人为号.
当,语文成绩为“A等”的7人为号;
当,语文成绩为“A等”不为7人,不合题意;
当,语文成绩为“A等”的7人为号.
故当,时,数学与语文两科成绩全是“A等”的有号,共7人,不合题意;
当,时,数学与语文两科成绩全是“A等”的有号,共6人,符合题意;
当,时,数学与语文两科成绩全是“A等”的有号,共6人,符合题意;
当,时,数学与语文两科成绩全是“A等”的有号,共6人,符合题意.
综上可知:
对①,当时,,①对;
对②,当时,,②错;
对③,当,、,、,时,两科均不是“A等”的学生依次为8、9、10号,均恰有1名,③对;
对④,学号1~6的学生两科成绩全“A等”,④对.
故答案为:①③④
【变式3】(21-22高一下·湖北恩施·期末)某农户从一批待售的苹果中随机抽取100个,对样本中每个苹果称重,数据如下表.
质量(单位,千克)
[0.08,0.09)
[0.09,0.1)
[0.1,0.11)
[0.11,0.12)
[0.12,0.13)
[0.13,0.14]
个数
10
10
20
40
15
5
若将这批苹果按质量大小进行分级,质量不小于0.12千克的苹果为一级果;质量不小于0.1千克且小于0.12千克的苹果为二级果;质量在0.1千克以下的苹果为三级果.
(1)根据以上抽样调查数据,能否认为这批苹果符合“二级果和一级果的数量之和至少要占全部产品的70%”的规定?
(2)若将这批苹果按等级出售,一级果的售价为10元/千克;二级果的售价为8元/千克;三级果的售价为6元/千克经估算,这批苹果有150000个,请问该批苹果的销售收入约为多少元?(问一组中的数据用该组区间的中点值作代表)
【答案】(1)符合规定
(2)183450元
【知识点】根据频率分布表解决实际问题
【分析】(1)根据已知数据计算“二级果和一级果的数量之和的占比可得;
(2)求出一级、二组、三级果品的数量及平均质量后得各级果品质量,从而得总收入.
【详解】(1)由题意可知,样本中二级果和一级果的数量之和占比为.
所以这批苹果符合规定;
(2)由样本知,这批苹果中一级果占20%,二级果占60%,三级果占20%,
所以150000个苹果中一级果有30000个,二级果有90000个,三级果有30000个.
一级果的质量约为千克
三级果的质量约为千克.
三级果的质量约为千克:
总售价约为
所以该苹果的销售收入的为183450元
题型03 由频率分布直方图计算频率、频数、样本容量、总体容量
【例3】(23-24高一下·山东青岛·期末)如果一组数据的频率分布直方图在右边“拖尾”,则下列说法一定错误的是( )
A.数据中可能存在极端大的值 B.这组数据是不对称的
C.数据中众数一定不等于中位数 D.数据的平均数大于中位数
【答案】C
【知识点】由频率分布直方图计算频率、频数、样本容量、总体容量
【分析】根据频率分布直方图的性质结合样本的数字特征即可判断.
【详解】数据的频率分布直方图在右边“拖尾”,则其图单峰不对称,故B正确;其大致图如下:
由图可知数据中可能存在极端大的值,故A正确;
由于“右拖尾”时最高峰偏左,中位数靠近高峰处,可能与众数相等,故C错误;
平均数靠近中点处,平均数容易受极端值的影响,与中位数相比,平均数总是在“拖尾”那边,故D正确;
故选:C
【变式1】(23-24高一下·湖南邵阳·期末)某校高一年级有800名学生选学物理,将某次联考的物理成绩绘制成的频率分布直方图如图所示,则高一年级这次联考的物理成绩位于区间的人数约为( )
A.200 B.220 C.240 D.260
【答案】C
【知识点】由频率分布直方图计算频率、频数、样本容量、总体容量
【分析】根据频率和为可构造方程求得的值,再由频率分布直方图可求得成绩落在的频率,由样本估计总体可计算得到结果.
【详解】,
成绩落在的频率为,则成绩位于区间的人数约为(人).
故选:C.
【变式2】(24-25高一上·江西·期末)某校60名同学数学竞赛的成绩(满分:100分)均在之间,进行适当分组后(每组为左闭右开区间),画出频率分布直方图如图所示,若从这60名参赛者中随机选取1人,试估计其成绩在的概率为 .
【答案】0.05
【知识点】由频率分布直方图计算频率、频数、样本容量、总体容量
【分析】由频率分布直方图的性质面积和为1,即可求解;
【详解】由图可知,,解得,
成绩在的频率为,以频率为概率估计概率为0.05.
故答案为:0.05
【变式3】(23-24高一下·广东潮州·期末)某校为了解全校高中学生五一小长假参加实践活动的情况,抽查了100名学生,统计他们假期参加实践活动的时间,绘成的频率分布直方图如图所示.这100名学生中参加实践活动时间在4~10小时内的人数为 .
【答案】82
【知识点】由频率分布直方图计算频率、频数、样本容量、总体容量
【分析】由频率分布直方图求出时间在4~10小时内的频率,再求人数.
【详解】依题意,100名学生中参加实践活动的时间在4~10小时内的人数为:
,
即这100名学生中参加实践活动时间在4~10小时内的人数为82.
故答案为:82.
题型04 总体百分位数的估计
【例4】(24-25高一上·湖南邵阳·期末)数据53,62,78,67,98,32,42,12,90的第三四分位数是( )
A.67 B.42 C.62 D.78
【答案】D
【知识点】总体百分位数的估计
【分析】由分位数的定义即可得解.
【详解】这组数据共9个数,从小到大排列是12,32,42,53,62,67,78,90,98,
,所以第三四分位数是第7个数,即.
故选:D.
【变式1】(24-25高一上·广西钦州·期末)我国2024年4月至11月太阳能发电量同比增长速度依次为21.4%,29.1%,18.1%,16.4%,21.7%,12.7%,12.6%,10.3%,则这组数据的75%分位数为( )
A.21.55% B.21.65% C.21.4% D.21.7%
【答案】A
【知识点】总体百分位数的估计
【分析】把给定的数据由小到大排列,再利用百分位数的定义求解即得.
【详解】将这组数据从小到大排列为10.3%,12.6%,12.7%,16.4%,18.1%,21.4%,21.7%,29.1%.
因为,所以这组数据的75%分位数为.
故选:A
【变式2】(24-25高一上·江西·期末)已知一组数据、、、、、、、,这组数据的分位数是 .
【答案】
【知识点】总体百分位数的估计
【分析】将数据由小到大排序,结合百分位数的定义判断可得出结果.
【详解】将这组数据由小到大排序为:、、、、、、、,共个数,
因为,因此,这组数据的分位数是.
故答案为:.
【变式3】(24-25高一上·陕西汉中·期末)数据1,2,3,4,5,6,7,8的分位数为 .
【答案】7
【知识点】总体百分位数的估计
【分析】借助百分位数定义计算即可得.
【详解】因为,
且数据已经从小到大排列,
故第七个数据即为分位数,为7,
故答案为:7.
题型05 计算几个数的众数、中位数和平均数
【例5】(20-21高一下·陕西宝鸡·期中)某学生所得分数为、、、、、、,这组数据的众数是( )
A. B. C. D.
【答案】C
【知识点】计算几个数的众数
【分析】利用众数的定义可得结果.
【详解】由众数的定义可知,这组数据的众数为.
故选:C.
【变式1】(23-24高一下·吉林·期末)已知样本数据:6,5,7,8,9,6,则这组样本数据的中位数为( )
A.6 B.6.5 C.7 D.7.5
【答案】B
【知识点】计算几个数的中位数
【分析】将给定的数据由小到大排列,再利用中位数的定义求解即得.
【详解】样本数据由小到大排列为:5,6,6,7,8,9,
所以这组样本数据的中位数为.
故选:B
【变式2】(23-24高一下·天津滨海新·期末)已知一组样本数据:3,4,4,4,6,6,7,8,8,则该组样本数据的众数为 ,中位数为 .
【答案】 4 6
【知识点】计算几个数的中位数、计算几个数的众数
【分析】根据众数、中位数的定义判断即可.
【详解】依题意可得该组样本数据的众数为,中位数为.
故答案为:;
【变式3】(23-24高一下·吉林白城·期末)如图所示,某学校高一(1)班期中考试成绩的统计图.根据该图可估计,这次考试的平均成绩为 分.
【答案】46
【知识点】计算几个数的平均数
【分析】根据统计图结合平均数公式运算求解.
【详解】根据题中统计图,可知有4人成绩在之间,估计其考试分数之和为;
有8人成绩在之间,估计其考试分数之和为;
有10人成绩在之间,估计其考试分数之和为;
有6人成绩在之间,估计其考试分数之和为;
有2人成绩在之间,估计其考试分数之和为,
由此可知,考生人数为,
考试总成绩为,所以估计平均分数为.
故答案为:46.
题型06 根据频率分布直方图估计中位数、平均数
【例6】(23-24高一下·河北张家口·期末)某时间段公路上车速的频率分布直方图如图所示,则( )
A. B.车速的众数估计值是70
C.车速的平均数估计值大于其中位数的估计值 D.车速的中位数估计值是62.5
【答案】D
【知识点】根据频率分布直方图计算众数、由频率分布直方图估计平均数、由频率分布直方图估计中位数、补全频率分布直方图
【分析】利用频率分布直方图求出、众数、平均数、中位数判断即得.
【详解】对于A,由,得,A错误;
对于B,车速在内的频率最大,车速的众数估计值是65,B错误;
对于C,车速的平均数为,
车速的中位数,则,解得,C错误;
对于D,车速的中位数估计值是62.5.
故选:D
【变式1】(23-24高一下·山东济南·期末)如图,已知某频率分布直方图形成“右拖尾”形态,则下列结论正确的是( )
A.众数平均数中位数 B.众数中位数平均数
C.众数平均数中位数 D.中位数平均数众数
【答案】B
【知识点】根据频率分布直方图计算众数、由频率分布直方图估计平均数、由频率分布直方图估计中位数
【分析】根据平均数,中位数,众数的概念结合图形分析判断.
【详解】由频率直方图可得,单峰不对称且“右拖尾”,最高峰偏左,众数最小,
平均数易受极端值的影响,与中位数相比,平均数总是在“拖尾”那边,
故平均数大于中位数,所以众数中位数平均数.
故选:B
【变式2】(23-24高一下·四川达州·期末)在某次考试成绩中随机抽取50个,成绩均在之间,将这些成绩共分成五组:,,,,,得到如图所示的频率分布直方图,由图中数据估计总体的众数和中位数(中位数精确到个位)分别是( ).
A.65,70 B.65,71 C.65,72 D.65,73
【答案】D
【知识点】根据频率分布直方图计算众数、由频率分布直方图估计中位数
【分析】本题根据众数和中位数的概念以及在频率分布直方图的表达方法即可计算求解.
【详解】众数是频率分布直方图中最高的矩形的中点的坐标,即众数为,
设把频率分布直方图分成两个面积相等部分的平行于y轴的直线横坐标为,
先求图中的a值,由得,,
则,所以.
故选:D.
【变式3】(23-24高一下·云南大理·期末)平均数、中位数和众数都是刻画一组数据的集中趋势的信息,它们的大小关系和数据分布的形态有关.在下图分布形态中,分别对应这组数据的中位数、平均数和众数,则的大小关系为 .
【答案】
【知识点】根据频率分布直方图计算众数、由频率分布直方图估计平均数、由频率分布直方图估计中位数
【分析】利用数据往右拖尾,即平均数大于中位数,再利用众数是用最高矩形的中点值来估计,可以判断众数小于中位数,这样即可作出判断.
【详解】根据直方图矩形高低以及数据的分布趋势判断,可得出结论:众数是最高矩形的中点横坐标,因此众数在第二列的中点处.
因为直方图第一、二、三、四列高矩形较多,且在右边拖尾低矩形有三列,所以中位数大于众数,
右边拖尾的有三列,所以平均数大于中位数,因此有.
故答案为:.
题型07 根据平均数求参数
【例7】(23-24高一下·广西南宁·期末)高二(1)班有40名学生,其中男生有16名,已知男生平均体重为,总平均体重为,则女生的平均体重约为( )
A. B. C. D.
【答案】B
【知识点】根据平均数求参数
【分析】设女生的平均体重为,根据平均数的计算公式列式求解即可.
【详解】由题意可知:高二(1)班有24名女生,有16名男生,
设女生的平均体重为,
则,解得.
故选:B.
【变式1】(22-23高一下·河北沧州·期末)一组数据,5,6,7,7,8,11,12的平均数为8,则这组数据的中位数为( )
A.6.5 B.7 C.7.5 D.8
【答案】C
【知识点】根据平均数求参数、计算几个数的中位数
【分析】先由平均数可求出,再根据中位数的定义判定即可.
【详解】由题意得,解得,
故这组数据的中位数为.
故选:C.
【变式2】(21-22高一上·辽宁营口·期末)某班有30名男生,20名女生,其中男生平均身高为,全班平均身高为,女生的平均身高为 .
【答案】
【知识点】根据平均数求参数
【分析】设全班女生的平均身高为,故根据题意得,解方程即可得答案.
【详解】解:设全班女生的平均身高为,
因为该班有30名男生,20名女生,其中男生平均身高为,全班平均身高为,
所以,解得
所以女生的平均身高为.
故答案为:
【变式3】(20-21高一下·江西南昌·期末)马芸的某次语数外考试成绩都是两位数,成绩单被色彩笔弄脏,只能看到语文十位数字是8,数学成绩个位数字是7,英语成绩95,若他平均成绩是93,则他的数学成绩是 .
【答案】97
【知识点】根据平均数求参数
【分析】设语文成绩为分,数学成绩为分,根据平均数的计算公式,列出方程求得,得到的值,即可求解.
【详解】设他的语文成绩为分,数学成绩为分,其中,且,
因为他平均成绩是,可得,解得,
所以,所以其数学成绩为.
故答案为:.
题型08 众数、平均数、中位数的比较
【例8】(22-23高一下·广东东莞·期末)平均数和中位数都描述了数据的集中趋势,它们的大小关系和数据分布的形态有关.下面四幅频率分布直方图中,最能说明平均数大于中位数的是( )
A. B.
C. D.
【答案】A
【知识点】众数、平均数、中位数的比较
【分析】对于单峰频率分布直方图来说,如果直方图的形状是对称的,那么平均数和中位数大体相等,和中位数相比,平均数总在“长尾巴”那边.
【详解】对于图象对称,平均数和中位数相等,中图象尾巴向右拖,中图象尾巴靠左拖,故正确.
故选:.
【变式1】(20-21高一下·河北·期末)某校举行校园歌手大赛,6位评委对某选手的评分分别为9.2,9.5,8.8,9.9,8.9,9.5,设该选手得分的平均数为x,中位数为y,众数为z,则( )
A. B. C. D.
【答案】A
【知识点】众数、平均数、中位数的比较
【分析】根据平均数,中位数,众数的概念,分别求出,即可求出结果.
【详解】由题意可得,,,,
则.
故选:A.
【变式2】(20-21高一·全国)下列数字特征一定会在原始数据中出现的是( )
A.众数 B.中位数 C.平均数 D.都不会
【答案】A
【知识点】众数、平均数、中位数的比较
【分析】根据特征数字的定义即可作出判断.
【详解】众数是在一组数据中出现次数最多的数,所以一定会在原始数据中出现.
故选:A.
【变式3】(21-22高一上·湖南长沙·期末)为了落实习主席提出“绿水青山就是金山银山”的环境治理要求.某市政府积极鼓励居民节约用水.计划调整居民生活用水收费方案.拟确定一个合理的月用水量标准x(吨).一位居民的月用水量不超过x的部分按平价收费.超出x的部分按议价收费.为了了解居民用水情况.通过抽样.获得了某年200位居民每人的月均用水量(单位:吨).将数据按照[0.1).[1.2).….[8.9)分成9组.制成了如图所示的频率分布直方图.其中0.4a=b.
(1)求直方图中a.b的值.并由频率分布直方图估计该市居民用水量的众数;
(2)若该市政府希望使85%的居民每月的用水量不超过标准x(吨).估计x的值.
【答案】(1)a=0.15.b=0.06,众数为4.5吨.
(2)5.8
【知识点】众数、平均数、中位数的比较、频率分布直方图的实际应用、补全频率分布直方图
【分析】(1)由频率直方图的面积和为建立方程组.由此即可求出的值.再根据估计众数的定义即可求解;
(2)分别求出前组.前组的频率和,估计出的范围.再根据范围建立方程,由此即可求解.
【详解】(1)由题意可得 .
解得,.
由频率分布直方图估计该市居民用水量的众数为吨.
(2)因为前6组的频率和为,
前5组的频率和为.
所以,由,解得,
所以估计月用水量标准为吨时,的居民每月的用水量不超过标准.
题型09 计算几个数据的极差、方差、标准差
【例9】(23-24高一下·浙江宁波·期中)甲乙丙丁四位同学各掷5次骰子并记录点数,方差最大的是( )
甲:4 5 4 5 5 乙:4 2 3 4 3
丙:2 3 2 3 4 丁:6 1 2 6 1
A.甲 B.乙 C.丙 D.丁
【答案】D
【知识点】计算几个数据的极差、方差、标准差
【分析】根据条件,利用方差的定义,分别求出甲乙丙丁四位同学各掷5次骰子的点数的方差,即可求出结果.
【详解】由题知,所以,
,所以,
,所以,
,所以,
所以方差最大的是丁,
故选:D.
【变式1】(24-25高一上·江西·期末)已知四个不同的实数,,,,其中,,的方差为,,,的方差为,若,则( )
A. B.
C. D.
【答案】B
【知识点】计算几个数据的极差、方差、标准差
【分析】利用方差的定义,带字母进行运算,再利用相等关系进行变形化简即可得结果.
【详解】
,
同理,
由题意得,
即,整理可得,
因为,所以.
故选:B.
【变式2】(24-25高一上·山东潍坊·期末)已知一组数据的标准差为3,且,则的方差为 .
【答案】36
【知识点】计算几个数据的极差、方差、标准差
【分析】利用方差的定义计算可得结论.
【详解】因为,又数据的标准差为3,
所以,
又,
所以
.
故答案为:.
【变式3】(23-24高一下·广东广州·期末)已知总体划分为2层,通过分层随机抽样,第层抽取的样本量、样本均值和样本方差分别为.记总样本数据的均值为,总样本数据的方差为.
(1)写出与的计算公式(直接写出结果,不需证明);
(2)某学校有高中学生500人,其中男生300人,女生200人.现采用分层随机抽样的方法抽取样本,并观测样本的指标值(单位:),计算得男生样本的均值为172.5,方差为16,女生样本的均值为162.5,方差为30.
(i)如果已知男、女样本量按比例分配,试计算出总样本的均值与方差;
(ii)如果已知男、女的样本量都是50,试计算出总样本的均值与方差,此时将它们分别作为总体的均值与方差的估计合适吗?请说明理由.
【答案】(1)答案见解析
(2)(i)均值为(),方差为;(ii)均值为(),方差为,不合适,理由见解析
【知识点】计算几个数的平均数、计算几个数据的极差、方差、标准差
【分析】(1)写出分层抽样的均值与方差公式即可;
(2)(i)按男女生比例抽取样本,可按相应公式计算均值和方差;(ii)已知样本量,可按样本量所占比计算均值与方差,但不具代表性,个体不是等概率抽取的.
【详解】(1)依题意可得,
.
(2)(i)男、女的样本量按比例分配,
则总样本的均值为(),
总样本的方差为;
(ii)男、女的样本量都是,
总样本的均值为(),
总样本的方差为,
不能作为总体均值和方差的估计,因为分层抽样中未按比例抽样,总体中每个个体被抽到的可能性不完全相同,因而样本的代表性差.
题型10 根据方差、标准差求参数
【例10】(20-21高一下·湖北十堰·期末)已知一组数据的平均数是方差是且这组数据的平方和是这组数据和的平方的,则这组数据的个数是( )
A. B. C. D.
【答案】B
【知识点】根据方差、标准差求参数、根据平均数求参数
【分析】设这组数据分别为,根据平均数公式及方差公式即可得的,,从而得到,再依题意得到方程,解得即可;
【详解】解:设这组数据分别为,
则,
所以
所以
从而.
因为这组数据的平方和是这组数据和的平方的,
所以,
解得或(舍去).
故选:B
【变式1】(20-21高一下·河南平顶山·期末)设样本数据1,3,,,9的平均数为5,方差为8,则此样本的中位数为( )
A.3 B.4 C.5 D.6
【答案】C
【知识点】根据方差、标准差求参数、根据平均数求参数、计算几个数的中位数
【分析】根据题意列方程得且,进而解方程即可求解.
【详解】解:由题知,
,
整理得:,,
进而解方程得:或
所以该样本数据1,3,,,9,中位数为
故选:C
【变式2】(22-23高一下·福建福州·期末)若10个数据的平均数是2,标准差是2,则这10个数据的平方和是 .
【答案】80
【知识点】根据方差、标准差求参数
【分析】确定数据的方差,根据方差的计算公式化简,即可得答案.
【详解】由题意可设这10个数据为,其方差为,
则
,
故,
故答案为:.
【变式3】(22-23高一下·湖北武汉·期末)已知一组数据,,,的平均值为,,删去一个数之后,平均值没有改变,方差比原来大4,则这组数据的个数 .
【答案】9
【知识点】根据方差、标准差求参数
【分析】因删除一个数平均值没有改变,所以删除的数为均值5,根据方差公式可以求.
【详解】由题意删去一个数之后,平均值没有改变,所以删除的数为5,
由题意,得,
删除一个数后的方差为:
得,即,
故答案为:9
题型11 各数据同时加减、乘除同一数对方差的影响
【例11】(24-25高一上·江西景德镇·期末)已知一组数,,,的平均数是,方差,则数据,,,的平均数和方差分别为( )
A.11,4 B.8,8 C.11,8 D.4,2
【答案】C
【知识点】各数据同时乘除同一数对方差的影响、各数据同时加减同一数对方差的影响
【分析】根据数据()的平均数、方差分别、求解.
【详解】根据题意,数,,,的平均数是,方差,
则,,,的平均数为,
方差为.
故选:C
【变式1】(23-24高一下·湖北武汉·期末)已知一组样本数据,,…,()的方差为1.2,则,,⋯,的方差为( ).
A.5 B.6 C.25 D.30
【答案】D
【知识点】各数据同时乘除同一数对方差的影响、各数据同时加减同一数对方差的影响
【分析】利用方差的性质求解.
【详解】数据的方差为1.2,
,,……的方差为:.
故选:D.
【变式2】(24-25高一上·湖南邵阳·期末)若数据,,…,的方差为3,则数据,,…,的标准差为 .
【答案】
【知识点】各数据同时加减同一数对方差的影响、各数据同时乘除同一数对方差的影响
【分析】应用方差的性质计算新数据的方差,再计算标准差即可.
【详解】因为数据,,…,的方差为3,则数据,,…,的方差为,
则数据,,…,的标准差为.
故答案为:.
【变式3】(24-25高一上·甘肃兰州·期末)若的方差为4,且,则新数据的标准差为 .
【答案】6
【知识点】各数据同时加减同一数对方差的影响、各数据同时乘除同一数对方差的影响
【分析】根据方差的性质,结合题中条件,可直接求出新数据的方差,进而可得标准差.
【详解】因为的方差为,,
所以的方差为,故标准差为6
故答案为:6
题型12 估计总体的方差、标准差
【例12】(23-24高一上·浙江绍兴·期末)某校组织高一1班,2班开展数学竞赛,1班40人,2班30人,根据统计分析,两班成绩的方差分别为,.记两个班总成绩的方差为,则( )
A. B. C. D.
【答案】B
【知识点】估计总体的方差、标准差
【分析】借助分层抽样的方差公式计算即可得.
【详解】设两个班的平均分分别为,,两个班的总的平均分为,
则
.
故选:B.
【变式1】(22-23高一下·河南开封·期末)在连续六次数学考试中,甲、乙两名同学的考试成绩情况如图,则( )
A.甲同学最高分与最低分的差距低于30分
B.乙同学的成绩一直在上升
C.乙同学六次考试成绩的平均分高于120分
D.甲同学六次考试成绩的方差低于乙同学
【答案】C
【知识点】估计总体的方差、标准差、根据折线统计图解决实际问题
【分析】利用直接观察图表的方式,结合极差、平均数、方差的定义,可得答案.
【详解】对于A,由图可知,甲同学的最高分大约为,最低分大约为,其差值大约为,则其差值不能确定是否低于,故A错误;
对于B,由图可知,乙同学在第次的考试成绩是一直下降的,故B错误;
对于C,由图可知,乙同学在次考试中有成绩在分以上,且其中有次在130分以上,
另两次成绩,次约为分,次约为110分,所以乙同学的这六次考试成绩的平均分高于120分,故C正确;
对于D,由于甲同学成绩波动较大,则甲同学六次成绩方差大,故D错误.
故选:C.
【变式2】(23-24高一下·河北张家口·期末)为了解某高中学校暑假学生学习情况,采用分层抽样对该校高中三个年级学生平均每天学习时间(单位:小时)进行统计,得到样本数据如下:
年级
抽样人数
样本平均值
样本方差
高一
30
3
1.5
高二
30
4
2
高三
40
5
3.5
根据上述数据,估计该校三个年级学生平均每天学习时间的方差为 .
【答案】3.14
【知识点】估计总体的方差、标准差
【分析】分别由总样本的平均数公式和总样本方差公式求解即可.
【详解】由高中三个年级学生的总样本平均数为:
可得.
总样本方差为:
.
故答案为:3.14
【变式3】(20-21高一下·湖北武汉·期末)某中学为了贯策教育部对学生的五项管理中的体质管理,对高一年级学生身高进行调查,在调查中,采用样本量比例分配的分层随机抽样,如果不知道样本数据,只知道抽取了男34人,其平均数和方差分别为170.5和15,抽取了女生16人,其平均数和方差分别为160.5和35.
(1)由这些数据计算总样本的平均数;
(2)由这些数据计算出总样本的方差,并对高一年级全体学生的身高方差作出估计.
参考数据:
【答案】(1)
(2)
【知识点】估计总体的方差、标准差、计算几个数据的极差、方差、标准差、计算几个数的平均数
【分析】(1)先根据男女平均数算出各自的数据的总和,将它们相加再算出整个样本的总和,则总样本的平均数可求;
(2)由分层方差公式可得,则样本总体方差可求,继而高一年级全体学生的身高方差可估计.
【详解】(1)把男生样本记为,其平均数记为,方差记为;
把女生样本记为,其平均数记为,方差记为;
把总样本数据的平均数记为,方差记为.
则,
故.
(2)由分层方差公式可得
.
据此估计高一总方差为.
【夯实基础】
一、单选题
1.(23-24高一下·浙江金华·期中)数据1,2,3,4,5,6,7,8,9,10的第75百分位数为( )
A.7 B.7.5 C.8 D.8.5
【答案】C
【分析】利用百分位数的求法计算即可.
【详解】易知,则该组数据的第八个数8为第75百分位数.
故选:C
2.(24-25高二上·四川成都·期中)2024年度最具幸福感城市调查推选活动于9月16日正式启动,在100个地级及以上的候选城市名单中,成都市入选.“幸福感指数”是指某个人主观地评价他对自己目前生活状态满意程度的指标,常用区间内的一个数来表示,该数越接近10表示满意度越高,现随机抽取10位成都市居民,他们的幸福感指数分别为4,5,6,7,7,7,8,8,9,9,则下列说法错误的是( )
A.该组数据的第60百分位数为7.5 B.该组数据的极差为5
C.该组数据的平均数为7.5 D.该组数据的中位数为7
【答案】C
【分析】根据百分位数的计算即可判断A,根据极差的定义即可求解B,根据平均数的计算即可求解C,根据中位数的计算即可求解D.
【详解】A选项:,因此该组数据的第60百分位数为,故A正确;
B选项:该组数据最大为9,最小为4,因此极差为,故B正确;
C选项:该组数据的平均数为,故C错误;
D选项:该组数据的中位数为第五个和第六个数据的平均值7,故D正确,
故选:C.
3.(21-22高一上·辽宁沈阳·期末)若样本的平均数为10,方差为20,则样本的平均数和方差分别为( )
A.20,35 B.20,40 C.15,75 D.15,80
【答案】D
【分析】根据平均数、方差的运算性质进行求解即可.
【详解】由题得样本,的平均数为,方差为.
故选:D
4.(23-24高一下·北京通州·期中)已知样本数据为:,,,,,,,,,. 去掉一个最大值和一个最小值后的数据与原来的数据相比,下列数字特征的值一定不变的是( )
A.平均数 B.众数 C.极差 D.中位数
【答案】D
【分析】由平均数、众数、极差和中位数的定义可直接判断.
【详解】样本数据为,,,,,,,,,,
去掉一个最大值和一个最小值后的数据与原来的数据相比,假设从小到大就是从到,极差和众数可能变化,故BC错;
平均数为,可能变,故A错;
中位数还是按从小到大排序中间两个数的平均数,即,故D正确;
故选:D.
二、多选题
5.(24-25高一上·安徽宿州·期末)2021年某地居民人均可支配收入的构成比例如图所示,已知该地居民人均经营净收入为5250元,则( )
A.2021年该地居民人均经营净收入占居民人均可支配收入的21%
B.2021年该地居民人均可支配收入为25000元
C.2021年该地居民人均转移净收入低于人均经营净收入
D.2021年该地居民人均工资性收入比人均转移净收入多6750元
【答案】ABD
【分析】利用给定的饼状图,逐项分析计算判断.
【详解】对于A,2021年该地居民人均经营净收入占居民人均可支配收入的百分比为,A正确;
对于B,2021年该地居民人均可支配收入为(元),B正确;
对于C,由,得2021年该地居民人均转移净收入高于人均经营净收入,C错误;
对于D,2021年该地居民人均工资性收入为(元),
人均转移净收入为(元),,D正确.
故选:ABD
6.(24-25高一上·河南驻马店·期末)某卫星主要用于开展低轨星座系统新技术试验,其主要功能用于记录飞行过程中观测到的低轨行星的数目,已知该卫星连续7天内观测到的低轨行星数目分别为:9,13,12,12,14,10,14,则这组样本数据的( )
A.极差是5 B.众数是12
C.均值是12 D.50%分位数是12.5
【答案】AC
【分析】对于A,根据极差的定义分析判断,对于B,根据众数的定义分析判断,对于C,根据平均数的定义计算判断,对于D,根据百分位数的定义计算判断.
【详解】对于A,这7个数的极差为,所以A正确,
对于B,这7个数的众数为12和14,所以B错误,
对于C,这7个数的均值为,所以C正确,
对于D,这7个数从小到大排列依次为9,10,12,12,13,14,14,
因为,所以这组数的50%分位数是12,所以D错误.
故选:AC
三、填空题
7.(23-24高一下·浙江杭州·期末)在对树人中学高一年级学生身高的调查中,采用样本比例分配的分层随机抽样,如果不知道样本数据,只知道抽取了男生20人,其平均数和方差分别为170和10,抽取了女生30人,其平均数和方差分别为160和15.则估计出总样本的方差为 .
【答案】37
【分析】按男女生比例抽取样本,结合相应公式计算均值和方差即可.
【详解】由题意知,
总样本的平均数为,
总样本的方差为.
故答案为:37
8.(24-25高一上·四川·期中)某校举行校园歌手大赛,5名参赛选手的得分分别是9,8.7,9.3,x,8.5,已知这5名参赛选手得分的平均数为9,则这5名参赛选手得分的方差为 .
【答案】
【分析】根据平均数与方差的概念,进行计算即可.
【详解】数据9,8.7,9.3,x,8.5的平均数是9,
所以,解得;
所以这组数据的方差为.
故答案为:.
四、解答题
9.(20-21高一下·浙江宁波·期中)某校对120名考生的数学竞赛成绩进行统计,分成五组,得到如图所示频率分布直方图.
(1)求图中的值;
(2)估计该校学生数学竞赛成绩的平均数;
(3)估计该校学生数学竞赛成绩的第80百分位数落在哪一组.
【答案】(1);(2);(3)
【分析】(1)利用各组频率和为1,列方程可求出的值;
(2)由频率分布直方图计算平均数的公式直接计算平均数即可;
(3)由于频率为,的频率,从而估计即可
【详解】(1)由,
从而.
(2)平均数分.
(3)因为的频率为,
的频率为,
所以估计该校学生数学竞赛成绩的第80百分位数落在内
10.(21-22高一上·山东潍坊·期末)某大学为了解学生对两家餐厅的满意度情况,从在两家餐厅都用过餐的学生中随机抽取了100人,每人分别对这两家餐厅进行满意指数打分(满意指数是指学生对餐厅满意度情况的打分,分数设置为分.根据打分结果按,分组,得到如图所示的频率分布直方图,其中餐厅满意指数在中有30人.
(1)求餐厅满意指数频率分布直方图中的值;
(2)利用样本估计总体的思想,估计餐厅满意指数和餐厅满意指数的平均数及方差(同一组中的数据用该组区间中点值作代表);
参考公式:,其中为的平均数,分别为对应的频率.
(3)如果一名新来同学打算从两家餐厅中选择一个用餐,你建议选择哪个餐厅?说明理由.
【答案】(1),
(2)餐厅满意指数的平均数和方差分别为,;餐厅满意指数的平均数和方差分别为,
(3)答案见解析
【分析】(1)根据频率的含义和性质列方程,即可解得:,;
(2)根据平均数和方差的定义,然后运算即可;
(3)平均数和方差在实际生活中的应用,平均满意度越高,就越会受到欢迎.
【详解】(1)因为餐厅满意指数在中有30人,则有:
解得:
根据总的频率和为1,则有:
解得:
综上可得:,
(2)设餐厅满意指数的平均数和方差分别为餐厅满意指数的平均数和方差分别为,则有:
,
,
,
,
综上可得:餐厅满意指数的平均数和方差分别为,;餐厅满意指数的平均数和方差分别,
(3)答案一:餐厅满意指数的平均数为,方差为,餐厅满意指数的平均数为,方差为,因为,所以推荐餐厅;
答案二:餐厅满意指数在的频率为,在的频率为,餐厅满意指数在和的频率都为,所以推荐餐厅;
(答案不唯一,符合实际情况即可)
【能力提升】
一、单选题
1.(23-24高一下·贵州毕节·期末)某研究小组为了解某市高中生自主阅读情况,随机调查了2000名学生的每周自主阅读时间,按照时长(单位:小时)分成五组:,得到如图所示的频率分布直方图,其中每周自主阅读时间不低于8小时的频率为0.3.则以下说法中错误的是( )
A.
B.估计样本数据的第60百分位数值是7.5小时
C.样本的极差介于6小时至10小时之间
D.估计这2000名学生每周自主阅读时间的平均值是6.5小时
【答案】D
【分析】A项,由已知频率可得关系;B项,由各组频率之和为与A项所得频率关系求解,由,估计第60百分位数值所在区间,再利用矩形面积计算估值即可;C项,由最大值与最小值的取值区间,再由不等式的性质可得极差范围;D项,样本平均数由每个小矩形底边中点的横坐标与小矩形的面积(频率)的乘积之和近似代替,计算可得.
【详解】选项A,由每周自主阅读时间不低于8小时的频率为0.3,
则,解得,故A正确;
选项B,由各组频率之和为得,,
联立解得,
故五组的频率分别为,
因为前两组的频率之和为,前三组的频率之和为,
且,
设样本数据的第60百分位数值为,则,
由,解得,
故估计样本数据的第60百分位数值是7.5小时,故B正确;
选项C,设样本数据中的最小值为,最大值为,
由频率分布直方图可知,最小值,最大值,
所以,则由不等式的性质可得极差,
即样本的极差介于6小时至10小时之间,故C正确;
选项D,由频率分布直方图样本平均数的近似值为,
估计这2000名学生每周自主阅读时间的平均值是小时,故D错误.
故选:D.
2.(23-24高一下·黑龙江大庆·期末)一个同学投掷10次骰子,记录出现的点数,根据统计结果,在下列情况中一定不能出现点数6的是( )
A.平均数为3,中位数为4
B.中位数为4,众数为3
C.平均数为2,方差为2.1
D.中位数为3,方差为0.85
【答案】C
【分析】举例判断ABD,C用反证法证明不能出现6.
【详解】对于A,10次点数为符合题意,故A错误;
对于B,10次点数为符合题意,故B错误
;
对于C,设10次点数为,且,平均数为,
假设有一次点数为6,不妨设,
由方差公式,
代入,,,
则,则最大取4,
不妨设,则,方程无解,故,
当,,最大取3,
不妨设,则,则,
则这10次点数为,但平均数为,不合题意,故;
当时,,方程无解,故;
当时,,方程无解,
综上所述,假设有一次点数为6不成立,故C正确;
对于D,10次点数为符合题意,故D错误
;
故选:C.
3.(23-24高一下·青海·期末)某篮球运动员进行投篮训练,共进行了10组,每组投篮55次,每组投篮命中的个数分别为m,n,48,47,48,50,45,47,49,50.已知这组数据的平均数为48,方差为7,则( )
A.10 B. C. D.5
【答案】A
【分析】根据平均数与方差的公式列方程可得解.
【详解】因为这组数据的平均数为48,方差为7,
所以
整理得
设,则,
因为50,所以,即,
则.
故选:A
4.(21-22高一下·天津和平·期中)日前,十九大代表、奥运冠军——魏秋月老师在升旗仪式上为耀华师生上了一堂生动的体育思政课,并为耀华排球社的同学们带来了魏秋月名师工作室团队的专业技术指导.其间对同学们垫排球的手势技术动作进行了特别指导.之后排球社的同学为训练动作组织了垫排球比赛,以下为排球社50位同学的垫球个数所做的频率分布直方图,所有同学垫球数都在5-40之间.估计垫球数的样本数据的75%分位数是( )
A.25 B.26 C.27 D.28
【答案】D
【分析】根据频率分布直方图,结合分位数计算公式即可求解
【详解】垫球数在的人数为,占总数的;
垫球数在的人数为,占总数的;
垫球数在的人数为,占总数的;
垫球数在的人数为,占总数的;
垫球数在的人数为,占总数的;
垫球数在的人数为,占总数的;
垫球数在的人数为,占总数的,
因为75%分位数位于内,由,
所以估计垫球数的样本数据的75%分位数是28.
故选:D
二、多选题
5.(24-25高一上·陕西汉中·期末)某地发起“寻找绿色合伙人——低碳生活知识竞赛”活动,从参赛选手的答卷中随机抽取了100份,将成绩分成6组,第1组为,第2组为,…,第6组为,画出如图所示的频率分布直方图,则( )
A.
B.第6组有15个样本
C.从第5,6组中,按组别分层抽取6个样本,则应在第5组抽取3个样本
D.估计参赛选手成绩的中位数在内
【答案】AD
【分析】由矩形的面积和为1可得A正确;计算频数可判断B,由中位数的计算可得D正确;根据频率及分层抽样的概念直接判断C选项.
【详解】对于A,由,得,故A正确;
对于B:第6组有个样本,B错误;
对于C,由频率分布直方图可知第5组与第6组的频率分别为与,
则第5组内抽取为个样本,故C错误;
对于D,因为,,
所以估计参赛选手得分的中位数在内,故D正确.
故选:AD.
6.(24-25高一上·山东日照·期末)已知一组样本数据:2,2,0,2,4,1,3,则下列关于该组样本数据说法正确的是( )
A.极差是4 B.众数不等于平均数
C.方差是 D.分位数是3
【答案】AD
【分析】由数据的最大值减去最小值可得极差,即可判断;出现次数最多的为众数,求出7个数据的平均数即可判断;根据方差公式求解即可判断;将数据从小到大排序,由百分位数的计算方法即可求解.
【详解】对于,由已知样本数据的最大值为,最小值为,所以极差为,故正确;
对于,样本数据的众数为,平均数为,
所以众数等于平均数,故错误;
对于,方差为,故错误;
对于,将数据按照从小到大的顺序排列可得,,,,,,,
因为,所以分位数是,故正确.
故选:.
三、填空题
7.(24-25高二上·安徽阜阳·期中)某高一班级有40名学生,在一次物理考试中统计出平均分数为70,方差为95,后来发现有2名同学的成绩有误,甲实得70分却记为50分,乙实得60分却记为80分,则更正后的方差是 .
【答案】85
【分析】根据平均数、方差的计算公式求解即可.
【详解】设更正前甲,乙,丙...的成绩依次为,
则,
即,
所以,
,
即,
所以.
更正后的平均分,
更正后的方差
.
故答案为:.
8.(24-25高一上·辽宁沈阳·期末)已知一组数据丢失了其中一个,剩下的六个数据分别是、、、、、,若这组数据的平均数与众数的和是中位数的倍,则丢失数据的所有可能值构成的集合为 .
【答案】
【分析】设丢失的数据为,对的取值进行分类讨论,求出这七个数的平均数、众数和中位数,根据题意可得出关于的方程,解之即可.
【详解】设丢失的数据为,则这七个数的平均数为,众数为,
因为这组数据的平均数与众数的和是中位数的倍,分以下几种情况讨论:
若,则中位数为,此时,,解得;
若,则中位数为,此时,,解得;
若,则中位数为,此时,,解得.
综上可知,丢失数据所有可能取值构成的集合为.
故答案为:.
四、解答题
9.(24-25高一上·江西南昌·期末)随着手机和网络的普及,外卖行业得到迅速的发展.某外卖平台为了解某地区用户对其提供的服务的满意度,随机调查了个用户,得到用户的满意度评分,系统自动将评分按从大到小顺序排列如下:
用户编号
评分
用户编号
评分
用户编号
评分
用户编号
评分
01
97
11
86
21
81
31
76
02
96
12
86
22
81
32
76
03
95
13
85
23
81
33
76
04
93
14
85
24
80
34
75
05
92
15
84
25
79
35
74
06
91
16
84
26
79
36
74
07
89
17
83
27
78
37
73
08
89
18
83
28
78
38
72
09
88
19
82
29
78
39
66
10
88
20
82
30
77
40
63
(1)请你估计该地区所有用户评分的,分位数;
(2)若从这个用户中抽取一个容量为的样本,有一个数据不小心丢失了,抽到的其他个用户的评分分别为,且这个数据的平均数,记这个数据的方差为,若用户的满意度评分在内,则满意度等级为“级”,试用样本估计总体的思想,根据所抽到的个数据,估计该地区满意度等级为“级”的用户所占的百分比.
(3)平台为拓展客流,开发了一个新的评价系统.把(2)中样本的平均数和方差作为老评价系统的数据,且老系统的总数据占两个系统所有数据总和的新系统得出的评分平均数为89分,方差为12.据此计算新老系统所有评分的方差.
附:;参考数据:,,.
【答案】(1),
(2)
(3)
【分析】(1)根据百分位数的定义求解即可;
(2)先根据平均数的计算公式求出丢失的数据,再计算方差,根据评分范围求解即可;
(3)根据平均数和参考中方差的计算公式求解即可.
【详解】(1)由表可知这个用户评分按从小到大排列如下:,,,,,,,,
,,,,,,,,,,,,,,,,
,,,,,,,,,,,,,,, ,
因为,,
所以这个用户评分的,分位数分别为第项数据和第项和第项数据的平均数,
分别为,,据此估计该地区所有用户评分的,分位数分别约为和.
(2)设丢失数据为,
则,解得,
所以
,
由题意知评分在,即内的满意度等级为“级”,
样本中评分在内的有人,
则可估计该地区满意度等级为“级”的用户所占的百分比约为.
(3)由题意,,,,
因为老系统的10个数据占两个系统所有数据总和的
所以,,
即新老系统所有评分的方差为.
10.(24-25高一上·辽宁大连·期末)某公司生产A、B两种型号电动汽车电机,为了了解电机的某项指标,从这两种电机中各抽取100台进行检测,获得该项指标的频率分布直方图,如图所示:
假设数据在组内均匀分布,以样本估计,以事件发生的频率作为相应事件发生的概率.
(1)估计B型电机该项指标的平均值(同一组数据用该组区间中点值为代表);
(2)从A型电机指标在内采用分层抽样方式抽取2件,B型电机指标在内采用分层抽样方式抽取4件,再从这6件中任意抽取2件,求指标在和内各抽取1件的概率;
(3)根据检测结果确定该项指标的一个临界值m,且,某汽车厂准备用A、B两种型号电机生产C牌和D牌汽车各1万辆,有以下两种方案可供选择:
方案一:将A型电机用于生产C牌汽车,其中该指标小于等于临界值m的电机会导致每台汽车损失7000元;将B型电机用于生产D牌汽车,其中该指标大于等于临界值m的电机会导致每台汽车损失3000元;
方案二:重新检测所用的电机,会避免方案一的损失费用,但检测费用共需1010万元.请从汽车厂节约成本的角度考虑,选择合理的方案,并说明理由.
【答案】(1)
(2)
(3)答案见解析
【分析】(1)根据频率分布直方图结合平均数的定义求解;
(2)根据分层抽样的定义分别求出来自A型电机指标在和及来自B型电机指标在和的台数,然后利用列举法结合古典概型的概率公式求解;
(3)设将A、B两种型号电机应用C牌、D牌汽车时,该汽车厂损失y(万元),然后根据题意表示出,分,,三种情况讨论即可.
【详解】(1)由频率分布直方图得B型电机该项指标的平均值为:
.
(2)根据分层抽样得,来自A型电机指标在和的各1台,分别记为x,y,来自B型电机指标在和分别为3台和1台,分别记为,,和p.
从中任意抽取两件,样本空间可记为
共15个样本点,
记事件M:指标在和内各抽取1件,
则共含3个样本点,
所以.
(3)设将A、B两种型号电机应用C牌、D牌汽车时,该汽车厂损失y(万元),
,,
所以当时,,当时,,
当时,.
综上所述,当临界值时,选择方案二;
当临界值时,选择方案一或二都行;
当临界值时,选择方案一.
11.(24-25高一上·陕西·期末)某市为提高市民对文明城市创建的认识,举办了“创建文明城市”知识竞赛,从所有答卷中随机抽取100份作为样本,将样本的成绩(满分100分,成绩均为不低于40分的整数)分成六组:,,,,,,得到如图所示的频率分布直方图.
(1)求频率分布直方图中的值与样本成绩的第80百分位数;
(2)在样本答卷成绩为,,的三组市民中,用分层抽样的方法抽取13个,则样本的答卷成绩在中的市民应抽取多少个?
(3)若落在的平均成绩是57,方差是2,落在的平均成绩为69,方差是5,求这两组成绩的总平均数和总方差.
【答案】(1)0.03;第80百分位数为86.
(2)6人
(3)65;36
【分析】(1)根据每组小矩形的面积之和为1求出,判断出第80百分位数,进而可得答案;
(2)先求出抽样比,再利用分层抽样的性质即可求解;
(3)利用分层抽样的平均数和方差的计算公式即可求解.
【详解】(1),
.
成绩落在内的频率为,
落在内的频率为,
显然第80百分位数,
,解得,
第80百分位数为86.
(2)由频率分布直方图知,样本成绩为,,的三组答卷的市民有个样本,
成绩在的市民人数为,
用分层抽样的方法应在答卷成绩为的市民中,抽取人.
(3)由频率分布直方图知,成绩在的市民人数为,
成绩在的市民人数为,
总平均数,
总方差为.
原创精品资源学科网独家享有版权,侵权必究!学科网(北京)股份有限公司6
学科网(北京)股份有限公司
$$