内容正文:
用样本估计总体
一、单项选择题
1.(★)在某中学举行的环保知识竞赛中,将三个年级参赛学生的成绩(单位:分)进行整理后分为5组,绘制出如图所示的频率分布直方图,图中从左到右依次为第一、第二、第三、第四、第五小组,已知第二小组的频数是40,则成绩在区间[80,100]的学生人数是( )
A.15 B.18 C.20 D.25
答案 A
解析 根据频率分布直方图,
得第二小组的频率是0.04×10=0.4,
∵第二小组的频数是40,
∴样本容量是=100,
又成绩在区间[80,100]的频率是×10=0.15,
∴成绩在区间[80,100]的学生人数是100×0.15=15.
2.(★)甲、乙两工厂生产某种产品,抽取连续5个月的产品生产产量(单位:件)情况如下:甲:80,70,100,50,90;乙:60,70,80,55,95,则下列说法中正确的是( )
A.甲平均产量高,甲产量稳定
B.甲平均产量高,乙产量稳定
C.乙平均产量高,甲产量稳定
D.乙平均产量高,乙产量稳定
答案 B
解析 对于甲,
平均数甲==78,
方差s=×[(80-78)2+(70-78)2+(100-78)2+(50-78)2+(90-78)2]=296,
同理对于乙,平均数乙=72,方差s=206,
∵甲>乙,s>s,
∴甲平均产量高,乙产量稳定.
3.(★)(2022·全国甲卷)某社区通过公益讲座以普及社区居民的垃圾分类知识.为了解讲座效果,随机抽取10位社区居民,让他们在讲座前和讲座后各回答一份垃圾分类知识问卷,这10位社区居民在讲座前和讲座后问卷答题的正确率如图,则( )
A.讲座前问卷答题的正确率的中位数小于70%
B.讲座后问卷答题的正确率的平均数大于85%
C.讲座前问卷答题的正确率的标准差小于讲座后正确率的标准差
D.讲座后问卷答题的正确率的极差大于讲座前正确率的极差
答案 B
解析 对于A,讲座前问卷答题的正确率的中位数是=72.5%,所以A错误;
对于B,讲座后问卷答题的正确率分别是80%,85%,85%,85%,85%,90%,90%,95%,100%,100%,其平均数显然大于85%,所以B正确;
对于C,由题图可知,讲座前问卷答题的正确率波动较大,讲座后问卷答题的正确率波动较小,所以讲座前问卷答题的正确率的标准差大于讲座后问卷答题的正确率的标准差,所以C错误;
对于D,讲座前问卷答题的正确率的极差是95%-60%=35%,讲座后问卷答题的正确率的极差是100%-80%=20%,所以讲座前问卷答题的正确率的极差大于讲座后问卷答题的正确率的极差,所以D错误.
4.(★)如图为国家统计局于2023年1月20日发布的2016~2022年全国R&D经费总量和R&D经费与GDP之比的数据图表,则( )
A.R&D经费总量的平均数超过23 000亿元
B.R&D经费总量的中位数为19 678亿元
C.R&D经费与GDP之比的极差为0.45%
D.R&D经费与GDP之比增幅最大的是2021年~2022年
答案 C
解析 对于选项A,R&D经费总量的平均数为×(15 677+17 606+19 678+22 144+24 393+27 956+30 870)≈22 617.7(亿元),所以A错误;
对于选项B,R&D经费总量的中位数为22 144亿元,所以B错误;
对于选项C,R&D经费与GDP之比的极差为2.55%-2.10%=0.45%,所以C正确;
对于选项D,R&D经费与GDP之比增幅最大的是2019年~2020年,所以D错误.
5.(★)(2023·长沙模拟)某中学全体学生参加了主题为“致敬建党百年”的知识竞赛,随机抽取了400名学生进行成绩统计,发现抽取的学生的成绩都在50分至100分之间,进行适当分组后(除最后一组为闭区间外其余每组为左闭右开的区间),画出频率分布直方图如图所示,下列说法正确的是( )
A.直方图中x的值为0.004
B.在被抽取的学生中,成绩在区间[70,80)内的学生有30人
C.估计全校学生的平均成绩为84分
D.估计全校学生成绩的80%分位数为93分
答案 C
解析 由直方图可得(0.005+0.010+0.015+x+0.040)×10=1,解得x=0.030,故A错误;
在被抽取的学生中,成绩在区间[70,80)内的学生有10×0.015×400=60(人),故B错误;
估计全校学生的平均成绩为55×0.05+65×0.1+75×0.15+85×0.3+95×0.4=84(分),故C正确;
估计全校学生成绩的80%分位数为90+×10=95(分),故D错误.
6.(★★)(2023·杭州模拟)甲、乙两同学对同一组数据进行分析,甲同学得到的数据平均数为,方差为s2,乙同学不小心丢掉了一个数据,得到的平均数仍为,方差为2,则下列判断正确的是( )
A.s2=2
B.s2>2
C.s2<2
D.s2与2的大小关系无法判断
答案 C
解析 由题意知,丢失的数据为,才可保证甲、乙得到的平均数相等,
结合方差公式s2=[(x1-)2+(x2-)2+…+(xn-)2],n≥2,
所以乙所得方差s′2==2,即s2=<2.
二、多项选择题
7.(★)2023年“三月三”期间,广西交通部门统计了2023年4月19日至4月25日的高速公路车流量(单位:万车次),并与2022年同期比较,得到同比增长率(同比增长率= (今年车流量-去年同期车流量)÷去年同期车流量×100%)数据,绘制了如图所示的统计图,则下列结论正确的是( )
A.2023年4月19日至4月25日的高速公路车流量的极差为23万车次
B.2023年4月19日至4月25日的高速公路车流量的第70百分位数为22万车次
C.2023年4月19日至4月21日的高速公路车流量的标准差小于2023年4月23日至4月25日的高速公路车流量的标准差
D.2022年4月23日的高速公路车流量为20万车次
答案 ABD
解析 对于A,2023年4月19日至4月25日的高速公路车流量的极差为25-2=23(万车次),故A正确;
对于B,因为7×70%=4.9,所以2023年4月19日至4月25日的高速公路车流量的第70百分位数为22万车次,故B正确;
对于C,2023年4月19日至4月21日的高速公路车流量波动更大,即标准差更大,故C错误;
对于D,2023年4月23日的高速公路车流量为22万车次,同比增长率为10%,
设2022年4月23日的高速公路车流量为x万车次,则×100%=10%,解得x=20,故D正确.
8.(★★)(2024·台州模拟)袋子中有6个相同的球,分别标有数字1,2,3,4,5,6,从中有放回地随机取5次,每次取一个球.记录每次取到的数字,统计后发现这5个数字的平均数为2,方差小于1,则( )
A.可能取到数字4 B.中位数可能是2
C.极差可能是4 D.众数可能是2
答案 BD
解析 设这5个数字为x1,x2,x3,x4,x5,
对于A,若取到数字4,不妨设x1=4,
则=2,可得x2+x3+x4+x5=6,
可知这4个数中至少有2个1,不妨设x2=x3=1,
则这5个数字的方差s2=[(x1-2)2+(x2-2)2+(x3-2)2+(x4-2)2+(x5-2)2]
≥×[(4-2)2+(1-2)2+(1-2)2]=>1,
不符合题意,故A错误;
对于C,因为这5个数字的平均数为2,若这5个数字不完全相同,则这5个数字至少有1个1,不妨设x1=1,
若极差是4,则最大数为5,不妨设x2=5,
则这5个数字的平均数=(x1+x2+x3+x4+x5)=(1+5+x3+x4+x5)=2,
则x3+x4+x5=4,可知这3个数有2个1,1个2,
此时这5个数字的方差s2=×[(1-2)2+(5-2)2+(1-2)2+(1-2)2+(2-2)2]=>1,
不符合题意,若这5个数字完全相同,则极差为0,故C错误;
对于B,D,例如2,2,2,2,2,可知这5个数字的平均数为2,方差为0,符合题意,
且中位数是2,众数是2,故B,D正确.
三、填空题
9.(★)已知a为实数,若数据1,2,a,6的平均数为3,则这组数据的标准差为__________.
答案
解析 由题意知,×(1+2+a+6)=3,解得a=3,所以方差为×[(1-3)2+(2-3)2+(3-3)2+(6-3)2]=,
则标准差为=.
10.(★)为了解本市的交通状况,某校高一年级的学生分成了甲、乙、丙三组,从13时到18时,分别对三个路口的机动车通行情况进行了实地调查,并绘制了频率分布直方图(如图).若定义“总体平均数的估计值等于频率分布直方图中每个小矩形的面积乘以小矩形底边中点的横坐标之和”,则甲、乙、丙三组所调查数据的总体平均数的估计值1,2,3的大小关系为________.
答案 1=3>2
解析 根据题中总体平均数的估计值的定义可得,
1=0.3×13.5+0.2×14.5+0.1×15.5+0.1×16.5+0.3×17.5=15.4,
2=0.2×13.5+0.2×14.5+0.3×15.5+0.2×16.5+0.1×17.5=15.3,
3=0.1×13.5+0.3×14.5+0.3×15.5+0.2×16.5+0.1×17.5=15.4,
故1=3>2.
四、解答题
11.(★)2023年9月23日,第19届亚洲运动会开幕式在杭州举行,为了解某校学生对亚运会相关知识的了解情况,从该校抽取100名学生进行了亚运会知识竞赛并纪录得分(满分:100分),根据得分将他们的成绩分成[40,50),[50,60),[60,70),[70,80),[80,90),[90,100]六组,绘制成如图所示的频率分布直方图.
(1)求图中a的值;
(2)估计竞赛成绩不低于60分的概率;
(3)估计这100人竞赛成绩的平均数(同一组数据用该组数据的中点值代替)及中位数.
解 (1)由频率分布直方图的性质可知,
(0.005+a+0.020+0.030+0.025+0.005)×10=1,解得a=0.015.
(2)结合(1)及图表可知,
估计竞赛成绩不低于60分的概率为1-(0.005+0.015)×10=1-0.2=0.8.
(3)易知平均数为45×0.05+55×0.15+65×0.20+75×0.30+85×0.25+95×0.05=72(分),
前3组的频率为0.05+0.15+0.2=0.4,
前4组的频率为0.05+0.15+0.2+0.3=0.7,所以中位数落在区间[70,80)内,设中位数为x分,则0.4+(x-70)×0.03=0.5,解得x=,所以中位数为分.
12.(★★)(2023·吉林模拟)近几年中国高科技企业正在不断突破科技封锁,多项技术已经“遥遥领先”.国产光刻机作为芯片制造的核心设备,也已经取得了突飞猛进的发展.已知一芯片生产商用某国产光刻机生产的Q型芯片经过十项指标全面检测后,分为Ⅰ级品和Ⅱ级品,两种芯片的某项指标的频率分布直方图如图所示.
若只利用该指标制定一个标准,需要确定临界值c,将该指标大于c的产品应用于A型手机,小于或等于c的产品应用于B型手机.假设数据在组内均匀分布,以事件发生的频率作为相应事件发生的概率.
(1)求Q型芯片Ⅰ级品该项指标的第70百分位数;
(2)当临界值c=65时,求Q型芯片Ⅱ级品应用于A型手机的概率;
(3)已知c∈[50,60],现有足够多的Q型芯片Ⅰ级品、Ⅱ级品分别应用于A型手机、B型手机各1万部的生产,
方案一:直接将Q型芯片Ⅰ级品应用于A型手机,其中该指标小于或等于临界值c的芯片会导致芯片生产商每部手机损失700元;直接将Q型芯片Ⅱ级品应用于B型手机,其中该指标大于临界值c的芯片,会导致芯片生产商每部手机损失300元;
方案二:重新检测Q型芯片Ⅰ级品、Ⅱ级品,会避免方案一的损失费用,但检测费用共需要101万元,
请从芯片生产商的成本考虑,选择合理的方案.
解 (1)设Q型芯片Ⅰ级品该项指标的第70百分位数为a,
则该指标在80以下的概率为0.55,该指标在90以下的概率为0.8,因此该项指标的第70百分位数a一定在[80,90)内,
0.002×10+0.005×10+0.023×10+0.025×10+0.025×(a-80)=0.7
(也可以用0.02×10+0.025×(90-a)=1-0.7),
解得a=86,
所以Q型芯片Ⅰ级品该项指标的第70百分位数为86.
(2)当临界值c=65时,
Q型芯片Ⅱ级品应用于A型手机的概率为0.01×(70-65)=0.05.
(3)设直接将Q型芯片Ⅰ级品、Ⅱ级品分别应用于A型、B型手机时,该芯片生产商的支出为y(万元),
y=700×[0.002×10+0.005×(c-50)]+300×[0.01×10+0.03×(60-c)] =409-5.5c,c∈[50,60],
所以当50≤c<56时,y>101,
当c=56时,y=101,
当56<c≤60时,y<101,
综上,为降低芯片生产商的成本,当临界值c∈[50,56)时,选择方案二;
当临界值c=56时,选择方案一和方案二均可;
当临界值c∈(56,60]时,选择方案一.
学科网(北京)股份有限公司
$$
用样本估计总体
一、单项选择题
1.(★)在某中学举行的环保知识竞赛中,将三个年级参赛学生的成绩(单位:分)进行整理后分为5组,绘制出如图所示的频率分布直方图,图中从左到右依次为第一、第二、第三、第四、第五小组,已知第二小组的频数是40,则成绩在区间[80,100]的学生人数是( )
A.15 B.18 C.20 D.25
2.(★)甲、乙两工厂生产某种产品,抽取连续5个月的产品生产产量(单位:件)情况如下:甲:80,70,100,50,90;乙:60,70,80,55,95,则下列说法中正确的是( )
A.甲平均产量高,甲产量稳定
B.甲平均产量高,乙产量稳定
C.乙平均产量高,甲产量稳定
D.乙平均产量高,乙产量稳定
3.(★)(2022·全国甲卷)某社区通过公益讲座以普及社区居民的垃圾分类知识.为了解讲座效果,随机抽取10位社区居民,让他们在讲座前和讲座后各回答一份垃圾分类知识问卷,这10位社区居民在讲座前和讲座后问卷答题的正确率如图,则( )
A.讲座前问卷答题的正确率的中位数小于70%
B.讲座后问卷答题的正确率的平均数大于85%
C.讲座前问卷答题的正确率的标准差小于讲座后正确率的标准差
D.讲座后问卷答题的正确率的极差大于讲座前正确率的极差
4.(★)如图为国家统计局于2023年1月20日发布的2016~2022年全国R&D经费总量和R&D经费与GDP之比的数据图表,则( )
A.R&D经费总量的平均数超过23 000亿元
B.R&D经费总量的中位数为19 678亿元
C.R&D经费与GDP之比的极差为0.45%
D.R&D经费与GDP之比增幅最大的是2021年~2022年
5.(★)(2023·长沙模拟)某中学全体学生参加了主题为“致敬建党百年”的知识竞赛,随机抽取了400名学生进行成绩统计,发现抽取的学生的成绩都在50分至100分之间,进行适当分组后(除最后一组为闭区间外其余每组为左闭右开的区间),画出频率分布直方图如图所示,下列说法正确的是( )
A.直方图中x的值为0.004
B.在被抽取的学生中,成绩在区间[70,80)内的学生有30人
C.估计全校学生的平均成绩为84分
D.估计全校学生成绩的80%分位数为93分
6.(★★)(2023·杭州模拟)甲、乙两同学对同一组数据进行分析,甲同学得到的数据平均数为,方差为s2,乙同学不小心丢掉了一个数据,得到的平均数仍为,方差为2,则下列判断正确的是( )
A.s2=2
B.s2>2
C.s2<2
D.s2与2的大小关系无法判断
二、多项选择题
7.(★)2023年“三月三”期间,广西交通部门统计了2023年4月19日至4月25日的高速公路车流量(单位:万车次),并与2022年同期比较,得到同比增长率(同比增长率= (今年车流量-去年同期车流量)÷去年同期车流量×100%)数据,绘制了如图所示的统计图,则下列结论正确的是( )
A.2023年4月19日至4月25日的高速公路车流量的极差为23万车次
B.2023年4月19日至4月25日的高速公路车流量的第70百分位数为22万车次
C.2023年4月19日至4月21日的高速公路车流量的标准差小于2023年4月23日至4月25日的高速公路车流量的标准差
D.2022年4月23日的高速公路车流量为20万车次
8.(★★)(2024·台州模拟)袋子中有6个相同的球,分别标有数字1,2,3,4,5,6,从中有放回地随机取5次,每次取一个球.记录每次取到的数字,统计后发现这5个数字的平均数为2,方差小于1,则( )
A.可能取到数字4 B.中位数可能是2
C.极差可能是4 D.众数可能是2
三、填空题
9.(★)已知a为实数,若数据1,2,a,6的平均数为3,则这组数据的标准差为__________.
10.(★)为了解本市的交通状况,某校高一年级的学生分成了甲、乙、丙三组,从13时到18时,分别对三个路口的机动车通行情况进行了实地调查,并绘制了频率分布直方图(如图).若定义“总体平均数的估计值等于频率分布直方图中每个小矩形的面积乘以小矩形底边中点的横坐标之和”,则甲、乙、丙三组所调查数据的总体平均数的估计值1,2,3的大小关系为________.
四、解答题
11.(★)2023年9月23日,第19届亚洲运动会开幕式在杭州举行,为了解某校学生对亚运会相关知识的了解情况,从该校抽取100名学生进行了亚运会知识竞赛并纪录得分(满分:100分),根据得分将他们的成绩分成[40,50),[50,60),[60,70),[70,80),[80,90),[90,100]六组,绘制成如图所示的频率分布直方图.
(1)求图中a的值;
(2)估计竞赛成绩不低于60分的概率;
(3)估计这100人竞赛成绩的平均数(同一组数据用该组数据的中点值代替)及中位数.
12.(★★)(2023·吉林模拟)近几年中国高科技企业正在不断突破科技封锁,多项技术已经“遥遥领先”.国产光刻机作为芯片制造的核心设备,也已经取得了突飞猛进的发展.已知一芯片生产商用某国产光刻机生产的Q型芯片经过十项指标全面检测后,分为Ⅰ级品和Ⅱ级品,两种芯片的某项指标的频率分布直方图如图所示.
若只利用该指标制定一个标准,需要确定临界值c,将该指标大于c的产品应用于A型手机,小于或等于c的产品应用于B型手机.假设数据在组内均匀分布,以事件发生的频率作为相应事件发生的概率.
(1)求Q型芯片Ⅰ级品该项指标的第70百分位数;
(2)当临界值c=65时,求Q型芯片Ⅱ级品应用于A型手机的概率;
(3)已知c∈[50,60],现有足够多的Q型芯片Ⅰ级品、Ⅱ级品分别应用于A型手机、B型手机各1万部的生产,
方案一:直接将Q型芯片Ⅰ级品应用于A型手机,其中该指标小于或等于临界值c的芯片会导致芯片生产商每部手机损失700元;直接将Q型芯片Ⅱ级品应用于B型手机,其中该指标大于临界值c的芯片,会导致芯片生产商每部手机损失300元;
方案二:重新检测Q型芯片Ⅰ级品、Ⅱ级品,会避免方案一的损失费用,但检测费用共需要101万元,
请从芯片生产商的成本考虑,选择合理的方案.
学科网(北京)股份有限公司
$$