内容正文:
第九章 统计
一、单项选择题:在每小题给出的四个选项中,只有一项是符合题目要求的.
1.一组数据分成5组,第一组,第三组的频率之和为0.24,第四组的频率是0.5,第二组、第五组的频率之比为3∶10,那么第二组、第五组的频率分别为( )
A.0.2,0.06 B.0.6,0.02
C.0.06,0.2 D.0.02,0.6
2.某校做了一次关于“感恩父母”的问卷调查,从8~10岁,11~12岁,13~14岁,15~16岁四个年龄段回收的问卷依次为120份,180份,240份,x份.因调查需要,从回收的问卷中按年龄段分层抽取容量为300的样本,其中在11~12岁学生问卷中抽取60份,则在15~16岁学生中抽取的问卷份数为( )
A.60 B.80 C.120 D.180
3.将一个容量为n的样本分组,已知某组的频率为0.25,频数为5,则n的值为( )
A.50 B.40 C.20 D.10
4.某企业六月中旬生产A,B,C三种产品共3 000件,根据分层随机抽样的结果,企业统计员制作了如下的统计表格:
产品类别
A
B
C
产品数量/件
1 300
样本量
130
a
由于不小心,表格中A,C产品的有关数据已被污染看不清楚,统计员只记得A产品的样本量比C产品的样本量多10,请你根据以上信息确定表格中a的值是( )
A.70 B.80 C.90 D.100
5.“幸福感指数”是指某个人主观地评价他对自己目前生活状态的满意程度的指标,常用区间[0,10]内的一个数来表示,该数越接近10表示满意度越高.现随机抽取10位北京市民,他们的幸福感指数为3,4,5,5,6,7,7,8,9,10.则这组数据的75%分位数是( )
A.7 B.7.5 C.8 D.8.5
6.若数据a1,a2,a3,…,an的方差为s2,则数据2a1-3,2a2-3,2a3-3,…,2an-3的标准差是( )
A.s B.s C.2s D.4s2
7.某学校对甲、乙两个班级的某次成绩进行统计分析,制成了如图的条形图与扇形图,则下列说法一定正确的是( )
甲班
乙班
A.甲班成绩优良人数超过了乙班成绩优良人数
B.甲班平均成绩高于乙班平均成绩
C.甲班学生比乙班学生发挥稳定
D.甲班不及格率高于乙班不及格率
8.中国营养学会把走路称为“最简单、最优良的锻炼方式”,它不仅可以帮助减肥,还可以增强心肺功能、血管弹性、肌肉力量等.下图为甲、乙两人在同一星期内日步数的折线统计图:
则下列结论不正确的是( )
A.这一星期内甲的日步数的中位数为11 600
B.乙的日步数星期四比星期三少
C.这一星期内甲的日步数的平均值大于乙的日步数的平均值
D.这一星期内甲的日步数的方差大于乙的日步数的方差
二、多项选择题:在每小题给出的选项中,有多项符合题目要求.
9.某农业研究部门在面积相等的100块稻田上种植一种新型水稻,得到各块稻田的亩产量(单位:kg)并整理下表:
亩产量
[900,950)
[950,1 000)
[1 000,1 050)
[1 050,1 100)
[1 100,1 150)
[1 150,1 200)
生产数
6
12
18
30
24
10
据表中数据,结论中正确的是( )
A.100块稻田亩产量的中位数大于1 050 kg
B.100块稻田中的亩产量低于1 100 kg的稻田所占比例超过80%
C.100块稻田亩产量的极差介于200 kg至300 kg之间
D.100块稻田亩产量的平均值介于900 kg至1 000 kg之间
10.(2023新高考Ⅰ)有一组样本数据x1,x2,…,x6,其中x1是最小值,x6是最大值,则( )
A.x2,x3,x4,x5的平均数等于x1,x2,…,x6的平均数
B.x2,x3,x4,x5的中位数等于x1,x2,…,x6的中位数
C.x2,x3,x4,x5的标准差不小于x1,x2,…,x6的标准差
D.x2,x3,x4,x5的极差不大于x1,x2,…,x6的极差
11.某健身房为了解运动健身减肥的效果,调查了20名肥胖者健身前(如直方图(1)所示)后(如直方图(2)所示)的体重(单位:kg)变化情况.
对比数据,关于这20名肥胖者,下面结论正确的有( )
A.他们健身后,体重在区间[90,100)内的人数较健身前增加了2人
B.他们健身后,体重原在区间[100,110)内的人员一定无变化
C.他们健身后,20人的平均体重大约减少了8 kg
D.他们健身后,原来体重在区间[110,120]内的肥胖者体重都有减少
三、填空题
12.为了了解中学生的体育锻炼情况,现从某学校随机抽取了部分学生,对他们每天的体育锻炼时间进行统计分析,得到如图所示的频率分布直方图,估计该校学生每天的体育锻炼时间的众数是 分钟.
13.下图是样本容量为200的频率分布直方图.根据样本的频率分布直方图估计,样本数据落在[6,14)内的频数为 ;数据落在[2,14)内的频率约为 .
14.为了了解中学生课外阅读情况,现从某中学随机抽取200名学生,收集了他们一年内的课外阅读量(单位:本)等数据,以下是根据数据绘制的统计图表的一部分.
学生类别
阅读量
[0,10)
[10,20)
[20,30)
[30,40)
[40,+∞)
性别
男
7
31
25
30
4
女
8
29
26
32
8
学段
初中
25
36
44
11
高中
学生类别阅读量
下面有四个推断:
①这200名学生阅读量的平均数可能是26本;
②这200名学生阅读量的第75百分位数在区间[30,40)内;
③这200名学生中的初中生阅读量的中位数一定在区间[20,30)内;
④这200名学生中的初中生阅读量的第25百分位数可能在区间[20,30)内.
所有合理推断的序号是 .
四、解答题:解答应写出文字说明、证明过程或演算步骤.
15.对甲、乙两名同学的学习成绩进行抽样分析,各抽5门功课,得到的观测值如下:
甲
60
80
70
90
70
乙
80
60
70
80
75
(1)甲、乙的平均成绩谁较好?
(2)谁的各门功课发展较平衡?
16.一项试验旨在研究臭氧效应,试验方案如下:选40只小白鼠,随机地将其中20只分配到试验组,另外20只分配到对照组,试验组的小白鼠饲养在高浓度臭氧环境,对照组的小白鼠饲养在正常环境,一段时间后统计每只小白鼠体重的增加量(单位:g).试验结果如下:
对照组的小白鼠体重的增加量从小到大排序为
15.2 18.8 20.2 21.3 22.5 23.2 25.8 26.5 27.5 30.1
32.6 34.3 34.8 35.6 35.6 35.8 36.2 37.3 40.5 43.2
试验组的小白鼠体重的增加量从小到大排序为
7.8 9.2 11.4 12.4 13.2 15.5 16.5
18.0 18.8 19.2
19.8 20.2 21.6 22.8 23.6 23.9 25.1 28.2 32.3 36.5
(1)计算试验组的样本平均数;
(2)求40只小白鼠体重的增加量的中位数m.
17.为了了解学生参加体育活动的情况,学校对学生进行随机抽样调查,其中一个问题是“你平均每天参加体育活动的时间是多少?”,共有4个选项:A.1.5小时以上,B.1~1.5小时,C.0.5~1小时,D.0.5小时以下.图①,图②是根据调查结果绘制的两幅不完整的统计图,请你根据统计图提供的信息,解答以下问题:
(1)本次一共调查了多少名学生;
(2)在图①中将B对应的部分补充完整;
(3)若该校有3 000名学生,估计全校有多少名学生平均每天参加体育活动的时间在0.5小时以下.
18.在某中学举行的电脑知识竞赛中,将高一年级两个班参赛的学生成绩进行整理后分成五组,绘制下图所示的频率分布直方图.已知图中从左到右的第一,第三,第四,第五小组的频率分别是0.30,0.15,0.10,0.05,第二小组的频数是40.
(1)补齐图中频率分布直方图,并求这两个班参赛学生的总人数;
(2)利用频率分布直方图,估算本次比赛学生成绩的平均数和中位数.
19.某学校为了解本校历史、物理方向学生的学业水平模拟测试数学成绩情况,分别从物理方向的学生中随机抽取60人的成绩得到样本甲,从历史方向的学生中随机抽取n人的成绩得到样本乙,根据两个样本数据分别得到如图所示的频率分布直方图,已知乙样本中,在区间[70,80)上的数据有10个.
甲样本数据频率分布直方图
乙样本数据频率分布直方图
(1)求n和乙样本频率分布直方图中a的值;
(2)试估计该校物理方向的学生本次模拟测试数学成绩的平均值和历史方向的学生本次模拟测试数学成绩的中位数(同一组中的数据用该组区间的中点值作代表);
(3)若本校历史方向的学生约为300人,估计其中数学成绩在85分以上的人数.
参考答案
1.C ∵各个小组的频率和是1,
∴第二组、第五组的频率之和为1-0.24-0.5=0.26.
又第二组、第五组的频率之比为3∶10,
∴第二组的频率是0.26×=0.06,
第五组的频率是0.26-0.06=0.2.故选C.
2.C 11~12岁回收180份,其中在11~12岁学生问卷中抽取60份,因为分层抽取的样本容量为300,故回收问卷总数为=900(份),故x=900-120-180-240=360(份),所以在15~16岁学生中抽取的问卷份数为360×=120.
3.C ∵频率=,
∴0.25=,解得n=20.故选C.
4.B 设样本的总量为x,则×1 300=130,
∴x=300,∴A产品和C产品在样本中共有300-130=170(件).
由表格知,C产品的样本量为a,则a+a+10=170,
∴a=80.故选B.
5.C 由题意,这10个人的幸福指数已经从小到大排列,因为75%×10=7.5,所以这10个人的75%分位数是从小到大排列后第8个人的幸福指数,即8.故选C.
6.C ∵数据a1,a2,a3,…,an的方差是s2,
∴数据2a1-3,2a2-3,2a3-3,…,2an-3的方差是4s2,
∴数据2a1-3,2a2-3,2a3-3,…,2an-3的标准差是2s,故选C.
7.D 对于A和B,因为乙班的人数不确定,所以无法比较,故A和B均错误;对于C,无法确定甲班和乙班学生成绩的方差,故C错误;对于D,甲班不及格率为20%,乙班不及格率为10%,故D正确.故选D.
8.B 对于A,甲的日步数从小到大排列为2 435,7 965,9 500,11 600,12 700,16 000,16 800,中位数是11 600,故A正确;
对于B,乙星期三的步数为7 030,星期四的步数为12 970,星期四比星期三的日步数多,故B不正确;
对于C,(16 000+7 965+12 700+2 435+16 800+9 500+11 600)=11 000,(14 200+12 300+7 030+12 970+5 340+11 600+10 060)=10 500.所以,故C正确;
对于D,[(16 000-11 000)2+(7 965-11 000)2+(12 700-11 000)2+(2 435-11 000)2+(16 800-11 000)2+(9 500-11 000)2+(11 600-11 000)2]≈20 958 636,
[(14 200-10 500)2+(12 300-10 500)2+(7 030-10 500)2+(12 970-10 500)2+(5 340-10 500)2+(11 600-10 500)2+(10 060-10 500)2]≈9 014 429,经计算,故D正确.故选B.
9.AC 由6+12+18=36<50,6+12+18+30=66>50,得中位数在[1 050,1 100)范围内,故A正确;
亩产量低于1 100 kg的稻田生产数为6+12+18+30=66,=66%<80%,故B错误;
亩产量最大值在[1 150,1 200)范围内,最小值在[900,950)范围内,故极差在(1 150-950,1 200-900)范围内,即200 kg至300 kg之间,故C正确;
取各区间中点估算平均值:925×+975×+1 025×+1 075×+1 125×+1 175×=1 067,大于1 000 kg,故D错误.
故选AC.
10.BD ≠0,所以A错误;
因为x1是最小值,x6是最大值,所以x2,x3,x4,x5的中位数的位置和x1,x2,…,x6的中位数的位置相同,所以B正确;
因为x1是最小值,x6是最大值,所以x2,x3,x4,x5的波动性不大于x1,x2,…,x6的波动性,所以C错误;
设x2,x3,x4,x5的最小值为x2,最大值为x5,则x1≤x2,x5≤x6,所以x6-x1≥x5-x2,所以D正确.故选BD.
11.AD 体重在区间[90,100)内的肥胖者由健身前的6人增加到健身后的8人,增加了2人,故A正确;他们健身后,体重在区间[100,110)内的百分比没有变,但人员组成可能改变,故B错误;他们健身后,20人的平均体重大约减少了(0.3×95+0.5×105+0.2×115)-(0.1×85+0.4×95+0.5×105)=5 kg,故C错误;因为图(2)中没有体重在区间[110,120]内的人员,所以原来体重在区间[110,120]内的肥胖者体重都有减少,故D正确.故选AD.
12.45 由图可知人数最多的组别在40~50组,故众数的估计值为45.
13.136 0.76 ∵样本数据落在[6,14)内的频率为0.08×4+0.09×4=0.68,且样本容量为200,
∴样本数据落在[6,14)内的频数为0.68×200=136;数据落在[2,14)内的频率为(0.02+0.08+0.09)×4=0.76.
14.②③④ 在①中,由学生类别阅读量中男生和女生人均阅读量知,这200名学生的平均阅读量在区间(24.5,25.5)内,故错误;
在②中,200×75%=150,阅读量在[0,30)内的人数有7+8+31+29+25+26=126(人),在[30,40)内的人数有62人,所以这200名学生阅读量的第75百分位数在区间[30,40)内,故正确;
在③中,设在区间[0,10)内的初中生人数为x,则x∈[0,15],x∈N*,当x=0时,初中生总人数为116,=58,
此时区间[0,20)内有25人,区间[20,30)内有36人,所以中位数在[20,30)内,
当x=15时,初中生总人数为131,=65.5,
此时区间[0,20)内有15+25=40(人),区间[20,30)内有36人,所以中位数在[20,30)内,
当在区间[0,10)内初中人数取最小值和最大值时,中位数都在[20,30)内,
所以这200名学生中的初中生阅读量的中位数一定在区间[20,30)内,故正确;
在④中,当x=0时,初中生总人数为116,116×25%=29,
此时区间[0,20)内有25人,区间[20,30)有36人,所以第25百分位数在[20,30)内,
当x=15时,初中生总人数为131人,131×25%=32.75,区间[0,20)内有15+25=40(人),
所以第25百分位数在[0,20)内,
所以这200名学生中的初中生阅读量的第25百分位数可能在区间[20,30)内,故正确.
15.解(1)(60+80+70+90+70)=74,
(80+60+70+80+75)=73,
故甲的平均成绩较好.
(2)[(60-74)2+(80-74)2+(70-74)2+(90-74)2+(70-74)2]=104,
[(80-73)2+(60-73)2+(70-73)2+(80-73)2+(75-73)2]=56,
由,知乙的各门功课发展较平衡.
16.解(1)试验组样本平均数为
(7.8+9.2+11.4+12.4+13.2+15.5+16.5+18.0+18.8+19.2+19.8+20.2+21.6+22.8+23.6+23.9+25.1+28.2+32.3+36.5)==19.8.
(2)依题意,可知这40只小鼠体重的中位数是将两组数据合在一起,从小到大排后第20位与第21位数据的平均数,由原数据可得第11位数据为18.8,后续依次为19.2,19.8,20.2,20.2,21.3,21.6,22.5,22.8,23.2,23.6,…故第20位为23.2,第21位数据为23.6,
所以m==23.4.
17.解(1)从题图中知,选A的共60人,占总人数的百分比为30%,所以总人数为60÷30%=200,即本次一共调查了200名学生.
(2)被调查的学生中,选B的人数为200-60-30-10=100,补充完整的条形统计图如下图所示.
(3)3 000×5%=150,估计全校有150名学生平均每天参加体育活动的时间在0.5小时以下.
18.解(1)第二小组的频率为1-0.30-0.15-0.10-0.05=0.40,所以补全的频率分布直方图如下图.
这两个班参赛学生的总人数为=100.
(2)本次比赛学生成绩的平均数为54.5×0.30+64.5×0.40+74.5×0.15+84.5×0.10+94.5×0.05=66.5.
中位数出现在第二组中,设中位数为x,则(x-59.5)×0.04+0.30=0.50,x=64.5,所以估计本次比赛学生成绩的平均数为66.5,中位数为64.5.
19.解 (1)由频率分布直方图可知乙样本中数据在区间[70,80)的频率为0.020×10=0.20,
则=0.20,解得n=50.
由乙样本频率分布直方图可知(0.006+0.016+0.020+0.040+a)×10=1,解得a=0.018.
(2)甲样本数据的平均值的估计值为(55×0.005+65×0.010+75×0.020+85×0.045+95×0.020)×10=81.5.
乙样本频率分布直方图中前3组的频率之和为(0.006+0.016+0.02)×10=0.42<0.5,
前4组的频率之和为(0.006+0.016+0.02+0.04)×10=0.82>0.5,所以乙样本数据的中位数在第4组.
设中位数为x,则(x-80)×0.04+0.42=0.5,解得x=82,所以乙样本数据的中位数为82.
(3)乙样本中数学成绩在85分以上的学生频率为+0.18=0.38,
由样本估计总体,得300×0.38=114,故历史方向的学生数学成绩在85分以上的约有114人.
2
学科网(北京)股份有限公司
$