内容正文:
5.2 数学探究活动:由编号样本估计总数及其模拟
[对应学生用书P74]
日常生活中,为了方便管理,人们经常对人或事物进行连续编号.
在很多情况下,得到最大的编号并不容易,但可以得到一些编号的样本.此时,能不能根据编号样本的信息,利用有关统计的知识,估计出人或物的总数呢?
类似问题在实际生活中有时是有战略意义的.例如,二战期间,德军生产的坦克是连续编号的,盟军从战场上缴获了一些德军坦克,因此获得了一些坦克编号,盟军希望能根据这些样本数据估计出德军所生产的坦克数量.后来统计学家们圆满地解决了这一问题,而且,如下表所示,当时统计学家们的估计比情报部门的估计误差小很多!
时间
统计估计
情报估计
实际数量
1940年6月
169
1 000
122
1941年6月
244
1 550
271
1942年8月
327
1 550
342
[对应学生用书P75]
要完成的任务可以简述为:假设已有的编号样本从小到大依次为x1,x2,…,xm,由这些样本怎样去估计总数n.
最大值估计:n的值一定不会小于编号中的最大值,所以可以用编号中的最大值作为n的一个估计,即n≈xm.
平均值估计:考虑到样本的平均数与总体的平均数应该相差不大,因此可用样本平均数来给出n的一个估计.记=,又因为=,所以有≈,从而可以用大于等于2-1的最小整数作为n的估计.
值得注意的是,这种方法得到的n的估计与xm的相对大小是不确定的,因此有可能出现n<xm的情况.当然,此时我们可以用xm作为n的估计值.
你能想出其他的估计方法吗?感兴趣的学生请查阅有关资料进行了解.
[对应学生用书P75]
请与其他同学分工合作,寻找生活中有连续编号的实例,获取适当容量的编号样本,在此基础上讨论估计总数的多种办法,并用模拟的办法验证估计方法的准确性,将活动过程记录在下表中.
由编号样本估计总数活动记录表
活动开始时间:________________
(1)成员与分工
姓名
分工
(2)待估计总数的、有连续编号的实例
(3)获取的编号样本
(4)估计总数的方法以及计算过程
(5)采用模拟的方法以及估计结果的验证
(6)活动总结(包括活动感受等)
活动结束时间:________________
阶段测评三(范围5.1,5.2)
一、选择题(每小题5分,共40分)
1.某中学初中部共有110名教师,高中部共有150名教师,其性别比例如图所示,则该校女教师的人数为( )
A.93 B.123
C.137 D.167
解析 初中部的女教师人数为110×70%=77,高中部的女教师人数为150×(1-60%)=60,该校女教师的人数为77+60=137.
答案 C
2.某示范农场的鱼塘放养鱼苗8万条,根据这几年的经验知道,鱼苗的成活率为95%,一段时间后准备打捞出售,第一网捞出40条,称得平均每条鱼2.5 kg,第二网捞出25条,称得平均每条鱼2.2 kg,第三网捞出35条,称得平均每条鱼2.8 kg,试估计鱼塘中鱼的总质量约为( )
A.192 280 kg B.202 280 kg
C.182 280 kg D.172 280 kg
解析 平均每条鱼的质量为==2.53 kg,所以估计这时鱼塘中鱼的总质量约为80 000×95%×2.53=192 280 kg.
答案 A
3.为了普及环保知识,增强环保意识,某大学随机抽取30名学生参加环保知识测试,得分(十分制)如图所示,假设得分的中位数为me,众数为mo,平均值为,则( )
A.me=mo= B.me=mo<
C.me<mo< D.mo<me<
解析 由题图可知:30个得分中,按大小排序,中间的两个得分为5,6,故中位数me=5.5,得分为5的最多,故众数m0=5,平均数=≈5.97.故m0<me<.
答案 D
4.从某中学高一年级中随机抽取100名学生的数学成绩(单位:分),绘制成频率分布直方图(如图),原始数据丢失,则对该校高一学生数学成绩中位数的估计值较为合理的是( )
A.115 B.125
C.120 D.124
解析 由题图可知(a+a-0.005)×10=1-(0.010+0.015+0.030)×10,解得a=0.025.中位数在120~130之间,设中位数为x,则0.010×10+0.030×10+0.025×(x-120)=0.5,解得x=124,故选D.
答案 D
5.已知一组数据x1,x2,x3,x4,x5的平均数是2,方差是,那么另一组数3x1-2,3x2-2,3x3-2,3x4-2,3x5-2的平均数、方差分别是( )
A.2, B.2,1
C.4, D.4,3
解析 因为数据x1,x2,x3,x4,x5的平均数是2,方差是,所以=2,(xi-2)2=,
因此数据3x1-2,3x2-2,3x3-2,3x4-2,3x5-2的平均数为:
(3xi-2)=3×i-2=4,
方差为:(3xi-2-)2
=(3xi-6)2
=9×(xi-2)2=9×=3.
答案 D
6.(多选题)甲、乙两支女子曲棍球队在某年的国际联赛中,甲队平均每场进球数是3.2,全年进球数的标准差为3;乙队平均每场进球数是1.8,全年进球数的标准差为0.3.下列说法中,正确的有( )
A.甲队的技术没乙队好 B.乙队发挥比甲队稳定
C.乙队几乎每场都进球 D.甲队的表现时好时坏
解析 因为甲队的平均进球数比乙队多,所以甲队技术较好,A错误;乙队的标准差比甲队小,标准差越小越稳定,所以乙队发挥稳定,B正确;乙队平均每场进球数为1.8,标准差为0.3,较稳定,所以乙队几乎每场都进球,C正确;由于s甲=3,s乙=0.3,所以甲队与乙队相比,不稳定,所以甲队的表现时好时坏,D正确.
答案 BCD
7.(多选题)空气质量指数分为“优”“良”“轻度污染”“中度污染”“重度污染”“严重污染”六个等级,指数越大说明污染的情况越严重,对人体危害越大,这六个等级分别对应的指数范围为[0,50],[51,100],[101,150],[151,200],[201,300],[301,500],如图是某市连续14天的空气质量指数趋势图,下面说法正确的是( )
A.这14天中有4天空气质量指数为“良”
B.从2日至5日空气质量越来越差
C.这14天中空气质量指数的中位数是103
D.连续三天中空气质量指数方差最小的是9日至11日
解析 根据题图分析数据,对选项逐一判断.
对于A,1日、3日、12日、13日,共4天空气质量指数为“良”,故A正确;
对于B,从2日到5日空气质量指数越来越高,故空气质量越来越差,故B正确;
对于C,中位数为=103.5,故C错误;
对于D,方差小说明3个数据的波动较小,由题图可知D正确.故选ABD.
答案 ABD
8.(多选题)某公司为提高职工政治素养,对全体职工进行了一次时事政治测试,随机抽取了100名职工的成绩,并将其制成如图所示的频率分布直方图.以样本估计总体,则下列结论不正确的是( )
A.该公司职工的测试成绩不低于60分的人数约占总人数的80%
B.该公司职工测试成绩的中位数约为75
C.该公司职工测试成绩的平均值约为68
D.该公司职工测试成绩的众数约为60
解析 对于A,该公司职工的测试成绩不低于60分的频率为(0.02+0.015)×20=0.70,∴该公司职工的测试成绩不低于60分的人数约占总人数的70%,故A错误;
对于B,测试成绩在[20,60)的频率为(0.005+0.01)×20=0.3,测试成绩在[60,80)的频率为0.02×20=0.4,
∴该公司职工测试成绩的中位数约为60+×20=70,故B错误;
对于C,估计该公司职工测试成绩的平均值=30×0.005×20+50×0.01×20+70×0.02×20+90×0.015×20=68,故C正确;
对于D,该公司职工测试成绩的众数约为=70,故D错误.故选ABD.
答案 ABD
二、填空题(每小题5分,共20分)
9.为调查某高校学生对本校文化的了解情况,现采用分层抽样的方法抽取一个容量为500的样本,其中大一年级抽取200人,大二年级抽取100人.若其他年级共有学生3 000人,则该校学生的总人数是________.
解析 由题意知,从其他年级抽取200人,又其他年级共有学生3 000人,所以该校学生的总人数是=7 500.
答案 7 500
10.现有10个数,其平均数是4,且这10个数的平方和是200,那么这组数的方差是________.
解析 设这10个数为a1,a2,…,a10,则有a+a+…+a=200,且a1+a2+…+a10=40,则这10个数的方差为
=
==4.
答案 4
11.如图是根据某中学为敬老院捐款的情况而制作的统计图,已知该校共有学生3 000人,由统计图可得该校共捐款________元.
解析 由扇形统计图可知,该中学高一、高二、高三分别有学生960人、990人、1 050人,由条形统计图知,该中学高一、高二、高三人均捐款分别为15元、13元、10元,所以共捐款15×960+13×990+10×1 050=37 770(元).
答案 37 770
12.从某小区抽取100户居民进行月用电量调查,发现其用电量都在50~350度之间,频率分布直方图如图所示:
(1)直方图中x的值为________.
(2)在这些用户中,用电量落在区间[100,250)内的户数为________.
解析 (1)由于(0.002 4+0.003 6+0.006 0+x+0.002 4+0.001 2)×50=1,解得x=0.004 4.
(2)数据落在[100,250)内的频率是(0.003 6+0.004 4+0.006 0)×50=0.7,所以月用电量在[100,250)内的户数为100×0.7=70.
答案 (1)0.004 4 (2)70
三、解答题(共40分)
13.(10分)某初级中学共有学生2 000名,各年级男、女生人数如下表:
初一年级
初二年级
初三年级
女生
373
x
y
男生
377
370
z
已知在全校学生中随机抽取1名,抽到初二年级女生的概率是0.19.
①求x的值.
②现用分层抽样的方法在全校抽取48名学生,问应在初三年级抽取多少名?
③在②中,若所抽取的初一年级、初二年级、初三年级三个年级学生的体重的平均数分别是40 kg,50 kg,60 kg,方差分别是1,2,3,估计该校所有学生体重的平均数和方差.
解析 ①∵=0.19,∴x=380.
②初三年级人数为y+z=2 000-(373+377+380+370)=500,现用分层抽样的方法在全校抽取48名学生,应在初三年级抽取的人数为×500=12(名).
③初一年级应抽取学生的人数×750=18,
初二年级应抽取学生的人数×750=18,
所以该校所有学生体重的平均数约为
=×40+×50+×60=48.75,
该校所有学生体重的方差约为
s2=×[1+(40-48.75)2]+×[2+(50-48.75)2]+×[3+(60-48.75)2]=62.812 5.
14.(10分)为了了解某工厂生产的产品情况,从该工厂生产的产品中随机抽取一个容量为20的样本,测量它们的尺寸(单位:mm),并分为[92,94),[94,96),[96,98),[98,100),[100,102),[102,104),[104,106]七组,其频率分布直方图如图所示.
(1)求图中x的值;
(2)根据频率分布直方图,估计200件该产品中尺寸在[98,100)内的个数;
(3)记产品尺寸在[98,102)内的为优等品,每件可获利5元;在[92,94)内的为不合格品,每件亏损2元;其余的为合格品,每件可获利3元.已知每台机器一个月共生产3 000件产品.以样本的频率代替总体在各组的频率,若每台机器生产的产品一个月所获得的利润未达到11 000元,则需要对该工厂设备实施升级改造.试判断是否需要对该工厂设备实施升级改造.
解析 (1)由(0.02+0.04+0.06+0.07+0.09+0.10+x)×2=1,解得x=0.12.
(2)估计200件该产品中尺寸在[98,100)内的个数为200×0.09×2=36.
(3)由题意可得,这批产品中优等品有3 000×(0.18+0.20)=1 140(件),
不合格品有3 000×0.04=120(件),
合格品有3 000-1 140-120=1 740(件),
所以每台机器生产的产品一个月所获得的利润为1 140×5+1 740×3-120×2=10 680(元),
因为10 680<11 000,所以需要对该工厂设备实施升级改造.
15.(10分)随着互联网的发展,与餐饮美食相关的手机应用软件层出不穷.现从使用A和B两款订餐软件的商家中分别随机抽取50个商家,对它们的“平均送达时间”进行统计,得到频率分布直方图如图:
(1)试估计使用A款订餐软件的50个商家的“平均送达时间”的众数及平均数(同一组中的数据用该组区间的中点值作代表).
(2)根据以上抽样调查的数据,用样本估计总体,回答下列问题:
①能否认为使用B款订餐软件“平均送达时间”不超过40分的商家达到75%?
②如果你要从A和B两款订餐软件中选择一款订餐,你会选择哪款?请说明理由.
解析 (1)依题意可得,使用A款订餐软件的50个商家的“平均送达时间”的众数约为55.
使用A款订餐软件的50个商家的“平均送达时间”的平均数约为15×0.06+25×0.34+35×0.12+45×0.04+55×0.4+65×0.04=40.
(2)①使用B款订餐软件“平均送达时间”不超过40分的商家的比例估计值为0.04+0.2+0.56=0.80=80%>75%.故可以认为使用B款订餐软件“平均送达时间”不超过40分的商家达到75%.
②因为使用B款订餐软件的50个商家的“平均送达时间”的平均数为15×0.04+25×0.2+35×0.56+45×0.14+55×0.04+65×0.02=35<40,所以选B款订餐软件.
16.(10分)已知甲工厂生产一种内径为36.5 mm的零件,为了了解零件的生产质量,从该厂的2 000 件零件中抽出100件,测得其内径尺寸如下(单位:mm):36.2×16,36.6×12,36.3×12,36.4×12,36.5×20,36.7×12,36.8×16(注:x×n表示有n件尺寸为x mm的零件).
(1)求这100件零件内径尺寸的平均数;
(2)设这100件零件内径尺寸的方差为s2,试估计该厂2 000件零件中其内径尺寸(单位:mm)在(-s,+0.5s)内的件数;
(3)若乙工厂也生产同种零件,为了了解零件的生产质量,从该厂的2 000件零件中抽出100件,测得其内径(单位:mm)的方差为0.040 5,试比较甲、乙两工厂抽检的100件零件内径尺寸的稳定性.
解析 (1)=×[(36.2+36.8)×16+(36.6+36.4)×12+(36.3+36.7)×12+36.5×20]=36.5.
(2)因为|36.2-36.5|=|36.8-36.5|=0.3,|36.6-36.5|=|36.4-36.5|=0.1,|36.3-36.5|=|36.7-36.5|=0.2,|36.5-36.5|=0,故s2=×(0.32×16×2+0.12×12×2+0.22×12×2)=0.040 8.
所以s=∈(0.2,0.21),故(-s,+0.5s)∈(36.29,36.605),故1件零件内径尺寸在(-s,+0.5s)内的频率为=0.56,故估计该厂2 000件零件中内径尺寸在(-s,+0.5s)内的件数为2 000×0.56=1 120.
(3)因为甲工厂抽检的100个零件内径尺寸的方差0.040 8>0.040 5,所以乙工厂抽检的100件零件内径尺寸的稳定性更好.
学科网(北京)股份有限公司
$$