内容正文:
第六章 统计 单元检测卷 一、选择题:本题共8小题,每小题5分,共40分.在每小题给出的四个选项中,只有一项是符合题目要求的. 1.为了调查参加北京冬奥会的2 892名运动员的平均年龄,从中抽取了100名运动员进行调查,下面说法正确的是 ( ) A.2 892名运动员是总体 B.2 892名运动员的年龄是总体 C.抽取的100名运动员是样本 D.抽取的100名运动员的平均年龄是样本 2.从800件产品中抽取60件进行质检,利用随机抽样法抽取样本时,先将800件产品按001,002,…,800进行编号.现从如下随机数表中第3行第1列的数1开始往右读数(三位三位地读),则抽取的第4件产品的编号是 ( ) 8442175331 5724550688 7704744767 2176335025 8392120676 6301637859 1695566719 9810507175 1286735807 4439523879 3321123429 7864560782 5242074438 1551001342 9966027954 A.169 B.556 C.671 D.105 3.甲、乙两组各八名学生在一次英语听力测试中的成绩(单位:分)如下. 甲:9,16,25,18,24,x,27,24. 乙:8,17,y,13,24,28,20,22. 已知甲组数据的25%分位数为14,乙组数据的平均数为18.5,则x,y的值分别为 ( ) A.12,16 B.12,18 C.14,16 D.14,18 4.非空数集A={a1,a2,a3,…,an}(n∈N*)中,所有元素的算术平均数记为E(A),即E(A)=.若非空数集B满足下列两个条件:①B⊆A,②E(B)=E(A),则称B为A的一个“保均值子集”. 据此,集合{1,2,3,4,5}的“保均值子集”有 ( ) A.5个 B.6个 C.7个 D.8个 5.若一个样本容量为8的样本的平均数为5,方差为s2.现样本中又加入一个新数据5,此时样本容量为9,平均数为,方差为,则 ( ) A.=5,s2<2 B.=5,s2=2 C.<5,s2>2 D.<5,s2<2 6.为了普及环保知识,增强环保意识,某大学随机抽取30名学生参加环保知识测试,成绩(满分10分)如图1所示,假设成绩的中位数为me,众数为mo,平均值为,则 ( ) 图1 A.me=mo= B.me=mo< C.me<mo< D.mo<me< 7.某企业有3个分厂生产同一种电子产品,第一、二、三分厂的产量之比为1∶2∶1,用分层随机抽样的方法(每个分厂生产的产品为一层)从3个分厂生产的电子产品中共抽取100件进行使用寿命的测试,由所得的测试结果算得从第一、二、三分厂抽取的产品的使用寿命的平均数分别为 980 h,1 020 h,1 032 h,则抽取的100件产品的使用寿命的平均数为 ( ) A.1 013 h B.1 014 h C.1 016 h D.1 022 h 8.从某中学高一年级中随机抽取100名学生的成绩(单位:分),绘制成频率分布直方图(如图2),则这100名学生成绩的平均数、中位数分别为 ( ) 图2 A.125分,125分 B.125.1分,125分 C.124.5分,124分 D.125分,124分 二、选择题:本题共3小题,每小题6分,共18分.在每小题给出的选项中,有多项符合题目要求.全部选对的得6分,部分选对的得部分分,有选错的得0分. 9.一组数据2x1+1,2x2+1,2x3+1,…,2xn+1的平均值为7,方差为4,记3x1+2,3x2+2,3x3+2,…,3xn+2的平均值为a,方差为b,则 ( ) A.a=7 B.a=11 C.b=12 D.b=9 10.某学校为了调查学生一周在生活方面的支出情况,抽取了一个样本,其频率分布直方图如图3所示,其中支出在[50,60)元的学生有60人,则下列说法正确的是 ( ) 图3 A.样本中支出在[50,60)元的频率为0.03 B.样本中支出不少于40元的人数为132 C.估计该校学生一周在生活方面的平均支出为43.6元 D.若该校有2 000名学生,则一定有600人一周在生活方面的支出在[50,60)元 11.冬末春初,乍暖还寒,人们容易感冒发热,若发生群体性发热,则会影响到人们的身体健康,干扰正常工作生产.某大型公司规定:若任意连续7天,每天不超过5人体温高于37.3 ,则称没有发生群体性发热.下列连续7天体温高于37.3 的人数的统计特征数中,能判定该公司没有发生群体性发热的为 ( ) A.中位数为3,众数为2 B.平均数小于1,中位数为1 C.平均数为3,众数为4 D.平均数为2,标准差为 三、填空题:本题共3小题,每小题5分,共15分. 12.某制药厂月生产A,B,C三种药品共4 000件,为了保证药品质量,省药监局抽样检验,根据分层随机抽样的结果,省药监局的统计员制作了如下的统计表格: 药品类型 A B C 药品数量/件 1 600 样本容量 160 由于不小心,表格中A,C药品的有关数据已被污损,统计员记得A药品的样本容量比C药品的样本容量多20,根据以上信息,可得C药品的样本容量是 . 13.为了解本市居民的生活成本,甲、乙、丙三名同学利用假期分别对三个社区进行了“家庭每月日常消费额(单位:元)”的调查.甲、乙、丙将调查所得到的数据分别绘制成频率分布直方图,如图4(1)(2)(3)所示,记甲、乙、丙所调查数据的标准差分别为s1,s2,s3,则它们的大小关系为 (用“>”连接). 图4 14.某班有50名学生,在一次考试中统计出平均分数为70,方差为75,后来发现有2名学生的成绩统计有误,学生甲实际得分是80分,却误记为60分,学生乙实际得分是70分,却误记为90分,更正后的平均分数为 ,方差是 .(本题第一空2分,第二空3分) 四、解答题:本题共5小题,共77分.解答应写出文字说明、证明过程或演算步骤. 15.(13分)某市共有户籍人口400万,其中老人约有66万.为了了解老人们的健康状况,政府从老人中随机抽取600人并委托医疗机构免费为他们进行健康评估,健康状况共分为不能自理、不健康尚能自理、基本健康、健康四个等级,并以80岁为界限分成两个群体进行统计,制作成如图5所示的统计图. 图5 (1)若采用分层随机抽样的方法从样本中的不能自理的老人中抽取8人进一步了解他们的生活状况,则两个群体中各应抽取多少人? (2)估算该市80岁及以上老人占全市户籍人口的百分比. 16.(15分)为了让学生了解环保知识,增强环保意识,某中学举行了一次环保知识竞赛,共有900名学生参加了这次竞赛.为了了解本次竞赛的成绩情况,从中抽取了部分学生的成绩(得分取正整数,满分为100分)进行统计.请你根据下面尚未完成的频率分布表和频率分布直方图(图6),解答下列问题: 分组 频数 频率 [50,60) 4 0.08 [60,70) 0.16 [70,80) 10 [80,90) 16 0.32 [90,100] 合计 图6 (1)完成频率分布表; (2)不具体计算,补全如图6所示的频率分布直方图; (3)估计这900名学生竞赛的平均成绩(同一组中的数据用该组区间的中点值作代表). 17.(15分)2023年3月12日是我国第45个植树节.劳动人民在植树节这天种植树木,对治理土地荒漠化和沙化有着重要的意义.治理土地荒漠化离不开优质的树苗,现从苗圃中随机抽测了200株树苗的高度(单位:cm),得到如图7所示的频率分布直方图. 图7 (1)求频率分布直方图中a的值及众数、中位数. (2)若树苗高度为185 cm及以上是可以移栽的合格树苗, ①求合格树苗的平均高度(结果精确到个位数); ②从样本中按分层随机抽样方法抽取20株树苗作进一步研究,不合格树苗、合格树苗分别应抽取多少株? 18.(17分)某校高一年级学生全部参加了体育科目的达标测试,现从中随机抽取40名学生的测试成绩(单位:分),整理数据并按分数段[40,50),[50,60),[60,70),[70,80),[80,90),[90,100]进行分组.已知测试分数均为整数,现用每组区间的中点值代替该组中的每个数据,得到体育成绩的折线图如图8所示. 图8 (1)若体育成绩大于或等于70分的学生为“体育良生”,已知该校高一年级有1 000名学生,试估计该校高一年级学生“体育良生”的人数; (2)用样本估计总体的思想,试估计该校高一年级学生达标测试的平均分; (3)假设甲、乙、丙三人的体育成绩分别为a,b,c,且a∈[70,80),b∈[80,90),c∈[90,100],当三人的体育成绩方差s2最小时,写出a,b,c的所有可能取值(不要求证明). 19.(17分)某学校为了解学校食堂的服务情况,随机调查了50名就餐的教师和学生.根据这50名师生对食堂服务质量的评分,绘制出了如图9所示的频率分布直方图,其中样本数据分组为[40,50),[50,60),…,[90,100]. (1)求频率分布直方图中a的值. (2)若采用分层随机抽样的方式从评分在[40,60), [60,80), [80,100]内的师生中抽取10人,则评分在[60,80)内的师生应抽取多少人? (3)学校规定:师生对食堂服务质量的评分不得低于 75分,否则将进行内部整顿.用每组数据的中点值代替该组数据,试估计该校师生对食堂服务质量评分的平均分,并据此回答食堂是否需要进行内部整顿. 图9 第六章 统计 单元检测卷 参考答案 1.B 根据调查目的可知,总体是这2 892名运动员的年龄,个体是每名运动员的年龄,样本是抽取的100名运动员的年龄,而不是平均年龄. 2.D 找到第3行第1列的数1,开始往右读数,每次读取三位,超过800的数跳过去不读,前面已经读过的数也跳过去不读,从而抽取的前4件产品的编号依次是169,556,671,105.故抽取的第4件产品的编号是105. 3.A 将甲组剩余7个数据从小到大排列:9,16,18,24,24,25,27,因为8 25%=2,所以14 2=16+x,所以x=12. 因为18.5=(8+17+y+13+24+28+20+22),所以y=16. 4.C 记集合C={1,2,3,4,5}中,所有元素的算术平均数E(C)==3,∴集合C的“保均值子集”有:{3},{1,5},{2,4},{3,1,5},{3,2,4},{1,5,2,4},{1,2,3,4,5}.共7个. 5.B 由题意得==5,=,解得s2=2. 6.D 由条形统计图可知,30名学生的成绩依次为2个3分,3个4分,10个5分,6个6分,3个7分,2个8分,2个9分,2个10分.中位数为第15,16个数(分别为5,6)的平均数,即me=5.5. 5出现次数最多,故mo=5. = (2 3+3 4+10 5+6 6+3 7+2 8+2 9+2 10)≈5.97. 于是得mo<me<. 7.A 由分层随机抽样的知识可知,从第一、二、三分厂抽取的电子产品数量分别为25件、50件、25件,则抽取的100件产品的使用寿命的平均数为 (980 25+1 020 50+1 032 25)=1 013(h). 因为第一、二、三分厂的产量之比为1∶2∶1,所以可以根据各层抽取样本数量所占的比例计算抽取的100件产品的使用寿命的平均数为 (980+2 1 020+1 032)=1 013(h). 8.D 由题图可知,(a+a-0.005) 10=1-(0.01+0.015+0.03) 10,解得a=0.025,则这100名学生成绩的平均数为105 0.1+115 0.3+125 0.25+135 0.2+145 0.15=125(分). 设中位数为x分,则x在120~130之间,则0.01 10+0.03 10+0.025 (x-120)=0.5,解得x=124. 9.BD 因为2x1+1,2x2+1,2x3+1,…,2xn+1的平均值为7,方差为4,所以x1,x2,x3,…,xn的平均值为(7-1) 2=3,方差为4 22=1,所以3x1+2,3x2+2,3x3+2,…,3xn+2的平均值a=3 3+2=11,方差b=32 1=9. 10.BC 由频率分布直方图得: 在A中,样本中支出在[50,60)元的频率为1-(0.01+0.024+0.036) 10=0.3,故A错误; 在B中,样本中支出不少于40元的人数为 60+60=132,故B正确; 在C中,由频率分布直方图可估计平均数为25 0.1+35 0.24+45 0.36+55 0.3=43.6(元),故C正确; 在D中,若该校有2 000名学生,则0.3 2 000=600(人),故可能有600人一周在生活方面的支出在[50,60)元,故D错误. 11.BD 依题意,设连续7天,体温高于37.3 的人数分别为a,b,c,d,e,f,g,且0≤a≤b≤c≤d≤e≤f≤g,a,b,c,d,e,f,g∈N. 对于A,可取2,2,2,3,3,4,6,则满足中位数为3,众数为2,但是第7天的人数为6,6>5,故选项A错误; 对于B,若g≥6,由中位数为1,可知平均数为 (a+b+c+d+e+f+g)≥1,与平均数小于1矛盾,故g≤5,故选项B正确; 对于C,取0,1,2,4,4,4,6,则满足平均数为3,众数为4,但是第7天的人数为6,故选项C错误; 对于D,当平均数为2,标准差为时,a+b+c+d+e+f+g=14,(a-2)2+…+(g-2)2=14,若g≥6,则(a-2)2+…+(g-2)2>14,与(a-2)2+…+(g-2)2=14矛盾,故g≤5,故选项D正确. 12.110 因为==,所以样本的总容量是4 000 =400.设C药品的样本容量是x,根据A药品的样本容量比C药品的样本容量多20,得A药品的样本容量是x+20,由x+x+20=400-160,得x=110. 13.s1>s2>s3 本题主要考查频率分布直方图及由频率分布直方图估计总体数据的情况.观察三个频率分布直方图,可知第一个图所表示的数据比较分散,第三个图所表示的数据比较集中,所以s1最大,s3最小,即s1>s2>s3. 14.70 67 设更正前甲、乙的成绩依次为a1,a2,其余同学的成绩依次为a3,a4,…,a50, 则a1+a2+…+a50=50 70,即60+90+a3+…+a50=50 70,(a1-70)2+(a2-70)2+…+(a50-70)2=50 75, 即102+202+(a3-70)2+…+(a50-70)2=50 75. 所以更正后平均分数为= (80+70+a3+…+a50)=70, 更正后方差为s2= [(80-70)2+(70-70)2+(a3-70)2+…+(a50-70)2]= [100+(a3-70)2+…+(a50-70)2]= [100+50 75-102-202]=67. 15.(1)整理数据如下表: 健康情况 健康 基本健康 不健康 尚能自理 不能 自理 80岁及 以上人数 20 45 20 15 80岁以 下人数 200 225 50 25 从图表中知, 80岁及以上老人应抽取8 =3(人), 80岁以下老人应抽取8 =5(人). (2)在600人中80岁及以上老人所占比为=, 用样本估计总体,80岁及以上老人占全市户籍人口的百分比为 100%=2.75%. 16.(1)=50,即样本容量为50.成绩在[60,70)内的频数为50 0.16=8.成绩在[70,80)内的频率为10 50=0.2.成绩在[90,100]内的频数为50-4-8-10-16=12,该组的频率为=0.24. 又各小组频率之和为1,所以频率分布表中的六个空格(从左至右,从上至下)应分别填8,0.2,12,0.24,50,1. (2)根据小矩形的高与频数成正比,设第一个小矩形的高为h1,第二个小矩形的高为h2,第五个小矩形的高为h5. 由等量关系得=,=,所以h2=2h1,h5=3h1.这样即可补全频率分布直方图,如图D 1. 图D 1 (3)50名学生竞赛的平均成绩为 ==79.8(分). 利用样本估计总体的思想估计这900名学生竞赛的平均成绩为79.8分. 17.(1)由题意得,(0.001 5+0.011 0+0.022 5+0.030 0+a+0.008 0+0.002 0) 10=1,解得a=0.025 0. 众数为=190(cm). 因为(0.001 5+0.011 0+0.022 5) 10=0.35<0.5, 设中位数为x cm,则(0.001 5+0.011 0+0.022 5) 10+(x-185) 0.03=0.5,解得x=190,所以中位数为190 cm. (2)①因为树苗高度为185 cm及以上的频率为(0.030 0+0.025 0+0.008 0+0.002 0) 10=0.65, 所以合格树苗的平均高度为(0.3 190+0.25 200+0.08 210+0.02 220) 0.65≈197(cm). ②由①知样本中合格树苗的频率为0.65,则不合格树苗的频率为1-0.65=0.35, 所以按分层随机抽样方法抽取20株树苗,则不合格树苗应抽取20 0.35=7(株),合格树苗应抽取20 0.65=13(株). 18.(1)由折线图得体育成绩大于或等于70分的学生有14+3+13=30(人),∴估计该校高一年级学生“体育良生”的人数为1 000 =750(人). (2)用样本估计总体的思想,估计该校高一年级学生达标测试的平均分为 (45 2+55 6+65 2+75 14+85 3+95 13)=77.25(分). (3)∵甲、乙、丙三人的体育成绩分别为a,b,c,且a∈[70,80),b∈[80,90),c∈[90,100],其中a,b,c∈N,∴当三人的体育成绩方差s2最小时,a,b,c的所有可能取值为79,84,90或79,85,90. 19.(1)由(0.004+a+0.022+0.028+0.022+0.018) 10=1,解得a=0.006. (2)由频率分布直方图可知,评分在[40,60), [60,80), [80,100]内的师生人数之比为(0.004+0.006)∶(0.022+0.028)∶(0.022+0.018)=1∶5∶4,所以评分在[60,80)内的师生应抽取10 =5(人). (3)由题中数据可得师生对食堂服务质量评分的平均分=45 0.004 10+55 0.006 10+65 0.022 10+75 0.028 10+85 0.022 10+95 0.018 10=76.2(分). 因为76.2>75,所以食堂不需要内部整顿. 学科网(北京)股份有限公司 $$