内容正文:
专题01统计
目录
A题型建模・专项突破
题型一、总体与样本 1
题型二、普查与抽样 1
题型三、简单随机抽样 1
题型四、随机数表法 2
题型五、抽样比、样本总量、各层总数、总体容量的计算(重点) 3
题型六、频率分布直方图(重点) 4
题型七、茎叶图(重点) 8
题型八、平均数、极差、方差、标准差(重点) 9
题型九、百分位数(重点) 11
B综合攻坚・能力跃升
题型一、总体与样本
1.(22-23高二上·上海长宁·阶段练习)为了了解某水库里大概有多少条鱼,先打捞出了1000条鱼,在鱼身上标记一个不会掉落的印记后放回水库,过一段时间后再次捕捞了200条鱼,发现其中5条鱼有印记.则这个水库里大概有 条鱼
2.(23-24高二上·上海长宁·期末)从总体容量为的一批电子元件中抽取一个容量为30的样本,若每个电子元件被抽到的可能性为,则总体容量 .
3.某校高二年级有300人,为调查年级学生每天上网时间,现抽取的同学做调查问卷,该统计的样本量为 .
题型二、普查与抽样
4.(24-25高二上·上海·期末)在以下调查中,适合用普查的是( ).
A.调查某批次汽车的抗撞击能力 B.调查一批LED灯的寿命
C.调查某城市居民的食品消费结构 D.调查一个班级学生的身高情况
5.(24-25高二上·上海长宁·期末)完成下列任务所获得的数据是观测数据还是实验数据 .
某旅游公司为开发新的旅游产品,调查了5000名客户对于旅游目的地的偏好.
题型三、简单随机抽样
6.下列抽样方法是简单随机抽样的是( )
A.某医院从200名医生中,挑选出50名最优秀的医生去参加抗疫活动
B.从10个手机中逐个不放回地随机抽取2个进行质量检验
C.从空间直角坐标系中抽取10个点作为样本
D.饮料公司从仓库中的500箱饮料中一次性抽取前10箱进行质量检查
7.(23-24高二上·上海·期末)已知一个总体含有N个个体,要用简单随机抽样方法从中抽取一个个体,则在抽样过程中,每个个体被抽取的概率( )
A.变小 B.变大 C.相等 D.无法确定
8.(24-25高二上·上海黄浦·阶段练习)某果园种植了240棵苹果树,现从中随机抽取了20棵苹果树,算得这20棵苹果树平均每棵产量为28kg,则预估该果园的苹果产量为 kg.
9.(22-23高二上·上海浦东新·期末)“二十四节气歌”是以“春、夏、秋、冬”开始的四句诗.某校高二共有学生400名,随机抽查100名学生并提问二十四节气歌,只能说出一句的有45人,能说出两句及以上的有38人,据此估计该校高二年级的400名学生中,对“二十四节气歌”一句也说不出的有 人.
题型四、随机数表法
10.(24-25高二上·上海·阶段练习)某工厂利用随机数表对生产的 50 个零件进行抽样测试, 先将 50 个零件进行编号, 编号分别为 01, 02, ......, 50. 从中抽取 5 个样本,下面提供随机数表的第 1 行到第 2 行:
66 67 40 37 14 64 05 71 11 05 65 09 95 86 68 76 83 20 37 90
57 16 03 11 63 14 90 84 45 21 75 73 88 05 90 52 23 59 43 10
若从表中第 1 行第 7 列开始向右依次读取数据, 则得到的第5个样本编号是 ( ).
A.09 B.05 C.65 D.71
11.(22-23高二下·上海浦东新·期末)从总体容量为240的研究对象中挑选10个样本,利用随机数表法抽取样本时,先将所有研究对象按001,002,,240进行编号,然后从随机数表第4行第5个数开始向右读,则选出的第4个编号是(注:下面为随机数表的第3~5行)( )
91685307 17337298 29849526 37515923 03886191 14679054
49042443 36160865 53317333 03570684 57173171 84357012
17355239 47454753 01644305 44017425 26545229 10694745
A.865 B.086 C.173 D.171
12.(24-25高二上·上海长宁·期末)现利用随机数表法从编号为00,01,02,…,18,19的20支水笔中随机选取6支,选取方法是从下列随机数表第1行的第9个数字开始由左到右依次选取两个数字,则选出来的第6支水笔的编号为 .
95226000 49840128 66175168 39682927 43772366 27096623
92583556 43890890 06482834 59741458 29778149 64608925
13.(24-25高二下·上海·阶段练习)设总体由编号为的个个体组成,利用下面的随机数表选取6个个体,选取方法是从该随机数表第1行的第6个数字开始由左到右依次选取两个数字,则选出来的第3个个体的编号为 .
5044664421 6606580462 6155643502 4235489632 1452415248
2266221586 2663754199 5842367224 5837521851 0337183911
题型五、抽样比、样本总量、各层总数、总体容量的计算
14.(23-24高二上·上海·期末)某校有学生1800人,为了解学生的作业负担,学校向学生家长随机抽取了1000人进行调查,其中70%的家长回答他们孩子每天睡眠时间大致在6-7小时,28%的家长回答他们孩子回家做作业的时间一般在3-4小时,下列说明正确的是( ).
A.总体是1000 B.个体是每一名学生
C.样本是1000名学生 D.样本容量是1000
15.(23-24高二上·上海·阶段练习)为了解黄浦区全体高二学生“小三门”的选科情况,区教育局共联络了950名黄浦区在读高二学生进行调查,在这项调查中,样本量是 .
16.(24-25高二下·上海·阶段练习)某高中为了了解学生收看空中课堂的具体情况,利用分层抽样的方法从高中三个年级的学生中随机抽取了200名进行问卷调查,其中从高一年级的学生中抽取了40名,从高二年级的学生中抽取了50名,若高三年级共有学生440名,则该高中共有学生 名.
17.(23-24高二上·上海·阶段练习)管理人员为了了解某水库里大概有多少条鱼,拖网打捞出1000条鱼,在鱼身处打上一个不会掉落的印记,再放回水库,一个月后再次捕捞1000条鱼,发现其中有20条有印记的鱼,问:这个水库里大概有 条鱼.
18.(22-23高二上·上海宝山·期末)某医院对某学校高三年级的600名学生进行身体健康调查,采用男女分层抽样法抽取一个容量为50的样本,已知男生比女生少抽了10人,则该年级的女生人数是 .
19.(22-23高二下·上海浦东新·期中)某校共有师生2400人,现用分层抽样的方法,从所有师生中抽取一个容量为180的样本,已知从学生中抽取的人数为165,则该学校的教师人数是 .
20.(22-23高二下·上海黄浦·阶段练习)某高中共有学生人,其中高一、高二、高三的学生人数比为,现用分层抽样的方法从该校所有学生中抽取一个容量为60的样本,则高三年级应该抽取 人.
21.(23-24高二上·上海黄浦·期末)某高中二年级共有学生425名,其中男生204名,女生221名,为了解该校高二年级学生的身高情况,从中抽取50名学生测量身高,若采用分层随机抽样的方法,则要抽取男生的人数为 .
22.(22-23高二下·上海浦东新·期末)为了了解同学们的作业量,学校决定采用分层抽样的方法从高一、高二、高三学生中选取150人进行调查,已知高一学生有400人,高二学生有500人,高三学生有600人,则应抽取的高三学生人数为 .
23.(22-23高二下·上海杨浦·期中)在100个人中,其中45人为女性,55人为男性,计划抽取20人测量身高.若按性别进行分层随机抽样,则应该抽取 位男性测量身高。
24.(24-25高二上·上海长宁·期末)某校高一共有学生240人,现采用分层抽样的方法从中抽取80人进行体能测试;若这80人中有35人是男生,则该校高一男生共有 人.
25.(24-25高二上·上海徐汇·期末)某高中的三个年级共有学生1000人,其中高一300人,高二340人,高三360人,该校现在要了解学生对校本课程的看法,准备从全校学生中抽取50人进行访谈,若采取分层抽样,且按年级来分层,则高一年级应抽取的人数是 .
26.(23-24高二上·上海·期末)某大学共有教师1000人,其中教授、副教授、讲师、助教的人数比为1:4:3:2,现用分层抽样的方法从全校所有教师中抽取一个容量为40的样本,讲师应抽取的人数为 .
27.(23-24高二上·上海·期末)某高中二年级共有学生425名,其中男生204名,女生221名,为了解该校高二年级学生的身高情况,现从中抽取50名学生测量身高,应当采用 的方法求出男女生分别要抽取 、 名,然后在此基础上进行简单随机抽样.
题型六、频率分布直方图
28.(24-25高二上·上海·期末)某校抽取100名学生测量他们的身高,其山最大值为,最小值,绘制身高频率分布直方图,若组距为5,且第一组下限为,则组数为 .
29.(24-25高二上·上海·期末)已知某校高一年级所有学生的体重(单位:kg),且最大值为98,最小值为44.在制作频率分布直方图时,要对这些体重数据进行分组.若组距为5,则将数据分成 组为宜.
30.(24-25高二下·上海·期末)对学校高三年级某班50名学生的高校招生体检表中视力情况进行统计,其结果的频率分布直方图如图.若高校专业对视力要求不低于0.9,则该班学生中有 人能报考该专业.
31.(23-24高二上·上海·期末)某学校组织全校学生参加网络安全知识竞赛,成绩(单位:分)的频率分布直方图如图所示,数据的分组依次为,若该校的学生总人数为1000,则成绩不低于60分的学生人数为 .
32.(25-26高二上·上海奉贤·阶段练习)为进一步增强学生的疫情防控意识,友实学校组织学生进行了新冠肺炎疫情防控科普知识线上问答,共有100人参加了这次问答,将他们的成绩(满分100分)分成六组:,,,,,,制成如图所示的频率分布直方图.
(1)求图中的值;
(2)用分层抽样的方法从问答成绩在内的学生中抽取24人参加疫情防控知识宣讲,那么在,,内应各抽取多少人?
33.(24-25高二下·上海·期末)为积极参与马拉松比赛,某中学决定从3000名学生随机抽取100名学生进行体能检测,这100名学生进行了15公里的马拉松比赛,比赛成绩(分钟)的频率分布直方图如图所示,其中成绩分布区间是,,,,.
(1)求图中的值,并估计这100名学生比赛成绩的平均数;
(2)根据样本频率分布直方图,估计该校3000名学生中约有多少名学生能在80分钟内完成15公里马拉松比赛?
34.(24-25高二上·上海·期末)某学校组织全校学生进行了一次“两会知识知多少”的问卷测试,已知所有学生的测试成绩均位于区间,从中随机抽取了40名学生的测试成绩,绘制得到如图所示的频率分布直方图.
(1)求图中的值,并估算这40名学生测试成绩的平均数;
(2)现学校准备利用分层随机抽样方法,从和的学生中抽取7人组成两会知识宣讲团.从选定的7人中随机抽取2人对高一同学进行宣讲,设事件为“至少有1人测试成绩位于区间”,求事件发生的概率.
35.(22-23高二下·上海长宁·期末)A校为了了解学生对食堂的满意程度,随机调查了50名就餐学生,根据这50名学生对食堂满意度的评分,绘制出如图所示的频率分布直方图,其中样本数据分组为,,…,.
(1)求频率分布直方图中a的值;
(2)若A校共有3000名学生,试估计全体学生中对食堂满意度不低于80分的人数.
36.(22-23高二下·上海浦东新·期中)为了解某校高二年级学生数学学习的阶段性表现,年级组织了一次阶段测试.已知此次考试共有450名学生参加,考试成绩的频率分布直方图如下.
450名高二学生数学成绩的频率分布直方图
(1)求的值;
(2)估计这次数学考试的平均成绩;
(3)求这次数学考试的及格率(不低于60分视作及格).
37.(23-24高二上·上海宝山·阶段练习)为了让学生适应上海“3+3”的新高考模式,某校在高二期末考试中使用赋分制给等级考科目的成绩进行赋分.先按照考生原始分从高到低按比例划定A+、A、B+、B、B-、C+、C、C-、D+、D、E共5等11级,然后在相应赋分区间内利用转换公式进行赋分,A+和E级排名各占比5%,其余各级排名各占比10%.现从全年级的等级考化学成绩中随机取100名学生的原始成绩(满分100分)进行分析,其频率分布直方图如图所示:
(1)求图中的值;
(2)若采用分层抽样的方法,从原始成绩在和内的学生中共抽取6人查看他们的答题情况,再从中选取2人进行个案分析,求这2人中恰有一人原始成绩在内的概率;
(3)已知落在的平均成绩,方差,落在的平均成绩,方差,求落在的平均成绩,并估计落在的成绩的标准差(结果精确到0.1).
题型七、茎叶图
38.(22-23高二上·上海浦东新·期末)小明同学每天阅读数学文化相关的书籍,他每天阅读的页数分别为:4、5、4.5、5、6、8、7、5、4.5、6(单位:页).下列图形中不利于描述这些数据的是( )
A.条形图 B.茎叶图 C.散点图 D.扇形图
39.(22-23高二·上海·单元测试)已知甲、乙两组数据如茎叶图所示,若它们的中位数相同,平均数也相同,则图中的m,n的比值 .
甲
乙
7
2
n
9
m
3
2
4
8
40.(22-23高二上·上海闵行·期末)甲、乙两名运动员5场比赛得分的茎叶图如图所示已知甲得分的极差为32,乙得分的众数为26,则 .
41.(22-23高二下·上海浦东新·期末)如图所示的茎叶图记录着甲、乙两支篮球是各6名球员某份比赛的得分数据(单位:分).若这两组数据的中位数相等,且平均值也相等,则 .
42.(22-23高二上·上海虹口·期中)某社区安置了15个体温检测点,每个检测点每天检测的人数都是随机的,不受位置等因素影响,如图是由2021年1月1日检测人数绘制的茎叶图,则某个检测点在这一天检测人数达145及以上的概率是 .
13
0
2
4
6
14
0
0
0
5
6
8
8
15
2
3
3
4
43.(22-23高二上·上海徐汇·期末)从本市某高中全体高二学生中抽取部分学生参加体能测试,按照测试成绩绘制茎叶图,并以,,,,为分组作出频率分布直方图,后来茎叶图受到了污损,可见部分信息如图,则a的值为 .
44.(23-24高二下·上海静安·期末)甲、乙两位气步枪运动员在射击队内的选拔赛成绩茎叶图如右:
(1)求甲、乙两名选手射击的平均环数;
(2)请用具有统计意义的数量来刻画甲、乙两位运动员的射击成绩的稳定性,并帮助射击队选拔一名运动员外出参加比赛.
题型八、平均数、极差、方差、标准差
45.(24-25高二上·上海黄浦·期末)某校有学生500人,其中男生320人,女生180人.某人想了解该校全体学生的身高(单位:cm)信息,从男生、女生中分别随机抽取人进行测量.如果已知男生样本的均值为173.5,方差为17,女生样本的均值为163.83,方差为30.03,但原始测量数据已丢失.设总体均值与方差分别为与,则下列说法正确的是( ).
A.若,可算出总样本的均值与方差,且将其分别作为与的估计值是合适的
B.若,无法算出总样本的均值与方差
C.若,可算出总样本的均值与方差,且将其分别作为与的估计值是合适的
D.若,无法算出总样本的均值与方差
46.(24-25高二上·上海·期末)校高一年级共有学生330名,为了解该校高一年级学生的身高情况,学校采用分层随机抽样的方法抽取66名学生,其中女生32名,男生34名,测量他们的身高.
(1)该校高一学生中男、女生各有多少名?
(2)在32名女生身高的数据中,其中一个数据记录有误,错将165cm记录为156cm,由错误数据求得这32个数据的平均数为161cm,方差为23.6875,求原始数据的平均数及方差(平均数结果保留精确值,方差结果精确到0.01).
47.(23-24高二下·上海·期中)为了让学生适应上海“3+3”的新高考模式,某校在高二期末考试中使用赋分制给等级考科目的成绩进行赋分.先按照考生原始分从高到低按比例划定,共5等11级,然后在相应赋分区间内利用转换公式进行赋分,和E级排名各占比5%,其余各级排名各占比10%.现从全年级的等级考化学成绩中随机取100名学生的原始成绩(满分100分)进行分析,其频率分布直方图如图所示:
(1)若采用分层抽样的方法,从原始成绩在和内的学生中共抽取5人查看他们的答题情况,再从中选取2人进行个案分析,求这2人中至少有一人原始成绩在内的概率;
(2)已知落在的平均成绩,方差,落在的平均成绩,方差,求落在的平均成绩,并估计落在的成绩的标准差s(结果精确到0.1).
48.(23-24高二下·上海嘉定·期末)用分层随机抽样从某校高一年级学生的数学期末成绩(满分100分,成绩都是整数)中抽取一个容量为100的样本,其中男生成绩数据40个,女生成绩数据60个,再将40个男生成绩样本数据分为6组: [40,50)、[50,60)、[60,70)、[70,80)、[80,90)、[90,100].绘制得到如图所示的频率分布直方图.
(1)求a的值;
(2)若在区间[40,50)和[90,100]内的两组男生成绩样本数据中,随机抽取两个进行调查,求调查对象来自不同分组的概率:
(3)已知男生成绩样本数据的平均数和方差分别为71和187.75,女生成绩样本数据的平均数和方差分别为73.5和119,求总样本的平均数和方差.
题型九、百分位数
49.(24-25高二下·上海·阶段练习)以下数据为参加某次数学竞赛的15人的成绩(单位:分),分数从低到高依次是:56、70、72、78、79、80、81、83、84、85、88、90、91、94、98,则这15人成绩的第60百分位数是 .
50.(24-25高二上·上海金山·期末)现有一组数据:,其第70百分位数为 .
51.(24-25高二上·上海·期末)现有7张卡片,分别写上数字2,4,5,5,6,9,16,则这7个数的第75百分位数是 .
52.(23-24高二下·上海·期中)以下数据为参加某次数学竞赛的15人的成绩(单位:分),分数从低到高依次是:,,则这15人成绩的第80百分位数是 .
53.(24-25高二上·上海·阶段练习)某次数学考试后,随机选取14位学生的成绩,得到如下茎叶图,其中个数部分作为“叶”,百位数和十位数作为“茎”,若该组数据的第25百分位数是87,则x的值为 .
54.(23-24高二下·上海·阶段练习)某个品种的小麦麦穗长度(单位:)的样本数据的茎叶图如图所示,其中整数部分为“茎”,小数部分为“叶”,则这组数据的第百分位数为 .
55.(23-24高二下·上海杨浦·期中)小明为了解自己每天花在体育锻炼上的时间(单位:min),连续记录了7天的数据并绘制成如图所示的茎叶图,则这组数据的第50百分位数是 .
56.(22-23高二下·上海静安·期中)随着中国实施制造强国战略以来,中国制造(MadeinChina)逐渐成为世界上认知度最高的标签之一,企业也越来越重视产品质量的全程控制某企业从生产的一批产品中抽取40件作为样本,检测其质量指标值,质量指标的范围为,经过数据处理后得到如右频率分布直方图.则频率分布直方图中质量指标值的第30百分位数是 .
57.(24-25高二上·上海宝山·期末)某学校为了获得该校全体高中学生的体育锻炼情况,按男、女学生的比例分别抽样调查了48名男生和27名女生的每周锻炼时间.通过计算得到男生每周锻炼时间的平均数为7.6小时,方差为7;女生每周锻炼时间的平均数为6.4小时,方差为8.
(1)若该校男生总数为1280,求该校学生总数;
(2)若所选27名女生每周锻炼时间从小到大排列后的第9至第13个数据依次为5、5.3、5.6、5.8、5.9,求所选女生样本的第40百分位数;
(3)求所有样本数据的平均数和方差(精确到0.001).
58.(24-25高二上·上海青浦·期末)为加强学生睡眠监测督导,学校对高中三个年级学生的日均睡眠时间进行调查.根据分层随机抽样法,学校在高一、高二和高三年级中共抽取了100名学生的日均睡眠时间作为样本,其中高一35人,高二33人.已知该校高三年级一共512人.
(1)学校高中三个年级一共有多少个学生?
(2)若抽取100名学生的样本极差为2,数据如下表所示(其中,n是正整数)
日均睡眠时间(小时)
8.5
9
9.5
10
学生数量
32
13
11
4
求该样本的第40百分位数.
一、单选题
1.(22-23高二上·上海浦东新·期末)某校组织了一次航空知识竞赛,甲、乙两个班级各派8名同学代表参赛.两个班级的数学课代表合作,将甲、乙两班所有参赛同学的得分绘制成如图所示的茎叶图,则下列结论错误的是( )
A.甲班参赛同学得分的极差比乙班参赛同学得分的极差小
B.甲班参赛同学得分的中位数比乙班参赛同学得分的中位数低
C.甲班参赛同学得分的平均数为84
D.乙班参赛同学得分的第75百分位数为89
2.(23-24高二上·上海·期末)为调研某地空气质量,连续10天测得该地的日均值(单位为),依次为,则下列四个结论中正确的个数为( )
①前4天的极差大于后4天的极差;②前4天的方差小于后4天的方差;③这组数据的中位数为31或33;④这组数据的第60百分位数与众数相同.
A.0 B.1 C.2 D.3
二、填空题
3.(22-23高二上·上海黄浦·期末)根据《中华人民共和国道路交通安全法》规定:车辆驾驶员血液酒精浓度在20~80mg/100ml(不含80)之间,属于酒后驾车,处暂扣一个月以上三个月以下驾驶证,并处200元以上500元以下罚款;血液酒精浓度在80mg/100ml(含80)以上时,属醉酒驾车,处十五日以下拘留和暂扣三个月以上六个月以下驾驶证,并处500元以上2000元以下罚款.据《法制晚报》报道,2009年8月15日至8月28日,全国查处酒后驾车和醉酒驾车共28800人,如图是对这28800人血液中酒精含量进行检测所得结果的频率分布直方图,则属于醉酒驾车的人数约为
4.(22-23高二上·上海宝山·期末)为了解某校高三年级男生的体重,从该校高三年级男生中抽取17名,测得他们的体重数据如下(按从小到大的顺序排列,单位:kg):56、56、57、58、59、59、61、63、64、65、66、68、70、71、73、74、83.据此估计该校高三年级男生体重的第75百分位数为 .
5.(22-23高二上·上海闵行·期末)某学校为了获得该校全体高中学生的体育锻炼情况,按男、女学生的比例分别抽样调查了48名男生和27名女生的每周锻炼时间,通过计算得到男生每周锻炼时间的平均数为7.6小时,方差为7.3;女生每周锻炼时间的平均数为6.4小时,方差为8,则所有样本数据的方差为 .(结果精确到小数点后三位)
6.(23-24高三上·上海浦东新·期末)小明为了解自己每天花在体育锻炼上的时间(单位:min),连续记录了7天的数据并绘制成如图所示的茎叶图,则这组数据的第60百分位数是 .
7.(23-24高二上·上海·期末)中国17岁射击运动员黄雨婷在2023年杭州亚运会上以顽强作风和精湛技艺为中国代表团摘得三枚金牌,展现了奋发向上、勇攀高峰的精神面貌.以下是她在女子10米气步枪个人项目决赛最后淘汰赛阶段14次射击取得的成绩(单位:环)
1
2
3
4
5
6
7
8
9
10
11
12
13
14
10.3
10.3
10.4
10.4
10.8
10.8
10.5
10.4
10.7
10.5
10.7
10.7
10.3
10.6
则该组数据的方差是 .(近似到0.001)
8.(24-25高二上·上海·期末)已知甲、乙两组数据如茎叶图所示,其中.若这两组数据的中位数相等,平均数也相等,则 .
9.(22-23高二下·上海杨浦·期中)已知一组数据的平均数为6,那么的平均数为 .
10.(22-23高二下·上海浦东新·阶段练习)已知这5个数的平均数为3,方差为2,则这4个数的方差为 .
11.(23-24高三上·上海·期中)以下数据为某校参加数学竞赛的19人的成绩:66,75,77,69,78,70,72,86,88,79,80,81,94,84,82,98,83,90,91,则这19人成绩的第80百分位数是 .
12.(23-24高三上·上海黄浦·期中)某校共有400名学生参加了趣味知识竞赛(满分:150分),且每位学生的竞赛成绩均不低于90分.将这400名学生的竞赛成绩分组如下:,得到的频率分布直方图如图所示,则这400名学生中竞赛成绩不低于120分的人数为 .
三、解答题
13.某商场为推销当地的某种特产进行了一次促销活动,将派出的促销员分成甲、乙两个小组分别在两个不同的场地进行促销,每个小组各6人.以下茎叶图记录了这两个小组成员促销特产的件数,且图中甲组的一个数据已损坏,用表示,已知甲组促销特产件数的平均数比乙组促销特产件数的平均数少1件.
(1)求的值,并求甲组数据的第80百分位数;
(2)在甲组中任选2位促销员,求他们促销的特产件数都多于乙组促销件数的平均数的概率.
14.(22-23高二下·上海浦东新·期末)某中学为了加强食堂用餐质量开展“美食”工作,后勤部门需了解学生对“美食”工作的认可程度,若学生的认可系数(认可系数)不低于0.95,“美食”工作按原方案继续实施,否则需进一步整改.为此该部门随机调查了600名学生,根据这600名学生对“美食”工作认可程度给出的评分,分成,,,,五组,得到如图所示的频率分布直方图.
(1)为了了解部分学生给“美食”工作评分较低的原因,该部门从评分低于80分的学生中用分层抽样的方法随机选取30人进行座谈,求出应选取评分在的学生人数;
(2)判断“美食”工作是否需要进一步整改,并说明理由.
15.(23-24高二上·上海·期末)随机抽取某校甲乙两班各10名同学,测量他们的身高(单位:),获得身高数据如下:
甲班:170 179 162 168 158 182 179 168 163 171
乙班:159 173 179 178 162 181 176 168 170 165
(1)计算甲班的样本方差;
(2)求乙班数据的分位数.
16.(23-24高二下·上海松江·期中)本学期初,某校对全校高二学生进行数学测试(满分100),并从中随机抽取了100名学生的成绩,以此为样本,分成,得到如图所示频率分布直方图.
(1)估计该校高二学生数学成绩的平均数和分位数;
(2)为进一步了解学困生的学习情况,从数学成绩低于70分的学生中,分层抽样6人,再从6人中任取2人,求此2人分数都在的概率.
1 / 6
学科网(北京)股份有限公司
$
专题01统计
目录
A题型建模・专项突破
题型一、总体与样本 1
题型二、普查与抽样 2
题型三、简单随机抽样 2
题型四、随机数表法 3
题型五、抽样比、样本总量、各层总数、总体容量的计算(重点) 4
题型六、频率分布直方图(重点) 8
题型七、茎叶图(重点) 13
题型八、平均数、极差、方差、标准差(重点) 17
题型九、百分位数(重点) 20
B综合攻坚・能力跃升
题型一、总体与样本
1.(22-23高二上·上海长宁·阶段练习)为了了解某水库里大概有多少条鱼,先打捞出了1000条鱼,在鱼身上标记一个不会掉落的印记后放回水库,过一段时间后再次捕捞了200条鱼,发现其中5条鱼有印记.则这个水库里大概有 条鱼
【答案】40000
【详解】设水库里大概有x条鱼,则,解之得
故答案为:40000
2.(23-24高二上·上海长宁·期末)从总体容量为的一批电子元件中抽取一个容量为30的样本,若每个电子元件被抽到的可能性为,则总体容量 .
【答案】
【详解】由条件可知:,
所以,
故答案为:.
3.某校高二年级有300人,为调查年级学生每天上网时间,现抽取的同学做调查问卷,该统计的样本量为 .
【答案】120
【详解】由已知总体中的元素的个数为300,抽取变量为,故样本量为,
故答案为:120.
题型二、普查与抽样
4.(24-25高二上·上海·期末)在以下调查中,适合用普查的是( ).
A.调查某批次汽车的抗撞击能力 B.调查一批LED灯的寿命
C.调查某城市居民的食品消费结构 D.调查一个班级学生的身高情况
【答案】D
【详解】A选项,每个批次生产的汽车的数量非常多,且调查汽车抗重击能力具有破坏性,不适合使用普查,应使用抽样调查;
B选项,调查一批LED灯的寿命具有破坏性,不宜使用普查,应使用抽样调查;
C选项,某城市居民数量非常多,不适合使用全面普查,应使用抽样调查;
D选项,一个班级学生的身高情况,人数较少,适合用普查;
故选:D
5.(24-25高二上·上海长宁·期末)完成下列任务所获得的数据是观测数据还是实验数据 .
某旅游公司为开发新的旅游产品,调查了5000名客户对于旅游目的地的偏好.
【答案】观测数据
【详解】由题意可知是通过调查观测得到的数据,所以是观测数据.
故答案为:观测数据
题型三、简单随机抽样
6.下列抽样方法是简单随机抽样的是( )
A.某医院从200名医生中,挑选出50名最优秀的医生去参加抗疫活动
B.从10个手机中逐个不放回地随机抽取2个进行质量检验
C.从空间直角坐标系中抽取10个点作为样本
D.饮料公司从仓库中的500箱饮料中一次性抽取前10箱进行质量检查
【答案】B
【详解】对于A,某医院从200名医生中,挑选出50名最优秀的医生去参加抗疫活动,每个人被抽到的机会不相等,故错误;
对于B,从10个手机中逐个不放回地随机抽取2个进行质量检验,是简单随机抽样,故正确;
对于C,从空间直角坐标系中抽取10个点作为样本,由于被抽取的样本的总体个数是无限的,所以不是简单随机抽样,故错误;
对于D,饮料公司从仓库中的500箱饮料中一次性抽取前10箱进行质量检查,不是逐个抽取,所以不是简单随机抽样,故错误.
故选:B.
7.(23-24高二上·上海·期末)已知一个总体含有N个个体,要用简单随机抽样方法从中抽取一个个体,则在抽样过程中,每个个体被抽取的概率( )
A.变小 B.变大 C.相等 D.无法确定
【答案】C
【详解】一个总体含有N个个体,要用简单随机抽样方法从中抽取一个个体,
则在抽样过程中,每个个体被抽取的概率为.
故选:C.
8.(24-25高二上·上海黄浦·阶段练习)某果园种植了240棵苹果树,现从中随机抽取了20棵苹果树,算得这20棵苹果树平均每棵产量为28kg,则预估该果园的苹果产量为 kg.
【答案】6720
【详解】将样本均值视为总体均值,故预估该果园的苹果产量为kg.
故答案为:
9.(22-23高二上·上海浦东新·期末)“二十四节气歌”是以“春、夏、秋、冬”开始的四句诗.某校高二共有学生400名,随机抽查100名学生并提问二十四节气歌,只能说出一句的有45人,能说出两句及以上的有38人,据此估计该校高二年级的400名学生中,对“二十四节气歌”一句也说不出的有 人.
【答案】
【详解】由题意可知,随机抽查100名学生中有人一句也说不出,
又抽查比例为,
所以,该校高二年级的400名学生中共有人对“二十四节气歌”一句也说不出.
故答案为:
题型四、随机数表法
10.(24-25高二上·上海·阶段练习)某工厂利用随机数表对生产的 50 个零件进行抽样测试, 先将 50 个零件进行编号, 编号分别为 01, 02, ......, 50. 从中抽取 5 个样本,下面提供随机数表的第 1 行到第 2 行:
66 67 40 37 14 64 05 71 11 05 65 09 95 86 68 76 83 20 37 90
57 16 03 11 63 14 90 84 45 21 75 73 88 05 90 52 23 59 43 10
若从表中第 1 行第 7 列开始向右依次读取数据, 则得到的第5个样本编号是 ( ).
A.09 B.05 C.65 D.71
【答案】A
【详解】第一行第7列为3,依次往右读,37,14,05,11,09.
09为第5个样本编号,
故选:A
11.(22-23高二下·上海浦东新·期末)从总体容量为240的研究对象中挑选10个样本,利用随机数表法抽取样本时,先将所有研究对象按001,002,,240进行编号,然后从随机数表第4行第5个数开始向右读,则选出的第4个编号是(注:下面为随机数表的第3~5行)( )
91685307 17337298 29849526 37515923 03886191 14679054
49042443 36160865 53317333 03570684 57173171 84357012
17355239 47454753 01644305 44017425 26545229 10694745
A.865 B.086 C.173 D.171
【答案】D
【详解】从随机数表第4行第5个数开始向右读,符合条件的有160,173,068,171,
则选出的第4个编号是171.
故选: D
12.(24-25高二上·上海长宁·期末)现利用随机数表法从编号为00,01,02,…,18,19的20支水笔中随机选取6支,选取方法是从下列随机数表第1行的第9个数字开始由左到右依次选取两个数字,则选出来的第6支水笔的编号为 .
95226000 49840128 66175168 39682927 43772366 27096623
92583556 43890890 06482834 59741458 29778149 64608925
【答案】14
【详解】由题意可知,符合题意的编号依次为01,17,09,08,06,14,
故选出来的第6支水笔的编号为14.
故答案为:14
13.(24-25高二下·上海·阶段练习)设总体由编号为的个个体组成,利用下面的随机数表选取6个个体,选取方法是从该随机数表第1行的第6个数字开始由左到右依次选取两个数字,则选出来的第3个个体的编号为 .
5044664421 6606580462 6155643502 4235489632 1452415248
2266221586 2663754199 5842367224 5837521851 0337183911
【答案】46
【详解】由题意可知,从该随机数表第1行的第6个数字开始由左到右依次选取两个数字,
则选出来的编号依次为:(舍去),(舍去),(舍去),(舍去),(舍去),,
即选出的6个编号依次为:,所以第3个个体的编号为46.
故答案为:46.
题型五、抽样比、样本总量、各层总数、总体容量的计算
14.(23-24高二上·上海·期末)某校有学生1800人,为了解学生的作业负担,学校向学生家长随机抽取了1000人进行调查,其中70%的家长回答他们孩子每天睡眠时间大致在6-7小时,28%的家长回答他们孩子回家做作业的时间一般在3-4小时,下列说明正确的是( ).
A.总体是1000 B.个体是每一名学生
C.样本是1000名学生 D.样本容量是1000
【答案】D
【详解】A:总体是1800学生每天睡眠时间和作业时间,故A错误;
B:个体是每一名学生每天睡眠时间和作业时间,故B错误;
C:样本是1000名学生每天睡眠时间和作业时间,故C错误;
D:样本容量是1000,故D正确.
故选:D.
15.(23-24高二上·上海·阶段练习)为了解黄浦区全体高二学生“小三门”的选科情况,区教育局共联络了950名黄浦区在读高二学生进行调查,在这项调查中,样本量是 .
【答案】950
【详解】由题意可知样本量为:950
故答案为:950
16.(24-25高二下·上海·阶段练习)某高中为了了解学生收看空中课堂的具体情况,利用分层抽样的方法从高中三个年级的学生中随机抽取了200名进行问卷调查,其中从高一年级的学生中抽取了40名,从高二年级的学生中抽取了50名,若高三年级共有学生440名,则该高中共有学生 名.
【答案】800
【详解】依题意可得样本中高三年级抽取了名学生,
所以该高中共有学生名学生。
故答案为:.
17.(23-24高二上·上海·阶段练习)管理人员为了了解某水库里大概有多少条鱼,拖网打捞出1000条鱼,在鱼身处打上一个不会掉落的印记,再放回水库,一个月后再次捕捞1000条鱼,发现其中有20条有印记的鱼,问:这个水库里大概有 条鱼.
【答案】
【详解】令这个水库里大概有条鱼,由题意有,可得条.
故答案为:
18.(22-23高二上·上海宝山·期末)某医院对某学校高三年级的600名学生进行身体健康调查,采用男女分层抽样法抽取一个容量为50的样本,已知男生比女生少抽了10人,则该年级的女生人数是 .
【答案】360
【详解】抽取比例为,
设该年级的女生人数是 ,则男生人数为,
因为男生比女生少抽了10人,
所以,
解得 ,
故答案为:360.
19.(22-23高二下·上海浦东新·期中)某校共有师生2400人,现用分层抽样的方法,从所有师生中抽取一个容量为180的样本,已知从学生中抽取的人数为165,则该学校的教师人数是 .
【答案】200
【详解】从所有师生中抽取一个容量为180的样本,已知从学生中抽取的人数为165,则老师抽取人,则该学校的教师人数人.
故答案为:200
20.(22-23高二下·上海黄浦·阶段练习)某高中共有学生人,其中高一、高二、高三的学生人数比为,现用分层抽样的方法从该校所有学生中抽取一个容量为60的样本,则高三年级应该抽取 人.
【答案】
【详解】设高一学生数为,则高二学生数为,高三学生数为,
所以,该高中共有学生数为,解得,
用分层抽样的方法从该校所有学生中抽取一个容量为60的样本,抽样比为,
所以高三年级应该抽取人.
故答案为:.
21.(23-24高二上·上海黄浦·期末)某高中二年级共有学生425名,其中男生204名,女生221名,为了解该校高二年级学生的身高情况,从中抽取50名学生测量身高,若采用分层随机抽样的方法,则要抽取男生的人数为 .
【答案】
【详解】由分层抽样的等比例性质,要抽取男生为人.
故答案为:
22.(22-23高二下·上海浦东新·期末)为了了解同学们的作业量,学校决定采用分层抽样的方法从高一、高二、高三学生中选取150人进行调查,已知高一学生有400人,高二学生有500人,高三学生有600人,则应抽取的高三学生人数为 .
【答案】60
【详解】由题可知,三个年级共有人,
抽样比例为,
则抽取的学生中,高三年级有人.
故答案为:60.
23.(22-23高二下·上海杨浦·期中)在100个人中,其中45人为女性,55人为男性,计划抽取20人测量身高.若按性别进行分层随机抽样,则应该抽取 位男性测量身高。
【答案】
【详解】利用分层抽样的方法从100个人中抽取了20人测量身高,其中45人为女性,55人为男性,
则每个人被抽到的概率为,
设应该抽取位男性,可得,解得(人),
即应该抽取位男性测量身高.
故答案为:.
24.(24-25高二上·上海长宁·期末)某校高一共有学生240人,现采用分层抽样的方法从中抽取80人进行体能测试;若这80人中有35人是男生,则该校高一男生共有 人.
【答案】105
【详解】依题意,分层抽样的抽样比为:,所以该校男生的人数为:.
故答案为:105
25.(24-25高二上·上海徐汇·期末)某高中的三个年级共有学生1000人,其中高一300人,高二340人,高三360人,该校现在要了解学生对校本课程的看法,准备从全校学生中抽取50人进行访谈,若采取分层抽样,且按年级来分层,则高一年级应抽取的人数是 .
【答案】
【详解】由题意可知抽样比为:,
所以高一年级应抽取的人数是,
故答案为:
26.(23-24高二上·上海·期末)某大学共有教师1000人,其中教授、副教授、讲师、助教的人数比为1:4:3:2,现用分层抽样的方法从全校所有教师中抽取一个容量为40的样本,讲师应抽取的人数为 .
【答案】
【详解】由分层抽样得到讲师应抽取的人数为.
故答案为:12
27.(23-24高二上·上海·期末)某高中二年级共有学生425名,其中男生204名,女生221名,为了解该校高二年级学生的身高情况,现从中抽取50名学生测量身高,应当采用 的方法求出男女生分别要抽取 、 名,然后在此基础上进行简单随机抽样.
【答案】 分层抽样
【详解】由于男生和女生在身高上有明显的差异,故应该采用分层抽样的方法来进行抽样,
其中男生抽人,女生抽人.
故答案为:分层抽样;;.
题型六、频率分布直方图
28.(24-25高二上·上海·期末)某校抽取100名学生测量他们的身高,其山最大值为,最小值,绘制身高频率分布直方图,若组距为5,且第一组下限为,则组数为 .
【答案】7
【详解】,则组数为7.
故答案为:7.
29.(24-25高二上·上海·期末)已知某校高一年级所有学生的体重(单位:kg),且最大值为98,最小值为44.在制作频率分布直方图时,要对这些体重数据进行分组.若组距为5,则将数据分成 组为宜.
【答案】
【详解】因为最大值为98,最小值为44,则,
又组距为5,则将数据分成组.
故答案为:
30.(24-25高二下·上海·期末)对学校高三年级某班50名学生的高校招生体检表中视力情况进行统计,其结果的频率分布直方图如图.若高校专业对视力要求不低于0.9,则该班学生中有 人能报考该专业.
【答案】
【详解】由频率分布直方图知:视力在0.9以上的频率为,
所以该班学生中能报专业的最多人数为.
故答案为:20.
31.(23-24高二上·上海·期末)某学校组织全校学生参加网络安全知识竞赛,成绩(单位:分)的频率分布直方图如图所示,数据的分组依次为,若该校的学生总人数为1000,则成绩不低于60分的学生人数为 .
【答案】
【详解】根据频率分布直方图得
该校的学生成绩不低于60分的学生人数为.
故答案为:
32.(25-26高二上·上海奉贤·阶段练习)为进一步增强学生的疫情防控意识,友实学校组织学生进行了新冠肺炎疫情防控科普知识线上问答,共有100人参加了这次问答,将他们的成绩(满分100分)分成六组:,,,,,,制成如图所示的频率分布直方图.
(1)求图中的值;
(2)用分层抽样的方法从问答成绩在内的学生中抽取24人参加疫情防控知识宣讲,那么在,,内应各抽取多少人?
【详解】(1).
(2)因为,
所以在,,内应各抽取:
,,.
故在,,内分别抽取,,人.
33.(24-25高二下·上海·期末)为积极参与马拉松比赛,某中学决定从3000名学生随机抽取100名学生进行体能检测,这100名学生进行了15公里的马拉松比赛,比赛成绩(分钟)的频率分布直方图如图所示,其中成绩分布区间是,,,,.
(1)求图中的值,并估计这100名学生比赛成绩的平均数;
(2)根据样本频率分布直方图,估计该校3000名学生中约有多少名学生能在80分钟内完成15公里马拉松比赛?
【详解】(1)由频率分布直方图得,解得,
这100名学生比赛成绩的平均数为
;
(2)由频率分布直方图可知,样本中能在80分钟内完成15公里马拉松比赛的频率为
,
所以该校3000名学生中能在80分钟内完成15公里马拉松比赛的学生人数约为
名.
34.(24-25高二上·上海·期末)某学校组织全校学生进行了一次“两会知识知多少”的问卷测试,已知所有学生的测试成绩均位于区间,从中随机抽取了40名学生的测试成绩,绘制得到如图所示的频率分布直方图.
(1)求图中的值,并估算这40名学生测试成绩的平均数;
(2)现学校准备利用分层随机抽样方法,从和的学生中抽取7人组成两会知识宣讲团.从选定的7人中随机抽取2人对高一同学进行宣讲,设事件为“至少有1人测试成绩位于区间”,求事件发生的概率.
【详解】(1)根据题意,,解得,
所以这40名学生测试成绩的平均数为.
(2)由频率分布直方图,和这两组的频率之比为,
故应从学生中抽取的学生人数为人,
从学生中抽取的学生人数为人,
设从学生中抽取的5人为,从学生中抽取的2人为,
则这个试验的样本空间为,
故,
又,则,
所以事件的概率为.
35.(22-23高二下·上海长宁·期末)A校为了了解学生对食堂的满意程度,随机调查了50名就餐学生,根据这50名学生对食堂满意度的评分,绘制出如图所示的频率分布直方图,其中样本数据分组为,,…,.
(1)求频率分布直方图中a的值;
(2)若A校共有3000名学生,试估计全体学生中对食堂满意度不低于80分的人数.
【详解】(1)由题意可知:,解得;
(2)样本中对食堂满意度不低于80分的频率为,用样本估计总体,
所以估计全体学生中对食堂满意度不低于80分的人数为人.
36.(22-23高二下·上海浦东新·期中)为了解某校高二年级学生数学学习的阶段性表现,年级组织了一次阶段测试.已知此次考试共有450名学生参加,考试成绩的频率分布直方图如下.
450名高二学生数学成绩的频率分布直方图
(1)求的值;
(2)估计这次数学考试的平均成绩;
(3)求这次数学考试的及格率(不低于60分视作及格).
【详解】(1)由,
解得;
(2)这次数学考试的平均成绩为:
;
(3)由频率分布直方图得这次数学考试的及格率为:
.
37.(23-24高二上·上海宝山·阶段练习)为了让学生适应上海“3+3”的新高考模式,某校在高二期末考试中使用赋分制给等级考科目的成绩进行赋分.先按照考生原始分从高到低按比例划定A+、A、B+、B、B-、C+、C、C-、D+、D、E共5等11级,然后在相应赋分区间内利用转换公式进行赋分,A+和E级排名各占比5%,其余各级排名各占比10%.现从全年级的等级考化学成绩中随机取100名学生的原始成绩(满分100分)进行分析,其频率分布直方图如图所示:
(1)求图中的值;
(2)若采用分层抽样的方法,从原始成绩在和内的学生中共抽取6人查看他们的答题情况,再从中选取2人进行个案分析,求这2人中恰有一人原始成绩在内的概率;
(3)已知落在的平均成绩,方差,落在的平均成绩,方差,求落在的平均成绩,并估计落在的成绩的标准差(结果精确到0.1).
【详解】(1),解得;
(2)由原始分在和中的频率之比为,
故抽取的6人中,原始分在中的有人,记为、,
原始分在中的有人,记为、、、,
则从人中抽取人所有可能的结果有:
,,,,,,,,
,,,,,,,
共个基本事件,
其中抽取这2人中恰有一人原始成绩在内的结果有,
,,,,,,,,
共个基本事件,
故这2人中恰有一人原始成绩在内的概率;
(3),
,
故其估计值为.
题型七、茎叶图
38.(22-23高二上·上海浦东新·期末)小明同学每天阅读数学文化相关的书籍,他每天阅读的页数分别为:4、5、4.5、5、6、8、7、5、4.5、6(单位:页).下列图形中不利于描述这些数据的是( )
A.条形图 B.茎叶图 C.散点图 D.扇形图
【答案】C
【详解】条形图:是用宽度相同的条形的高度(或长度)表示数据的频数,故符合题意;
茎叶图:即可以保留原始数据又可以方便记录数据,故符合题意;
散点图:用两组数据构成多个坐标点,通常用于比较跨类别的成对数据,不符合题意;
扇形图:是用整个圆表示总体,用圆内各个扇形的大小表示各个部分占总体的百分数,扇形图可以容易看出各个部分所占总体的比例,故符合题意;
故选:C.
39.(22-23高二·上海·单元测试)已知甲、乙两组数据如茎叶图所示,若它们的中位数相同,平均数也相同,则图中的m,n的比值 .
甲
乙
7
2
n
9
m
3
2
4
8
【答案】
【详解】由图知:甲数据为,乙数据为,且,
显然乙的中位数为,故,则,
所以平均数为,即,可得,
故.
故答案为:
40.(22-23高二上·上海闵行·期末)甲、乙两名运动员5场比赛得分的茎叶图如图所示已知甲得分的极差为32,乙得分的众数为26,则 .
【答案】
【详解】由茎叶图可知,甲的最低得分为6分,由甲得分的极差为32,可知,甲的最高得分为,所以的值为8,
乙得分的众数为26,所以的值为6,
所以.
故答案为:
41.(22-23高二下·上海浦东新·期末)如图所示的茎叶图记录着甲、乙两支篮球是各6名球员某份比赛的得分数据(单位:分).若这两组数据的中位数相等,且平均值也相等,则 .
【答案】
【详解】由题意,甲的中位数为:,故乙的中位数①
,
,
因为平均数相同,所以②,
由①②可得,,
所以,
故答案为:.
42.(22-23高二上·上海虹口·期中)某社区安置了15个体温检测点,每个检测点每天检测的人数都是随机的,不受位置等因素影响,如图是由2021年1月1日检测人数绘制的茎叶图,则某个检测点在这一天检测人数达145及以上的概率是 .
13
0
2
4
6
14
0
0
0
5
6
8
8
15
2
3
3
4
【答案】
【详解】由茎叶图可知:
检测人数达145及以上的有8个检测点,占全部的,
由古典概型可知:
这个检测点在这一天检测人数达145及以上的概率为.
故答案为:
43.(22-23高二上·上海徐汇·期末)从本市某高中全体高二学生中抽取部分学生参加体能测试,按照测试成绩绘制茎叶图,并以,,,,为分组作出频率分布直方图,后来茎叶图受到了污损,可见部分信息如图,则a的值为 .
【答案】
【详解】由频率分布直方图可得,组内数据的频率等于组内数据的频率,所以组内有2个数据.
设样本容量为,则,所以.
所以组内的数据有,所以组内数据的频率等于,所以.
故答案为:.
44.(23-24高二下·上海静安·期末)甲、乙两位气步枪运动员在射击队内的选拔赛成绩茎叶图如右:
(1)求甲、乙两名选手射击的平均环数;
(2)请用具有统计意义的数量来刻画甲、乙两位运动员的射击成绩的稳定性,并帮助射击队选拔一名运动员外出参加比赛.
【详解】(1)
(2)
由可知甲、乙两位运动员的平均成绩一致;
而即甲的射击成绩的离散程度较小,乙的射击成绩的离散程度较大,
因此甲的成绩较稳定,所以选甲代表射击队出去参加比赛.
题型八、平均数、极差、方差、标准差
45.(24-25高二上·上海黄浦·期末)某校有学生500人,其中男生320人,女生180人.某人想了解该校全体学生的身高(单位:cm)信息,从男生、女生中分别随机抽取人进行测量.如果已知男生样本的均值为173.5,方差为17,女生样本的均值为163.83,方差为30.03,但原始测量数据已丢失.设总体均值与方差分别为与,则下列说法正确的是( ).
A.若,可算出总样本的均值与方差,且将其分别作为与的估计值是合适的
B.若,无法算出总样本的均值与方差
C.若,可算出总样本的均值与方差,且将其分别作为与的估计值是合适的
D.若,无法算出总样本的均值与方差
【答案】C
【详解】由于男生、女生总人数不相等,需要用分层抽样的方式估计出样本的均值和方差,
此时所得样本特征可作为总体特征的估计值,故不合适、合适,A、D错,C对;
在情况下,只有所有男生、女生身高都在各自身高均值附近波动且幅度很小时,可以算出总样本的均值与方差,B错;
故选:C.
46.(24-25高二上·上海·期末)校高一年级共有学生330名,为了解该校高一年级学生的身高情况,学校采用分层随机抽样的方法抽取66名学生,其中女生32名,男生34名,测量他们的身高.
(1)该校高一学生中男、女生各有多少名?
(2)在32名女生身高的数据中,其中一个数据记录有误,错将165cm记录为156cm,由错误数据求得这32个数据的平均数为161cm,方差为23.6875,求原始数据的平均数及方差(平均数结果保留精确值,方差结果精确到0.01).
【详解】(1)该校高一学生中,男生共有名,
女生共有名.
(2)设原始的32个数据为,其中,
由错误数据的平均数,
得原始数据的平均数(cm).
由,
得,
故.
47.(23-24高二下·上海·期中)为了让学生适应上海“3+3”的新高考模式,某校在高二期末考试中使用赋分制给等级考科目的成绩进行赋分.先按照考生原始分从高到低按比例划定,共5等11级,然后在相应赋分区间内利用转换公式进行赋分,和E级排名各占比5%,其余各级排名各占比10%.现从全年级的等级考化学成绩中随机取100名学生的原始成绩(满分100分)进行分析,其频率分布直方图如图所示:
(1)若采用分层抽样的方法,从原始成绩在和内的学生中共抽取5人查看他们的答题情况,再从中选取2人进行个案分析,求这2人中至少有一人原始成绩在内的概率;
(2)已知落在的平均成绩,方差,落在的平均成绩,方差,求落在的平均成绩,并估计落在的成绩的标准差s(结果精确到0.1).
【分析】(1)由频率分布直方图的性质,求得,得到在和中的频率之比为,结合古典摡型的概率计算公式,即可求解;
(2)根据题意,求得,结合,即可求解.
【详解】(1)解:由频率分布直方图的性质,可得,
解得,则原始分在和中的频率之比为,
所以抽取的5中,原始成绩在和内的学生分布为人和人,
则这2人中至少有一人原始成绩在内的概率为.
(2)解:由题意知,落在的平均成绩,方差,
落在的平均成绩,方差,
可得,
所以
,
所以估计落在的成绩的标准差.
48.(23-24高二下·上海嘉定·期末)用分层随机抽样从某校高一年级学生的数学期末成绩(满分100分,成绩都是整数)中抽取一个容量为100的样本,其中男生成绩数据40个,女生成绩数据60个,再将40个男生成绩样本数据分为6组: [40,50)、[50,60)、[60,70)、[70,80)、[80,90)、[90,100].绘制得到如图所示的频率分布直方图.
(1)求a的值;
(2)若在区间[40,50)和[90,100]内的两组男生成绩样本数据中,随机抽取两个进行调查,求调查对象来自不同分组的概率:
(3)已知男生成绩样本数据的平均数和方差分别为71和187.75,女生成绩样本数据的平均数和方差分别为73.5和119,求总样本的平均数和方差.
【详解】(1)由题意得,解得.
(2),,
所以成绩在区间的男生有4人,在区间的男生有2人,
设成绩在区间的男生为,在区间的男生为,
则在这6个数据中随机抽取两个的样本空间包含的样本点为:
,,,,,,,,,,,,,,,
所以,
记事件“调查对象来自不同分组”,
则事件包含的样本点为,,,,,,,,
,
所以调查对象来自不同的分组得概率为.
(3)设男生成绩样本数据为,其平均数位,方差为,
女生成绩样本数据为,其平均数为,方差为,
设总体的平均数为,方差为,
由分层抽样总体样本平均数与各层样本平均数的关系得,
因为,
又,
同理,
所以
,
所以总样本的平均数和方差分别为72.5和148.
题型九、百分位数
49.(24-25高二下·上海·阶段练习)以下数据为参加某次数学竞赛的15人的成绩(单位:分),分数从低到高依次是:56、70、72、78、79、80、81、83、84、85、88、90、91、94、98,则这15人成绩的第60百分位数是 .
【答案】84.5
【详解】因为,故这15人成绩的第60百分位数为,
故答案为:84.5.
50.(24-25高二上·上海金山·期末)现有一组数据:,其第70百分位数为 .
【答案】10
【详解】因为,从小到大排列数据:,向上取整取第6位数为10.
故答案为:10.
51.(24-25高二上·上海·期末)现有7张卡片,分别写上数字2,4,5,5,6,9,16,则这7个数的第75百分位数是 .
【答案】9
【详解】由于,则这7个数的第75百分位数是9,
故答案是:9.
52.(23-24高二下·上海·期中)以下数据为参加某次数学竞赛的15人的成绩(单位:分),分数从低到高依次是:,,则这15人成绩的第80百分位数是 .
【答案】90.5
【详解】因为,
将数据从小到大排序得56、70、72、78、79、80、81、83、84、86、88、90、91、94、98,
故这15人成绩的第80百分位数为,
故答案为:90.5.
53.(24-25高二上·上海·阶段练习)某次数学考试后,随机选取14位学生的成绩,得到如下茎叶图,其中个数部分作为“叶”,百位数和十位数作为“茎”,若该组数据的第25百分位数是87,则x的值为 .
【答案】7
【详解】,则该组数据从小到大排列后的第四位数是87,即,
故答案为:7.
54.(23-24高二下·上海·阶段练习)某个品种的小麦麦穗长度(单位:)的样本数据的茎叶图如图所示,其中整数部分为“茎”,小数部分为“叶”,则这组数据的第百分位数为 .
【答案】
【详解】由题知,
样本数据有,
共个,则,
则这组数据的第百分位数为.
故答案为:
55.(23-24高二下·上海杨浦·期中)小明为了解自己每天花在体育锻炼上的时间(单位:min),连续记录了7天的数据并绘制成如图所示的茎叶图,则这组数据的第50百分位数是 .
【答案】55
【详解】根据茎叶图中的数据从小到大排列为:42,47,54,55,58,70,96,共7个数据;
且,这组数据的第4个数据即为所求的第50百分位数,即为55.
故答案是:55.
56.(22-23高二下·上海静安·期中)随着中国实施制造强国战略以来,中国制造(MadeinChina)逐渐成为世界上认知度最高的标签之一,企业也越来越重视产品质量的全程控制某企业从生产的一批产品中抽取40件作为样本,检测其质量指标值,质量指标的范围为,经过数据处理后得到如右频率分布直方图.则频率分布直方图中质量指标值的第30百分位数是 .
【答案】66
【详解】设这组数据的第30百分位数为,则左侧矩形的面积和为0.3,
由直方图可知第一组段频率为:
,
第二组段频率为,
前两个组段频率和为,
在第二组段,则之间矩形面积应为,
即,解得
这组数据的第30百分位数为66.
故答案为:66.
57.(24-25高二上·上海宝山·期末)某学校为了获得该校全体高中学生的体育锻炼情况,按男、女学生的比例分别抽样调查了48名男生和27名女生的每周锻炼时间.通过计算得到男生每周锻炼时间的平均数为7.6小时,方差为7;女生每周锻炼时间的平均数为6.4小时,方差为8.
(1)若该校男生总数为1280,求该校学生总数;
(2)若所选27名女生每周锻炼时间从小到大排列后的第9至第13个数据依次为5、5.3、5.6、5.8、5.9,求所选女生样本的第40百分位数;
(3)求所有样本数据的平均数和方差(精确到0.001).
【答案】(1)2000;
(2)5.6;
(3)平均数为7.168,方差为7.692.
【知识点】总体百分位数的估计、计算几个数的平均数、计算几个数据的极差、方差、标准差、抽样比、样本总量、各层总数、总体容量的计算
【详解】(1)设该校学生总数为,依题意,,解得,
所以该校学生总数为2000.
(2)由,得所选女生样本的第40百分位数为第11个数5.6.
(3)所有样本数据的平均数;
所有样本数据的方差为.
58.(24-25高二上·上海青浦·期末)为加强学生睡眠监测督导,学校对高中三个年级学生的日均睡眠时间进行调查.根据分层随机抽样法,学校在高一、高二和高三年级中共抽取了100名学生的日均睡眠时间作为样本,其中高一35人,高二33人.已知该校高三年级一共512人.
(1)学校高中三个年级一共有多少个学生?
(2)若抽取100名学生的样本极差为2,数据如下表所示(其中,n是正整数)
日均睡眠时间(小时)
8.5
9
9.5
10
学生数量
32
13
11
4
求该样本的第40百分位数.
【详解】(1)设学校高中三个年级一共有个学生,
因为采用分层抽样法抽取一个容量为100的样本,
在高一年级抽取了35人,高二年级抽取了33人,
所以高三抽取的人数为:人,
又因为高三年级一共512人,所以有:,解得.
所以学校高中三个年级一共有1600个学生.
(2)因为抽取100名学生的样本极差为2,,
所以,
又因为,
所以样本的第40百分位数为:(小时).
一、单选题
1.(22-23高二上·上海浦东新·期末)某校组织了一次航空知识竞赛,甲、乙两个班级各派8名同学代表参赛.两个班级的数学课代表合作,将甲、乙两班所有参赛同学的得分绘制成如图所示的茎叶图,则下列结论错误的是( )
A.甲班参赛同学得分的极差比乙班参赛同学得分的极差小
B.甲班参赛同学得分的中位数比乙班参赛同学得分的中位数低
C.甲班参赛同学得分的平均数为84
D.乙班参赛同学得分的第75百分位数为89
【答案】D
【详解】对A,甲班参赛同学得分的极差为,乙班参赛同学得分的极差为,故正确;
对B,甲班参赛同学得分的中位数是,乙班参赛同学得分的中位数是,故正确;
对C,甲班参赛同学得分的平均数为,故正确;
对D,乙班参赛同学得分为71,80,81,82,85,89,90,94,,取第6个与第7个数的平均数为第75百分位数,即为,故错误.
故选:D
2.(23-24高二上·上海·期末)为调研某地空气质量,连续10天测得该地的日均值(单位为),依次为,则下列四个结论中正确的个数为( )
①前4天的极差大于后4天的极差;②前4天的方差小于后4天的方差;③这组数据的中位数为31或33;④这组数据的第60百分位数与众数相同.
A.0 B.1 C.2 D.3
【答案】C
【详解】前4天的极差为,后4天的极差为,所以①正确;
前4天的平均数为,方差为,后4天的平均数为,方差为,所以②错误;
数据从小到大排列为17,23,26,30,31,33,33,36,42,106,中位数为,所以③错误;
数据的第60百分位数为,众数也为33,所以④正确,正确的有两个.
故选:C.
二、填空题
3.(22-23高二上·上海黄浦·期末)根据《中华人民共和国道路交通安全法》规定:车辆驾驶员血液酒精浓度在20~80mg/100ml(不含80)之间,属于酒后驾车,处暂扣一个月以上三个月以下驾驶证,并处200元以上500元以下罚款;血液酒精浓度在80mg/100ml(含80)以上时,属醉酒驾车,处十五日以下拘留和暂扣三个月以上六个月以下驾驶证,并处500元以上2000元以下罚款.据《法制晚报》报道,2009年8月15日至8月28日,全国查处酒后驾车和醉酒驾车共28800人,如图是对这28800人血液中酒精含量进行检测所得结果的频率分布直方图,则属于醉酒驾车的人数约为
【答案】4320
【详解】由题意结合频率分布直方图可得,醉酒驾车,即血液酒精浓度在80mg/100ml(含80)以上的人数约为:
.
故答案为:4320.
4.(22-23高二上·上海宝山·期末)为了解某校高三年级男生的体重,从该校高三年级男生中抽取17名,测得他们的体重数据如下(按从小到大的顺序排列,单位:kg):56、56、57、58、59、59、61、63、64、65、66、68、70、71、73、74、83.据此估计该校高三年级男生体重的第75百分位数为 .
【答案】
【详解】,
数据从小到大第个数是,
所以第75百分位数为
故答案为:
5.(22-23高二上·上海闵行·期末)某学校为了获得该校全体高中学生的体育锻炼情况,按男、女学生的比例分别抽样调查了48名男生和27名女生的每周锻炼时间,通过计算得到男生每周锻炼时间的平均数为7.6小时,方差为7.3;女生每周锻炼时间的平均数为6.4小时,方差为8,则所有样本数据的方差为 .(结果精确到小数点后三位)
【答案】
【详解】设所有样本数据的平均数为,
所以所有样本数据的方差为,
故答案为:
6.(23-24高三上·上海浦东新·期末)小明为了解自己每天花在体育锻炼上的时间(单位:min),连续记录了7天的数据并绘制成如图所示的茎叶图,则这组数据的第60百分位数是 .
【答案】
【详解】根据茎叶图中的数据从小到大排列为:,
则,所以这组数据的第60百分位数是.
故答案为:.
7.(23-24高二上·上海·期末)中国17岁射击运动员黄雨婷在2023年杭州亚运会上以顽强作风和精湛技艺为中国代表团摘得三枚金牌,展现了奋发向上、勇攀高峰的精神面貌.以下是她在女子10米气步枪个人项目决赛最后淘汰赛阶段14次射击取得的成绩(单位:环)
1
2
3
4
5
6
7
8
9
10
11
12
13
14
10.3
10.3
10.4
10.4
10.8
10.8
10.5
10.4
10.7
10.5
10.7
10.7
10.3
10.6
则该组数据的方差是 .(近似到0.001)
【答案】
【详解】由题意知,平均数为,
则方差为.
故答案为:0.032
8.(24-25高二上·上海·期末)已知甲、乙两组数据如茎叶图所示,其中.若这两组数据的中位数相等,平均数也相等,则 .
【答案】24
【详解】根据茎叶图知,乙的中位数是,所以,
所以甲的平均数是,
所以,解得.
.
故答案为:24.
9.(22-23高二下·上海杨浦·期中)已知一组数据的平均数为6,那么的平均数为 .
【答案】17
【详解】由条件可知,,
则
.
故答案为:
10.(22-23高二下·上海浦东新·阶段练习)已知这5个数的平均数为3,方差为2,则这4个数的方差为 .
【答案】
【详解】因为这5个数的平均数为3,方差为2,
所以,即,
所以这4个数的平均数为,
所以,即,
所以这4个数的方差为
故答案为:
11.(23-24高三上·上海·期中)以下数据为某校参加数学竞赛的19人的成绩:66,75,77,69,78,70,72,86,88,79,80,81,94,84,82,98,83,90,91,则这19人成绩的第80百分位数是 .
【答案】
【详解】由小到大排列,则66,69,70,72,75,77,78,79,80,81,82,83,84,86,88,90,91,94,98,
由,则第位的数字就是所求百分位数,即.
故答案为:.
12.(23-24高三上·上海黄浦·期中)某校共有400名学生参加了趣味知识竞赛(满分:150分),且每位学生的竞赛成绩均不低于90分.将这400名学生的竞赛成绩分组如下:,得到的频率分布直方图如图所示,则这400名学生中竞赛成绩不低于120分的人数为 .
【答案】
【详解】由频率分布直方图可知,解得,
这400名学生中竞赛成绩不低于120分的人数为,
故答案为:
三、解答题
13.某商场为推销当地的某种特产进行了一次促销活动,将派出的促销员分成甲、乙两个小组分别在两个不同的场地进行促销,每个小组各6人.以下茎叶图记录了这两个小组成员促销特产的件数,且图中甲组的一个数据已损坏,用表示,已知甲组促销特产件数的平均数比乙组促销特产件数的平均数少1件.
(1)求的值,并求甲组数据的第80百分位数;
(2)在甲组中任选2位促销员,求他们促销的特产件数都多于乙组促销件数的平均数的概率.
【详解】(1)乙组同学促销特产件数的平均数为(件).
则甲组同学促销特产件数的平均数为35件,
由,解得.
将甲组同学促销特产件数按从小到大排列可得,
因为, 所以甲组数据的第80百分位数为其第5个数,
所以甲组数据的第80百分位数为40.
(2)乙组促销特产件数的平均数为36件.
甲组同学促销的件数分别为28,29,34,38,40,41.
若从中任取两个数字,所有的基本事件为,,,,
,,,,,,,,
,,,共15个基本事件.
其中符合条件的基本事件有,,,共3个基本事件.
所求概率为.
14.(22-23高二下·上海浦东新·期末)某中学为了加强食堂用餐质量开展“美食”工作,后勤部门需了解学生对“美食”工作的认可程度,若学生的认可系数(认可系数)不低于0.95,“美食”工作按原方案继续实施,否则需进一步整改.为此该部门随机调查了600名学生,根据这600名学生对“美食”工作认可程度给出的评分,分成,,,,五组,得到如图所示的频率分布直方图.
(1)为了了解部分学生给“美食”工作评分较低的原因,该部门从评分低于80分的学生中用分层抽样的方法随机选取30人进行座谈,求出应选取评分在的学生人数;
(2)判断“美食”工作是否需要进一步整改,并说明理由.
【详解】(1)由题意有:,
解得,
评分低于80分的频率为:,
因此评分低于80分的人数为:,
评分在的学生总数为,
因此分层抽样时应选取评分在的学生人数为:人.
(2)认可程度平均分为:
,
设认可程度评分第60百分位数为,
则,
解得,
因此认可系数,
所以需要进一步整改.
15.(23-24高二上·上海·期末)随机抽取某校甲乙两班各10名同学,测量他们的身高(单位:),获得身高数据如下:
甲班:170 179 162 168 158 182 179 168 163 171
乙班:159 173 179 178 162 181 176 168 170 165
(1)计算甲班的样本方差;
(2)求乙班数据的分位数.
【详解】(1)依题意,设甲班的样本平均数为,方差为,
则,
所以
(2)将乙班数据从小到大重新排列得:159,162,165,168,170,173,176,178,179,181,
又,所以乙班数据的分位数为第3位数,即.
16.(23-24高二下·上海松江·期中)本学期初,某校对全校高二学生进行数学测试(满分100),并从中随机抽取了100名学生的成绩,以此为样本,分成,得到如图所示频率分布直方图.
(1)估计该校高二学生数学成绩的平均数和分位数;
(2)为进一步了解学困生的学习情况,从数学成绩低于70分的学生中,分层抽样6人,再从6人中任取2人,求此2人分数都在的概率.
【详解】(1)由,解得.
该校高三学生期初数学成绩的平均数为.
前3组的频率和为,所以分位数为.
(2)分层抽样抽取的6人中,的有人,记为
的有人,记为,
从6人中任取2人,基本事件有,共15种,
其中2人分数都在的有共6种,
所以从6人中任取2人,分数都在的概率为.
1 / 6
学科网(北京)股份有限公司
$