内容正文:
专题9.1 统计
一、选择题(每小题5分,在每小题给出的选项中,只有一项是符合题目要求的.)
1.(2025·湖北武汉·二模)某批产品检验后的评分,由统计结果制成如图所示的频率分布直方图,
下列说法中正确的是( )
A. B.评分的众数估值为70
C.评分的第25百分位数估值为67.5 D.评分的平均数估值为76
2.(24-25高三上·山西运城·开学考试)下列说法错误的是( )
A.某校高一年级共有男女学生500人,现按性别采用分层抽样的方法抽取容量为50人的样本,若样本中男生有30人,则该校高一年级女生人数是200
B.数据1,3,4,5,7,9,11,16的第75百分位数为10
C.在一元线性回归方程中,若线性相关系数r越大,则两个变量的线性相关性越强
D.根据分类变量与的成对样本数据,计算得到,根据小概率值的独立性检验,可判断与有关联,此推断犯错误的概率不大于0.05
3.(2024·河南驻马店·二模)电影《孤注一掷》的上映引发了电信诈骗问题的热议,也加大了各个社区反电信诈骗的宣传力度.已知某社区共有居民480人,其中老年人200人,中年人200人,青少年80人,若按年龄进行分层随机抽样,共抽取36人作为代表,则中年人比青少年多( )
A.6人 B.9人 C.12人 D.18人
4.(2024·陕西铜川·模拟预测)已知某地区中小学生人数和近视情况分别如图甲和图乙所示.为了了解该地区中小学生近视情况形成的原因,采用分层抽样的方法抽取部分学生进行调查,若抽取的小学生人数为70,则抽取的高中生中近视人数为( )
A.10 B.20 C.25 D.40
5.(2025·江西·一模)声音经济产业指的是围绕声音进行信息消费而引发的一切经济现象及行为.已知年中国声音经济产业市场规模(单位:千亿元)依次为:0.3,0.5,1.4,2.2,3.1,3.9,2.5,5,则这组数据的分位数为( )
A.3.1 B.3.2 C.3.5 D.3.9
6.(2024·四川德阳·模拟预测)中国人口亿人口中肠胃病患者高达亿,慢性胃炎发病率高达,消化性溃疡病发率也高达,是全世界当之无愧的“胃病大国”.根据随机对名青少年随机抽查,的青少年表示自己患有胃病,的青少年不清楚自己是否患有胃病,只有明确自己没有胃病.肠胃病的严重程度,一般可体现在排便量、排便时长上. 某高中为了了解学生肠胃病占比和严重程度,对年高一高二学生单日单次的排便时长进行了统计(记排便分钟内为正常,排便分钟为轻度肠胃病,排便分钟以上为重度肠胃病),并将结果制成统计图(如图所示),若高一学生人,高二学生人,占比百分数均保留整数,下列说法正确的是( )
A.高二学生的肠胃病人数比高一年级少
B.高一年级的各肠胃病区间人数占比都比高二年级少
C.高一年级重度肠胃病人数占比比高二年级少
D.高一肠胃质量参数比高二高(肠胃质量参数)
7.(2025·贵州遵义·模拟预测)遵义羊肉粉是黔北民众最喜爱的小吃之一.2024年12月16日,遵义市第七届羊肉粉节在凤凰山文化广场盛大开幕,某商家为了调研顾客对本店就餐的满意度,从用过餐的顾客中随机抽取100名进行评分.整理评分数据,将收集到的顾客满意度分值数据(满分100分)分成六段:,,…,,得到如图所示的频率分布直方图,则下列选项正确的是( )
A.这100名顾客评分的极差介于40分至50分之间
B.这100名顾客评分的中位数小于80分
C.
D.这100名顾客评分的平均值介于60分到70分之间
8.(2025·重庆·一模)有 4 位同学各掷骰子 5 次(骰子出现的点数可能为1,2,3,4,5,6),分别记录自己每次出现的点数,四位同学根据统计结果,并对自己的试验数据分别做了如下描述,可以判断一定没有出现点数 1的是( )
A.平均数为3 ,中位数为4 B.中位数为3 ,众数为5
C.平均数为4 ,方差为1.2 D.中位数为4 ,方差为1.6
9.(24-25高二上·四川绵阳·期末)哈希表(HashTable)是一种利用键值的映射关系,将数据存储在特定位置的数据结构.常用的方法之一是“除留余数法”.例如,当除数为时,键值为的数据因余,应存放于位置中,从而可直接依据键值快速定位数据位置,多个数据可映射到同一位置(如键值和均映射到同一位置).现有一个容量为个位置(编号)的哈希表,以除留余数法(除数为)进行映射,需要存储个数据.设这个位置存放的数据个数分别为、、、、、、,则下列说法中正确的是( )
A.至少有个位置存放了不少于个数据
B.若这个数据的键值恰好是间的所有奇数,则的中位数为
C.若的方差为,则的最小值为,最大值为
D.若的极差为,则最多有个位置没有存放数据
10.(2024·全国·模拟预测)随着汽车智能化与电动化的不断升级,无人驾驶汽车成为汽车行业发展的新趋势.据统计,截至2024年7月底中国无人驾驶汽车行业存续企业数量为1782家,这些企业的注册资本分布情况如图所示,则下列结论错误的是( )
A.注册资本不高于200万元的企业数量占比不足
B.注册资本在1000万元以上的企业超过750家
C.注册资本分布数据的分位数是
D.从注册资本在100万元—500万元的企业中随机抽取1家,该企业注册资本在200万元—500万元的概率不小于0.55
11.(2024·甘肃白银·一模)2014年1月至9月全国城镇调查失业率依次为,则( )
A.这组数据的众数为
B.这组数据的极差为
C.这组数据的分位数为
D.这组数据的平均数大于
12.(2019·福建泉州·二模)已知某人收集一个样本容量为50的一组数据,并求得其平均数为70,方差为75,现发现在收集这些数据时,其中得两个数据记录有误,一个错将80记录为60,另一个错将70记录为90,在对错误的数据进行更正后,重新求得样本的平均数为,方差为,则( )
A. B.
C. D.
二、多选题(每小题6分,在每小题给出的选项中,只有一项或者多项是符合题目要求的.)
13.(2024·江苏苏州·模拟预测)在某次数学练习中,高三班的男生数学平均分为120,方差为2,女生数学平均分为112,方差为1,已知该班级男女生人数分别为25、15,则下列说法正确的有( )
A.该班级此次练习数学成绩的均分为118
B.该班级此次练习数学成绩的方差为16.625
C.利用分层抽样的方法从该班级抽取8人,则应抽取5名男生
D.从该班级随机选择2人参加某项活动,则至少有1名女生的概率为
14.(2024·广西南宁·模拟预测)给出下列命题,其中错误的命题为( )
A.若样本数据的方差为3,则数据的方差为6.
B.具有相关关系的两个变量x,y的相关系数为r,那么越接近于0,x,y之间的线性相关程度越高;
C.在一个列联表中,根据表中数据计算得到的观测值k,若k的值越大,则认为两个变量间有关的把握就越大;
D.甲同学所在的某校高三共有5003人,先剔除3人,再按简单随机抽样的方法抽取容量为200的一个样本,则甲被抽到的概率为.
15.(2025·山东临沂·一模)甲,乙两个体育社团小组成员的某次立定跳远成绩(单位:厘米)如下:
甲组:,,,,,,,,,,,
乙组:,,,,,,,,,
则下列说法正确的是( )
A.甲组数据的第60百分位数是252
B.乙组数据的中位数是246
C.从甲、乙两组各随机选取一个成员,两人跳远成绩均在250厘米以上的概率为
D.甲组中存在这样的成员,将他调派到乙组后,甲、乙两组的跳远平均成绩都有提高
16.(2025·福建福州·模拟预测)近日,国家发展改革委等部门联合印发《完善碳排放统计核算体系工作方案》,指出要在2025年全面建立碳排放年报、快报制度,完善碳排放统计核算体系.专家在甲、乙、丙、丁四地2024年第4季度的周快报数据中随机抽取7周数据进行分析,整理出四地这7周各周内碳排放量超过的天数的数据特征:
地区
甲
乙
丙
丁
数据特征
中位数
3
中位数
1
均值
3
均值
2
众数
2
均值
<1
众数
4
方差
2
根据规定,若这7周中每周内碳排放量超过的天数都不多于5天,则可称该地区为低碳生态区.分析数据,四个地区中能判定为低碳生态区的是( )
A.甲地 B.乙地 C.丙地 D.丁地
三、填空题(每小题5分,把答案填在答题卡中的横线上.)
17.(2024·四川德阳·一模)某中学田径队有男运动员28人,女运动员21人,按性别进行分层随机抽样的方法从全体运动员中抽取一个容量为14的样本,如果样本按比例分配,则男运动员应该抽取的人数为
18.(2024·山东·二模)某中职学校计划从300名学生中抽取30名进行问卷调查,拟采用系统抽样方法,为此将他们逐一编号为1—300,并对编号进行分段,若从第一个号码段中随机抽取的号码是6,则从第五个号码段中抽取的号码应是 .
19.(2024·山西·模拟预测)某商场为了了解顾客的停车时长(单位:分钟),现随机抽取了100辆该商场到访顾客的车辆进行停车时长调查,将数据整理得到如下频率分布直方图:
则样本中停车时长在区间上的车辆数为 辆.
20.(22-23高三下·河南安阳·阶段练习)《中国居民膳食指南(2022)》数据显示,岁至岁儿童青少年超重肥胖率高达为了解某地中学生的体重情况,某机构从该地中学生中随机抽取名学生,测量他们的体重单位:千克,根据测量数据,按,,,,,分成六组,得到的频率分布直方图如图所示,根据调查的数据,估计该地中学生体重的分位数是 .
21.(2024·山西太原·二模)为获得某校高一年级全体学生的身高信息,现采用样本量按比例分配的分层随机抽样方法抽取了一个样本,其中有30名男生和20名女生,计算得男生样本的均值为170,方差为15.女生样本的均值为160,方差为30,则由上述数据计算该校高一年级学生身高的均值是 ,方差是 .
22.(2024·陕西西安·三模)某厂有甲、乙、丙三个车间生产同一种零件,经统计,甲车间生产的100个零件中的次品率为0.03,乙车间生产的200个零件中的次品率为0.02,丙车间生产的200个零件中的次品率为0.03,则该厂零件的次品率的估计值为 .
四、填空题(解答应写出必要的文字说明、证明过程或演算步骤.)
23.(24-25高二上·浙江杭州·期中)在某市的三次数学测试中,为了解学生的测试情况,从中随机抽取100名学生的测试成绩,被抽取成绩全部介于40分到100分之间(满分100分),将统计结果按如下方式分成六组:第一组.第二组,……第六组,画出频率分布直方图如图所示,
(1)估计该市学生这次测试成绩的第25百分位数;
(2)估计该市学生这次测试成绩的平均值(回一组中的数据用该组区间的中点值为代表);
(3)从两组中按分层抽样抽取5名学生,再随机抽取3名同学进行问卷测试,问3名同学中恰好只有1名同学成绩在之间的概率.
24.(2024·上海长宁·一模)2024年第七届中国国际进口博览会(简称进博会)于11月5日至10日在上海国家会展中心举行.为了解进博会参会者的年龄结构,某机构随机抽取了年龄在15-75岁之间的200名参会者进行调查,并按年龄绘制了频率分布直方图,分组区间为.把年龄落在区间内的人称为“青年人”,把年龄落在区间内的人称为“中年人”,把年龄落在内的人称为“老年人”.
(1)求所抽取的“青年人”的人数;
(2)以分层抽样的方式从“青年人”“中年人”“老年人”中抽取10名参会者做进一步访谈,发现其中女性共4人,这4人中有3人是“中年人”.再用抽签法从所抽取的10名参会者中任选2人.
①简述如何采用抽签法任选2人;
②设事件A:2人均为“中年人”,事件B:2人中至少有1人为男性,判断事件A与事件B是否独立,并说明理由.
25.(23-24高一下·广西桂林·阶段练习)为提升基层综合文化服务中心服务效能,广泛开展群众性文化活动,某村干部在本村的村民中进行问卷调查,将他们的成绩(满分:100分)分成7组:.整理得到如下频率分布直方图.
(1)求的值并估计该村村民成绩的平均数(同一组中的数据用该组区间的中点值代表);
(2)从成绩在内的村民中用分层抽样的方法选取6人,再从这6人中任选2人,求这2人成绩不在同一组的概率.
26.(2024·陕西商洛·模拟预测)为建立健全国家学生体质健康监测评价机制,激励学生积极参加身体锻炼,教育部印发了《国家学生体质健康标准》,要求各学校每学年开展覆盖本校各年级学生的《标准》测试工作,为做好全省的迎检工作.某市在高三年级开展了一次体质健康模拟测试.并从中随机抽取了500名学生的数据.根据他们的健康指数绘制了如图所示的频率分布直方图.
(1)估计这500名学生健康指数的平均数(同一组数据用该组区间的中点值作代表);
(2)现从体质健康指数在区间和内的学生中,用分层抽样法抽取5人,再从这5人中随机抽取3人填写调查问卷,求这3人中恰有2人体质健康指数在区间内的概率.
1.(2023·新课标Ⅱ卷·高考真题)某学校为了解学生参加体育运动的情况,用比例分配的分层随机抽样方法作抽样调查,拟从初中部和高中部两层共抽取60名学生,已知该校初中部和高中部分别有400名和200名学生,则不同的抽样结果共有( ).
A.种 B.种
C.种 D.种
2.(2019·全国I卷·高考真题)某学校为了解1 000名新生的身体素质,将这些学生编号为1,2,…,1 000,从这些新生中用系统抽样方法等距抽取100名学生进行体质测验,若46号学生被抽到,则下面4名学生中被抽到的是
A.8号学生 B.200号学生 C.616号学生 D.815号学生
3.(2024·新课标Ⅱ卷·高考真题)某农业研究部门在面积相等的100块稻田上种植一种新型水稻,得到各块稻田的亩产量(单位:kg)并整理如下表
亩产量
[900,950)
[950,1000)
[1000,1050)
[1050,1100)
[1100,1150)
[1150,1200)
频数
6
12
18
30
24
10
根据表中数据,下列结论中正确的是( )
A.100块稻田亩产量的中位数小于1050kg
B.100块稻田中亩产量低于1100kg的稻田所占比例超过80%
C.100块稻田亩产量的极差介于200kg至300kg之间
D.100块稻田亩产量的平均值介于900kg至1000kg之间
4.(2022·天津·高考真题)将1916到2015年的全球年平均气温(单位:),共100个数据,分成6组:,并整理得到如下的频率分布直方图,则全球年平均气温在区间内的有( )
A.22年 B.23年 C.25年 D.35年
5.(2022·全国乙卷·高考真题)分别统计了甲、乙两位同学16周的各周课外体育运动时长(单位:h),得如下茎叶图:
则下列结论中错误的是( )
A.甲同学周课外体育运动时长的样本中位数为7.4
B.乙同学周课外体育运动时长的样本平均数大于8
C.甲同学周课外体育运动时长大于8的概率的估计值大于0.4
D.乙同学周课外体育运动时长大于8的概率的估计值大于0.6
6.(2022·北京·高考真题)在北京冬奥会上,国家速滑馆“冰丝带”使用高效环保的二氧化碳跨临界直冷制冰技术,为实现绿色冬奥作出了贡献.如图描述了一定条件下二氧化碳所处的状态与T和的关系,其中T表示温度,单位是K;P表示压强,单位是.下列结论中正确的是( )
A.当,时,二氧化碳处于液态
B.当,时,二氧化碳处于气态
C.当,时,二氧化碳处于超临界状态
D.当,时,二氧化碳处于超临界状态
7.(2023·新课标Ⅰ卷·高考真题)有一组样本数据,其中是最小值,是最大值,则( )
A.的平均数等于的平均数
B.的中位数等于的中位数
C.的标准差不小于的标准差
D.的极差不大于的极差
8.(2020·海南·高考真题)我国新冠肺炎疫情进入常态化,各地有序推进复工复产,下面是某地连续11天复工复产指数折线图,下列说法正确的是
A.这11天复工指数和复产指数均逐日增加;
B.这11天期间,复产指数增量大于复工指数的增量;
C.第3天至第11天复工复产指数均超过80%;
D.第9天至第11天复产指数增量大于复工指数的增量;
9.(2020·山东·高考真题)某创新企业为了解新研发的一种产品的销售情况,从编号为001,002,…480的480个专卖店销售数据中,采用系统抽样的方法抽取一个样本,若样本中的个体编号依次为005,021,…则样本中的最后一个个体编号是 .
10.(2019·全国II卷·高考真题)我国高铁发展迅速,技术先进.经统计,在经停某站的高铁列车中,有10个车次的正点率为0.97,有20个车次的正点率为0.98,有10个车次的正点率为0.99,则经停该站高铁列车所有车次的平均正点率的估计值为 .
11.(2019·天津·高考真题)2019年,我国施行个人所得税专项附加扣除办法,涉及子女教育、继续教育、大病医疗、住房贷款利息或者住房租金、赡养老人等六项专项附加扣除.某单位老、中、青员工分别有人,现采用分层抽样的方法,从该单位上述员工中抽取人调查专项附加扣除的享受情况.
(Ⅰ)应从老、中、青员工中分别抽取多少人?
(Ⅱ)抽取的25人中,享受至少两项专项附加扣除的员工有6人,分别记为.享受情况如下表,其中“”表示享受,“×”表示不享受.现从这6人中随机抽取2人接受采访.
员工
项目
A
B
C
D
E
F
子女教育
○
○
×
○
×
○
继续教育
×
×
○
×
○
○
大病医疗
×
×
×
○
×
×
住房贷款利息
○
○
×
×
○
○
住房租金
×
×
○
×
×
×
赡养老人
○
○
×
×
×
○
(i)试用所给字母列举出所有可能的抽取结果;
(ii)设为事件“抽取的2人享受的专项附加扣除至少有一项相同”,求事件发生的概率.
12.(2023·全国乙卷·高考真题)某厂为比较甲乙两种工艺对橡胶产品伸缩率的处理效应,进行10次配对试验,每次配对试验选用材质相同的两个橡胶产品,随机地选其中一个用甲工艺处理,另一个用乙工艺处理,测量处理后的橡胶产品的伸缩率.甲、乙两种工艺处理后的橡胶产品的伸缩率分别记为,.试验结果如下:
试验序号
1
2
3
4
5
6
7
8
9
10
伸缩率
545
533
551
522
575
544
541
568
596
548
伸缩率
536
527
543
530
560
533
522
550
576
536
记,记的样本平均数为,样本方差为.
(1)求,;
(2)判断甲工艺处理后的橡胶产品的伸缩率较乙工艺处理后的橡胶产品的伸缩率是否有显著提高(如果,则认为甲工艺处理后的橡胶产品的伸缩率较乙工艺处理后的橡胶产品的伸缩率有显著提高,否则不认为有显著提高)
13.(2023·新课标Ⅱ卷·高考真题)某研究小组经过研究发现某种疾病的患病者与未患病者的某项医学指标有明显差异,经过大量调查,得到如下的患病者和未患病者该指标的频率分布直方图:
利用该指标制定一个检测标准,需要确定临界值c,将该指标大于c的人判定为阳性,小于或等于c的人判定为阴性.此检测标准的漏诊率是将患病者判定为阴性的概率,记为;误诊率是将未患病者判定为阳性的概率,记为.假设数据在组内均匀分布,以事件发生的频率作为相应事件发生的概率.
(1)当漏诊率%时,求临界值c和误诊率;
(2)设函数,当时,求的解析式,并求在区间的最小值
1
学科网(北京)股份有限公司
$$
专题9.1 统计
一、选择题(每小题5分,在每小题给出的选项中,只有一项是符合题目要求的.)
1.(2025·湖北武汉·二模)某批产品检验后的评分,由统计结果制成如图所示的频率分布直方图,
下列说法中正确的是( )
A. B.评分的众数估值为70
C.评分的第25百分位数估值为67.5 D.评分的平均数估值为76
【答案】C
【难度】0.85
【知识点】由频率分布直方图估计平均数、总体百分位数的估计、补全频率分布直方图、根据频率分布直方图计算众数
【分析】根据频率分布直方图中所有小矩形的面积之和为得到方程,求出,再根据平均数、百分位数及众数的计算规则计算可得.
【详解】由题意:,
解得,A错误,
所以平均数为,故D错误;
众数为,故B错误;
因为,第百分位数估计为,故C正确;
故选:C
2.(24-25高三上·山西运城·开学考试)下列说法错误的是( )
A.某校高一年级共有男女学生500人,现按性别采用分层抽样的方法抽取容量为50人的样本,若样本中男生有30人,则该校高一年级女生人数是200
B.数据1,3,4,5,7,9,11,16的第75百分位数为10
C.在一元线性回归方程中,若线性相关系数r越大,则两个变量的线性相关性越强
D.根据分类变量与的成对样本数据,计算得到,根据小概率值的独立性检验,可判断与有关联,此推断犯错误的概率不大于0.05
【答案】C
【难度】0.65
【知识点】独立性检验解决实际问题、总体百分位数的估计、抽样比、样本总量、各层总数、总体容量的计算、相关系数的意义及辨析
【分析】利用分层抽样计算判断A;求出第75百分位数判断B;利用线性相关系数的意义判断C;利用独立性检验的思想判断D.
【详解】对于A,该校高一年级女生人数是,A正确;
对于B,由,得第75百分位数为,B正确;
对于C,线性回归方程中,线性相关系数绝对值越大,两个变量的线性相关性越强,C错误;
对于D,由,可判断与有关联,此推断犯错误的概率不大于0.05,D正确.
故选:C
3.(2024·河南驻马店·二模)电影《孤注一掷》的上映引发了电信诈骗问题的热议,也加大了各个社区反电信诈骗的宣传力度.已知某社区共有居民480人,其中老年人200人,中年人200人,青少年80人,若按年龄进行分层随机抽样,共抽取36人作为代表,则中年人比青少年多( )
A.6人 B.9人 C.12人 D.18人
【答案】B
【难度】0.85
【知识点】抽样比、样本总量、各层总数、总体容量的计算
【分析】根据题意可以计算出分层随机抽样的抽样比例,进而计算出中年人和青年人的人数,进而可以知道中年人比青少年多多少个.
【详解】设中年人抽取人,青少年抽取人,由分层随机抽样可知,
解得,故中年人比青少年多9人.
故选:B.
4.(2024·陕西铜川·模拟预测)已知某地区中小学生人数和近视情况分别如图甲和图乙所示.为了了解该地区中小学生近视情况形成的原因,采用分层抽样的方法抽取部分学生进行调查,若抽取的小学生人数为70,则抽取的高中生中近视人数为( )
A.10 B.20 C.25 D.40
【答案】B
【难度】0.85
【知识点】根据扇形统计图解决实际问题、根据条形统计图解决实际问题、抽样比、样本总量、各层总数、总体容量的计算
【分析】根据题意,求得抽取的高中生人数是人,再结合图乙可知高中生的近视率为,即可求解.
【详解】由图甲可知抽取的高中生人数是,
又由图乙可知高中生的近视率为,所以抽取的高中生中近视人数为人.
故选:B.
5.(2025·江西·一模)声音经济产业指的是围绕声音进行信息消费而引发的一切经济现象及行为.已知年中国声音经济产业市场规模(单位:千亿元)依次为:0.3,0.5,1.4,2.2,3.1,3.9,2.5,5,则这组数据的分位数为( )
A.3.1 B.3.2 C.3.5 D.3.9
【答案】C
【难度】0.94
【知识点】总体百分位数的估计
【分析】利用百分位数的定义求解即可.
【详解】因为,所以该组数据的分位数为这组数据按照从小到大排列的第6个数(3.1)与第7个数(3.9)的平均数,
所以这组数据的分位数为.
故选:C.
6.(2024·四川德阳·模拟预测)中国人口亿人口中肠胃病患者高达亿,慢性胃炎发病率高达,消化性溃疡病发率也高达,是全世界当之无愧的“胃病大国”.根据随机对名青少年随机抽查,的青少年表示自己患有胃病,的青少年不清楚自己是否患有胃病,只有明确自己没有胃病.肠胃病的严重程度,一般可体现在排便量、排便时长上. 某高中为了了解学生肠胃病占比和严重程度,对年高一高二学生单日单次的排便时长进行了统计(记排便分钟内为正常,排便分钟为轻度肠胃病,排便分钟以上为重度肠胃病),并将结果制成统计图(如图所示),若高一学生人,高二学生人,占比百分数均保留整数,下列说法正确的是( )
A.高二学生的肠胃病人数比高一年级少
B.高一年级的各肠胃病区间人数占比都比高二年级少
C.高一年级重度肠胃病人数占比比高二年级少
D.高一肠胃质量参数比高二高(肠胃质量参数)
【答案】C
【难度】0.65
【知识点】根据条形统计图解决实际问题、根据扇形统计图解决实际问题
【分析】根据扇形统计图计算高一的肠胃病人数,各肠胃病区间人数占比,肠胃质量参数,再利用条形统计图确定高二学生的肠胃病人数,各肠胃病区间人数占比,肠胃质量常数,由此确定正确结论.
【详解】由扇形统计图可得高一年级肠胃病人数为,
高一年级的轻度肠胃病人数占比,
高一年级重度肠胃病人数占比为,
高一肠胃质量参数为,
由条形统计图可得高二年级肠胃病人数为,
高二年级的轻度肠胃病人数占比为,
高二年级重度肠胃病人数占比为,
高二肠胃质量参数为,
所以高二学生的肠胃病人数比高一年级多,A错误;
高一年级轻度肠胃病区间人数占比比高二年级高,B错误;
高一年级重度肠胃病人数占比比高二年级少,C正确;
高一肠胃质量参数比高二低,D错误;
故选:C.
7.(2025·贵州遵义·模拟预测)遵义羊肉粉是黔北民众最喜爱的小吃之一.2024年12月16日,遵义市第七届羊肉粉节在凤凰山文化广场盛大开幕,某商家为了调研顾客对本店就餐的满意度,从用过餐的顾客中随机抽取100名进行评分.整理评分数据,将收集到的顾客满意度分值数据(满分100分)分成六段:,,…,,得到如图所示的频率分布直方图,则下列选项正确的是( )
A.这100名顾客评分的极差介于40分至50分之间
B.这100名顾客评分的中位数小于80分
C.
D.这100名顾客评分的平均值介于60分到70分之间
【答案】C
【难度】0.65
【知识点】由频率分布直方图估计中位数、由频率分布直方图估计平均数、由频率分布直方图计算频率、频数、样本容量、总体容量
【分析】由极差的概念可得A错误;由频率分布直方图的面积和为1可得C正确;由后两个矩形的面积大于可得B错误;由频率分布直方图平均值的求法可得D错误.
【详解】对于A,由频率分布直方图可知,这100名顾客评分的极差最小不低于,最大为,故A错误;
对于C,由面积和为可得,故C正确;
对于B,后两个矩形的面积为,所以这100名顾客评分的中位数应该在倒数第二个区间内,不小于80分,故B错误;
对于D,这100名顾客评分的平均值为,故D错误;
故选:C.
8.(2025·重庆·一模)有 4 位同学各掷骰子 5 次(骰子出现的点数可能为1,2,3,4,5,6),分别记录自己每次出现的点数,四位同学根据统计结果,并对自己的试验数据分别做了如下描述,可以判断一定没有出现点数 1的是( )
A.平均数为3 ,中位数为4 B.中位数为3 ,众数为5
C.平均数为4 ,方差为1.2 D.中位数为4 ,方差为1.6
【答案】C
【难度】0.65
【知识点】计算几个数的众数、计算几个数的中位数、计算几个数的平均数、计算几个数据的极差、方差、标准差
【分析】根据数字特征的定义,依次对选项分析判断即可
【详解】对于A,由于平均数为3,中位数为4,所以这5个数从小到大排列后,第3次是4,当第3,4,5次为4,4,4时,总和为12,第1,2次总和为3,故这5个数可以是1,2,4,4,4,
故A错误;
对于B,由于中位数为3,众数为5,所以这5个数从小到大排列后,第3次是3,则第4和5次为5,所以这5个数可以是1,2,3,5,5,所以B错误;
对于C,由于平均数为4,方差为1.2,则5次总和为20,,
若有一个数为1,取,则,不合题意,则一定没有出现点数1,故C正确;
对于D,由中位数为4 ,方差为1.6,所以这5个数从小到大排列后,第3次是4,平均数最小值为2.8,
,
,
若有一个数为1,取,,
若取平均数为3,则,
,则符合要求,这5个数为1,2,4,4,4,故D错误,
故选:C.
9.(24-25高二上·四川绵阳·期末)哈希表(HashTable)是一种利用键值的映射关系,将数据存储在特定位置的数据结构.常用的方法之一是“除留余数法”.例如,当除数为时,键值为的数据因余,应存放于位置中,从而可直接依据键值快速定位数据位置,多个数据可映射到同一位置(如键值和均映射到同一位置).现有一个容量为个位置(编号)的哈希表,以除留余数法(除数为)进行映射,需要存储个数据.设这个位置存放的数据个数分别为、、、、、、,则下列说法中正确的是( )
A.至少有个位置存放了不少于个数据
B.若这个数据的键值恰好是间的所有奇数,则的中位数为
C.若的方差为,则的最小值为,最大值为
D.若的极差为,则最多有个位置没有存放数据
【答案】D
【难度】0.4
【知识点】计算几个数的中位数、计算几个数据的极差、方差、标准差
【分析】设为数据除以的余数为的数的个数,利用特例法可判断A选项;求出这个数的值,结合中位数的定义可判断B选项;利用方差的定义可求出的最大值和最小值,可判断C选项;对个位置是否存在空位进行讨论,结合极差的定义可判断D选项.
【详解】设为数据除以的余数为的数的个数,
对于A选项,,
不妨假设这个位置存放的数据个数分别为、、、、、、,A错;
对于B选项,由题意可知,这些奇数分别为、、、、、、、、、
、、、、、、、、、、、、,
这些数据除的余数分别为:、、、、、、、、、、、、、、
、、、、、、、,
所以,,,,,,,,
将这个数由小到大排列依次为、、、、、、,中位数为,B错;
对于C选项,由题意可知,这个数的平均数为,
且,,
因为,,
当这个数中有个,个时,取最小值,
即,
当这个数中有个,个时,取最大值,
即,C错;
对于D选项,不妨这个数依次为:、、、、、、,
满足极差为,此时,所有位置都有数据,
若存在一些位置没有数据,则这个数据中的最大值为,最小值为,
因为,此时,至少需要个位置存放数据,则至多有个位置没有存放数据,D对.
故选:D.
【点睛】关键点点睛:解决本题D选项,主要要对个位置是否存在空位进行讨论,利用特例法结合极差的定义进行判断.
10.(2024·全国·模拟预测)随着汽车智能化与电动化的不断升级,无人驾驶汽车成为汽车行业发展的新趋势.据统计,截至2024年7月底中国无人驾驶汽车行业存续企业数量为1782家,这些企业的注册资本分布情况如图所示,则下列结论错误的是( )
A.注册资本不高于200万元的企业数量占比不足
B.注册资本在1000万元以上的企业超过750家
C.注册资本分布数据的分位数是
D.从注册资本在100万元—500万元的企业中随机抽取1家,该企业注册资本在200万元—500万元的概率不小于0.55
【答案】C
【难度】0.85
【知识点】根据扇形统计图解决实际问题、总体百分位数的估计
【分析】根据饼状图可知注册资本不高于200万元的企业数量占比为,在1000万元以上的企业数量为,可判断AB正确,利用百分位数定义计算可得C错误,根据不同资本的企业占比计算可得D正确.
【详解】选项A:注册资本不高于200万元的企业数量占比为,,A正确.
选项B:注册资本在1000万元以上的企业数量为,,B正确.
选项C:,故分位数为与的平均数,C错误.
选项D:从注册资本在100万元—500万元的企业中随机抽取1家,
则该企业注册资本在200万元—500万元的概率为,,D正确.
故选:C
11.(2024·甘肃白银·一模)2014年1月至9月全国城镇调查失业率依次为,则( )
A.这组数据的众数为
B.这组数据的极差为
C.这组数据的分位数为
D.这组数据的平均数大于
【答案】D
【难度】0.85
【知识点】计算几个数据的极差、方差、标准差、计算几个数的众数、总体百分位数的估计、计算几个数的平均数
【分析】由众数、极差、百分位数和平均数计算公式即可求解.
【详解】由题意得这组数据的众数为和,极差为,A,B错误.
因为,所以这组样本数据的分位数为,C错误.
这组数据的平均数为,D正确.
故选:D
12.(2019·福建泉州·二模)已知某人收集一个样本容量为50的一组数据,并求得其平均数为70,方差为75,现发现在收集这些数据时,其中得两个数据记录有误,一个错将80记录为60,另一个错将70记录为90,在对错误的数据进行更正后,重新求得样本的平均数为,方差为,则( )
A. B.
C. D.
【答案】C
【难度】0.85
【知识点】计算几个数的平均数、计算几个数据的极差、方差、标准差
【分析】由平均数,方差计算公式可判断各选项正误.
【详解】设其他48个数据依次为,
则,因为,
因此平均数不变,即;又由方差计算公式可知:,
,
注意到,则.
故选:C.
二、多选题(每小题6分,在每小题给出的选项中,只有一项或者多项是符合题目要求的.)
13.(2024·江苏苏州·模拟预测)在某次数学练习中,高三班的男生数学平均分为120,方差为2,女生数学平均分为112,方差为1,已知该班级男女生人数分别为25、15,则下列说法正确的有( )
A.该班级此次练习数学成绩的均分为118
B.该班级此次练习数学成绩的方差为16.625
C.利用分层抽样的方法从该班级抽取8人,则应抽取5名男生
D.从该班级随机选择2人参加某项活动,则至少有1名女生的概率为
【答案】BCD
【难度】0.94
【知识点】抽样比、样本总量、各层总数、总体容量的计算
【分析】利用均值、方差、分层随机抽样、古典概型等知识逐项判断即可.
【详解】对于A,该班级此次练习数学成绩的均分,故A错误;
对于B,该班级此次练习数学成绩的方差
,故B正确;
对于C,利用分层抽样的方法从该班级抽取8人,则应抽取的男生人数为,C正确;
对于D,从该班级随机选择2人参加某项活动,则至少有1名女生的概率,故D正确.
故选BCD.
14.(2024·广西南宁·模拟预测)给出下列命题,其中错误的命题为( )
A.若样本数据的方差为3,则数据的方差为6.
B.具有相关关系的两个变量x,y的相关系数为r,那么越接近于0,x,y之间的线性相关程度越高;
C.在一个列联表中,根据表中数据计算得到的观测值k,若k的值越大,则认为两个变量间有关的把握就越大;
D.甲同学所在的某校高三共有5003人,先剔除3人,再按简单随机抽样的方法抽取容量为200的一个样本,则甲被抽到的概率为.
【答案】ABD
【难度】0.85
【知识点】简单随机抽样的概率、各数据同时乘除同一数对方差的影响、相关系数的意义及辨析、独立性检验的概念及辨析
【分析】根据方差的性质可判断A;根据相关系数的性质可判断B;根据的性质可判断C;根据简单随机抽样每个个体被抽到的概率是等可能的可判断D。
【详解】若样本数据的方差为3,则数据的方差为,故A错误;
由相关系数的实际意义知越接近于1,x,y之间的线性相关程度越高,故B错误;
的观测值越大,则认为两个变量间有关的把握就越大,故C正确;
简单随机抽样中每个个体被抽到的概率是等可能的,概率等于,故D错误;
故选:ABD
15.(2025·山东临沂·一模)甲,乙两个体育社团小组成员的某次立定跳远成绩(单位:厘米)如下:
甲组:,,,,,,,,,,,
乙组:,,,,,,,,,
则下列说法正确的是( )
A.甲组数据的第60百分位数是252
B.乙组数据的中位数是246
C.从甲、乙两组各随机选取一个成员,两人跳远成绩均在250厘米以上的概率为
D.甲组中存在这样的成员,将他调派到乙组后,甲、乙两组的跳远平均成绩都有提高
【答案】BCD
【难度】0.85
【知识点】计算几个数的中位数、计算几个数的平均数、计算古典概型问题的概率、总体百分位数的估计
【分析】对于A直接利用百分位数计算公式即可;对于B根据公式计算中位数和平均数;对于C根据古典概率公式计算即可;对于D,求出两者平均数判断即可.
【详解】对于选项A,因为,所以甲组数据的第60百分位数是第8个数,即253,故A错误;
对于选项B,因为,所以乙组数据的中位数是第5个数与第6个
数的平均数,即,故B正确;
对于选项C,甲组中跳远成绩在250厘米,以上的有5人,乙组中跳远成绩在250厘米以上的
有2人,所以从甲、乙两组各随机选取一个成员,两人跳远成绩均在250厘米以上的概率为
,故C正确;
对于选项D,甲组的平均成绩为厘米,
乙组的平均成绩为厘米,所以将甲组中跳远成
绩为251厘米的成员调派到乙组后,甲、乙两组的跳远平均成绩都有提高,故D正确.
故选:BCD.
16.(2025·福建福州·模拟预测)近日,国家发展改革委等部门联合印发《完善碳排放统计核算体系工作方案》,指出要在2025年全面建立碳排放年报、快报制度,完善碳排放统计核算体系.专家在甲、乙、丙、丁四地2024年第4季度的周快报数据中随机抽取7周数据进行分析,整理出四地这7周各周内碳排放量超过的天数的数据特征:
地区
甲
乙
丙
丁
数据特征
中位数
3
中位数
1
均值
3
均值
2
众数
2
均值
<1
众数
4
方差
2
根据规定,若这7周中每周内碳排放量超过的天数都不多于5天,则可称该地区为低碳生态区.分析数据,四个地区中能判定为低碳生态区的是( )
A.甲地 B.乙地 C.丙地 D.丁地
【答案】BD
【难度】0.65
【知识点】众数、平均数、中位数的比较、用众数的代表意义解决实际问题、用中位数的代表意义解决实际问题、用平均数的代表意义解决实际问题
【分析】根据表中数据分别作出四个地方的数据分布,即可结合低碳生活区的定义求解.
【详解】将四地这7周各周内碳排放量超过的天数由小到大依次记为,,,,,,,分别对应第周.
对于甲地,由题可知(中位数),则可做表:
周
第周
第周
第周
第周
第周
第周
第周
天数
3
众数为二,可使,,显然可以是6或7,
此时第周内碳排放量超过的天数都多于5天,故无法判定甲地为低碳生态区;
对于乙地,由题可知(中位数),则可做表:
周
第周
第周
第周
第周
第周
第周
第周
天数
1
我们可以使,,,,尽可能小,
通过判断是否有可能来判断乙地是否能被判定为低碳生态区.
则,,可计算均值,化简得,
满足7周中每周内碳排放量超过的天数都不多于5天,因此可以判定乙地为低碳生态区;
对于丙地,根据题意,我们无法直接判断对应的值,
但类似的,我们可以使,,,,,的和尽可能小,
通过判断是否有可能来判断丙地是否能被判定为低碳生态区.
则可以使,,,,,可做表:
周
第周
第周
第周
第周
第周
第周
第周
天数
0
1
2
3
4
4
均值,解得,
即此时第周内碳排放量超过的天数都多于5天,故无法判定丙地为低碳生态区;
对于乙地,假设,则方差,不合题意,
故,即满足7周中每周内碳排放量超过的天数都不多于5天,
因此可以判定丁地为低碳生态区;
综上所述,四地中能判定为低碳生态区的是乙地和丁地.
故选:BD
三、填空题(每小题5分,把答案填在答题卡中的横线上.)
17.(2024·四川德阳·一模)某中学田径队有男运动员28人,女运动员21人,按性别进行分层随机抽样的方法从全体运动员中抽取一个容量为14的样本,如果样本按比例分配,则男运动员应该抽取的人数为
【答案】8
【难度】0.85
【知识点】抽样比、样本总量、各层总数、总体容量的计算
【分析】先计算得到抽取比例为,再计算得到答案.
【详解】解:田径队运动员的总人数是,要得到14人的样本,占总体的比例为,
于是应该在男运动员中随机抽取(名),
故答案为:8
18.(2024·山东·二模)某中职学校计划从300名学生中抽取30名进行问卷调查,拟采用系统抽样方法,为此将他们逐一编号为1—300,并对编号进行分段,若从第一个号码段中随机抽取的号码是6,则从第五个号码段中抽取的号码应是 .
【答案】46
【难度】0.94
【知识点】等距抽样的组距与编号
【分析】根据系统抽样的特征即可求解.
【详解】由题意可知,抽取的间距10,第一组抽取的数据是6,故接下来抽取的数据分别为16,26,36,46,......
故第五个号码段中抽取的号码应是46
故答案为:46
19.(2024·山西·模拟预测)某商场为了了解顾客的停车时长(单位:分钟),现随机抽取了100辆该商场到访顾客的车辆进行停车时长调查,将数据整理得到如下频率分布直方图:
则样本中停车时长在区间上的车辆数为 辆.
【答案】
【难度】0.85
【知识点】补全频率分布直方图、由频率分布直方图计算频率、频数、样本容量、总体容量
【分析】利用频率直方图中频率之和为1求得的频率,进而求得的频数,从而得解.
【详解】依题意,设的频率为,
则,解得,
所以样本中停车时长在区间上的车辆数为.
故答案为:.
20.(22-23高三下·河南安阳·阶段练习)《中国居民膳食指南(2022)》数据显示,岁至岁儿童青少年超重肥胖率高达为了解某地中学生的体重情况,某机构从该地中学生中随机抽取名学生,测量他们的体重单位:千克,根据测量数据,按,,,,,分成六组,得到的频率分布直方图如图所示,根据调查的数据,估计该地中学生体重的分位数是 .
【答案】
【难度】0.85
【知识点】总体百分位数的估计
【分析】先根据频率分布直方图判断分位数的位置,然后列方程求解即可.
【详解】因为前2组的频率和为,
前3组的频率和为,
所以分位数在内,
设分位数为,则,解得.
故答案为:
21.(2024·山西太原·二模)为获得某校高一年级全体学生的身高信息,现采用样本量按比例分配的分层随机抽样方法抽取了一个样本,其中有30名男生和20名女生,计算得男生样本的均值为170,方差为15.女生样本的均值为160,方差为30,则由上述数据计算该校高一年级学生身高的均值是 ,方差是 .
【答案】 166 45
【难度】0.65
【知识点】计算几个数的平均数、估计总体的方差、标准差
【分析】由样本均值、方差的计算公式,代入数据即可求得.
【详解】设样本中男生的身高为,女生的身高为,
则,该校高一年级学生身高的均值是,
方差为
.
故答案为:166,45.
22.(2024·陕西西安·三模)某厂有甲、乙、丙三个车间生产同一种零件,经统计,甲车间生产的100个零件中的次品率为0.03,乙车间生产的200个零件中的次品率为0.02,丙车间生产的200个零件中的次品率为0.03,则该厂零件的次品率的估计值为 .
【答案】0.026/
【难度】0.65
【知识点】计算几个数的平均数
【分析】由平均值计算公式求解.
【详解】该厂零件的次品率的估计值为.
故答案为:
四、填空题(解答应写出必要的文字说明、证明过程或演算步骤.)
23.(24-25高二上·浙江杭州·期中)在某市的三次数学测试中,为了解学生的测试情况,从中随机抽取100名学生的测试成绩,被抽取成绩全部介于40分到100分之间(满分100分),将统计结果按如下方式分成六组:第一组.第二组,……第六组,画出频率分布直方图如图所示,
(1)估计该市学生这次测试成绩的第25百分位数;
(2)估计该市学生这次测试成绩的平均值(回一组中的数据用该组区间的中点值为代表);
(3)从两组中按分层抽样抽取5名学生,再随机抽取3名同学进行问卷测试,问3名同学中恰好只有1名同学成绩在之间的概率.
【答案】(1)
(2)
(3)
【难度】0.85
【知识点】由频率分布直方图估计平均数、计算古典概型问题的概率、抽样比、样本总量、各层总数、总体容量的计算、总体百分位数的估计
【分析】(1)根据百分位的定义计算可得;
(2)根据频率分布直方图中平均数计算公式计算可得;
(3)分别求出、中抽取的人数,再利用列举法列出所有可能结果,最后利用古典概型的概率公式计算可得.
【详解】(1)因为,
,
所以第百分位数为.
(2)平均值;
(3)因为的频率为,的频率为,
则中抽取名学生,分别记作、,
中抽取名学生,分别记作、、,
从这5名学生,随机抽取3名同学进行问卷测试,则可能结果有:,,,,,,,,,共个;
其中3名同学中恰好只有1名同学成绩在之间有,,共个,
所以3名同学中恰好只有1名同学成绩在之间的概率;
24.(2024·上海长宁·一模)2024年第七届中国国际进口博览会(简称进博会)于11月5日至10日在上海国家会展中心举行.为了解进博会参会者的年龄结构,某机构随机抽取了年龄在15-75岁之间的200名参会者进行调查,并按年龄绘制了频率分布直方图,分组区间为.把年龄落在区间内的人称为“青年人”,把年龄落在区间内的人称为“中年人”,把年龄落在内的人称为“老年人”.
(1)求所抽取的“青年人”的人数;
(2)以分层抽样的方式从“青年人”“中年人”“老年人”中抽取10名参会者做进一步访谈,发现其中女性共4人,这4人中有3人是“中年人”.再用抽签法从所抽取的10名参会者中任选2人.
①简述如何采用抽签法任选2人;
②设事件A:2人均为“中年人”,事件B:2人中至少有1人为男性,判断事件A与事件B是否独立,并说明理由.
【答案】(1)80
(2)①答案见解析;②事件A与事件B不独立,理由见解析
【难度】0.65
【知识点】由频率分布直方图计算频率、频数、样本容量、总体容量、求超几何分布的概率、抽签法、独立事件的乘法公式
【分析】(1)根据频率分布直方图求得的值,然后求得“青年人”人数占比,从而可得“青年人”人数;
(2)①利用简单随机抽样设计抽签法任选2人即可;②根据独立事件判断公式,结合超几何分布概率问题求解,从而可得结论.
【详解】(1)由频率分布直方图可得,解得:,
又“青年人”占比为,
所以所抽取的“青年人”人数为人;
(2)①先将10名参会者进行编号:1、2、、10,并将10个号码写在完全相同的纸片上,
放入某容器中充分混合均匀,再取出2张,2张纸片上所对应的参会者就是要选取的人,
②“青年人”“中年人”“老年人”的人数之比为,
所以10人中“中年人”共有5人,
2人均为“中年人”的概率,
2人中至少有1人为男性的概率,
2人均为“中年人”且至少有1人为男性的概率,
因为,所以事件A与事件B不独立.
25.(23-24高一下·广西桂林·阶段练习)为提升基层综合文化服务中心服务效能,广泛开展群众性文化活动,某村干部在本村的村民中进行问卷调查,将他们的成绩(满分:100分)分成7组:.整理得到如下频率分布直方图.
(1)求的值并估计该村村民成绩的平均数(同一组中的数据用该组区间的中点值代表);
(2)从成绩在内的村民中用分层抽样的方法选取6人,再从这6人中任选2人,求这2人成绩不在同一组的概率.
【答案】(1),平均数为;
(2).
【难度】0.65
【知识点】补全频率分布直方图、抽样比、样本总量、各层总数、总体容量的计算、计算古典概型问题的概率、由频率分布直方图估计平均数
【分析】(1)根据频率之和等于1可得,然后由平均数的估算公式可的平均数;
(2)求出两组的频率,根据频率比求出每层抽取的人数,然后利用列举法和古典概型概率公式可得.
【详解】(1)由直方图可得,
解得,
平均数为.
(2)成绩在内的频率分别为,
则成绩在内抽取的人数分别为人,人,
成绩在内的2人记为,成绩在内的4人记为,
从这6人中任选2人的样本空间
,所以.
记2人成绩不在同一组为事件A,
则,所以,
所以从这6人中任选2人,这2人成绩不在同一组的概率.
26.(2024·陕西商洛·模拟预测)为建立健全国家学生体质健康监测评价机制,激励学生积极参加身体锻炼,教育部印发了《国家学生体质健康标准》,要求各学校每学年开展覆盖本校各年级学生的《标准》测试工作,为做好全省的迎检工作.某市在高三年级开展了一次体质健康模拟测试.并从中随机抽取了500名学生的数据.根据他们的健康指数绘制了如图所示的频率分布直方图.
(1)估计这500名学生健康指数的平均数(同一组数据用该组区间的中点值作代表);
(2)现从体质健康指数在区间和内的学生中,用分层抽样法抽取5人,再从这5人中随机抽取3人填写调查问卷,求这3人中恰有2人体质健康指数在区间内的概率.
【答案】(1)
(2)
【难度】0.65
【知识点】由频率分布直方图估计平均数、计算古典概型问题的概率、抽样比、样本总量、各层总数、总体容量的计算
【分析】(1)根据频率分布直方图中平均数的计算公式即可求解.
(2)先分层抽样求出区间和内的抽取的学生人数,再利用列举法求出古典概型的概率即可.
【详解】(1)由频率分布直方图平均数计算公式得.
(2)区间和内两组学生分别有人,人,
故按照分层抽样抽得区间内的学生人数为4,分别设为,,,,
区间内的学生人数为1,设为,
这5人中选出3人,所有情况有,,,,,,,,,,共有10种情况,
其中选出的恰有2人体质健康指数在区间内有,,,,,共6种情况,
故这3人中恰有2人体质健康指数在区间内的概率为.
1.(2023·新课标Ⅱ卷·高考真题)某学校为了解学生参加体育运动的情况,用比例分配的分层随机抽样方法作抽样调查,拟从初中部和高中部两层共抽取60名学生,已知该校初中部和高中部分别有400名和200名学生,则不同的抽样结果共有( ).
A.种 B.种
C.种 D.种
【答案】D
【难度】0.85
【知识点】抽样比、样本总量、各层总数、总体容量的计算、分步乘法计数原理及简单应用、实际问题中的组合计数问题
【分析】利用分层抽样的原理和组合公式即可得到答案.
【详解】根据分层抽样的定义知初中部共抽取人,高中部共抽取,
根据组合公式和分步计数原理则不同的抽样结果共有种.
故选:D.
2.(2019·全国I卷·高考真题)某学校为了解1 000名新生的身体素质,将这些学生编号为1,2,…,1 000,从这些新生中用系统抽样方法等距抽取100名学生进行体质测验,若46号学生被抽到,则下面4名学生中被抽到的是
A.8号学生 B.200号学生 C.616号学生 D.815号学生
【答案】C
【难度】0.65
【知识点】系统抽样
【分析】等差数列的性质.渗透了数据分析素养.使用统计思想,逐个选项判断得出答案.
【详解】详解:由已知将1000名学生分成100个组,每组10名学生,用系统抽样,46号学生被抽到,
所以第一组抽到6号,且每组抽到的学生号构成等差数列,公差,
所以,
若,则,不合题意;若,则,不合题意;
若,则,符合题意;若,则,不合题意.故选C.
【点睛】本题主要考查系统抽样.
3.(2024·新课标Ⅱ卷·高考真题)某农业研究部门在面积相等的100块稻田上种植一种新型水稻,得到各块稻田的亩产量(单位:kg)并整理如下表
亩产量
[900,950)
[950,1000)
[1000,1050)
[1050,1100)
[1100,1150)
[1150,1200)
频数
6
12
18
30
24
10
根据表中数据,下列结论中正确的是( )
A.100块稻田亩产量的中位数小于1050kg
B.100块稻田中亩产量低于1100kg的稻田所占比例超过80%
C.100块稻田亩产量的极差介于200kg至300kg之间
D.100块稻田亩产量的平均值介于900kg至1000kg之间
【答案】C
【难度】0.85
【知识点】计算几个数的中位数、计算几个数的平均数、计算几个数据的极差、方差、标准差
【分析】计算出前三段频数即可判断A;计算出低于1100kg的频数,再计算比例即可判断B;根据极差计算方法即可判断C;根据平均值计算公式即可判断D.
【详解】对于 A, 根据频数分布表可知, ,
所以亩产量的中位数不小于 , 故 A 错误;
对于B,亩产量不低于的频数为,
所以低于的稻田占比为,故B错误;
对于C,稻田亩产量的极差最大为,最小为,故C正确;
对于D,由频数分布表可得,平均值为,故D错误.
故选;C.
4.(2022·天津·高考真题)将1916到2015年的全球年平均气温(单位:),共100个数据,分成6组:,并整理得到如下的频率分布直方图,则全球年平均气温在区间内的有( )
A.22年 B.23年 C.25年 D.35年
【答案】B
【难度】0.85
【知识点】由频率分布直方图计算频率、频数、样本容量、总体容量
【分析】由频率分布直方图可得所求区间的频率,进而可以求得结果.
【详解】全球年平均气温在区间内的频率为,
则全球年平均气温在区间内的有年.
故选:B.
5.(2022·全国乙卷·高考真题)分别统计了甲、乙两位同学16周的各周课外体育运动时长(单位:h),得如下茎叶图:
则下列结论中错误的是( )
A.甲同学周课外体育运动时长的样本中位数为7.4
B.乙同学周课外体育运动时长的样本平均数大于8
C.甲同学周课外体育运动时长大于8的概率的估计值大于0.4
D.乙同学周课外体育运动时长大于8的概率的估计值大于0.6
【答案】C
【难度】0.94
【知识点】由茎叶图计算中位数、由茎叶图计算平均数、计算古典概型问题的概率
【分析】结合茎叶图、中位数、平均数、古典概型等知识确定正确答案.
【详解】对于A选项,甲同学周课外体育运动时长的样本中位数为,A选项结论正确.
对于B选项,乙同学课外体育运动时长的样本平均数为:
,
B选项结论正确.
对于C选项,甲同学周课外体育运动时长大于的概率的估计值,
C选项结论错误.
对于D选项,乙同学周课外体育运动时长大于的概率的估计值,
D选项结论正确.
故选:C
6.(2022·北京·高考真题)在北京冬奥会上,国家速滑馆“冰丝带”使用高效环保的二氧化碳跨临界直冷制冰技术,为实现绿色冬奥作出了贡献.如图描述了一定条件下二氧化碳所处的状态与T和的关系,其中T表示温度,单位是K;P表示压强,单位是.下列结论中正确的是( )
A.当,时,二氧化碳处于液态
B.当,时,二氧化碳处于气态
C.当,时,二氧化碳处于超临界状态
D.当,时,二氧化碳处于超临界状态
【答案】D
【难度】0.85
【知识点】对数的运算、根据折线统计图解决实际问题
【分析】根据与的关系图可得正确的选项.
【详解】当,时,,此时二氧化碳处于固态,故A错误.
当,时,,此时二氧化碳处于液态,故B错误.
当,时,与4非常接近,故此时二氧化碳处于固态,对应的是非超临界状态,故C错误.
当,时,因, 故此时二氧化碳处于超临界状态,故D正确.
故选:D
7.(2023·新课标Ⅰ卷·高考真题)有一组样本数据,其中是最小值,是最大值,则( )
A.的平均数等于的平均数
B.的中位数等于的中位数
C.的标准差不小于的标准差
D.的极差不大于的极差
【答案】BD
【难度】0.65
【知识点】计算几个数的中位数、计算几个数的平均数、计算几个数据的极差、方差、标准差
【分析】根据题意结合平均数、中位数、标准差以及极差的概念逐项分析判断.
【详解】对于选项A:设的平均数为,的平均数为,
则,
因为没有确定的大小关系,所以无法判断的大小,
例如:,可得;
例如,可得;
例如,可得;故A错误;
对于选项B:不妨设,
可知的中位数等于的中位数均为,故B正确;
对于选项C:举反例说明,例如:,则平均数,
标准差,
,则平均数,
标准差,显然,即,
所以的标准差不小于的标准差,这一论断不成立,故C错误;
对于选项D:不妨设,
则,当且仅当时,等号成立,故D正确;
故选:BD.
8.(2020·海南·高考真题)我国新冠肺炎疫情进入常态化,各地有序推进复工复产,下面是某地连续11天复工复产指数折线图,下列说法正确的是
A.这11天复工指数和复产指数均逐日增加;
B.这11天期间,复产指数增量大于复工指数的增量;
C.第3天至第11天复工复产指数均超过80%;
D.第9天至第11天复产指数增量大于复工指数的增量;
【答案】CD
【难度】0.85
【知识点】根据折线统计图解决实际问题
【分析】注意到折线图中有递减部分,可判定A错误;注意考查第1天和第11天的复工复产指数的差的大小,可判定B错误;根据图象,结合复工复产指数的意义和增量的意义可以判定CD正确.
【详解】由图可知,第1天到第2天复工指数减少,第7天到第8天复工指数减少,第10天到第11复工指数减少,第8天到第9天复产指数减少,故A错误;
由图可知,第一天的复产指标与复工指标的差大于第11天的复产指标与复工指标的差,所以这11天期间,复产指数增量小于复工指数的增量,故B错误;
由图可知,第3天至第11天复工复产指数均超过80%,故C正确;
由图可知,第9天至第11天复产指数增量大于复工指数的增量,故D正确;
【点睛】本题考查折线图表示的函数的认知与理解,考查理解能力,识图能力,推理能力,难点在于指数增量的理解与观测,属中档题.
9.(2020·山东·高考真题)某创新企业为了解新研发的一种产品的销售情况,从编号为001,002,…480的480个专卖店销售数据中,采用系统抽样的方法抽取一个样本,若样本中的个体编号依次为005,021,…则样本中的最后一个个体编号是 .
【答案】469
【难度】0.85
【知识点】等距抽样的组距与编号
【分析】先求得编号间隔为16以及样本容量,再由样本中所有数据编号为求解.
【详解】间隔为021-005=16,
则样本容量为,
样本中所有数据编号为,
所以样本中的最后一个个体的编号为,
故答案为:469
10.(2019·全国II卷·高考真题)我国高铁发展迅速,技术先进.经统计,在经停某站的高铁列车中,有10个车次的正点率为0.97,有20个车次的正点率为0.98,有10个车次的正点率为0.99,则经停该站高铁列车所有车次的平均正点率的估计值为 .
【答案】0.98.
【难度】0.85
【知识点】总体与样本
【分析】本题考查通过统计数据进行概率的估计,采取估算法,利用概率思想解题.
【详解】由题意得,经停该高铁站的列车正点数约为,其中高铁个数为10+20+10=40,所以该站所有高铁平均正点率约为.
【点睛】本题考点为概率统计,渗透了数据处理和数学运算素养.侧重统计数据的概率估算,难度不大.易忽视概率的估算值不是精确值而失误,根据分类抽样的统计数据,估算出正点列车数量与列车总数的比值.
11.(2019·天津·高考真题)2019年,我国施行个人所得税专项附加扣除办法,涉及子女教育、继续教育、大病医疗、住房贷款利息或者住房租金、赡养老人等六项专项附加扣除.某单位老、中、青员工分别有人,现采用分层抽样的方法,从该单位上述员工中抽取人调查专项附加扣除的享受情况.
(Ⅰ)应从老、中、青员工中分别抽取多少人?
(Ⅱ)抽取的25人中,享受至少两项专项附加扣除的员工有6人,分别记为.享受情况如下表,其中“”表示享受,“×”表示不享受.现从这6人中随机抽取2人接受采访.
员工
项目
A
B
C
D
E
F
子女教育
○
○
×
○
×
○
继续教育
×
×
○
×
○
○
大病医疗
×
×
×
○
×
×
住房贷款利息
○
○
×
×
○
○
住房租金
×
×
○
×
×
×
赡养老人
○
○
×
×
×
○
(i)试用所给字母列举出所有可能的抽取结果;
(ii)设为事件“抽取的2人享受的专项附加扣除至少有一项相同”,求事件发生的概率.
【答案】(I)6人,9人,10人;
(II)(i)见解析;(ii).
【难度】0.65
【知识点】抽样比、样本总量、各层总数、总体容量的计算、写出基本事件、计算古典概型问题的概率
【分析】(I)根据题中所给的老、中、青员工人数,求得人数比,利用分层抽样要求每个个体被抽到的概率是相等的,结合样本容量求得结果;
(II)(I)根据6人中随机抽取2人,将所有的结果一一列出;
(ii)根据题意,找出满足条件的基本事件,利用公式求得概率.
【详解】(I)由已知,老、中、青员工人数之比为,
由于采取分层抽样的方法从中抽取25位员工,
因此应从老、中、青员工中分别抽取6人,9人,10人.
(II)(i)从已知的6人中随机抽取2人的所有可能结果为
,,,,共15种;
(ii)由表格知,符合题意的所有可能结果为,,,,共11种,
所以,事件M发生的概率.
【点睛】本小题主要考查随机抽样、用列举法计算随机事件所含的基本事件数、古典概型即其概率计算公式等基本知识,考查运用概率知识解决简单实际问题的能力.
12.(2023·全国乙卷·高考真题)某厂为比较甲乙两种工艺对橡胶产品伸缩率的处理效应,进行10次配对试验,每次配对试验选用材质相同的两个橡胶产品,随机地选其中一个用甲工艺处理,另一个用乙工艺处理,测量处理后的橡胶产品的伸缩率.甲、乙两种工艺处理后的橡胶产品的伸缩率分别记为,.试验结果如下:
试验序号
1
2
3
4
5
6
7
8
9
10
伸缩率
545
533
551
522
575
544
541
568
596
548
伸缩率
536
527
543
530
560
533
522
550
576
536
记,记的样本平均数为,样本方差为.
(1)求,;
(2)判断甲工艺处理后的橡胶产品的伸缩率较乙工艺处理后的橡胶产品的伸缩率是否有显著提高(如果,则认为甲工艺处理后的橡胶产品的伸缩率较乙工艺处理后的橡胶产品的伸缩率有显著提高,否则不认为有显著提高)
【答案】(1),;
(2)认为甲工艺处理后的橡胶产品的伸缩率较乙工艺处理后的橡胶产品的伸缩率有显著提高.
【难度】0.85
【知识点】计算几个数的平均数、计算几个数据的极差、方差、标准差、统计新定义
【分析】(1)直接利用平均数公式即可计算出,再得到所有的值,最后计算出方差即可;
(2)根据公式计算出的值,和比较大小即可.
【详解】(1),
,
,
的值分别为: ,
故
(2)由(1)知:,,故有,
所以认为甲工艺处理后的橡胶产品的伸缩率较乙工艺处理后的橡胶产品的伸缩率有显著提高.
13.(2023·新课标Ⅱ卷·高考真题)某研究小组经过研究发现某种疾病的患病者与未患病者的某项医学指标有明显差异,经过大量调查,得到如下的患病者和未患病者该指标的频率分布直方图:
利用该指标制定一个检测标准,需要确定临界值c,将该指标大于c的人判定为阳性,小于或等于c的人判定为阴性.此检测标准的漏诊率是将患病者判定为阴性的概率,记为;误诊率是将未患病者判定为阳性的概率,记为.假设数据在组内均匀分布,以事件发生的频率作为相应事件发生的概率.
(1)当漏诊率%时,求临界值c和误诊率;
(2)设函数,当时,求的解析式,并求在区间的最小值.
【答案】(1),;
(2),最小值为.
【难度】0.65
【知识点】频率分布直方图的实际应用、总体百分位数的估计
【分析】(1)根据题意由第一个图可先求出,再根据第二个图求出的矩形面积即可解出;
(2)根据题意确定分段点,即可得出的解析式,再根据分段函数的最值求法即可解出.
【详解】(1)依题可知,左边图形第一个小矩形的面积为,所以,
所以,解得:,
.
(2)当时,
;
当时,
,
故,
所以在区间的最小值为.
1
学科网(北京)股份有限公司
$$