内容正文:
考点69概率与统计的综合问题(3种核心题型+基础保分练+综合提升练+拓展冲刺练)
【核心题型】
题型一 频率分布直方图与分布列的综合问题
高考常将频率分布直方图与分布列等交汇在一起进行考查,解题时要正确理解频率分布直方图,能利用频率分布直方图正确计算出各组数据.概率问题以计算为主,往往和实际问题相结合,要注意理解实际问题的意义,使之和相应的概率计算对应起来.
【例题1】.(2024·四川成都·三模)某植物园种植一种观赏花卉,这种观赏花卉的高度(单位:cm)介于之间,现对植物园部分该种观赏花卉的高度进行测量,所得数据统计如下图所示.
(1)求的值;
(2)若从高度在和中分层抽样抽取5株,在这5株中随机抽取3株,记高度在内的株数为,求 的分布列及数学期望;
(3)以频率估计概率,若在所有花卉中随机抽取3株,求至少有2株高度在的条件下,至多 1株高度低于的概率.
【变式1】(2024·重庆·模拟预测)某超市购进一批同种类水果,按照果径大小分为四类:不达标果、标准果、精品果、礼品果.质检技术人员从该批水果中随机选取100个,按果径大小分成5组进行统计:(单位:).统计后制成如下的频率分布直方图,并规定果径低于为不达标果,在到之间为标准果,在到之间为精品果,达到及以上的为礼品果.
(1)现采用分层随机抽样的方法从选取的100个水果中抽取10个,再从这10个水果中随机抽取2个,记礼品果的个数为,求的分布列与数学期望;
(2)以频率估计概率,从这批水果中随机抽取个,设其中恰有2个精品果的概率为.当最大时,求的值.
【变式2】(2024·北京东城·一模)某中学为了解本校高二年级学生阅读水平现状,从该年级学生中随机抽取100人进行一般现代文阅读速度的测试,以每位学生平均每分钟阅读的字数作为该学生的阅读速度,将测试结果整理得到如下频率分布直方图:
(1)若该校高二年级有1500人,试估计阅读速度达到620字/分钟及以上的人数;
(2)用频率估计概率,从该校高二学生中随机抽取3人,设这3人中阅读速度达到540字/分钟及以上的人数为,求的分布列与数学期望;
(3)若某班有10名学生参加测试,他们的阅读速度如下:506,516,553,592,617,632,667,693,723,776,从这10名学生中随机抽取3人,设这3人中阅读速度达到540字/分钟及以上的人数为,试判断数学期望与(2)中的的大小.
【变式3】(2024·陕西西安·二模)某校组织学生进行跳绳比赛,以每分钟跳绳个数作为比赛成绩(单位:个).为了解参赛学生的比赛成绩,从参赛学生中随机抽取50名学生的比赛成绩作为样本,整理数据并按比赛成绩分成,,,,,这6组,得到的频率分布直方图如图所示.
(1)估计该校学生跳绳比赛成绩的中位数;
(2)若跳绳比赛成绩不低于140分的为优秀,以这50名学生跳绳比赛成绩的频率作为概率,现从该校学生中随机抽取3人,记被抽取的比赛成绩优秀的学生人数为,求的分布列与期望.
题型二 回归模型与分布列的综合问题
高考常将回归模型与分布列等交汇在一起进行考查,求经验回归方程时要充分利用已知数据,合理利用公式减少运算.求解概率问题时要注意概率模型的应用,明确所求问题所属的事件类型是关键.
【例题2】(2024·福建南平·模拟预测)某大型商场的所有饮料自动售卖机在一天中某种饮料的销售量(单位:瓶)与天气温度(单位:)有很强的相关关系,为能及时给饮料自动售卖机添加该种饮料,该商场对天气温度和饮料的销售量进行了数据收集,得到下面的表格:
10
15
20
25
30
35
40
4
16
64
256
2048
4096
8192
经分析,可以用作为关于的经验回归方程.
(1)根据表中数据,求关于的经验回归方程(结果保留两位小数);
(2)若饮料自动售卖机在一天中不需添加饮料的记1分,需添加饮料的记2分,每台饮料自动售卖机在一天中需添加饮料的概率均为,在商场的所有饮料自动售卖机中随机抽取3台,记总得分为随机变量,求的分布列与数学期望.
参考公式及数据:对于一组数据,经验回归方程的斜率和截距的最小二乘估计公式分别为
【变式1】(2024·江苏南京·二模)某地5家超市春节期间的广告支出x(万元)与销售额y(万元)的数据如下:
超市
A
B
C
D
E
广告支出x
2
4
5
6
8
销售额y
30
40
60
60
70
(1)从A,B,C,D,E这5家超市中随机抽取3家,记销售额不少于60万元的超市个数为X,求随机变量X的分布列及期望;
(2)利用最小二乘法求y关于x的线性回归方程,并预测广告支出为10万元时的销售额.
附:线性回归方程中斜率和截距的最小二乘估计公式分别为:,.
【变式2】(2024·山西晋中·模拟预测)网络营销是利用互联网和数字技术开展的一种营销方式,包括电子商务营销、搜索引擎营销、社交媒体营销等多种形式.通过网络营销,商家可以更加直接高效地与消费者进行交流和互动,提高品牌美誉度和市场份额.视频营销成为一种网络营销“新宠”.某礼品店应用视频营销销售礼品,2023年1月到8月出售的礼盒数量及利润情况的相关数据如下表所示.
月份
1月
2月
3月
4月
5月
6月
7月
8月
月销售量/千个
3
4
5
6
7
9
10
12
月利润/万元
3.6
4.1
4.4
5.2
6.2
7.5
7.9
9.1
(1)求出月利润y(万元)关于月销售量x(千个)的回归方程(精确到0.01),并估计月利润不小于12.4万元时月销售量的最小值.
(2)2023年亚运会前夕,该店售卖装有亚运会吉祥物“琮琮”“宸宸”和“莲莲”玩偶的三款礼盒,小丽同学购买了5个装有“琮琮”玩偶的礼盒,4个装有“宸宸”玩偶的礼盒,3个装有“莲莲”玩偶的礼盒,从中随机选出3个作为元旦礼物赠送给同学.用X表示3个礼盒中装有“宸宸”玩偶的礼盒个数,求X的分布列和数学期望.
参考数据:,.
附:线性回归方程中,,.
【变式3】(2024·重庆·模拟预测)近年来某地在经济工作中坚持稳中求进工作总基调,在淘汰落后产能的同时大力发展新质生产力,下图是该地近几年来新型规模以上工业企业生产总值()的柱状图(单位:亿元),记2017年,2018年,当的年编号()依次为.
(1)求2017至2022年新型规模以上工业企业生产总值的平均数;
(2)在与中选择合适的模型计算关于的回归方程;
(3)若上级领导将在2022,2023,2024,2025,2026这五年中任意抽取3年来研究该地新质生产力发展情况,记为抽到的工业企业的生产总值超过12000亿元的年份数目,并用(2)中回归方程估计,求的分布列和数学期望.
参考数据:
8.46
10198
12705
17.5
20950
3.85
其中,附:经验回归方程中和的最小二乘估计公式为.
题型三 独立性检验与分布列的综合问题
高考常将独立性检验与分布列等交汇在一起进行考查,解决独立性检验问题,要注意过好“三关”:假设关、公式关、对比关.解决概率问题要准确地把握题中所涉及的事件,明确所求问题所属的事件类型.
【例题3】(2024·江苏·模拟预测)为推进乡村振兴计划,某镇通过实地考察当地状况,大力推广当地特色农产品.为了统计甲村,乙村生产该产品的质量,现对甲乙两村各随机选取300件产品,产品的质量如下:
合格
不合格
合计
甲村
270
30
300
乙村
290
10
300
合计
560
40
600
(1)分析能否有的把握认为甲乙两村的产品质量有差异?
(2)该镇通过线上平台对乡村生产的产品进行售卖,经统计,该产品在年上半年的月销量符合正态分布,乡镇人员现从年的前个月中随机选取三个月的销量数据,其中销量数据不低于的记为,求随机变量的分布列和数学期望.
附:,
0.1
0.05
0.01
k
2.706
3.841
6.635
【变式1】(2024·河南·模拟预测)2024年3月,某校语文教师对学生提出“3月读一本书”的要求,每位学生都选择且只能选择《红楼梦》和《三国演义》中的一本,现随机调查该校男、女生各100人,整理得到列联表如下.
《红楼梦》
《三国演义》
男生
30
70
女生
60
40
(1)依据小概率值的独立性检验,能否认为学生选择《红楼梦》还是《三国演义》与性别有关?
(2)已知学生选择哪本书是相互独立的,用频率代替概率,从该校选择《红楼梦》的学生中随机抽取3人,抽到的女生人数设为,求的分布列和数学期望.
参考公式:,其中.
参考数据:
0.1
0.05
0.01
0.005
0.001
2.706
3.841
6.635
7.879
10.828
【变式2】(2024·四川·模拟预测)某公司为了解旗下某产品的客户反馈情况,随机抽选了250名客户体验该产品并进行评价,评价结果为“喜欢”和“不喜欢”,整理得到如下列联表:
不喜欢
喜欢
合计
男
50
100
150
女
50
50
100
合计
100
150
250
(1)是否有的把握认为客户对该产品评价结果与性别因素有关系?
(2)公司为进一步了解客户对产品的反馈,现从参与评价的女性客户中,按评价结果用分层抽样的方法随机抽取了4人,收集对该产品改进建议.已知评价结果为“喜欢”的客户的建议被采用的概率为,评价结果为“不喜欢”的客户的建议被采用的概率为.若“建议”被采用,则赠送价值200元的纪念品,“建议”未被采用,则赠送价值100元的纪念品.记这4人获得的纪念品的总金额为,求的分布列及数学期望.
附:,
0.10
0.05
0.010
0.001
2.706
3.841
6.635
10.828
【变式3】(2024·贵州毕节·三模)2023年12月30日8时13分,长征二号丙/远征一号S运载火箭在酒泉卫星发射中心点火起飞,随后成功将卫星互联网技术试验卫星送入预定轨道.由中国航天科技集团有限公司研制的运载火箭48次宇航任务全部取得圆满成功.也代表着中国航天2023年完美收官.某市一调研机构为了了解当地学生对我国航天事业发展的关注度,随机从本市大学生和高中生中抽取一个容量为的样本,根据调查结果得到如下列联表:
学生群体
关注度
合计
关注
不关注
大学生
高中生
合计
(1)完成上述列联表;依据小概率值的独立性检验,认为关注航天事业发展与学生群体有关联,求样本容量n的最小值;
(2)用频率估计概率,从本市大学生和高中生中随机选取3人,用X表示不关注的人数,求X的分布列和数学期望.
附:
0.1
0.05
0.01
0.005
0.001
2.706
3.841
6.635
7.879
10.828
,其中.
【课后强化】
【基础保分练】
一、解答题
1.(2023·广东·一模)身高体重指数()这个概念,是由19世纪中期的比利时通才凯特勒最先提出,它的计算公式如下:身高体重指数()=体重()÷身高(m)的平方.成人的数值低于18.5,则体重过轻,在则正常;在为过重,在为肥胖,不低于32为非常肥胖,且专家指出最理想的体重指数是22.某科研小组设计了一套方案;并在两类人群中进行对比实验,其中科学饮食组采用科学饮食方案,对照组采用随意饮食方案.半年后,分别在两组中各随机选取100人,都分布在内,按分成5组进行统计:,,,,.统计后分别制成如下的频率分布直方图.
(1)求a,b,并估计科学饮食组的80%分位数(结果精确到小数点后两位);
(2)现采用分层抽样的方法从对照组选取的100人中抽取25人,再从这25人中随机抽取2人,记其中“肥胖”(不含非常肥胖)的人数为X,求X的分布列与数学期望.
2.(2024·全国·模拟预测)某空调企业为了解产品售后服务情况,给用户发放一份调查问卷,满分为100分.现从回收的问答卷中随机抽取100份作为样本.得到如下频率分布直方图.
(1)求的值和样本的中位数(精确到0.1);
(2)从样本中得分在的问卷中,按分层抽样抽取8份,再从中随机抽取3份,记这3份问卷中得分在的份数为,求的分布列及数学期望.
3.(2024·辽宁辽阳·一模)根据国家电影局统计,2024年春节假期(2月10日至2月17日)全国电影票房为亿元,观影人次为亿,相比2023年春节假期票房和人次分别增长了和,均创造了同档期新的纪录. 2024年2月10日某电影院调查了名观影者,并统计了每名观影者对当日观看的电影的满意度评分(满分分),根据统计数据绘制得到如图所示的频率分布直方图(分组区间为,,,,,).
(1)求这名观影者满意度评分不低于分的人数;
(2)估计这名观影者满意度评分的第百分位数(结果精确到);
(3)设这名观影者满意度评分小于分的频率为,小于分的频率为,若甲、乙名观影者在春节档某一天都只观看一部电影,甲观看,影片的概率分别为,,乙观看,影片的概率分别为,,当天甲、乙观看哪部电影相互独立,记甲、乙这名观影者中当天观看影片的人数与观看影片的人数之差为,求的分布列及期望.
4.(2023·辽宁朝阳·一模)秋天的第一杯奶茶是一个网络词汇,最早出自四川达州一位当地民警之口,民警用“秋天的第一杯奶茶”顺利救下一名女孩,由此而火爆全网.后来很多人开始在秋天里买一杯奶茶送给自己在意的人.某奶茶店主记录了入秋后前7天每天售出的奶茶数量(单位:杯)
如下:
日期
第一天
第二天
第三天
第四天
第五天
第六天
第七天
日期代码
1
2
3
4
5
6
7
杯数
4
15
22
26
29
31
32
(1)请根据以上数据,绘制散点图,并根据散点图判断,与哪一个更适宜作为y关于x的回归方程模型(给出判断即可,不必说明理由);
(2)建立y关于x的回归方程(结果保留1位小数),并根据建立的回归方程,试预测要到哪一天售出的奶茶才能超过35杯?
(3)若每天售出至少25杯即可盈利,则从第一天至第七天中任选三天,记随机变量X表示盈利的天数,求随机变量X的分布列.
参考公式和数据:其中
回归直线方程中,
22.7
1.2
759
235.1
13.2
8.2
5.(2023·江苏苏州·模拟预测)数据报告显示,2018-2022年期间,某公司旗下一款软件产品的年度活跃用户数每年都保持着较为稳定的增长态势,具体数据如下表.
年份代码
1
2
3
4
5
活跃用户数(单位:亿)
11.51
12.25
12.58
13.67
18.01
(1)根据上表的数据,可用函数模型拟合与的关系,请建立关于的回归方程(计算的值时精确到0.01),并预测2025年的活跃用户数;
(2)公司规定,活跃用户数大于12.00(单位:亿)的年份为“企业腾飞年”.在企业腾飞年中,将活跃用户数低于13.00的视为良好,赋1分;将活跃用户数不低于13.00的视为优秀,赋2分.现从企业腾飞年中任取两年,用表示赋分之和,求的分布列和数学期望.
(参考数据:,,)
6.(2024·广西柳州·三模)某企业为了对一批新研发的产品进行合理定价,将该产品按事先拟定的价格进行试销,得到一组销售数据,如下表所示:
试销单价x(百元)
1
2
3
4
5
6
产品销量y(件)
91
86
p
78
73
70
附:参考公式:,.
参考数据:,,.
(1)求p的值;
(2)已知变量x,y具有线性相关关系,求产品销量y(件)关于试销单价x(百元)的线性回归方程(计算结果精确到整数位);
(3)用表示用正确的线性回归方程得到的与对应的产品销量的估计值.当销售数据的残差的绝对值时,则将销售数据称为一个“有效数据”.现从这6组销售数据中任取2组,求“有效数据”个数的分布列和期望.
7.(2024·辽宁·二模)跳绳是一项很好的健体运动,坚持跳绳能够有效提高人体下肢的爆发力和身体协调能力.2023年暑假期间,某高中以2022年入学(以下称2022级)的学生为试点,倡议学生每天坚持不超过半小时的跳绳锻炼.开学后,对2022级学生进行了一次计时一分钟的跳绳测试,并从中随机抽查了100名学生在暑期每周跳绳的累计时间及测试成绩(一分钟跳绳的个数),得到如下数据:
人数
5
10
20
15
15
10
15
10
每周跳绳的累计时间(单位:小时)
0
0.5
1
1.5
2
2.5
3
3.5
成绩区间(单位:个)
[90,100)
[120,130)
[140,150)
[170,180)
[170,180)
[160,170)
[180,190)
[190,200)
(1)请完成下面列联表,并判断是否有99.9%的把握认为“2022级学生的测试成绩与学生每周跳绳的累计时间有关”;
跳绳个数不少于170个
跳绳个数不足170个
合计
每周跳绳的累计时间不少于2小时
每周跳绳的累计时间不足2小时
合计
(2)将测试成绩位于区间之内评定为“良好”,位于区间 之内评定为“优秀”.在被抽查的这100名学生中,对评定为“良好”和“优秀”按分层抽样抽取11人,再从这11人中随机抽取3人,记这3人中被评定为“优秀”的人数为X,求X的分布列和数学期望E(X).
附:,其中.
0.100
0.050
0.010
0.001
2.706
3.841
6.635
10.828
8.(2024·河北石家庄·二模)某校举办乒乓球与羽毛球比赛,要求每个学生只能报名参加其中一项.从报名参加比赛的学生中随机选取男生、女生各75人进行调查,得到如下列联表:
性别
比赛项目
合计
乒乓球组
羽毛球组
男生
50
25
75
女生
35
40
75
合计
85
65
150
(1)根据表中数据,依据小概率值的独立性检验,分析该校学生选择乒乓球还是羽毛球是否与性别有关联.
(2)从调查的女生中,按组别采用比例分配的分层随机抽样的方法抽取15人.若从这15人中随机抽2人,记为抽到乒乓球组的学生人数,求的分布列及数学期望.
附:
0.1
0.05
0.01
0.005
0.001
2.706
3.841
6.635
7.879
10.828
9.(2024·四川凉山·三模)某中学新高一经过前期模拟选科摸底情况确定开设物化生,物化政,物化地及政史地四个模块供高一学生选择(物化生,物化政,物化地统称为物理类,政史地称为历史类),下图是该校高一1000名学生选择各个模块扇形统计图.已知该校学生选择物理类男女比例为,选择历史类男女比例为.
男生
女生
合计
物理类
历史类
合计
1000
(1)完成列联表,并判断能否有99%把握认为“该校学生选择物理类是否与性别有关”?
(2)从该校选择物理类学生中按照分层抽样从物化生、物化政、物化地模块中抽取15人,再从这15人中随机抽取2人参加物理知识趣味问答比赛,用X表示被抽到选择物化地模块的学生人数,求X的分布列及数学期望.
附:.
0.05
0.01
0.001
3.841
6.635
10.828
10.(2024·四川宜宾·模拟预测)某地为调查年龄在岁段人群每周的运动情况,从年龄在岁段人群中随机抽取了200人的信息,将调查结果整理如下:
女性
男性
每周运动超过2小时
60
80
每周运动不超过2小时
40
20
(1)根据以上信息,能否有把握认为该地年龄在岁段人群每周运动超过2小时与性别有关?
(2)用样本估计总体,从该地年龄在岁段人群中随机抽取3人,设抽取的3人中每周运动不超过2小时的人数为,求的分布列和数学期望.
参考公式:.
0.10
0.05
0.025
0.010
0.001
2.706
3.841
5.024
6.635
10.828
【综合提升练】
一、解答题
1.(2021·四川凉山·三模)某品牌汽车4S店对2020年该市前几个月的汽车成交量进行统计,用表示2020年第月份该店汽车成交量,得到统计表格如下:
1
2
3
4
5
6
7
8
14
12
20
20
22
24
30
26
(1)求出关于的线性回归方程,并预测该店9月份的成交量;(,精确到整数)
(2)该店为增加业绩,决定针对汽车成交客户开展抽奖活动,若抽中“一等奖”获5千元奖金;抽中“二等奖”获2千元奖金;抽中“祝您平安”则没有奖金.已知一次抽奖活动中获得“二等奖”的概率为,没有获得奖金的概率为.现有甲、乙两个客户参与抽奖活动,假设他们是否中奖相互独立,求此二人所获奖金总额(千元)的分布列及数学期望.
参考数据及公式:,,,.
2.(2024·辽宁葫芦岛·一模)“村超”是贵州省榕江县举办的“和美乡村足球超级联赛”的简称,为了解不同年龄的游客对“村超”的满意度,某组织进行了一次抽样调查,分别抽取年龄超过40周岁的游客和年龄不超过40周岁的游客各100人作为样本,每位参与调查的游客都对“村超”给出满意或不满意的评价.调查结果如下表.
年龄
满意度
合计
满意
不满意
不超过40周岁
60
40
100
超过40周岁
80
20
100
合计
140
60
200
(1)根据列联表中的数据,在犯错误的概率不超过1%的前提下,可以认为游客对“村超”的满意度与年龄有关吗?
(2)若将频率视为概率,该组织从某日所有游客中随机抽取3名游客进行现场采访,记抽取的3名游客中对“村超”满意的人数为,求随机变量的分布列与数学期望.
附:.
0.1
0.05
0.01
0.005
0.001
k
2.706
3.841
6.635
7.879
10.828
3.(2023·辽宁·模拟预测)5G技术对社会和国家十分重要,从战略地位来看,业界一般将其定义为继蒸汽机革命、电气革命和计算机革命后的第四次工业革命.某科技公司生产一种5G手机的核心部件,下表统计了该公司2017-2021年在该部件上的研发投入x(单位:千万元)与收益y(单位:亿元)的数据,结果如下:
年份
2017
2018
2019
2020
2021
研发投入x
2
3
4
5
6
收益y
2
3
3
3
4
(1)求研发投入x与收益y的相关系数r(精确到0.01);
(2)由表格可知y与x线性相关,试建立y关于x的线性回归方程,并估计当x为9千万元时,该公司生产这种5G手机的核心部件的收益为多少亿元;
(3)现从表格中的5组数据中随机抽取2组数据并结合公司的其他信息作进一步调研,记其中抽中研发投入超出4千万元的组数为X,求X的分布列及数学期望.
参考公式及数据:对于一组数据(i=1,2,3,⋯,n),相关系数,其回归直线的斜率和截距的最小二乘估计分别为,,.
4.(2023·全国·模拟预测)2023年是我国改革开放45周年,改革开放以来,我国发生了翻天覆地的变化,居民消费水平也得到了大幅提升.调查得到某市居民周末消费金额(单位:元)的频率分布直方图如图所示.
(1)求该市居民周末人均消费金额(每组数据用该组区间的中点值为代表);
(2)以频率估计概率,从该市居民中随机选取3人进行周末消费习惯调查,这3人中周末消费金额在的人数记为,求的分布列与数学期望.
5.(2024·广东佛山·模拟预测)某区中考体育科目有必选项目和选考项目,其中篮球为一个选考项目.该区体育老师为了了解初中学生的性别和喜欢篮球是否有关,随机调查了该区1000名初中学生,得到成对样本数据的分类统计结果,如下表所示:
性别
是否喜欢篮球
合计
喜欢
不喜欢
男生
450
150
600
女生
150
250
400
合计
600
400
1000
(1)依据的独立性检验,能否认为该区初中学生的性别与喜欢篮球有关联;
(2)用按性别比例分配的分层随机抽样的方法从参与调查的喜欢篮球的600名初中学生中抽取8名学生做进一步调查,将这8名学生作为一个样本,从中随机抽取3人,用X表示随机抽取的3人中女生的人数,求X的分布列和数学期望.
附:参考数据
,其中.
0.1
0.05
0.01
0.005
0.001
2.706
3.841
6.635
7.879
10.828
6.(2024·湖南常德·三模)某市组织宣传小分队进行法律法规宣传,某宣传小分队记录了前9天每天普及的人数,得到下表:
时间(天)
1
2
3
4
5
6
7
8
9
每天普及的人数y
80
98
129
150
203
190
258
292
310
(1)从这9天的数据中任选4天的数据,以表示4天中每天普及人数不少于240人的天数,求的分布列和数学期望;
(2)由于统计人员的疏忽,第5天的数据统计有误,如果去掉第5天的数据,试用剩下的数据求出每天普及的人数y关于天数的线性回归方程.
(参考数据:
,
附:对于一组数据,,,,其回归直线的斜率和截距的最小二乘估计分别为:).
7.(2024·广东梅州·一模)某学校为了解本学期学生参加公益劳动的情况,从学校内随机抽取了500名高中学生进行在线调查,收集了他们参加公益劳动时间(单位:小时)分配情况等数据,并将样本数据分成,,九组,绘制成如图所示的频率分布直方图.
(1)为进一步了解这500名学生参加公益劳动时间的分配情况,从参加公益劳动时间在三组内的学生中,采用分层抽样的方法抽取了10人,现从这10人中随机抽取3人.记参加公益劳动时间在内的学生人数为,求的分布列和期望;
(2)以调查结果的频率估计概率,从该学校所有高中学生中随机抽取20名学生,用“”表示这20名学生中恰有名学生参加公益劳动时间在](单位:小时)内的概率,其中.当最大时,写出的值.
8.(2024·四川乐山·三模)某学校举办了一次主题为“科技兴国,强国有我”的知识竞赛,并从所有参赛学生中随机抽取了男、女生各50人,统计他们的竞赛成绩(满分100分,每名参赛学生至少得60分),并将成绩分成4组:,,,(单位:分),得到如下的频率分布直方图.
(1)现将竞赛成绩不低于90分的学生称为“科技知识达人”,成绩低于90分的学生称为“非科技知识达人”.把随机抽取的参赛学生数据统计如下,将下列列联表补充完整,并判断是否有95%的把握认为能否获得“科技知识达人”称号与性别有关.
科技知识达人
非科技知识达人
合计
男生
15
女生
合计
(2)将频率视为概率,从所有参赛学生中随机抽取3人进行访谈,记这3人中是“科技知识达人”的人数为,求的分布列与数学期望.
附:(其中).
0.10
0.05
0.025
0.010
0.005
0.001
2.706
3.841
5.024
6.635
7.879
10.828
9.(2024·山东泰安·模拟预测)某投资公司现从甲投资研究室(人)、乙投资研究室(人)中随机选出名资深投资顾问对某项目进行考察投资.
(1)记选出的名资深投资顾问中,甲投资研究室的人数为,求的分布列和均值;
(2)为给投资提供决策依据,资深投资顾问对此项目的个子项目调查了年研发经费(单位:万元)和年销售额(单位:十万元),并对数据进行了初步处理,得到一些统计量的值:,,,,根据散点图认为关于的经验回归方程为,求与的值(结果精确到).
参考公式:,其中
10.(2024·安徽池州·模拟预测)“十四冬”群众运动会于2024年1月13日至14日在呼和浩特市举办,有速度滑冰、越野滑雪等项目,参加的运动员是来自全国各地的滑冰与滑雪爱好者.运动会期间,运动员与观众让现场热“雪”沸腾,激发了人们对滑冰等项目的热爱,同时也推动了当地社会经济的发展.呼和浩特市某媒体为调查本市市民对“运动会”的了解情况,在15~65岁的市民中进行了一次知识问卷调查(参加者只能参加一次).从中随机抽取100人进行调查,并按年龄群体分成以下五组:,绘制得到了如图所示的频率分布直方图,把年龄在区间和内的人分别称为“青少年群体”和“中老年群体”.
(1)若“青少年群体”中有40人关注“运动会”,根据样本频率分布直方图完成下面的列联表,并根据小概率值的独立性检验,判断关注“运动会”是否与年龄样体有关;
年龄群体
运动会
合计
关注
不关注
青少年群体
40
中老年群体
合计
60
40
100
(2)利用按比例分层抽样的方法,在样本中从关注“运动会”的“青少年群体”与“中老年群体”中随机抽取6人,再从这6人中随机选取3人进行专访.设这3人中“青少年群体”的人数为,求的分布列与数学期望.
附:,其中.
0.05
0.01
0.001
3.841
6.635
10.828
11.(2023·河南·模拟预测)在高考结束后,程浩同学回初中母校看望数学老师,顺便帮老师整理初三年级学生期中考试的数学成绩,并进行统计分析,在整个年级中随机抽取了200名学生的数学成绩,将成绩分为,,,,,,共6组,得到如图所示的频率分布直方图,记分数不低于90分为优秀.
(1)从样本中随机选取一名学生,已知这名学生的分数不低于70分,问这名学生数学成绩为优秀的概率;
(2)在样本中,采取分层抽样的方法从成绩在内的学生中抽取13名,再从这13名学生中随机抽取3名,记这3名学生中成绩为优秀的人数为X,求X的分布列与数学期望.
12.(2023·浙江宁波·一模)某中学在运动会期间,随机抽取了200名学生参加绳子打结计时的趣味性比赛,并对学生性别与绳子打结速度快慢的相关性进行分析,得到数据如下表:
性别
速度
合计
快
慢
男生
65
女生
55
合计
110
200
(1)根据以上数据,能否有99%的把握认为学生性别与绳子打结速度快慢有关?
(2)现有n根绳子,共有2n个绳头,每个绳头只打一次结,且每个结仅含两个绳头,所有绳头打结完毕视为结束.
(i)当,记随机变量X为绳子围成的圈的个数,求X的分布列与数学期望;
(ii)求证:这n根绳子恰好能围成一个圈的概率为
附:
0.100
0.050
0.025
0.010
k
2.706
3.841
5.024
6.635
【拓展冲刺练】
一、解答题
1.(2024·内蒙古呼和浩特·二模)某游戏公司设计了一款益脑游戏,在内测时收集了玩家对每一关的平均过关时间,如下表:
关卡
1
2
3
4
5
6
平均过关时间(单位:秒)
50
78
124
121
137
352
计算得到一些统计量的值为:,,其中.
(1)若用模型拟合与的关系,根据提供的数据,求出与的回归方程;
(2)制定游戏规则如下:玩家在每关的平均过关时间内通过,可获得3分并进入下一关,否则获得分且该轮游戏结束.甲通过练习,前3关都能在平均时间内过关,后面3关能在平均时间内通过的概率均为,若甲玩一轮此款益脑游戏,求“甲获得的积分”的分布列和数学期望.
参考公式:对于一组数据,其回归直线的斜率和截距的最小二乘法估计分别为,.
2.(2024·重庆·二模)某商场推出“云闪付”购物活动,由于推广期内优惠力度较大,吸引了越来越多的顾客使用这种支付方式.现统计了活动刚推出一周内每天使用“云闪付”支付的人数,用表示活动推出的天数,表示每天使用该支付方式的人数,统计数据如下表所示:
1
2
3
4
5
6
7
6
13
25
40
73
110
201
根据散点图判断,在推广期内,支付的人数关于天数的回归方程适合用表示.
(1)求该回归方程,并预测活动推出第8天使用“云闪付”的人数;(的结果精确到0.01)
(2)推广期结束后,商场对顾客的支付方式进行统计,结果如下表:
支付方式
云闪付
会员卡
其它支付方式
比例
商场规定:使用会员卡支付的顾客享8折,“云闪付”的顾客随机优惠,其它支付方式的顾客无优惠,根据统计结果得知,使用“云闪付”的顾客,享7折的概率为,享8折的概率为,享9折的概率为.设顾客购买标价为元的商品支付的费用为,根据所给数据用事件发生的频率估计相应事件发生的概率,写出的分布列,并求.
参考数据:设.
参考公式:对于一组数据,其回归直线的斜率和截距的最小二乘估计公式分别为:.
3.(2024·江西景德镇·三模)近年来,景德镇市积极探索传统文化与现代生活的连接点,活化利用陶溪川等工业遗产,创新场景和内容,打造了创意集、陶然集、春秋大集“三大集市”IP,让传统文化绽放当代生命力.为了了解游客喜欢景德镇是否与年龄有关,随机选取了来景旅游的老年人和年轻人各50人进行调查,调查结果如表所示:
喜欢景德镇
不喜欢景德镇
合计
年轻人
30
20
50
老年人
15
35
50
合计
45
55
100
(1)判断是否有的把握认为游客喜欢景德镇与年龄有关?
(2)2024年春节期间,景德镇某旅行社推出了A、B两条旅游路线.现有甲、乙、丙共3名游客,他们都决定在A、B路线中选择其中一条路线旅游,他们之间选择哪条旅游路线相互独立.其中甲选择A路线的概率为,而乙、丙选择A路线的概率均为,且在三人中有且仅有1人选择A路线的条件下该人为甲的概率为.设表示这3位游客中选择A路线的人数,求的分布列与数学期望.
附:
0.100
0.050
0.010
2.706
3.841
6.635
4.(2024·浙江杭州·二模)杭州是国家历史文化名城,为了给来杭州的客人提供最好的旅游服务,某景点推出了预订优惠活动,下表是该景点在某App平台10天预订票销售情况:
日期
1
2
3
4
5
6
7
8
9
10
销售量(万张)
1.93
1.95
1.97
1.98
2.01
2.02
2.02
2.05
2.07
0.5
经计算可得:.
(1)因为该景点今年预订票购买火爆程度远超预期,该App平台在第10天时系统异常,现剔除第10天数据,求关于的线性回归方程(结果中的数值用分数表示);
(2)该景点推出团体票,每份团体票包含四张门票,其中张为有奖门票(可凭票兑换景点纪念品),的分布列如下:
2
3
4
今从某份团体票中随机抽取2张,恰有1张为有奖门票,求该份团体票中共有3张有奖门票的概率.
附:对于一组数据,其回归线的斜率和截距的最小二乘估计分别为:
5.(2024·广西·二模)为提升基层综合文化服务中心服务效能,广泛开展群众性文化活动,某村干部在本村的村民中进行问卷调查,将他们的成绩(满分:100分)分成7组:.整理得到如下频率分布直方图.
(1)求的值并估计该村村民成绩的平均数(同一组中的数据用该组区间的中点值代表);
(2)从成绩在内的村民中用分层抽样的方法选取6人,再从这6人中任选3人,记这3人中成绩在内的村民人数为,求的分布列与期望.
6.(2024·陕西汉中·二模)2024年03月04日《人民日报》发表文章《开展全民健身实现全民健康》,文中提到:体育锻炼要从小抓起.“让孩子们跑起来”“要长得壮壮的、练得棒棒的”“体育锻炼是增强少年儿童体质最有效的手段”…….习近平总书记的殷殷嘱托,牢牢印刻在广大教育工作者和孩子们的心中.某学校为了了解学生体育锻炼的情况,随机抽取了n名同学,统计了他们每周体育锻炼的时间,作出了频率分布直方图如图所示.其中体育锻炼时间在内的人数为50人.
(1)求n及a的值(a的取值保留三位小数);
(2)试估计该校学生每周体育锻炼时间的平均值(同一组数据用该区间的中点值作代表);
(3)以频率估计概率,在该校学生中任取4人,设X为这4人中每周体育锻炼时间在内的人数,求X的分布列及数学期望.
7.(2024·四川成都·模拟预测)刷脸时代来了,人们为“刷脸支付”给生活带来的便捷感到高兴,但“刷脸支付”的安全性也引起了人们的担忧.某调查机构为了解人们对“刷脸支付”的接受程度,通过安全感问卷进行调查(问卷得分在40~100分之间),并从参与者中随机抽取200人.根据调查结果绘制出如图所示的频率分布直方图.如图有两个数据没有标注清晰(即图中),但已知此直方图的满意度的中位数为68.
(1)求的值;并据此估计这200人满意度的平均数(同一组中的数据用该组区间的中点值作代表);
(2)某大型超市引入“刷脸支付”后,在推广“刷脸支付”期间,推出两种付款方案:
方案一:不采用“刷脸支付”,无任何优惠,但可参加超市的抽奖返现金活动.活动方案为:从装有8个形状、大小完全相同的小球(其中红球3个,黑球5个)的抽奖盒中,一次性摸出3个球,若摸到3个红球,返消费金额的;若摸到2个红球,返消费金额的,除此之外不返现金.
方案二:采用“刷脸支付”,此时对购物的顾客随机优惠,但不参加超市的抽奖返现金活动,根据统计结果得知,使用“刷脸支付”时有的概率享受8折优惠,有的概率享受9折优惠,有的概率享受95折优惠.
现小张在该超市购买了总价为1000元的商品.
①求小张选择方案一付款时实际付款额X的分布列与数学期望;
②试从期望角度,比较小张选择方案一与方案二付款,哪个方案更划算?
(注:结果精确到0.1)
8.(2020·江西南昌·三模)在全球抗击新冠肺炎疫情期间,我国医疗物资生产企业加班加点生产口罩、防护服、消毒水等防疫物品,保障抗疫一线医疗物资供应,在国际社会上赢得一片赞誉.我国某口罩生产厂商在加大生产的同时,狠抓质量管理,不定时抽查口罩质量,该厂质检人员从某日所生产的口罩中随机抽取了100个,将其质量指标值分成以下五组:,,,,,得到如下频率分布直方图.
(1)规定:口罩的质量指标值越高,说明该口罩质量越好,其中质量指标值低于130的为二级口罩,质量指标值不低于130的为一级口罩.现从样本口罩中利用分层抽样的方法随机抽取8个口罩,再从中抽取3个,求恰好取到一级口罩个数为的概率;
(2)在2020年“五一”劳动节前,甲、乙两人计划同时在该型号口罩的某网络购物平台上分别参加A、B两店各一个订单“秒杀”抢购,其中每个订单由个该型号口罩构成.假定甲、乙两人在A、B两店订单“秒杀”成功的概率分别为,,记甲、乙两人抢购成功的订单总数量、口罩总数量分别为,.
①求的分布列及数学期望;
②求当的数学期望取最大值时正整数的值.
9.(2020·四川德阳·模拟预测)我市某校800名高三学生在刚刚结束的一次数学模拟考试中,成绩全部在100分到150分之间,抽取其中一个容量为50的样本,将成绩按如下方式分成五组:第一组,第二组,…第五组,得到频率分布直方图.
(1)若成绩在130分及以上视为优秀,根据样本数据估计该校在这次考试中成绩优秀的
人数;
(2)若样本第一组只有一个女生,其他都是男生,第五组只有一个男生,其他都是女生现从第一、五组中各抽2个同学组成一个实验组,设其中男生的个数为,求的分布列及期望.
10.(2023·湖南益阳·模拟预测)为了研究学生每天整理数学错题情况,某课题组在某市中学生中随机抽取了100名学生调查了他们期中考试的数学成绩和平时整理数学错题情况,并绘制了下列两个统计图表,图1为学生期中考试数学成绩的频率分布直方图,图2为学生一个星期内整理数学错题天数的扇形图.若本次数学成绩在110分及以上视为优秀,将一个星期有4天及以上整理数学错题视为“经常整理”,少于4天视为“不经常整理”.已知数学成绩优秀的学生中,经常整理错题的学生占.
数学成绩优秀
数学成绩不优秀
合计
经常整理
不经常整理
合计
(1)求图1中的值以及学生期中考试数学成绩的上四分位数;
(2)根据图1、图2中的数据,补全上方列联表,并根据小概率值的独立性检验,分析数学成绩优秀与经常整理数学错题是否有关?
(3)用频率估计概率,在全市中学生中按“经常整理错题”与“不经常整理错题”进行分层抽样,随机抽取5名学生,再从这5名学生中随机抽取2人进行座谈.求这2名同学中经常整理错题且数学成绩优秀的人数X的分布列和数学期望.
附:
1
学科网(北京)股份有限公司
$$
考点69概率与统计的综合问题(3种核心题型+基础保分练+综合提升练+拓展冲刺练)
【核心题型】
题型一 频率分布直方图与分布列的综合问题
高考常将频率分布直方图与分布列等交汇在一起进行考查,解题时要正确理解频率分布直方图,能利用频率分布直方图正确计算出各组数据.概率问题以计算为主,往往和实际问题相结合,要注意理解实际问题的意义,使之和相应的概率计算对应起来.
【例题1】.(2024·四川成都·三模)某植物园种植一种观赏花卉,这种观赏花卉的高度(单位:cm)介于之间,现对植物园部分该种观赏花卉的高度进行测量,所得数据统计如下图所示.
(1)求的值;
(2)若从高度在和中分层抽样抽取5株,在这5株中随机抽取3株,记高度在内的株数为,求 的分布列及数学期望;
(3)以频率估计概率,若在所有花卉中随机抽取3株,求至少有2株高度在的条件下,至多 1株高度低于的概率.
【答案】(1);
(2)分布列见解析,;
(3)
【分析】(1)根据频率和为1,即可求解;
(2)首先确定高度在和的株数,再按照超几何分布,即可求解;
(3)根据独立重复概率公式,以及条件概率公式,即可求解.
【详解】(1)依题意可得,解得;
(2)由(1)可得高度在和的频率分别为和,所以分层抽取的5株中,高度在和的株数分别为2和3,所以可取0,1,2.
所以,,
所以的分布列为:
所以
(3)从所有花卉中随机抽取株,记至少有株高度在为事件,至多株高度低于为事件,
则,,
所以.
【变式1】(2024·重庆·模拟预测)某超市购进一批同种类水果,按照果径大小分为四类:不达标果、标准果、精品果、礼品果.质检技术人员从该批水果中随机选取100个,按果径大小分成5组进行统计:(单位:).统计后制成如下的频率分布直方图,并规定果径低于为不达标果,在到之间为标准果,在到之间为精品果,达到及以上的为礼品果.
(1)现采用分层随机抽样的方法从选取的100个水果中抽取10个,再从这10个水果中随机抽取2个,记礼品果的个数为,求的分布列与数学期望;
(2)以频率估计概率,从这批水果中随机抽取个,设其中恰有2个精品果的概率为.当最大时,求的值.
【答案】(1)分布列见解析,
(2)或
【分析】(1)由频率分布直方图中所有频率和为1求得,进而求出礼品果的个数,求出的可能取值及对应的概率,得到的分布列,代入期望公式求解期望;
(2)根据且,求出n的取值范围,代入判断求解即可.
【详解】(1)由题意,所以,
所以这100个水果中礼品果的个数为,
采用分层随机抽样的方法从选取的100个水果中抽取10个,其中礼品果有个,
故随机变量的所有可能取值为,
则,,.
所以的分布列为
0
1
2
期望.
(2)由频率分布直方图知,从该批水果中随机抽取1个,是精品果的概率为,
则,
所以,
要使最大,则且,
解得,因为,
所以,所以当最大时,或
【变式2】(2024·北京东城·一模)某中学为了解本校高二年级学生阅读水平现状,从该年级学生中随机抽取100人进行一般现代文阅读速度的测试,以每位学生平均每分钟阅读的字数作为该学生的阅读速度,将测试结果整理得到如下频率分布直方图:
(1)若该校高二年级有1500人,试估计阅读速度达到620字/分钟及以上的人数;
(2)用频率估计概率,从该校高二学生中随机抽取3人,设这3人中阅读速度达到540字/分钟及以上的人数为,求的分布列与数学期望;
(3)若某班有10名学生参加测试,他们的阅读速度如下:506,516,553,592,617,632,667,693,723,776,从这10名学生中随机抽取3人,设这3人中阅读速度达到540字/分钟及以上的人数为,试判断数学期望与(2)中的的大小.
【答案】(1)人
(2)分布列见解析;
(3)
【分析】(1)根据频率分布直方图分析数据得频率即可估计阅读速度达到620字/分钟及以上的人数;
(2)确定从中任取一人,其阅读速度达到540字/分钟及以上的概率,结合二项分布的概率求解的分布列与数学期望即可;
(3)根据超几何分布的概率求解的分布列与数学期望即可得结论.
【详解】(1),
故可估计阅读速度达到620字/分钟及以上的人数为人;
(2)从中任取一人,其阅读速度达到540字/分钟及以上的概率为:
,
的可能取值为、、、,
,
,
,
,
则其分布列为:
其期望为:;
(3),理由如下:
这10名学生中,阅读速度达到540字/分钟及以上的人数为人,的可能取值为、、,
,,,
则,故.
【变式3】(2024·陕西西安·二模)某校组织学生进行跳绳比赛,以每分钟跳绳个数作为比赛成绩(单位:个).为了解参赛学生的比赛成绩,从参赛学生中随机抽取50名学生的比赛成绩作为样本,整理数据并按比赛成绩分成,,,,,这6组,得到的频率分布直方图如图所示.
(1)估计该校学生跳绳比赛成绩的中位数;
(2)若跳绳比赛成绩不低于140分的为优秀,以这50名学生跳绳比赛成绩的频率作为概率,现从该校学生中随机抽取3人,记被抽取的比赛成绩优秀的学生人数为,求的分布列与期望.
【答案】(1)
(2)分布列见解析,
【分析】(1)首先判断中位数在内,再列出方程,解得即可;
(2)依题意可得,即可求出其分布列与数学期望.
【详解】(1)因为,,
所以该校学生比赛成绩的中位数在内,
设该校学生比赛成绩的中位数为,则,
解得,即该校学生比赛成绩的中位数为.
(2)由频率分布直方图可知比赛成绩优秀的频率为,
则从该校学生中随机抽取人,被抽取的学生比赛成绩优秀的概率是.
由题意可知,
则,
即,,
,
所以的分布列为
0
1
2
3
故.
题型二 回归模型与分布列的综合问题
高考常将回归模型与分布列等交汇在一起进行考查,求经验回归方程时要充分利用已知数据,合理利用公式减少运算.求解概率问题时要注意概率模型的应用,明确所求问题所属的事件类型是关键.
【例题2】(2024·福建南平·模拟预测)某大型商场的所有饮料自动售卖机在一天中某种饮料的销售量(单位:瓶)与天气温度(单位:)有很强的相关关系,为能及时给饮料自动售卖机添加该种饮料,该商场对天气温度和饮料的销售量进行了数据收集,得到下面的表格:
10
15
20
25
30
35
40
4
16
64
256
2048
4096
8192
经分析,可以用作为关于的经验回归方程.
(1)根据表中数据,求关于的经验回归方程(结果保留两位小数);
(2)若饮料自动售卖机在一天中不需添加饮料的记1分,需添加饮料的记2分,每台饮料自动售卖机在一天中需添加饮料的概率均为,在商场的所有饮料自动售卖机中随机抽取3台,记总得分为随机变量,求的分布列与数学期望.
参考公式及数据:对于一组数据,经验回归方程的斜率和截距的最小二乘估计公式分别为
【答案】(1)
(2)分布列见解析,
【分析】(1)设,转化为,利用最小二乘法,求得,求得,进而得到关于的经验回归方程;
(2)根据题意,得到变量的可能取值为,利用独立重复试验的概率公式,求得相应的概率,列出分布列,结合期望的公式,即可求解.
【详解】(1)解:设,由,可得,
因为,,
,所以,
由表中的数据可得,
则,
所以,
则,可得,
所以关于的经验回归方程为.
(2)解:由题意,随机变量的可能取值为,
可得,,
,,
所以变量的分布列为
3
4
5
6
P
所以,期望为
【变式1】(2024·江苏南京·二模)某地5家超市春节期间的广告支出x(万元)与销售额y(万元)的数据如下:
超市
A
B
C
D
E
广告支出x
2
4
5
6
8
销售额y
30
40
60
60
70
(1)从A,B,C,D,E这5家超市中随机抽取3家,记销售额不少于60万元的超市个数为X,求随机变量X的分布列及期望;
(2)利用最小二乘法求y关于x的线性回归方程,并预测广告支出为10万元时的销售额.
附:线性回归方程中斜率和截距的最小二乘估计公式分别为:,.
【答案】(1)X的分布列见解析,期望
(2);预测广告费支出10万元时的销售额为87万元.
【分析】(1)根据超几何分布的概率公式求解分布列,进而可求解期望,
(2)利用最小二乘法求解线性回归方程即可.
【详解】(1)从A,B,C,D,E这5家超市中随机抽取3家,记销售额不少于60万元的超市有C,D,E这3家超市,
则随机变量的可能取值为1,2,3
,,,
的分布列为:
1
2
3
数学期望.
(2),,
,
.
关于的线性回归方程为;
在中,取,得.
预测广告费支出10万元时的销售额为87万元.
【变式2】(2024·山西晋中·模拟预测)网络营销是利用互联网和数字技术开展的一种营销方式,包括电子商务营销、搜索引擎营销、社交媒体营销等多种形式.通过网络营销,商家可以更加直接高效地与消费者进行交流和互动,提高品牌美誉度和市场份额.视频营销成为一种网络营销“新宠”.某礼品店应用视频营销销售礼品,2023年1月到8月出售的礼盒数量及利润情况的相关数据如下表所示.
月份
1月
2月
3月
4月
5月
6月
7月
8月
月销售量/千个
3
4
5
6
7
9
10
12
月利润/万元
3.6
4.1
4.4
5.2
6.2
7.5
7.9
9.1
(1)求出月利润y(万元)关于月销售量x(千个)的回归方程(精确到0.01),并估计月利润不小于12.4万元时月销售量的最小值.
(2)2023年亚运会前夕,该店售卖装有亚运会吉祥物“琮琮”“宸宸”和“莲莲”玩偶的三款礼盒,小丽同学购买了5个装有“琮琮”玩偶的礼盒,4个装有“宸宸”玩偶的礼盒,3个装有“莲莲”玩偶的礼盒,从中随机选出3个作为元旦礼物赠送给同学.用X表示3个礼盒中装有“宸宸”玩偶的礼盒个数,求X的分布列和数学期望.
参考数据:,.
附:线性回归方程中,,.
【答案】(1),17
(2)答案见解析.
【分析】(1)根据所给数据,结合参考公式直接计算即可求解;
(2)写出X的所有可能,求对应概率即可得出分布列,由期望公式计算期望即可.
【详解】(1),根据参考数据可得,
所以
故月利润关于月销售量x的回归方程为;
月利润不小于12.4万元时,可得,利润不小于12.4万元时月销售量的最小值17千个.
(2)由题中数据可知5个装有“琮琮”玩偶的礼盒,4个装有“宸宸”玩偶的礼盒,3个装有“莲莲”玩偶的礼盒, X的所有可能取值为0,1,2,3,
,
,
故X的分布列为:
X
0
1
2
3
P
【变式3】(2024·重庆·模拟预测)近年来某地在经济工作中坚持稳中求进工作总基调,在淘汰落后产能的同时大力发展新质生产力,下图是该地近几年来新型规模以上工业企业生产总值()的柱状图(单位:亿元),记2017年,2018年,当的年编号()依次为.
(1)求2017至2022年新型规模以上工业企业生产总值的平均数;
(2)在与中选择合适的模型计算关于的回归方程;
(3)若上级领导将在2022,2023,2024,2025,2026这五年中任意抽取3年来研究该地新质生产力发展情况,记为抽到的工业企业的生产总值超过12000亿元的年份数目,并用(2)中回归方程估计,求的分布列和数学期望.
参考数据:
8.46
10198
12705
17.5
20950
3.85
其中,附:经验回归方程中和的最小二乘估计公式为.
【答案】(1)5150亿元
(2)解析间详解
(3)分布列见详解,.
【分析】(1)根据平均数的概念进行计算即可.
(2)先根据散点图判断,用作为模型更合适.设,结合给出的数据和公式求回归方程.
(3)明确的取值,求出每个值对应的概率,可得的分布列,再结合期望的计算公式求的期望.
【详解】(1)易知:
所以2017至2022年新型规模以上工业企业生产总值的平均数(亿元).
(2)由散点图可知,用模型拟合效果更好.
设,则,
因为.
所以,.
所以.即为所求回归方程.
(3)因为.
且2022年的生产总值为9000亿元,
所以估计2023年的生产总值为:亿元;
2024年的生产总值为:亿元;
2025年的生产总值为:亿元;
2026年的生产总值为:亿元;
其中生产总值超过12000亿元的年份数为3.
所以的值可能为:1,2,3
且,,.
所以的分布列为:
1
2
3
所以.
题型三 独立性检验与分布列的综合问题
高考常将独立性检验与分布列等交汇在一起进行考查,解决独立性检验问题,要注意过好“三关”:假设关、公式关、对比关.解决概率问题要准确地把握题中所涉及的事件,明确所求问题所属的事件类型.
【例题3】(2024·江苏·模拟预测)为推进乡村振兴计划,某镇通过实地考察当地状况,大力推广当地特色农产品.为了统计甲村,乙村生产该产品的质量,现对甲乙两村各随机选取300件产品,产品的质量如下:
合格
不合格
合计
甲村
270
30
300
乙村
290
10
300
合计
560
40
600
(1)分析能否有的把握认为甲乙两村的产品质量有差异?
(2)该镇通过线上平台对乡村生产的产品进行售卖,经统计,该产品在年上半年的月销量符合正态分布,乡镇人员现从年的前个月中随机选取三个月的销量数据,其中销量数据不低于的记为,求随机变量的分布列和数学期望.
附:,
0.1
0.05
0.01
k
2.706
3.841
6.635
【答案】(1)有
(2)分布列见解析,
【分析】(1)根据条件,计算出值,即可求解;
(2)由题知,的取值为0,1,2,3,利用相互独立事件的概率公式求出对应取值的概率公式,即可求出分布列,再利期望的计算公式,即可求解.
【详解】(1)设零假设:有99%的把握认为甲乙两村的产品质量没有差异
故零假设所不成立,所以有99%的把握认为甲乙两村的产品质量有差异.
(2)由题意,月销量符合正态分布,则,
由题意,的取值为0,1,2,3
所以,,
,,
所以的分布列如下表:
0
1
2
3
P
数学期望
【变式1】(2024·河南·模拟预测)2024年3月,某校语文教师对学生提出“3月读一本书”的要求,每位学生都选择且只能选择《红楼梦》和《三国演义》中的一本,现随机调查该校男、女生各100人,整理得到列联表如下.
《红楼梦》
《三国演义》
男生
30
70
女生
60
40
(1)依据小概率值的独立性检验,能否认为学生选择《红楼梦》还是《三国演义》与性别有关?
(2)已知学生选择哪本书是相互独立的,用频率代替概率,从该校选择《红楼梦》的学生中随机抽取3人,抽到的女生人数设为,求的分布列和数学期望.
参考公式:,其中.
参考数据:
0.1
0.05
0.01
0.005
0.001
2.706
3.841
6.635
7.879
10.828
【答案】(1)有关
(2)分布列见解析,
【分析】(1)利用公式计算,对照临界值表下结论;
(2)依题意,根据二项分布的概率公式求解概率,由此能求出的分布列和期望.
【详解】(1)因为,
所以依据小概率值的独立性检验,可以认为学生选择《红楼梦》还是《三国演义》与性别有关.
(2)由题可知,的所有可能取值为0,1,2,3,
选择《红楼梦》的学生是女生的概率为,所以.
所以, ,
, ,
所以的分布列为
0
1
2
3
P
所以.
【变式2】(2024·四川·模拟预测)某公司为了解旗下某产品的客户反馈情况,随机抽选了250名客户体验该产品并进行评价,评价结果为“喜欢”和“不喜欢”,整理得到如下列联表:
不喜欢
喜欢
合计
男
50
100
150
女
50
50
100
合计
100
150
250
(1)是否有的把握认为客户对该产品评价结果与性别因素有关系?
(2)公司为进一步了解客户对产品的反馈,现从参与评价的女性客户中,按评价结果用分层抽样的方法随机抽取了4人,收集对该产品改进建议.已知评价结果为“喜欢”的客户的建议被采用的概率为,评价结果为“不喜欢”的客户的建议被采用的概率为.若“建议”被采用,则赠送价值200元的纪念品,“建议”未被采用,则赠送价值100元的纪念品.记这4人获得的纪念品的总金额为,求的分布列及数学期望.
附:,
0.10
0.05
0.010
0.001
2.706
3.841
6.635
10.828
【答案】(1)有
(2)分布列见解析;期望为
【分析】(1)由的列联表中的数据,求得,结合附表,即可求解;
(2)根据题意,得到的所有可能取值为,求得相应的概率,列出分布列,结合期望的公式,即可求解.
【详解】(1)解:由题意,根据的列联表中的数据,
可得,
所以,有的把握认为客户对该产品评价结果与性别因素有关系.
(2)解:由题意知,选取的4人中,评价结果为“喜欢”和“不喜欢”的分别有2人,
所以的所有可能取值为,
则,
,
,
,
则随机变量的分布列为
400
500
600
700
800
所以,数学期望为.
【变式3】(2024·贵州毕节·三模)2023年12月30日8时13分,长征二号丙/远征一号S运载火箭在酒泉卫星发射中心点火起飞,随后成功将卫星互联网技术试验卫星送入预定轨道.由中国航天科技集团有限公司研制的运载火箭48次宇航任务全部取得圆满成功.也代表着中国航天2023年完美收官.某市一调研机构为了了解当地学生对我国航天事业发展的关注度,随机从本市大学生和高中生中抽取一个容量为的样本,根据调查结果得到如下列联表:
学生群体
关注度
合计
关注
不关注
大学生
高中生
合计
(1)完成上述列联表;依据小概率值的独立性检验,认为关注航天事业发展与学生群体有关联,求样本容量n的最小值;
(2)用频率估计概率,从本市大学生和高中生中随机选取3人,用X表示不关注的人数,求X的分布列和数学期望.
附:
0.1
0.05
0.01
0.005
0.001
2.706
3.841
6.635
7.879
10.828
,其中.
【答案】(1)列联表见解析,
(2)分布列见解析,
【分析】(1)根据题意即可完成列联表,再由题意可得,即可求出;
(2)由题意可得服从二项分布,再根据二项分布的期望公式即可得解.
【详解】(1)列联表如下:
学生群体
关注度
合计
关注
不关注
大学生
高中生
合计
,
因为依据小概率值的独立性检验,认为关注航天事业发展与学生群体有关,
所以,
由题可知,n是10的倍数,所以n的最小值为;
(2)由(1)可知,所以不关注的人数为,
用频率估计概率,所以不关注的概率为,
X的所有可能取值为0,1,2,3,
,
,
所以X的分布列为
X
0
1
2
3
P
因为,所以.
【课后强化】
【基础保分练】
一、解答题
1.(2023·广东·一模)身高体重指数()这个概念,是由19世纪中期的比利时通才凯特勒最先提出,它的计算公式如下:身高体重指数()=体重()÷身高(m)的平方.成人的数值低于18.5,则体重过轻,在则正常;在为过重,在为肥胖,不低于32为非常肥胖,且专家指出最理想的体重指数是22.某科研小组设计了一套方案;并在两类人群中进行对比实验,其中科学饮食组采用科学饮食方案,对照组采用随意饮食方案.半年后,分别在两组中各随机选取100人,都分布在内,按分成5组进行统计:,,,,.统计后分别制成如下的频率分布直方图.
(1)求a,b,并估计科学饮食组的80%分位数(结果精确到小数点后两位);
(2)现采用分层抽样的方法从对照组选取的100人中抽取25人,再从这25人中随机抽取2人,记其中“肥胖”(不含非常肥胖)的人数为X,求X的分布列与数学期望.
【答案】(1),,;
(2)分布列见解析,.
【分析】(1)利用频率分布直方图的性质及百分位数的求法计算即可;
(2)根据分层抽样的抽样方法先确定抽取的肥胖人数与非肥胖人数,再利用离散型随机变量的分布列与期望公式计算即可.
【详解】(1)由频率分布直方图可知,
,
由图象计算可得科学饮食组前三个区间所占频率为,
前四个区间所占频率为,
所以80%分位数在区间内,不妨设为,
所以;
(2)根据对照组的频率分布直方图可知在区间内的人数有人,
非肥胖的人数为人,
可取,
所以,
分布列如下:
0
1
2
所以.
2.(2024·全国·模拟预测)某空调企业为了解产品售后服务情况,给用户发放一份调查问卷,满分为100分.现从回收的问答卷中随机抽取100份作为样本.得到如下频率分布直方图.
(1)求的值和样本的中位数(精确到0.1);
(2)从样本中得分在的问卷中,按分层抽样抽取8份,再从中随机抽取3份,记这3份问卷中得分在的份数为,求的分布列及数学期望.
【答案】(1),样本的中位数约为分
(2)分布列见解析,.
【分析】(1)根据频率分布直方图中所有小矩形面积之和为得到方程,求出,再根据中位数计算规则求出中位数;
(2)首先求出得分在、的份数,则的所有可能取值为,,,求出所对应的概率,即可得到分布列与数学期望.
【详解】(1)因为,解得.
因为,,
所以中位数在分到分之间,设中位数为,
则,解得.
所以,样本的中位数约为分.
(2)根据分层抽样的意义,可知所抽取的份答题卷中,
得分在的有份,得分在的有份,
所以的所有可能取值为,,,
则,,,
所以的分布列为
0
1
2
所以的数学期望.
3.(2024·辽宁辽阳·一模)根据国家电影局统计,2024年春节假期(2月10日至2月17日)全国电影票房为亿元,观影人次为亿,相比2023年春节假期票房和人次分别增长了和,均创造了同档期新的纪录. 2024年2月10日某电影院调查了名观影者,并统计了每名观影者对当日观看的电影的满意度评分(满分分),根据统计数据绘制得到如图所示的频率分布直方图(分组区间为,,,,,).
(1)求这名观影者满意度评分不低于分的人数;
(2)估计这名观影者满意度评分的第百分位数(结果精确到);
(3)设这名观影者满意度评分小于分的频率为,小于分的频率为,若甲、乙名观影者在春节档某一天都只观看一部电影,甲观看,影片的概率分别为,,乙观看,影片的概率分别为,,当天甲、乙观看哪部电影相互独立,记甲、乙这名观影者中当天观看影片的人数与观看影片的人数之差为,求的分布列及期望.
【答案】(1)
(2)
(3)分布列见解析,
【分析】(1)根据频率分布直方图可知观影者满意度评分不低于分的频率,进而可得观影者满意度评分不低于分的人数;
(2)根据百分位数的概念直接得解;
(3)根据独立事件的乘法公式可得概率,进而可得分布列与期望.
【详解】(1)由频率分布直方图可知观影者满意度评分不低于分的频率为,
则中观影者满意度评分不低于分的人数为;
(2)设这名观影者满意度评分的第百分位数
由频率分布直方图可知,,
所以,
且,
解得,
即这名观影者满意度评分的第百分位数为;
(3)由已知,,
设甲观看影片为事件,则甲观看影片为事件,乙观看影片为事件,则乙观看影片为事件,
即,,,
由已知可得的可能取值有,,,
根据独立事件可知,
则,
,
,
则分布列为
则期望为.
4.(2023·辽宁朝阳·一模)秋天的第一杯奶茶是一个网络词汇,最早出自四川达州一位当地民警之口,民警用“秋天的第一杯奶茶”顺利救下一名女孩,由此而火爆全网.后来很多人开始在秋天里买一杯奶茶送给自己在意的人.某奶茶店主记录了入秋后前7天每天售出的奶茶数量(单位:杯)
如下:
日期
第一天
第二天
第三天
第四天
第五天
第六天
第七天
日期代码
1
2
3
4
5
6
7
杯数
4
15
22
26
29
31
32
(1)请根据以上数据,绘制散点图,并根据散点图判断,与哪一个更适宜作为y关于x的回归方程模型(给出判断即可,不必说明理由);
(2)建立y关于x的回归方程(结果保留1位小数),并根据建立的回归方程,试预测要到哪一天售出的奶茶才能超过35杯?
(3)若每天售出至少25杯即可盈利,则从第一天至第七天中任选三天,记随机变量X表示盈利的天数,求随机变量X的分布列.
参考公式和数据:其中
回归直线方程中,
22.7
1.2
759
235.1
13.2
8.2
【答案】(1)图见解析,更适宜作为关于的回归方程模型;
(2),到第9天才能超过35杯;
(3)分布列见解析.
【分析】(1)根据散点图趋势即可判断;
(2)利用非线性回归方程转化为线性回归方程的方法求解;
(3)根据超几何分布求分布列.
【详解】(1)
根据散点图,知更适宜作为关于的回归方程模型;
(2)令,则,
由已知数据得,
,
所以,
故关于的回归方程为,
进而由题意知,令,整理得,即,
故当时,即到第9天才能超过35杯;
(3)由题意知,这7天中销售超过25杯的有4天,则随机变量的可能取值为
,,
,,
则随机变量的分布列为
0
1
2
3
5.(2023·江苏苏州·模拟预测)数据报告显示,2018-2022年期间,某公司旗下一款软件产品的年度活跃用户数每年都保持着较为稳定的增长态势,具体数据如下表.
年份代码
1
2
3
4
5
活跃用户数(单位:亿)
11.51
12.25
12.58
13.67
18.01
(1)根据上表的数据,可用函数模型拟合与的关系,请建立关于的回归方程(计算的值时精确到0.01),并预测2025年的活跃用户数;
(2)公司规定,活跃用户数大于12.00(单位:亿)的年份为“企业腾飞年”.在企业腾飞年中,将活跃用户数低于13.00的视为良好,赋1分;将活跃用户数不低于13.00的视为优秀,赋2分.现从企业腾飞年中任取两年,用表示赋分之和,求的分布列和数学期望.
(参考数据:,,)
【答案】(1),2025年的活跃用户数约为20.85亿;
(2)分布列见解析,数学期望为.
【分析】(1)根据最小二乘法计算可得回归方程,代入年份代码即可预测2025年用户数;
(2)根据条件得出得分的分布列,由期望公式计算即可.
【详解】(1)由表格计算可得:,,
因为,,,
所以.
因为满足,即,
所以关于的回归方程是.
令,得,所以2025年的活跃用户数约为20.85亿.
(2)由表格可知:企业腾飞年有4个,其中计分为1分的年份有2个,计分为2分的年份有2个,所以的可能取值有2,3,4,
则,,,
所以的分布列为:
2
3
4
所以数学期望为.
6.(2024·广西柳州·三模)某企业为了对一批新研发的产品进行合理定价,将该产品按事先拟定的价格进行试销,得到一组销售数据,如下表所示:
试销单价x(百元)
1
2
3
4
5
6
产品销量y(件)
91
86
p
78
73
70
附:参考公式:,.
参考数据:,,.
(1)求p的值;
(2)已知变量x,y具有线性相关关系,求产品销量y(件)关于试销单价x(百元)的线性回归方程(计算结果精确到整数位);
(3)用表示用正确的线性回归方程得到的与对应的产品销量的估计值.当销售数据的残差的绝对值时,则将销售数据称为一个“有效数据”.现从这6组销售数据中任取2组,求“有效数据”个数的分布列和期望.
【答案】(1)
(2)
(3)见解析
【分析】(1)根据平均数的计算即可求解,
(2)利用最小二乘法即可求解,
(3)由超几何分布的概率公式即可求解.
【详解】(1)由,得,
解得.
(2),
而,
,
,
所求的线性回归方程为:;
(3)由(2)可知,,
故有效数据为,
的取值可能为0,1,
,
,
则的分布列为
0
1
.
注:若第(2)问代整数计算:
所求的线性回归方程为:
由(2)可知,,
故有效数据为
的取值可能为
则的分布列为
0
1
2
7.(2024·辽宁·二模)跳绳是一项很好的健体运动,坚持跳绳能够有效提高人体下肢的爆发力和身体协调能力.2023年暑假期间,某高中以2022年入学(以下称2022级)的学生为试点,倡议学生每天坚持不超过半小时的跳绳锻炼.开学后,对2022级学生进行了一次计时一分钟的跳绳测试,并从中随机抽查了100名学生在暑期每周跳绳的累计时间及测试成绩(一分钟跳绳的个数),得到如下数据:
人数
5
10
20
15
15
10
15
10
每周跳绳的累计时间(单位:小时)
0
0.5
1
1.5
2
2.5
3
3.5
成绩区间(单位:个)
[90,100)
[120,130)
[140,150)
[170,180)
[170,180)
[160,170)
[180,190)
[190,200)
(1)请完成下面列联表,并判断是否有99.9%的把握认为“2022级学生的测试成绩与学生每周跳绳的累计时间有关”;
跳绳个数不少于170个
跳绳个数不足170个
合计
每周跳绳的累计时间不少于2小时
每周跳绳的累计时间不足2小时
合计
(2)将测试成绩位于区间之内评定为“良好”,位于区间 之内评定为“优秀”.在被抽查的这100名学生中,对评定为“良好”和“优秀”按分层抽样抽取11人,再从这11人中随机抽取3人,记这3人中被评定为“优秀”的人数为X,求X的分布列和数学期望E(X).
附:,其中.
0.100
0.050
0.010
0.001
2.706
3.841
6.635
10.828
【答案】(1)列联表见解析,有99.9%的把握认为“2022级学生的测试成绩与学生每周跳绳的累计时间有关”
(2)分布列见解析,
【分析】(1)根据条件补全列联表,并依据卡方公式结合独立性检验思想判定即可;
(2)根据分层抽样得出优秀人数的可能取值,并计算相应概率,从而得出离散型随机变量的分布列即可.
【详解】(1)依题意补全列联表如下:
跳绳个数不少于170个
跳绳个数不足170个
合计
每周跳绳的累计时间不少于2小时
40
10
50
每周跳绳的累计时间不足2小时
15
35
50
合计
55
45
100
因为,
所以有的把握认为“2022级学生的测试成绩与学生每周跳绳的累计时间有关”.
(2)对评定为“良好”和“优秀”按分层抽样抽取11人,其中被评定为“良好”的有9人,被评定为“优秀”的有2人,则X的可能值为0,1,2.
,,,
所以X的分布列为:
X
0
1
2
P
X的数学期望.
8.(2024·河北石家庄·二模)某校举办乒乓球与羽毛球比赛,要求每个学生只能报名参加其中一项.从报名参加比赛的学生中随机选取男生、女生各75人进行调查,得到如下列联表:
性别
比赛项目
合计
乒乓球组
羽毛球组
男生
50
25
75
女生
35
40
75
合计
85
65
150
(1)根据表中数据,依据小概率值的独立性检验,分析该校学生选择乒乓球还是羽毛球是否与性别有关联.
(2)从调查的女生中,按组别采用比例分配的分层随机抽样的方法抽取15人.若从这15人中随机抽2人,记为抽到乒乓球组的学生人数,求的分布列及数学期望.
附:
0.1
0.05
0.01
0.005
0.001
2.706
3.841
6.635
7.879
10.828
【答案】(1)与性别有关联,理由见解析
(2)
【分析】(1)计算出卡方,与3.841比较得到结论;
(2)先得到选取乒乓球组和羽毛球组的人数,得到的可能取值为和对应的概率,得到分布列和数学期望.
【详解】(1),
故可以在的情况下,得到该校学生选择乒乓球还是羽毛球与性别有关联;
(2)女生中,乒乓球组与羽毛球组选取人数比例为,
故选取的15人中,选取乒乓球组的有人,选取羽毛球组的有人,
故的可能取值为,
,,,
故的分布列为
0
1
2
数学期望为.
9.(2024·四川凉山·三模)某中学新高一经过前期模拟选科摸底情况确定开设物化生,物化政,物化地及政史地四个模块供高一学生选择(物化生,物化政,物化地统称为物理类,政史地称为历史类),下图是该校高一1000名学生选择各个模块扇形统计图.已知该校学生选择物理类男女比例为,选择历史类男女比例为.
男生
女生
合计
物理类
历史类
合计
1000
(1)完成列联表,并判断能否有99%把握认为“该校学生选择物理类是否与性别有关”?
(2)从该校选择物理类学生中按照分层抽样从物化生、物化政、物化地模块中抽取15人,再从这15人中随机抽取2人参加物理知识趣味问答比赛,用X表示被抽到选择物化地模块的学生人数,求X的分布列及数学期望.
附:.
0.05
0.01
0.001
3.841
6.635
10.828
【答案】(1)列联表见解析,没有99%把握认为“该校学生选择物理类与性别有关”
(2)分布列见解析,数学期望为
【分析】(1)根据扇形图计算并补全列联表,再根据卡方公式计算结合独立性检验思想判定即可;
(2)利用分层抽样先确定抽取对应组合的人数,再根据离散型随机变量的分布列与期望公式计算即可.
【详解】(1)根据扇形统计图易得选择物理类学生为人,
其中男生人,则女生人,
选择历史类100人,其中男生人,女生人;
列表如下:
男生
女生
合计
物理类
480
420
900
历史类
40
60
100
合计
520
480
1000
所以,
所以没有把握认为“该校学生选择物理类与性别有关”;
(2)按照分层抽样选择物化生、物化政及物化地人数分别为8人,4人,3人,
则.
易知,,
所以X分布列如下:
X
0
1
2
P
所以.
10.(2024·四川宜宾·模拟预测)某地为调查年龄在岁段人群每周的运动情况,从年龄在岁段人群中随机抽取了200人的信息,将调查结果整理如下:
女性
男性
每周运动超过2小时
60
80
每周运动不超过2小时
40
20
(1)根据以上信息,能否有把握认为该地年龄在岁段人群每周运动超过2小时与性别有关?
(2)用样本估计总体,从该地年龄在岁段人群中随机抽取3人,设抽取的3人中每周运动不超过2小时的人数为,求的分布列和数学期望.
参考公式:.
0.10
0.05
0.025
0.010
0.001
2.706
3.841
5.024
6.635
10.828
【答案】(1)有把握认为该地岁年龄段人每周运动超过2小时与性别有关.
(2)分布列见解析,
【分析】(1)计算卡方进行独立性检验即可;
(2)由已知得,,再列出分布列求解数学期望即可.
【详解】(1)由.
知:有把握认为该地岁年龄段人每周运动超过2小时与性别有关.
(2)由已知得,
,
,
所以随机变量的分布列为:
0
1
2
3
所以.
【综合提升练】
一、解答题
1.(2021·四川凉山·三模)某品牌汽车4S店对2020年该市前几个月的汽车成交量进行统计,用表示2020年第月份该店汽车成交量,得到统计表格如下:
1
2
3
4
5
6
7
8
14
12
20
20
22
24
30
26
(1)求出关于的线性回归方程,并预测该店9月份的成交量;(,精确到整数)
(2)该店为增加业绩,决定针对汽车成交客户开展抽奖活动,若抽中“一等奖”获5千元奖金;抽中“二等奖”获2千元奖金;抽中“祝您平安”则没有奖金.已知一次抽奖活动中获得“二等奖”的概率为,没有获得奖金的概率为.现有甲、乙两个客户参与抽奖活动,假设他们是否中奖相互独立,求此二人所获奖金总额(千元)的分布列及数学期望.
参考数据及公式:,,,.
【答案】(1);预计9月份的成交量为30辆;(2)分布列见解析;期望为.
【分析】(1)先分别求出,的平均数,再利用最小二乘法计算即可得回归直线方程,取x=9可得成交量的预测值;
(2)写出随机变量的所有可能值,再计算出取各个值时的概率,列出分布列即可得解.
【详解】(1)由题意得:,,
∴,∴
所以,回归直线方程为,
∴当时,,即预计9月份的成交量为30辆;
(2)由题意得:获得“一等奖”的概率为,
所以的可能取值为0,2,4,5,7,10,
∴,,
,,
,,
所以的分布列为:
0
2
4
5
7
10
∴.
2.(2024·辽宁葫芦岛·一模)“村超”是贵州省榕江县举办的“和美乡村足球超级联赛”的简称,为了解不同年龄的游客对“村超”的满意度,某组织进行了一次抽样调查,分别抽取年龄超过40周岁的游客和年龄不超过40周岁的游客各100人作为样本,每位参与调查的游客都对“村超”给出满意或不满意的评价.调查结果如下表.
年龄
满意度
合计
满意
不满意
不超过40周岁
60
40
100
超过40周岁
80
20
100
合计
140
60
200
(1)根据列联表中的数据,在犯错误的概率不超过1%的前提下,可以认为游客对“村超”的满意度与年龄有关吗?
(2)若将频率视为概率,该组织从某日所有游客中随机抽取3名游客进行现场采访,记抽取的3名游客中对“村超”满意的人数为,求随机变量的分布列与数学期望.
附:.
0.1
0.05
0.01
0.005
0.001
k
2.706
3.841
6.635
7.879
10.828
【答案】(1)有关联
(2)分布列见解析,数学期望为
【分析】(1)计算,对照附表即可得出结论;
(2)根据随机变量的所有取值计算出对应概率,列出分布列,即可求出期望.
【详解】(1)零假设为:游客对“村超”的满意度与年龄互相独立,即游客对“村超”的满意度与年龄无关联,
,
依据小概率值的独立性检验,推断不成立,即认为游客对“村超”的满意度与年龄有关联,此推断犯错误的概率不大于.
(2)由题可知,参与调查的游客都对“村超”给出满意评价的概率为,则,
随机变量可取,
,
,
,
,
所以的分布列为:
0
1
2
3
0.027
0.189
0.441
0.343
数学期望.
3.(2023·辽宁·模拟预测)5G技术对社会和国家十分重要,从战略地位来看,业界一般将其定义为继蒸汽机革命、电气革命和计算机革命后的第四次工业革命.某科技公司生产一种5G手机的核心部件,下表统计了该公司2017-2021年在该部件上的研发投入x(单位:千万元)与收益y(单位:亿元)的数据,结果如下:
年份
2017
2018
2019
2020
2021
研发投入x
2
3
4
5
6
收益y
2
3
3
3
4
(1)求研发投入x与收益y的相关系数r(精确到0.01);
(2)由表格可知y与x线性相关,试建立y关于x的线性回归方程,并估计当x为9千万元时,该公司生产这种5G手机的核心部件的收益为多少亿元;
(3)现从表格中的5组数据中随机抽取2组数据并结合公司的其他信息作进一步调研,记其中抽中研发投入超出4千万元的组数为X,求X的分布列及数学期望.
参考公式及数据:对于一组数据(i=1,2,3,⋯,n),相关系数,其回归直线的斜率和截距的最小二乘估计分别为,,.
【答案】(1)0.89
(2),5亿元
(3)分布列见解析,
【分析】(1)利用利用相关系数的公式结合表格数据直接求解;
(2)根据最小二乘法先求,再求,可得回归直线方程,从而可预测x为9千万元时,该公司生产这种5G手机的核心部件的收益;
(3)利用古典概型结合组合数计算概率,从而可得分布列和期望.
【详解】(1)由题可得,,
,
,
所以.
(2)因为,,
所以y关于x的线性回归方程为.
当x=9时,,所以此时该公司生产这种5G手机的核心部件收益估计为5亿元.
(3)易知X的可能取值为0,1,2,
,,,
所以X的分布列为
X
0
1
2
P
所以.
4.(2023·全国·模拟预测)2023年是我国改革开放45周年,改革开放以来,我国发生了翻天覆地的变化,居民消费水平也得到了大幅提升.调查得到某市居民周末消费金额(单位:元)的频率分布直方图如图所示.
(1)求该市居民周末人均消费金额(每组数据用该组区间的中点值为代表);
(2)以频率估计概率,从该市居民中随机选取3人进行周末消费习惯调查,这3人中周末消费金额在的人数记为,求的分布列与数学期望.
【答案】(1)元
(2)分布列见解析,
【分析】(1)由频率分布直方图中各小矩形的面积之和为1得到方程即可求出,再根据频率分布直方图中平均数公式计算可得;
(2)由频率分布直方图求出周末消费金额在内的频率,即可得到,求出所对应的概率,即可得到分布列与数学期望.
【详解】(1)由题可得,解得,
所以估计该市居民周末人均消费金额为
(元).
(2)由频率分布直方图可知,在该市随机选取一人,该人周末消费金额在的概率为.
易知的所有可能取值为0,1,2,3,且,
即,,
,,
则的分布列为
0
1
2
3
0.216
0.432
0.288
0.064
故.(另解:)
5.(2024·广东佛山·模拟预测)某区中考体育科目有必选项目和选考项目,其中篮球为一个选考项目.该区体育老师为了了解初中学生的性别和喜欢篮球是否有关,随机调查了该区1000名初中学生,得到成对样本数据的分类统计结果,如下表所示:
性别
是否喜欢篮球
合计
喜欢
不喜欢
男生
450
150
600
女生
150
250
400
合计
600
400
1000
(1)依据的独立性检验,能否认为该区初中学生的性别与喜欢篮球有关联;
(2)用按性别比例分配的分层随机抽样的方法从参与调查的喜欢篮球的600名初中学生中抽取8名学生做进一步调查,将这8名学生作为一个样本,从中随机抽取3人,用X表示随机抽取的3人中女生的人数,求X的分布列和数学期望.
附:参考数据
,其中.
0.1
0.05
0.01
0.005
0.001
2.706
3.841
6.635
7.879
10.828
【答案】(1)该区初中学生的性别与喜欢篮球有关联;
(2)
【分析】(1)根据题意补全列联表,再计算出卡方值并与边界值比较即可;
(2)利用分层抽样可得抽取的男生与女生人数,利用超几何分布计算随机变的分布列,利用期望计算公式可求期望.
【详解】(1)零假设:该区初中学生的性别与喜欢篮球无关联,
,
根据小概率值的独立性检验,推断不成立,
即认为该区初中学生的性别与喜欢篮球有关联;
(2)根据喜欢篮球的学生中男生与女生的比例可得抽取的8人中男生有6人,女生有2人,
所以的为0,1,2,
,,,
所以的分布列为
.
6.(2024·湖南常德·三模)某市组织宣传小分队进行法律法规宣传,某宣传小分队记录了前9天每天普及的人数,得到下表:
时间(天)
1
2
3
4
5
6
7
8
9
每天普及的人数y
80
98
129
150
203
190
258
292
310
(1)从这9天的数据中任选4天的数据,以表示4天中每天普及人数不少于240人的天数,求的分布列和数学期望;
(2)由于统计人员的疏忽,第5天的数据统计有误,如果去掉第5天的数据,试用剩下的数据求出每天普及的人数y关于天数的线性回归方程.
(参考数据:
,
附:对于一组数据,,,,其回归直线的斜率和截距的最小二乘估计分别为:).
【答案】(1)分布列见解析,
(2)
【分析】(1)利用超几何分布与数学期望公式即可得解;
(2)利用平均数的定义结合参考数据求得新的样本点,结合的计算公式进行转化整理求得其值,从而得解.
【详解】(1)每天普及人数不少于240人的天数为3天,则的所有可能取值为,
,,
,,
故的分布列为
0
1
2
3
.
(2)设原来数据的样本中心点为,去掉第5天的数据后样本中心点为
,,
,
故
,
,
所以.
7.(2024·广东梅州·一模)某学校为了解本学期学生参加公益劳动的情况,从学校内随机抽取了500名高中学生进行在线调查,收集了他们参加公益劳动时间(单位:小时)分配情况等数据,并将样本数据分成,,九组,绘制成如图所示的频率分布直方图.
(1)为进一步了解这500名学生参加公益劳动时间的分配情况,从参加公益劳动时间在三组内的学生中,采用分层抽样的方法抽取了10人,现从这10人中随机抽取3人.记参加公益劳动时间在内的学生人数为,求的分布列和期望;
(2)以调查结果的频率估计概率,从该学校所有高中学生中随机抽取20名学生,用“”表示这20名学生中恰有名学生参加公益劳动时间在](单位:小时)内的概率,其中.当最大时,写出的值.
【答案】(1)分布列见解析,期望为
(2)
【分析】(1)由频率分布直方图列出方程,求出的值,由频率分布直方图求出这500名学生中参加公益劳动时间在,,三组内的学生人数分别为50人,40人,10人,采用分层抽样的方法抽取了10人,则从参加公益劳动时间在内的学生中抽取4人,现从这10人中随机抽取3人,则的可能取值为0,1,2,3,分别求出相应的概率,由此能求出的分布列,由分布列即可计算期望;
(2)根据独立重复试验的概率公式得到不等式组,解得的取值范围,即可得解.
【详解】(1)由频率分布直方图得:
解得
这500名学生中参加公益劳动时间在三组内的学生人数分别为:人,人,人,
若采用分层抽样的方法抽取了10人,
则从参加公益劳动时间在14,16内的学生中抽取:人,
现从这10人中随机抽取3人,则的可能取值为0,1,2,3,
的分布列为:
0
1
2
3
则其期望为
(2)由(1)可知参加公益劳动时间在的概率
所以
依题意,即,
即,解得
因为为非负整数,所以,
即当最大时,
8.(2024·四川乐山·三模)某学校举办了一次主题为“科技兴国,强国有我”的知识竞赛,并从所有参赛学生中随机抽取了男、女生各50人,统计他们的竞赛成绩(满分100分,每名参赛学生至少得60分),并将成绩分成4组:,,,(单位:分),得到如下的频率分布直方图.
(1)现将竞赛成绩不低于90分的学生称为“科技知识达人”,成绩低于90分的学生称为“非科技知识达人”.把随机抽取的参赛学生数据统计如下,将下列列联表补充完整,并判断是否有95%的把握认为能否获得“科技知识达人”称号与性别有关.
科技知识达人
非科技知识达人
合计
男生
15
女生
合计
(2)将频率视为概率,从所有参赛学生中随机抽取3人进行访谈,记这3人中是“科技知识达人”的人数为,求的分布列与数学期望.
附:(其中).
0.10
0.05
0.025
0.010
0.005
0.001
2.706
3.841
5.024
6.635
7.879
10.828
【答案】(1)列联表见解析,有的把握认为能否获得“科技知识达人”称号与性别有关
(2)分布列见解析,期望
【分析】(1)补充完整列联表,计算的值,再与临界值比较即可;
(2)由题意可知,的可能取值为0,1,2,3,利用二项分布的概率公式求出相应的概率,进而得到的分布列,再结合期望公式求解.
【详解】(1)列联表补充完整如下:
科技知识达人
非科技知识达人
合计
男生
15
35
50
女生
5
45
50
合计
20
80
100
零假设:能否获得“科技知识达人”称号与性别无关,
则,
所以依据小概率值的独立性检验,我们推断不成立,即有的把握认为能否获得“科技知识达人”称号与性别有关;
(2)从所有参赛学生中任取一人是“科技知识达人”的概率,
由题意可知:,的可能取值为0,1,2,3,
则,
,
,
,
所以的分布列为:
0
1
2
3
所以.
9.(2024·山东泰安·模拟预测)某投资公司现从甲投资研究室(人)、乙投资研究室(人)中随机选出名资深投资顾问对某项目进行考察投资.
(1)记选出的名资深投资顾问中,甲投资研究室的人数为,求的分布列和均值;
(2)为给投资提供决策依据,资深投资顾问对此项目的个子项目调查了年研发经费(单位:万元)和年销售额(单位:十万元),并对数据进行了初步处理,得到一些统计量的值:,,,,根据散点图认为关于的经验回归方程为,求与的值(结果精确到).
参考公式:,其中
【答案】(1)分布列见解析,均值
(2),
【分析】(1)根据超几何分布,求出对应的概率,得到分布列和均值;
(2)先求均值,再代入公式可求以及.
【详解】(1)的可能取值为,
故,
,
,
故的分布列为
故均值.
(2)由题中数据,,
又因为,,
故,
.
10.(2024·安徽池州·模拟预测)“十四冬”群众运动会于2024年1月13日至14日在呼和浩特市举办,有速度滑冰、越野滑雪等项目,参加的运动员是来自全国各地的滑冰与滑雪爱好者.运动会期间,运动员与观众让现场热“雪”沸腾,激发了人们对滑冰等项目的热爱,同时也推动了当地社会经济的发展.呼和浩特市某媒体为调查本市市民对“运动会”的了解情况,在15~65岁的市民中进行了一次知识问卷调查(参加者只能参加一次).从中随机抽取100人进行调查,并按年龄群体分成以下五组:,绘制得到了如图所示的频率分布直方图,把年龄在区间和内的人分别称为“青少年群体”和“中老年群体”.
(1)若“青少年群体”中有40人关注“运动会”,根据样本频率分布直方图完成下面的列联表,并根据小概率值的独立性检验,判断关注“运动会”是否与年龄样体有关;
年龄群体
运动会
合计
关注
不关注
青少年群体
40
中老年群体
合计
60
40
100
(2)利用按比例分层抽样的方法,在样本中从关注“运动会”的“青少年群体”与“中老年群体”中随机抽取6人,再从这6人中随机选取3人进行专访.设这3人中“青少年群体”的人数为,求的分布列与数学期望.
附:,其中.
0.05
0.01
0.001
3.841
6.635
10.828
【答案】(1)列联表见解析,有关
(2)分布列见解析,
【分析】(1)根据频率分布直方图完善二联表,即可计算卡方,与临界值比较作答,
(2)根据超几何分布求解概率,即可求解分布列以及期望.
【详解】(1)由题意可知“青少年群体”共有(人),
“中老年群体”共有(人),
所以列联表如下:
年龄群体
运动会
合计
关注
不关注
青少年群体
40
15
55
中老年群体
20
25
45
合计
60
40
100
零假设为:关注“运动会”与年龄群体无关联.
根据列联表中的数据,经计算得到,
所以根据小概率值的独立性检验,我们推断不成立,即认为关注“运动会”与“年龄群体”有关,此推断犯错误的概率不大于0.01.
(2)样本中“青少年群体”关注“运动会”的有40人,“中老年群体”关注“运动会”的有20人,
按比例分层抽样的方法抽取6人,则“青少年群体”应抽取4人,“中老年群体”应抽取2人,则的所有可能取值为1,2,3,
所以,,
故随机变量的分布列为
1
2
3
所以.
11.(2023·河南·模拟预测)在高考结束后,程浩同学回初中母校看望数学老师,顺便帮老师整理初三年级学生期中考试的数学成绩,并进行统计分析,在整个年级中随机抽取了200名学生的数学成绩,将成绩分为,,,,,,共6组,得到如图所示的频率分布直方图,记分数不低于90分为优秀.
(1)从样本中随机选取一名学生,已知这名学生的分数不低于70分,问这名学生数学成绩为优秀的概率;
(2)在样本中,采取分层抽样的方法从成绩在内的学生中抽取13名,再从这13名学生中随机抽取3名,记这3名学生中成绩为优秀的人数为X,求X的分布列与数学期望.
【答案】(1)
(2)分布列见解析;
【分析】(1)先由频率直方图中频率之和为求得,从而求得不低于70分与不低于90分的人数,由此求得这名学生成绩是优秀的概率;
(2)结合(1)中结论,求得成绩在,与内的人数,从而利用分层抽样比例相同求得各区间所抽人数,由此利用组合数求得各取值的概率,进而得到X的分布列与数学期望.
【详解】(1)依题意,得,解得,
则不低于70分的人数为,
成绩在内的,即优秀的人数为;
故这名学生成绩是优秀的概率为;
(2)成绩在内的有(人);
成绩在内的有(人);成绩在内的有人;
故采用分层抽样抽取的13名学生中,成绩在内的有6人,在内的有5人,在内的有2人,
所以由题可知,X的可能取值为0,1,2,
则,,,
所以X的分布列为:
X
0
1
2
P
故.
12.(2023·浙江宁波·一模)某中学在运动会期间,随机抽取了200名学生参加绳子打结计时的趣味性比赛,并对学生性别与绳子打结速度快慢的相关性进行分析,得到数据如下表:
性别
速度
合计
快
慢
男生
65
女生
55
合计
110
200
(1)根据以上数据,能否有99%的把握认为学生性别与绳子打结速度快慢有关?
(2)现有n根绳子,共有2n个绳头,每个绳头只打一次结,且每个结仅含两个绳头,所有绳头打结完毕视为结束.
(i)当,记随机变量X为绳子围成的圈的个数,求X的分布列与数学期望;
(ii)求证:这n根绳子恰好能围成一个圈的概率为
附:
0.100
0.050
0.025
0.010
k
2.706
3.841
5.024
6.635
【答案】(1)有的把握,认为学生性别与绳子打结速度快慢有关
(2)(i)分布列见解析,;(ii)证明见解析
【分析】(1)利用计算卡方进行检验即可;
(2)(i)依题意,先得到的所有可能取值,再依次求得对应的概率即可得解;(ii)利用分步计数原理,结合数列的累乘法与古典概型的概率公式即可得解.
【详解】(1)依题意,完善列联表如下,
性别
速度
合计
快
慢
男生
65
35
100
女生
45
55
100
合计
110
90
200
所以.
故有的把握,认为学生性别与绳子打结速度快慢有关.
(2)(i)由题知,随机变量的所有可能取值为,
,
,
所以的分布列为
1
2
3
所以.
(ii)不妨令绳头编号为,可以与绳头1打结形成一个圆的绳头除了1,2外有种可能,
假设绳头1与绳头3打结,那么相当于对剩下根绳子进行打结,
令根绳子打结后可成圆的种数为,
那么经过一次打结后,剩下根绳子打结后可成圆的种数为,
由此可得,,
所以,
所以,
显然,故;
另一方面,对个绳头进行任意2个绳头打结,总共有
;
所以.
【点睛】关键点睛:本题第二小问第二步的解决关键是利用分步计数原理得到数列的递推式,从而利用数列的累乘法求得结果.
【拓展冲刺练】
一、解答题
1.(2024·内蒙古呼和浩特·二模)某游戏公司设计了一款益脑游戏,在内测时收集了玩家对每一关的平均过关时间,如下表:
关卡
1
2
3
4
5
6
平均过关时间(单位:秒)
50
78
124
121
137
352
计算得到一些统计量的值为:,,其中.
(1)若用模型拟合与的关系,根据提供的数据,求出与的回归方程;
(2)制定游戏规则如下:玩家在每关的平均过关时间内通过,可获得3分并进入下一关,否则获得分且该轮游戏结束.甲通过练习,前3关都能在平均时间内过关,后面3关能在平均时间内通过的概率均为,若甲玩一轮此款益脑游戏,求“甲获得的积分”的分布列和数学期望.
参考公式:对于一组数据,其回归直线的斜率和截距的最小二乘法估计分别为,.
【答案】(1)
(2)分布列见解析;
【分析】(1)对两边取对数可得,即,再根据最小二乘法求出,即可得解;
(2)依题意的所有可能取值为8,11,14,18,求出所对应的概率,即可得到分布列,从而求出数学期望;
【详解】(1)因为两边取对数可得,即,
令,所以,由,
,.
所以,
又,即,
所以,所以.
所以关于的经验回归方程为.
(2)由题知,甲获得的积分的所有可能取值为8,11,14,18,
所以,,
,,
所以的分布列为
8
11
14
18
所以.
2.(2024·重庆·二模)某商场推出“云闪付”购物活动,由于推广期内优惠力度较大,吸引了越来越多的顾客使用这种支付方式.现统计了活动刚推出一周内每天使用“云闪付”支付的人数,用表示活动推出的天数,表示每天使用该支付方式的人数,统计数据如下表所示:
1
2
3
4
5
6
7
6
13
25
40
73
110
201
根据散点图判断,在推广期内,支付的人数关于天数的回归方程适合用表示.
(1)求该回归方程,并预测活动推出第8天使用“云闪付”的人数;(的结果精确到0.01)
(2)推广期结束后,商场对顾客的支付方式进行统计,结果如下表:
支付方式
云闪付
会员卡
其它支付方式
比例
商场规定:使用会员卡支付的顾客享8折,“云闪付”的顾客随机优惠,其它支付方式的顾客无优惠,根据统计结果得知,使用“云闪付”的顾客,享7折的概率为,享8折的概率为,享9折的概率为.设顾客购买标价为元的商品支付的费用为,根据所给数据用事件发生的频率估计相应事件发生的概率,写出的分布列,并求.
参考数据:设.
参考公式:对于一组数据,其回归直线的斜率和截距的最小二乘估计公式分别为:.
【答案】(1),355人;
(2)分布列见解析,.
【分析】(1)由两边取常用对数,利用换元法转化为线性归回直线方程并结合公式进行求解;
(2)根据概率的乘法公式进行求解列出分布列,根据期望公式计算结果.
【详解】(1)由,得,设,,,则.
,
.
把样本中心点代入方程得,
所以,即,
其回归方程为,
当时,.
(2)的可能取值为:.
分布列如下:
0.1
0.35
0.15
0.4
所以,购物的平均费用为:.
3.(2024·江西景德镇·三模)近年来,景德镇市积极探索传统文化与现代生活的连接点,活化利用陶溪川等工业遗产,创新场景和内容,打造了创意集、陶然集、春秋大集“三大集市”IP,让传统文化绽放当代生命力.为了了解游客喜欢景德镇是否与年龄有关,随机选取了来景旅游的老年人和年轻人各50人进行调查,调查结果如表所示:
喜欢景德镇
不喜欢景德镇
合计
年轻人
30
20
50
老年人
15
35
50
合计
45
55
100
(1)判断是否有的把握认为游客喜欢景德镇与年龄有关?
(2)2024年春节期间,景德镇某旅行社推出了A、B两条旅游路线.现有甲、乙、丙共3名游客,他们都决定在A、B路线中选择其中一条路线旅游,他们之间选择哪条旅游路线相互独立.其中甲选择A路线的概率为,而乙、丙选择A路线的概率均为,且在三人中有且仅有1人选择A路线的条件下该人为甲的概率为.设表示这3位游客中选择A路线的人数,求的分布列与数学期望.
附:
0.100
0.050
0.010
2.706
3.841
6.635
【答案】(1)有的把握认为游客喜欢景德镇与年龄有关;
(2)分布列见解析,
【分析】(1)根据公式求得卡方,从而即可求解;
(2)根据贝叶斯公式结合题意可得,根据分布列的求解步骤和期望公式即可求解.
【详解】(1),
有的把握认为游客喜欢景德镇与年龄有关;
(2)根据贝叶斯公式可知三人中有且仅有1人选择路线的条件下该人为甲的概率为
,
,解得:,
由题意可知,的取值为0,1,2,3.
;
;
;
.
的分布列为
的数学期望是.
4.(2024·浙江杭州·二模)杭州是国家历史文化名城,为了给来杭州的客人提供最好的旅游服务,某景点推出了预订优惠活动,下表是该景点在某App平台10天预订票销售情况:
日期
1
2
3
4
5
6
7
8
9
10
销售量(万张)
1.93
1.95
1.97
1.98
2.01
2.02
2.02
2.05
2.07
0.5
经计算可得:.
(1)因为该景点今年预订票购买火爆程度远超预期,该App平台在第10天时系统异常,现剔除第10天数据,求关于的线性回归方程(结果中的数值用分数表示);
(2)该景点推出团体票,每份团体票包含四张门票,其中张为有奖门票(可凭票兑换景点纪念品),的分布列如下:
2
3
4
今从某份团体票中随机抽取2张,恰有1张为有奖门票,求该份团体票中共有3张有奖门票的概率.
附:对于一组数据,其回归线的斜率和截距的最小二乘估计分别为:
【答案】(1)
(2).
【分析】(1)根据题意,由线性回归方程的公式代入计算,即可得到结果;
(2)根据题意,由全概率公式可得恰有1张为有奖门票的概率,再结合条件概率公式代入计算,即可求解.
【详解】(1)设关于的线性回归方程:,
则,
,
所以,
所以关于的线性回归方程是.
(2)记“从某份团体票中随机抽取2张,恰有1张为有奖门票”为事件A,
“该份团体票中共有张有奖门票”为事件,则,
,所以,
,所以,
.
所以.
则所求概率是.
5.(2024·广西·二模)为提升基层综合文化服务中心服务效能,广泛开展群众性文化活动,某村干部在本村的村民中进行问卷调查,将他们的成绩(满分:100分)分成7组:.整理得到如下频率分布直方图.
(1)求的值并估计该村村民成绩的平均数(同一组中的数据用该组区间的中点值代表);
(2)从成绩在内的村民中用分层抽样的方法选取6人,再从这6人中任选3人,记这3人中成绩在内的村民人数为,求的分布列与期望.
【答案】(1);
(2)分布列见详解;
【分析】(1)由频率和为1,可求的值,再由平均数计算公式求解;
(2)根据分层抽样可确定的取值,再分别求出概率,最后利用期望公式求解.
【详解】(1)由图可知,,
解得,
该村村民成绩的平均数约为
;
(2)从成绩在内的村民中用分层抽样的方法选取6人,
其中成绩在的村民有人,
成绩在的村民有4人,
从中任选3人,的取值可能为1,2,3,
,,,
则的分布列为
1
2
3
故
6.(2024·陕西汉中·二模)2024年03月04日《人民日报》发表文章《开展全民健身实现全民健康》,文中提到:体育锻炼要从小抓起.“让孩子们跑起来”“要长得壮壮的、练得棒棒的”“体育锻炼是增强少年儿童体质最有效的手段”…….习近平总书记的殷殷嘱托,牢牢印刻在广大教育工作者和孩子们的心中.某学校为了了解学生体育锻炼的情况,随机抽取了n名同学,统计了他们每周体育锻炼的时间,作出了频率分布直方图如图所示.其中体育锻炼时间在内的人数为50人.
(1)求n及a的值(a的取值保留三位小数);
(2)试估计该校学生每周体育锻炼时间的平均值(同一组数据用该区间的中点值作代表);
(3)以频率估计概率,在该校学生中任取4人,设X为这4人中每周体育锻炼时间在内的人数,求X的分布列及数学期望.
【答案】(1),
(2)小时
(3)分布列见详解,
【分析】(1)由频率分布直方图可知各组频率,根据题意求n的值,结合频率和为1求a的值;
(2)以同一组数据用该区间的中点值作代表结合平均数公式运算求解;
(3)由题意可知:,结合二项分布的概率公式求分布列,在利用二项分布的期望公式求期望.
【详解】(1)由频率分布直方图可知各组频率依次为:,
因为体育锻炼时间在内的人数为50人,可得,
又因为,解得;
(2)估计该校学生每周体育锻炼时间的平均值为(小时).
(3)因为每周体育锻炼时间在内的频率为,
由题意可知:,则有:
,,
,
,,
所以X的分布列为
X
0
1
2
3
4
P
X的期望为.
7.(2024·四川成都·模拟预测)刷脸时代来了,人们为“刷脸支付”给生活带来的便捷感到高兴,但“刷脸支付”的安全性也引起了人们的担忧.某调查机构为了解人们对“刷脸支付”的接受程度,通过安全感问卷进行调查(问卷得分在40~100分之间),并从参与者中随机抽取200人.根据调查结果绘制出如图所示的频率分布直方图.如图有两个数据没有标注清晰(即图中),但已知此直方图的满意度的中位数为68.
(1)求的值;并据此估计这200人满意度的平均数(同一组中的数据用该组区间的中点值作代表);
(2)某大型超市引入“刷脸支付”后,在推广“刷脸支付”期间,推出两种付款方案:
方案一:不采用“刷脸支付”,无任何优惠,但可参加超市的抽奖返现金活动.活动方案为:从装有8个形状、大小完全相同的小球(其中红球3个,黑球5个)的抽奖盒中,一次性摸出3个球,若摸到3个红球,返消费金额的;若摸到2个红球,返消费金额的,除此之外不返现金.
方案二:采用“刷脸支付”,此时对购物的顾客随机优惠,但不参加超市的抽奖返现金活动,根据统计结果得知,使用“刷脸支付”时有的概率享受8折优惠,有的概率享受9折优惠,有的概率享受95折优惠.
现小张在该超市购买了总价为1000元的商品.
①求小张选择方案一付款时实际付款额X的分布列与数学期望;
②试从期望角度,比较小张选择方案一与方案二付款,哪个方案更划算?
(注:结果精确到0.1)
【答案】(1),,68;
(2)①分布列见解析,969.6;②选择方案二付款更划算,理由见解析.
【分析】(1)根据中位数得到方程,求出,根据频率之和为1得到方程,求出,中点值作代表求出平均数;
(2)①求出可能的取值及对应的概率,得到分布列和数学期望;②选择方案二,记实际付款额为元,求出的可能取值,得到分布列和数学期望,与①中求出得的期望值比较大小,得到结论.
【详解】(1)由题意可得,中位数为68,说明,所以,
那么满意度在内的频率为,即.
因为,
所以对“刷脸支付”安全满意度的平均数为68.
(2)①选择方案一,若摸到3个红球,返消费金额的,即消费了元,
若摸到了2个红球,返消费金额的,即消费了元,
则可能的取值为,则,,,
所以的分布列如下表所示:
800
900
1000
所以.
②若选择方案二,记实际付款额为元,
8折优惠,则,9折优惠,则,95折优惠,则,
则的可能取值为,
由题意可知,的分布列如下表所示:
800
900
950
,
由①知,故选择方案二付款更划算.
8.(2020·江西南昌·三模)在全球抗击新冠肺炎疫情期间,我国医疗物资生产企业加班加点生产口罩、防护服、消毒水等防疫物品,保障抗疫一线医疗物资供应,在国际社会上赢得一片赞誉.我国某口罩生产厂商在加大生产的同时,狠抓质量管理,不定时抽查口罩质量,该厂质检人员从某日所生产的口罩中随机抽取了100个,将其质量指标值分成以下五组:,,,,,得到如下频率分布直方图.
(1)规定:口罩的质量指标值越高,说明该口罩质量越好,其中质量指标值低于130的为二级口罩,质量指标值不低于130的为一级口罩.现从样本口罩中利用分层抽样的方法随机抽取8个口罩,再从中抽取3个,求恰好取到一级口罩个数为的概率;
(2)在2020年“五一”劳动节前,甲、乙两人计划同时在该型号口罩的某网络购物平台上分别参加A、B两店各一个订单“秒杀”抢购,其中每个订单由个该型号口罩构成.假定甲、乙两人在A、B两店订单“秒杀”成功的概率分别为,,记甲、乙两人抢购成功的订单总数量、口罩总数量分别为,.
①求的分布列及数学期望;
②求当的数学期望取最大值时正整数的值.
【答案】(1);(2)①分布列见解析,数学期望;②6.
【分析】(1)根据分层抽样可得二级、一级口罩个数,然后计算即可.
(2)①写出写出的所有可得取值并计算相应的概率,列出分布列并根据数学期望公式可得结果.
②根据,使用换元法并构造函数,然后利用导数判断函数单调性,进一步可得取最大值的条件.
【详解】(1)按分层抽样抽取8个口罩,则其中二级、一级口罩个数分别为6、2,
所以恰好取到一级口罩个数为2的概率.
(2)①由题知,X的可能取值为0,1,2,
;
;
.
所以X的分布列为
0
1
2
.
②因为,所以.
令,设,则,
因为
所以当时,,
所以在区间上单调递增;
当时,,
所以在区间上单调递减;
所以当即时取最大值,所以.
所以取最大值时,n的值为6.
【点睛】本题考查了离散型随机变量的分布列以及数学期望,牢记公式,细心计算,本题难点在于之间的关系,同时导数在概率中的应用,考验分析能力以及计算能力,属难题.
9.(2020·四川德阳·模拟预测)我市某校800名高三学生在刚刚结束的一次数学模拟考试中,成绩全部在100分到150分之间,抽取其中一个容量为50的样本,将成绩按如下方式分成五组:第一组,第二组,…第五组,得到频率分布直方图.
(1)若成绩在130分及以上视为优秀,根据样本数据估计该校在这次考试中成绩优秀的人数;
(2)若样本第一组只有一个女生,其他都是男生,第五组只有一个男生,其他都是女生现从第一、五组中各抽2个同学组成一个实验组,设其中男生的个数为,求的分布列及期望.
【答案】(1)320;(2)分布列见解析,
【分析】(1)由频率分布直方图,得成绩在130分及以上的频率为0.4,由此能估计该校在这次考试中成绩优秀的人数;
(2)由频率分布直方图及题设条件得到第一组中有1名女生2名男生,第五组中有3名女生1名男生,由此得的可能取值为1,2,3,分别求出相应的概率,从而能求出的分布列和期望.
【详解】(1)由频率分布直方图得,
成绩在130分及以上的频率为,
根据样本数据估计该校在这次考试中成绩优秀的人数为:
(人.
(2)由频率分布直方图,得第一组的频率为0.06,第五组的频率为0.08,
第一组有人,第五组有人,
样本中第一组只有一名女生,第五组只有一名男生,
第一组中有1名女生2名男生,第五组中有3名女生1名男生,
现从第一、第五组中各抽取2名学生组成一个实验组,设其中男生人数为,
则的可能取值为1,2,3,
,
,
.
的分布列为:
1
2
3
.
【点睛】本题考查频率分布直方图的应用,考查离散型随机变量的分布列和数学期望的求法,是中档题,解题时要认真审题,注意频率分布直方图的性质和等可能事件概率计算公式的合理运用.
10.(2023·湖南益阳·模拟预测)为了研究学生每天整理数学错题情况,某课题组在某市中学生中随机抽取了100名学生调查了他们期中考试的数学成绩和平时整理数学错题情况,并绘制了下列两个统计图表,图1为学生期中考试数学成绩的频率分布直方图,图2为学生一个星期内整理数学错题天数的扇形图.若本次数学成绩在110分及以上视为优秀,将一个星期有4天及以上整理数学错题视为“经常整理”,少于4天视为“不经常整理”.已知数学成绩优秀的学生中,经常整理错题的学生占.
数学成绩优秀
数学成绩不优秀
合计
经常整理
不经常整理
合计
(1)求图1中的值以及学生期中考试数学成绩的上四分位数;
(2)根据图1、图2中的数据,补全上方列联表,并根据小概率值的独立性检验,分析数学成绩优秀与经常整理数学错题是否有关?
(3)用频率估计概率,在全市中学生中按“经常整理错题”与“不经常整理错题”进行分层抽样,随机抽取5名学生,再从这5名学生中随机抽取2人进行座谈.求这2名同学中经常整理错题且数学成绩优秀的人数X的分布列和数学期望.
附:
【答案】(1),分
(2)有关
(3)分布列见解析,
【分析】(1)利用频率分布直方图各个小矩形的面积和为1,求出的值,进而可求出上四分位数;
(2)先求出数学优秀和不优秀的人,常整理错题和不经常整理错题的人,得到列联表,根据列联表求出值,从而得出判断;
(3)先求出的可能取值,并求出相应取值的概率,从而求出分布列和期望.
【详解】(1)由题意可得,
解得,
学生期中考试数学成绩的上四分位数为:分;
(2)数学成绩优秀的有人,不优秀的人人,经常整理错题的有人,不经常整理错题的是人,经常整理错题且成绩优秀的有人,则
数学成绩优秀
数学成绩不优秀
合计
经常整理
35
25
60
不经常整理
15
25
40
合计
50
50
100
零假设为:数学成绩优秀与经常整理数学错题无关,
根据列联表中的数据,经计算得到可得,
根据小概率值的独立性检验,我们推断不成立,
即认为数学成绩优秀与经常整理数学错题有关联,此推断犯错误的概率不大于;
(3)由分层抽样知,随机抽取的5名学生中经常整理错题的有3人,不经常整理错题的有2人,则可能取为0,1,2,
经常整理错题的3名学生中,恰抽到k人记为事件,则
参与座谈的2名学生中经常整理错题且数学成绩优秀的恰好抽到人记为事件
则,,,,
,,
,
,
,
故X的分布列如下:
X
0
1
2
P
则可得X的数学期望为
1
学科网(北京)股份有限公司
$$