内容正文:
完成时间: 月 日 今日打卡:☐ 已完成
用时: min 自评勋章:
暑假作业10 随机变量分布与统计分析
【知识点1 离散型随机变量的分布列、数学期望与方差】
1. 分布列
设离散随机变量 取值 ,对应概率
性质:
① ;②
2. 数学期望(均值)
线性性质:
3. 方差与标准差
方差:
简化公式:
性质:
标准差:
【知识点2 二项分布】
1. 适用条件
次独立重复试验,每次只有成功/失败,单次成功概率恒为
2. 概率公式
3. 期望方差
场景:有放回抽取、多次独立射击、重复投篮。
【知识点3 超几何分布】
1. 适用条件
总数 件,其中合格品 件,不放回一次性抽取 件, 为取出合格品数量
2. 概率公式
3. 期望方差
近似: 很大、 很小时,超几何可近似二项分布。
【知识点4 正态分布】
1. 图像特征
正态曲线关于 对称; 定左右位置, 定胖瘦;曲线与 轴面积为 1
2. 数字特征
3. 原则
4. 标准化
令 ,则 标准正态分布。
【知识点5 成对数据的相关分析】
1. 相关系数
取值范围
· :正相关;:负相关
· 越接近 1,线性相关性越强; 越接近 0,线性越弱
【知识点6 一元线性回归分析】
回归直线方程:
1. 斜率、截距公式
2. 核心性质
回归直线必过样本中心点 ; 符号与相关系数 一致。
【知识点7 独立性检验】
1. 列联表
合计
合计
2. 卡方统计量
3. 判断标准(常用临界值)
:99% 把握认为两变量有关
:95% 把握认为两变量有关
:无充分证据判定有关
【题型1 离散型随机变量的分布列】
1.现有两个不透明的,箱子装有大小质地一样,只有颜色不同的若干小球,其中箱子中装有2个红球,1个白球,箱子中装有3个红球,3个白球.先从箱子采取不放回的方式依次取球,当箱子内的小球颜色只剩一种时,停止从箱子取球,并将箱子剩余的球混入箱子后再从箱中采取不放回的方式依次取球,当箱子内的小球颜色只剩一种时,停止从箱子取球,记为停止从箱子取球时,箱子内剩余的白球个数.
(1)停止从箱子取球时箱子恰好剩一个球的概率;
(2)停止从箱子取球时箱子不剩红球的概率;
(3)求的分布列.
2.袋中有编号为1,2,3,4的小球各一个,每次从袋中摸出一个小球,记下编号后,将小球放回袋中,记为一轮摸球,如此循环.
(1)若摸三轮,求在不摸出1号球的条件下,恰有一个小球被摸出次数等于该小球编号的概率;
(2)如此循环,直到4个编号的小球均被摸出过或摸球次数达到停止摸球,记停止摸球时摸球次数为X.
①时,求;
②求.
3.亳州百草园为了让游客有更好的游玩体验,特推出代步自行车租用服务已知有脚踏自行车与电动自行车两种车型,采用分段计费的方式租用.型车每分钟收费元(不足分钟的部分按分钟计算),型车每分钟收费元(不足分钟的部分按分钟计算),现有甲、乙、丙、丁四人,分别相互独立地到租车点租车骑行(各租一车一次),设甲、乙、丙、丁不超过分钟还车的概率分别为、、、,并且四个人每人租车都不会超过分钟,甲、乙、丙均租用型车,丁租用型车.
(1)求甲、乙、丙、丁四人所付的费用之和为元的概率;
(2)求甲、乙、丙三人所付的费用之和等于丁所付的费用的概率;
(3)设甲、乙、丙、丁四人所付费用之和为随机变量,求的概率分布列.
4.某答题闯关游戏,开始时,先给每位参加者赋分3分,并规定:每答一题,答对加1分,否则减1分;当积分为6分时,闯关成功并结束游戏;当积分为0分时,闯关失败,也结束游戏.甲同学参加该游戏,假如他答对每道题的概率均为,且每道题答对与否相互独立.记游戏结束时甲的答题数为.
(1)证明:为奇数;
(2)当为奇数时,记甲答完第题时积分为4分、2分的概率分别为,,证明:;
(3)求的分布列.
【题型2 离散型随机变量的数学期望】
1.现有5个大小、质地相同的球,分别标上数字1,2,3,4,5.
(1)从中任取三个球,求1号球被取到的概率.
(2)从中有放回地随机取3次,每次取1个球.记为这5个球中至少被取出1次的球的个数,求的数学期望.
2.甲,乙两队进行乒乓球双打比赛,规定采用五场三胜制,即先赢得三场比赛的队伍获胜.已知每场比赛甲队获胜的概率为,乙队获胜的概率为,且每场比赛的结果相互独立.
(1)求在甲队获胜的条件下,比赛恰好进行了四场的概率;
(2)记比赛结束时的场数为X,求X的分布列和数学期望.
3.有两个罐子,罐中放有3个白球和2个黑球,罐中放有5个白球.
(1)若从罐不放回地摸2个球,求恰好摸到一个白球一个黑球的概率;
(2)若从罐不放回地摸2个球,求第二次摸到白球的概率;
(3)现在从两个罐子各摸一个球并交换,这样交换2次后,记罐中黑球的个数为,求的分布列和期望.
4.甲、乙两人进行某项比赛,采取三局两胜制,积分规则如下:比分为时,胜者积分,败者积分;比分为时,胜者积分,败者积分.设每局比赛甲取胜的概率均为.
(1)若甲以取胜的概率大于以取胜的概率,求的范围;
(2)若,求甲所得积分的分布列及数学期望.
【题型3 离散型随机变量的方差】
1.甲、乙两队进行乒乓球双打比赛,规定每局比赛必须决出胜负,采用五局三胜制,即先赢得三局比赛的队伍获胜.已知每局比赛甲队获胜的概率为,且每局比赛的结果相互独立.
(1)设,记比赛结束时的场数为,求的分布、期望和方差;
(2)已知甲队获胜的条件下,比赛恰好进行了四局的概率为,求的值.
2.为激发学习数学的兴趣,高二年级举行数学知识竞赛,赛制规定:共进行5轮比赛,每轮比赛每个班可以从、两个题库中任选1题作答,在前两轮比赛中每个班的题目必须来自同一题库,后三轮比赛中每个班的题目必须来自同一题库,题库每题20分,题库每题30分,一班能正确回答、题库每题的概率分别为、,且每轮答题结果互不影响.
(1)若一班前两轮选题库,后三轮选题库,求其总分不少于100分的概率;
(2)若一班在前两轮比赛中选了题库,而且两轮得分60分,后三轮换成题库,设一班最后的总分为,求的分布、期望及方差.
3.某中学选派12名学生参加上海市高中生志愿者的培训活动,他们参加培训的次数统计如下表所示:
培训次数
1
2
3
参加人数
2
4
6
(1)从这12名学生中任选3名,求这3名学生中至少有2名学生参加培训次数恰好相等的概率(结果用最简分数表示);
(2)从这12名学生中任选2名,用表示这2人参加培训次数之差的绝对值,求随机变量的期望与方差(结果用最简分数表示).
4.“绿色出行,低碳环保”的理念已经深入人心,逐渐成为新的时尚.甲、乙、丙三人为响应“绿色出行,低碳环保”号召,他们计划每天选择“共享单车”或“地铁”两种出行方式中的一种.他们之间的出行互不影响,其中,甲每天选择“共享单车”的概率为,乙每天选择“共享单车”的概率为,丙在每月第一天选择“共享单车”的概率为,从第二天起,若前一天选择“共享单车”,后一天继续选择“共享单车”的概率为,若前一天选择“地铁”,后一天继续选择“地铁”的概率为,如此往复.
(1)求3月1日至少有一人选择“共享单车”出行的概率;
(2)记甲、乙、丙三人中3月1日选择“共享单车”出行的人数为,求的分布、期望与方差;
(3)求丙在3月份第天选择“共享单车”的概率,并帮丙确定在3月份中选择“共享单车”的概率大于“地铁”的概率的天数.
【题型4 二项分布】
1.某电台举办有奖知识竞答比赛,选手答题规则相同.甲每道题自己有把握独立答对的概率为,若甲自己没有把握答对,则在规定时间内连线亲友团寻求帮助,其亲友团每道题能答对的概率为p,假设每道题答对与否互不影响.
(1)当时,若甲答对了某道题,求该题是甲自己答对的概率;
(2)当时,甲答了4道题,计甲答对题目的个数为随机变量X,求随机变量X的分布列和数学期望;
(3)乙答对每道题的概率为(含亲友团),现甲乙两人各答两个问题,若甲答对题目的个数比乙答对题目的个数多的概率不低于,求甲的亲友团每道题答对的概率p的最小值.
2.从某校学生中随机抽出100名学生参加搏击操比赛,根据比赛成绩得到如图所示的频率分布直方图,数据的分组依次为[40,50)、[50,60)、[60,70)、[70,80)、[80,90)、[90,100].若成绩在前的学生可获得“优秀拳击手”称号.
(1)成绩至少要达到多少分才可以被评为“优秀拳击手”?
(2)从该校学生中随机抽取5人,设其中“优秀拳击手”的人数为,用频率估计概率,求的期望和方差;
(3)经过调查发现,该校高三学生中“优秀拳击手”的比例达到了,已知三个年级人数相同,现从该校的“优秀拳击手”中随机选一名学生,求这名学生来自高三的概率.
3.为了调研某地区学生在“自由式滑雪”和“单板滑雪”两项活动的参与情况,在该地区随机选取了10所学校进行研究,得到如下数据:
(1)从这10所学校中随机选取1所,事件表示“该学校参与”自由式滑雪“人数超过40人”,事件N表示“该校参与”单板滑雪“超过30人”,求在事件发生的条件下,事件N发生的概率;
(2)已知参与“自由式滑雪”人数超过40人的学校评定为“基地学校”.现在从这10所学校中随机选取2所,设“基地学校”的个数为X,求X的分布列和数学期望;
(3)现在有一个“单板滑雪”集训营,对“滑行、转弯、停止”这3个动作技巧进行集训.并专门对这3个动作进行了多轮测试.规定:在一轮测试中,这3个动作中至少有2个动作达到“优秀”,则该轮测试记为“优秀”.在此集训测试中,李华同学3个动作中每个动作达到“优秀”的概率均为,每个动作互不影响,每轮测试也互不影响.如果李华同学在集训测试中想获得“优秀”的次数的均值达到5次,那么至少要进行多少轮测试?(结论不要求证明)
4.某大型企业准备把某一型号的零件交给甲工厂或乙工厂生产. 经过调研和试生产, 质检人员抽样发现: 甲工厂试生产的一批零件的合格品率为 94%; 乙工厂试生产的另一批零件的合格品率为 98%;若将这两批零件混合放在一起,则合格品率为 97%.
(1)设甲工厂试生产的这批零件有 件,乙工厂试生产的这批零件有 件,证明: ;
(2)用频率估计概率,记这 3 个零件中来自甲工厂的个数为 ,求 的分布列、数学期望和方差.
【题型5 超几何分布】
1.2025年11月,教育部等五部门联合印发《关于实施学生体质强健计划的意见》,明确要求“中小学生每天综合体育活动时间不少于2小时”.某学校为了解政策落实情况,随机抽取了100名学生进行每周累计体育活动时长的调查,得到如下频率分布表:
每周活动总时长(单位:小时)
频率
0.15
0.25
0.35
0.15
0.1
我们将每天综合体育活动时间不少于2小时的学生定义为“达标学生”,否则为“未达标学生”.(一周按7天进行计算)
(1)已知小明同学是“达标学生”,求他每天综合体育活动时间不少于3小时的概率.
(2)从活动时长在和的学生中,按频率的比例抽取5人进行座谈.若从这5人中随机抽取2人,设为抽取的2人中活动时长在的人数,求的分布列和数学期望.
2.为助力上海“城市数字化转型”,某社区开展“智慧社区APP使用熟练度”调查,随机抽取该社区120名居民进行评分(满分100分),绘制频率分布直方图(各组区间为、、、、),已知组的频率是 组频率的3倍,组的频数是组频数的2倍,且组的频率为,组的频率为.
(1)求频率分布直方图中、组的频率及组距对应的高度;
(2)求这120名居民评分的平均数(精确到)和中位数;
(3)从评分在的居民中随机抽取3人,记抽取的3人中评分在 的人数为,求的分布列及数学期望.
3.现有除颜色外都相同的个红球和个白球,随机取个球放入一个不透明的袋中,记袋中红球的个数为.从袋中随机摸出一个球,并放入一个另一种颜色的球,经过次摸球,袋中的红球个数记为.
(1)求和;
(2)求;
4.一家水果店的店长为了解本店苹果的日销售情况,记录了过去20天苹果的日销售量(单位:kg),按从小到大的排序结果如下:62,74,75,84,84,85,85,85,86,87,89,92,93,94,97,99,101,104,107,117.
(1)求该水果店过去20天苹果日销售量的平均数;
(2)若以过去20天苹果的日销售量的第80百分位数作为下个月每日苹果的平均进货量,试确定下个月每日苹果的平均进货量;
(3)若从过去20天中随机抽取3天,分别求“3天中每天的苹果销售量均超过90kg”与“3天中恰有2天的苹果销售量超过90kg”的概率.
【题型6 正态分布】
1.质监部门从某超市销售的甲、乙两种食用油中各随机抽取100桶检测某项质量指标,由检测结果得到如下的频率分布直方图:
(1)写出频率分布直方图(甲)中的值;记甲、乙两种食用油100桶样本的质量指标的方差分别为,试比较与的大小(只要求写出结果);
(2)在甲、乙两种食用油中各随机抽取1桶,用频率估计概率,求恰有1桶的质量指标大于10且小于40的概率;
(3)由频率分布直方图可以认为,乙种食用油的质量指标值Z服从正态分布.其中近似为样本平均数近似为样本方差,现从乙种食用油中随机抽取10桶,设X表示质量指标值位于的桶数,求X的数学期望.(结果保留两位小数)
注:①同一组数据用该区间的中点值作代表;②若,则.
2.某公司生产的糖果每包标识“净含量500g”,但公司承认实际的净含量存在误差. 已知每包糖果的实际净含量(单位:g)服从正态分布.
(1)随机抽取一包该公司生产的糖果,求其净含量误差超过5g的概率(精确到);
(2)随机抽取3包该公司生产的糖果,记其中净含量小于497.5g的包数为. 求的分布和期望(精确到).
参考数据:,,,其中为标准正态分布函数.
3.某市举行了一次大型宣传活动,结束后组办方分别从7个不同的地方的问卷调查中各随机抽取了相同数量的数据(人均得分)构成一个样本,依据相关标准,该样本中各地抽取的数据构成数列(n为各地区的编号),且由各地的数据可以认为各地人均得分服从正态分布,μ近似为抽取的样本中7个地方人均得分的平均值(得分的平均值四舍五入并取整数).
(1)利用正态分布的知识求.
(2)组办方为此次参加问卷调查的市民制订如下两种奖励方案.
方案一:(ⅰ)得分不低于μ的可以获赠2次随机话费,得分低于μ的可以获赠1次随机话费.
(ⅱ)每次获赠的随机话费和对应的概率为
获赠的随机话费/元
50
100
概率
方案二:参加此次问卷调查的市民可获得价值100元的大型晚会入场券.
参加此次问卷调查的市民可选择其中一种奖励方案.
①市民小李参加了此次问卷调查,他选择了方案一,记X(单位:元)为他获赠的话费,求X的分布列及数学期望.
②仅从奖励的价值考虑,如果你参加了问卷调查,你选择参加获赠随机话费活动,还是获得价值100元的大型晚会入场券?用统计中相关知识做出决策.
(附:若,则,,)
4.辽宁、广东、河北、湖北、湖南、江苏、福建、重庆等八省市从2021年起全部采用“3+1+2”的新高考模式.“3”指的是语文、数学、外语,这三门科目考试参加统一高考,由教育部考试中心统一命题,以原始成绩计入考生总成绩;“1”指的是物理和历史中的一科,考生必须从物理和历史两个科目中选择一科,由各省自主命题,以原始成绩计入考生总成绩.为了让考生更好的适应新高考模式,某省几个地市进行了统一的高考适应性考试.在所有入考考生中有30000人选考物理,考后物理成绩X(满分100分)服从正态分布.
(1)分别估计成绩在和75分以上者的人数;(运算过程中精确到0.0001,最后结果保留为整数)
附1:,,;
(2)本次考试物理成绩X服从正态分布.令,则η~N(0,1),若本次考试物理成绩的前25%划定为优秀等级,试估计物理优秀等级划线分大约为多少分?(结果保留为整数)
附2:若η~N(0,1),则.
【题型7 线性回归】
1.绝对零度()是一个只能逼近而不能达到的最低温度,那么这个数据是如何得到的?小张同学通过查询资料了解到:①气体温度和气体压强存在线性关系;②当气体压强为时,气体温度达到绝对零度.小张同学在实验时,记录了某种气体温度和气体压强一组相关数据:
数据
1
2
3
4
5
6
温度
4.07
16.69
29.42
45.67
57.06
73.05
压强
103.095
107.734
112.461
118.469
122.706
128.758
(1)用上表数据建立气体压强与气体温度的线性回归方程,若这组实验数据的拟合误差小于0.05,则认为得到的线性回归是理想的.求出回归方程(精确到0.001),并判断所得回归方程是否理想?附:拟合误差
(2)估计该次实验下绝对零度的数值.(精确到)
2.某汽车研发公司的工程师为了解一款新型汽车在不同行驶速度x(km/h)下油耗y(L/100km)的变化规律,进行了相关实验,记录不同速度下的油耗数据的散点图如下:
(1)根据散点图求y关于x的经验回归方程(精确到0.01);
(2)根据线性回归方程,绘制残差图,并分析线性回归方程的拟合效果(若残差的平方和小于0.775,则说明拟合效果良好,否则拟合效果较差).
附:,.
3.某车间为了规定工时定额,需要确定加工零件所花费的时间,为此作了次试验,得到数据如下:
零件的个数x(个)
2
3
4
5
加工的时间y(小时)
2.5
3
4
4.5
参考公式:用最小二乘法求线性回归方程系数公式,
(1)求关于的线性回归方程;
(2)求各样本的残差;
(3)试预测加工个零件需要的时间.
4.根据相关研究报告显示,预计年电商交易额突破亿元,网购用户规模接近亿.下表为某网店统计的近个月的利润(单位:万元),其中为月份代号.
月份
2024年12月
2025年1月
2025年2月
2025年3月
2025年4月
月份代号
1
2
3
4
5
利润/万元
8
6.3
5.1
3.2
2.4
(1)依据表中的统计数据,计算样本相关系数(精确到),判断是否可以用线性回归模型拟合与的关系;若可用,求出关于的经验回归方程,并估计年月该网店利润;若不可用,请说明理由;
(2)该专营店为了吸引顾客,推出两种抽奖方案.方案一:一次性购物金额超过元可抽奖三次,每次中奖的概率均为,且每次抽奖互不影响,中奖一次打折,中奖两次打折,中奖三次打折,其余情况不打折.方案二:从装有个形状大小、完全相同的小球(其中红球个,白球个,黑球个)的抽奖盒中,一次性摸出个球,其中奖规则为:若摸出个红球和一个白球打六折,摸出个黑球打八折,其余情况不打折.某顾客计划在此网店购买元的商品,请从实际付款金额的数学期望的角度分析选哪种方案更优惠.
参考:,,
【题型8 非线性回归】
1.某芯片研究团队为制定下一年的研发投入计划,需要了解年研发资金投入量x(单位:亿元)对年销售额(单位:亿元)的影响,结合近12年的年研发资金投入量和年销售额的数据,该团队建立了两个模型:①;②,其中,,,均为常数,为自然对数的底数.经对历史数据的初步处理,得到右侧散点图,如图.令,,计算得如下数据:
20
66
770
200
14
460
4.20
3125000
0.308
21500
(1)设和的相关系数为,和的相关系数为,请从相关系数的角度,选择一个拟合程度更好的模型:
(2)(i)根据(1)的选择及表中数据,建立y关于x的回归方程(系数精确到0.01);
(ii)若下一年销售额y需达到80亿元,预测下一年的研发资金投入量x是多少亿元?(结果精确到0.01)
附:对于一组数据,样本相关系数
回归直线的斜率和截距的最小二乘估计分别为:
,.
2.中国茶文化博大精深,饮茶深受大众喜爱,茶水的口感与茶叶类型和水的温度有关,某数学建模小组为了获得茶水温度y(单位:)关于时间x(单位:min)的回归方程模型,通过实验收集在室温,用同一温度的水冲泡的条件下,茶水温度随时间变化的7组数据,并对数据做初步处理得到如图所示散点图以及如表所示数据.
73.5
3.85
表中:,
(1)根据散点图判断: ①与②哪一个更适宜作为该茶水温度y关于时间x的经验回归方程类型?(给出判断即可,不必说明理由)
(2)根据(1)的判断结果及表中数据,建立该茶水温度y关于时间x的经验回归方程
(3)已知该茶水温度降至口感最佳,根据(2)中的经验回归方程,求在相同条件下,刚泡好的茶水,大约需要放置多长时间才能达到最佳饮用口感.
附:(1)对于一组数据,…,,其回归直线的斜率和截距的最小二乘估计分别为,
(2)参考数据:,,,,.
3.某市开展“安全随我行”活动,交警部门在某个交通路口增设电子眼,并记录了某月该路口连续10日骑电动摩托车未佩戴头盔的人数与天数的情况,对统计得到的样本数据作了初步处理,得到下面的散点图及一些统计量的值.
5.5
8.7
1.9
301
385
79.75
表中,.
(1)依据散点图推断,与哪一个更适合作为未佩戴头盔人数与天数的回归方程类型?(给出判断即可,不必说明理由),并求出所选类型的回归方程;
(2)小张每天上班选择骑电动车或自行车,每月第一天他选择骑电动车或自行车的概率均为,从第二天起,若前一天选择骑电动车,则后一天选择骑自行车的概率为,若前一天选择骑自行车,则后一天选择骑电动车的概率为,每个月按照20个工作日计算,设他在某个月的第个工作日骑自行车上班的概率为.
(i)求数列的通项公式;
(ii)若,都是离散型随机变量,则,若小张该月累计骑自行车上班的次数为,求,保留到小数点后一位.
附:对于一组数据,,,,其回归直线的斜率和截距的最小二乘估计分别为:
,.
4.生物污染是环境污染的主要类型之一,它会对生态环境造成极大的破坏.某种有害昆虫每只的平均产卵数(单位:个)和平均温度(单位:)有关.现收集到此类昆虫的平均产卵数(个)和温度的组观测数据,制成图1所示的散点图.现用两种模型
①,②分别进行拟合.
根据收集到的数据,计算得到如下值:
24
2.9
646
179
422688
62.65
70308
表中,,,;
(1)根据散点图,比较模型①、②,哪个模型比较合适?(无需说明理由),并根据所选择的模型,利用上表中的参考数据,求出关于的回归方程.
(2)根据以往统计,我国南方某地每年平均温度达到以上时此类昆虫会对当地生态环境造成严重破坏,需要人工防治,其他情况均不需要人工防治.设该地每年平均温度达到以上的概率为,该地今后年恰好需要次人工防治的概率为,求取得最大值时对应的概率,并以此估计该地未来年需要人工防治的次数.
附:对于一组数据,,,,其回归直线的斜率和截距的最小二乘估计分别为:,.
【题型9 相关性分析】
1.某景区试卖一款纪念品,现统计了该款纪念品的定价(单位:元)与销量(单位:百件)的对应数据,如下表所示:
12
12.5
13
13.5
14
14
13
11
9
8
(1)求该纪念品定价的平均值和销量的平均值;
(2)计算与的相关系数;
(3)由(2)的计算结果,判断能否用线性回归模型拟合与的关系,并说明理由.
参考数据:.
参考公式:相关系数.
2.某地用简单随机抽样的方法抽取15个村进行验收调查,调查得到的样本数据,其中和分别表示第个村中村户的年平均收入(单位:万元)和产业资金投入数量(单位:万元),并计算得到,,,,.
(1)试估计该地被调查村的村户年平均收入;
(2)根据样本数据,求该地被调查村中村户年平均收入与产业资金投入的相关系数;(精确到0.01)
(3)根据现有统计资料,各被调查村产业资金投入差异很大.为了准确地进行验收,请给出一种你认为更合理的抽样方法,并说明理由.
3.某公司研发了一款新型智能机器人,一经投放市场颇受欢迎,为了更好地服务广大用户,该公司对这款机器人的某个性能指数x()与用户的喜欢程度y()进行调查统计,得到如下数据表:
x
5
6
7
8
9
y
0.55
0.50
0.60
0.65
0.70
(1)请根据上表提供的数据,利用相关系数r,判断该性能指数与用户的喜欢程度的相关性强弱(当时,x与y的相关性很强);
(2)这款智能机器人的交互性很强,用户可通过语音给机器人发布指令,机器人执行命令的正确率为90%,出错率为10%.当机器人正确执行命令时,使用者满意的概率为90%;当机器人执行命令错误时,使用者满意的概率为30%.如果使用者对某次命令执行结果不满意,求机器人实际正确执行命令的概率(精确到0.01);
(3)该公司科技人员随机抽取一台这款智能机器人进行挑战答题,共准备了4道高难度的问题,若机器人答对的题数不小于3,则挑战成功.已知机器人答对前两道题的概率均为p,答对后两道题的概率均为q,每次答题结果互不影响.当时,求机器人挑战成功的概率的最大值.
附:相关系数.
4.某新能源汽车公司为研究电池容量对续航里程的影响,随机选取了10辆不同配置的车进行测试,测量每辆车的电池容量(单位:)和续航里程(单位:),得到如下数据:
样本号
1
2
3
4
5
6
7
8
9
10
总和
电池容量
35
40
45
50
55
65
70
75
80
85
600
续航里程
330
350
390
410
480
520
560
620
640
700
5000
并计算得.
(1)估计这10辆车的平均电池容量与平均续航里程;
(2)求电池容量与续航里程的样本相关系数;(精确到0.001)
(3)现该公司计划推出新款车型,电池容量为,已知续航里程与电池容量近似成正比,利用以上数据给出新款车型续航里程的估计值.(精确到1)
附:相关系数.
【题型10 独立性检验】
1.直播带货是一种直播和电商相结合的销售手段,目前已被广大消费者所接受.针对这种现状,某公司决定逐月加大直播带货的投入,直播带货金额稳步提升,以下是该公司年前个月的带货金额:
月份
带货金额万元
(1)求关于的线性回归方程,并据此预测年月份该公司的直播带货金额;
(2)该公司随机抽取人进行问卷调查,得到如下不完整的列联表:
参加过直播带货
未参加过直播带货
总计
女性
男性
总计
请填写上表,并判断是否有的把握认为参加直播带货与性别有关?
参考公式:,;
,其中.
0.025
0.010
0.005
0.001
5.024
6.635
7.879
10.828
2.为了研究高三学生每天整理数学错题的情况,某校数学建模兴趣小组的同学在本校高三年级学生中采用随机抽样的方法抽取了40名学生,调查他们平时的数学成绩和整理数学错题的情况,现统计得部分数据如下:
数学成绩总评优秀人数
数学成绩总评非优秀人数
合计
每天都整理数学错题人数
14
不是每天都整理数学错题人数
15
20
合计
40
(1)完成上述样本数据的列联表,并计算:每天都整理数学错题且数学成绩总评优秀的经验概率;
(2)是否有的把握认为“数学成绩总评优秀与每天都整理数学错题有关”?
(3)从不是每天都整理数学错题的学生中随机抽取3名学生做进一步访谈,设恰好抽取到数学成绩总评优秀的人数为,求的分布列和期望.
附:;
0.10
0.01
0.001
2.706
6.635
10.828
3.某科技公司共有员工人,其中男员工人,女员工人.为推广一款新工作软件,在全体员工中随机抽取人进行调查,得到他们对该软件的接受与否如下表:
接受
不接受
合计
男性
女性
合计
(1)是否有的把握认为该科技公司“性别与是否接受该软件”有关联;
(2)将样本中男性和女性对这款新工作软件各自的接受率作为总体中相应性别的接受率的估计.现从该公司所有员工中随机地取人,设事件为“员工接受该软件”,事件为“员工为女性”.
①求(精确到小数点后位):
②若该员工接受软件,求该员工为女性的概率(精确到小数点后位).
(参考公式:)
4.某商场为了解顾客购买手机的意愿,随机调查了位顾客购买手机的情况,得到数据如下表.
购买手机
购买无技术的手机
总计
男性顾客
女性顾客
总计
(1)根据表中数据,判断是否有的把握认为购买手机与顾客的性别有关?并说明理由;
(2)从这位男性顾客中随机挑选位,求其中至少有位购买手机的概率(精确到);
(3)为促进手机的销量,该商场为购买手机的顾客设置了抽奖环节,共设一、二等奖两种奖项,分别奖励元、元手机话费,抽中一、二等奖的概率分别为和,其余情况不中奖.每位顾客允许连续抽奖两次,且两次抽奖相互独立.记某位顾客两次抽中的奖金之和为元,求随机变量的数学期望.
参考公式及数据:①,其中.
②,,,.
1.已知常数,在成功概率为的伯努利试验中,记为首次成功时所需的试验次数,的取值为所有正整数,此时称离散型随机变量的概率分布为几何分布.经计算:.对于几何分布的拓展问题,在成功概率为的伯努利试验中,记首次出现连续两次成功时所需的试验次数的期望为,现提供一种求的方式:先进行第一次试验,若第一次试验失败,因为出现试验失败对出现连续两次成功毫无帮助,可以认为后续期望仍是,即总的试验次数为;若第一次试验成功,则进行第二次试验,当第二次试验成功时,试验停止,此时试验次数为2,若第二次试验失败,相当于重新试验,此时总的试验次数为,则的值为( )
A. B. C. D.
2.某公司员工食堂每天都有米饭和面食两种套餐,已知员工甲每天中午都会在这两种套餐中选择一种,米饭套餐的价格是每份18元,面食套餐的价格是每份12元,如果甲当天选择了某种套餐,他第二天会有60%的可能性换另一种类型的套餐,假如第1天甲选择了米饭套餐,第n天选择米饭套餐的概率为,给出以下论述:
①;
②;
③
④前天甲午餐总费用的数学期望为.
其中正确的是( )
A.②③④ B.①②④ C.①③④ D.①②③
3.某挑战赛设置了个连续关卡,分别记为第1关卡,第2关卡,⋯,第关卡,每个参赛团队的选手人数均为,每2名选手组成一个双人挑战组,共个双人挑战组,每个关卡均由其中1个双人挑战组进行挑战,各关卡参赛选手均不相同,关卡挑战从第1关卡开始依次挑战,每个关卡至少有1名选手挑战成功(即该关卡挑战成功),才能进入下一个关卡的挑战.若某参赛团队这个连续关卡均挑战成功,则该参赛团队的挑战赛通关.已知参赛团队的每名选手挑战成功的概率均为,且各选手的挑战结果相互独立,若在挑战赛通关的情况下,记内挑战不成功的选手总人数为,则__________.
4.甲、乙、丙三人相互做传球训练,每次传球时,传球者都等可能地将球传给另外两个人中的任何一人.若第一次由甲传出,共传5次结束,记表示5次传球过程中,甲接到球的总次数,则X的数学期望________.
5.针对赛制对“强者”和“弱者”的影响进行建模分析.
设参赛人数为n(为2的幂次,如4,8,16),假设每场比赛只有两种可能结果:胜或负(忽略平局).各场比赛的结果相互独立.
赛制一、单败淘汰制:参赛者两两对决,胜者晋级,负者直接淘汰,直到决出冠军.
赛制二、双败淘汰制:参赛者随机分组进行初赛,胜者组、负者组分别组内随机抽签比赛,胜者组失败者掉入负者组,负者组失败者被淘汰,胜者组冠军和负者组冠军进行总决赛.
以4人为例,如图:
赛制三、单循环赛制:每位参赛者与其他所有参赛者都进行一场比赛.最终按总积分(或胜场数)排名.总积分(或胜场数)最高者为冠军(若积分相同再比较其他规则).
假设在强者(只有一人)与弱者单场比赛中,p为“强者”战胜“弱者”的概率.弱者实力均等,他们之间比赛时胜率均为r.表示“强者”最终赢得冠军的概率.
(1)当,,时,求赛制一、赛制二相应的;
(2)针对赛制三,、分别表示“强者”、“弱者”的胜场数,写出、;当,,时,计算并说明“强者”稳定夺冠的因素;
(3)评价三种赛制对“强者”和“弱者”的影响.
6.已知一个不透明的盒中有个小球(小球除编号不同外其余均相同),这个小球的编号分别为1,2,3,…,(,).现进行如下摸球活动:
(1)若,从盒中一次性摸取2个小球,求这2个小球编号不相邻的概率;
(2)如果摸球前约定“固定重叠原则”:即随机摸取盒中个小球(,),记录编号后放回,再重复以上操作一次,记这两次操作中被重复摸取的小球数为.
(ⅰ)若,,求概率;
(ⅱ)求使概率取得最大值时m的值.
1.江先生每天9点上班,上班通常开私家车加步行或乘坐地铁加步行,私家车路程近一些,但路上经常拥堵,所需时间(单位:分钟)服从正态分布,从停车场步行到单位要6分钟;江先生从家到地铁站需要步行5分钟,乘坐地铁畅通,但路线长且乘客多,所需时间(单位:分钟)服从正态分布,下地铁后从地铁站步行到单位要5分钟,从统计的角度出发,下列说法中合理的有( )
参考数据:若,则,,
A.若出门,则开私家车不会迟到
B.若出门,则乘坐地铁上班不迟到的可能性更大
C.若出门,则乘坐地铁上班不迟到的可能性更大
D.若出门,则乘坐地铁几乎不可能上班不迟到
2.一只小虫从数轴上的原点出发爬行,若一次爬行过程中,小虫等概率地向前或向后爬行1个单位,设爬行次后小虫所在位置对应的数为随机变量,则下列说法错误的是( )
A. B.
C. D.
3.飞行棋是一种家喻户晓的竞技游戏,玩家根据骰子(骰子为均匀的正六面体)正面朝上的点数确定飞机往前走的步数,刚好走到终点处算“到达”,如果玩家投掷的骰子点数超出到达终点所需的步数,则飞机须往回走超出点数对应的步数.在一次游戏中,飞机距终点只剩3步(如图所示),设该玩家到达终点时投掷骰子的次数为,则__________.
4.在维空间中,以单位长度为边长的“立方体”的顶点坐标可表示为维坐标,其中.定义:在维空间中两点与的曼哈顿距离为.在维“立方体”的顶点中任取两个不同的顶点,记随机变量为所取两点间的曼哈顿距离,则__________.
5.设正方体的棱长为1,记该正方体的8个顶点构成集合.
(1)从集合中有放回地随机抽取两个点、,令随机变量为向量模长的平方,求的分布及期望;
(2)从集合中随机抽取四个不同的点、、、,设事件:,事件:,求和.
6.不透明的口袋中装有编号分别为的个小球,小球除编号外完全相同.现从中有放回地任取次,每次取1个球,记取出的个球的最大编号为随机变量,则称服从参数为的“”分布,记为.
(1)若,求;
(2)若,且,求的最小值;
(3)若,求:当且的值.
1 / 2
学科网(北京)股份有限公司
$
完成时间: 月 日 今日打卡:☐ 已完成
用时: min 自评勋章:
暑假作业10 随机变量分布与统计分析
【知识点1 离散型随机变量的分布列、数学期望与方差】
1. 分布列
设离散随机变量 取值 ,对应概率
性质:
① ;②
2. 数学期望(均值)
线性性质:
3. 方差与标准差
方差:
简化公式:
性质:
标准差:
【知识点2 二项分布】
1. 适用条件
次独立重复试验,每次只有成功/失败,单次成功概率恒为
2. 概率公式
3. 期望方差
场景:有放回抽取、多次独立射击、重复投篮。
【知识点3 超几何分布】
1. 适用条件
总数 件,其中合格品 件,不放回一次性抽取 件, 为取出合格品数量
2. 概率公式
3. 期望方差
近似: 很大、 很小时,超几何可近似二项分布。
【知识点4 正态分布】
1. 图像特征
正态曲线关于 对称; 定左右位置, 定胖瘦;曲线与 轴面积为 1
2. 数字特征
3. 原则
4. 标准化
令 ,则 标准正态分布。
【知识点5 成对数据的相关分析】
1. 相关系数
取值范围
· :正相关;:负相关
· 越接近 1,线性相关性越强; 越接近 0,线性越弱
【知识点6 一元线性回归分析】
回归直线方程:
1. 斜率、截距公式
2. 核心性质
回归直线必过样本中心点 ; 符号与相关系数 一致。
【知识点7 独立性检验】
1. 列联表
合计
合计
2. 卡方统计量
3. 判断标准(常用临界值)
:99% 把握认为两变量有关
:95% 把握认为两变量有关
:无充分证据判定有关
【题型1 离散型随机变量的分布列】
1.现有两个不透明的,箱子装有大小质地一样,只有颜色不同的若干小球,其中箱子中装有2个红球,1个白球,箱子中装有3个红球,3个白球.先从箱子采取不放回的方式依次取球,当箱子内的小球颜色只剩一种时,停止从箱子取球,并将箱子剩余的球混入箱子后再从箱中采取不放回的方式依次取球,当箱子内的小球颜色只剩一种时,停止从箱子取球,记为停止从箱子取球时,箱子内剩余的白球个数.
(1)停止从箱子取球时箱子恰好剩一个球的概率;
(2)停止从箱子取球时箱子不剩红球的概率;
(3)求的分布列.
【答案】(1)
(2)
(3)见解析
【分析】(1)按取球规则,需第一次取红球,则可以发生停止从箱子取球时箱子恰好剩一个球;
(2)利用全概率公式求解;
(3)先列出箱球的情况,再对应求箱子内剩余的白球个数对应的概率,最后列分布列.
【详解】(1)A箱原有2红1白共3个球:若第一次取出白球,A箱剩余2个红球,
只剩同色,停止取球,剩余2个球;
若第一次取出红球(概率为),A箱剩余1红1白,两种颜色都存在,需继续取球,
取1次后剩余1个球,停止,因此恰好剩1个球的概率为;
(2)先分析A箱停止后的所有可能结果,概率分别为:
剩2个红球时:此时概率 ,混入B箱后,B箱有5红球3白球;
剩1个红球:此时概率 ,混入B箱后,B箱有4红球3白球;
剩1个白球:此时概率,混入B箱后,B箱有3红球4白球;
B箱不剩红球等价于红球先被全部取完,剩余全为白球,
由排列的等可能性,该事件概率等于最后一个球是白球的概率,即白球数除以总球数,
即对R个红球W个白球,红球先取完(停止后不剩红球)等价于所有排列最后一个是白球,每个球等可能在最后一位,概率为;
由全概率公式可得停止从箱子取球时箱子不剩红球的概率
;
(3)A 箱三种情况
剩2红:,并入B:5 红 3 白
剩1红:,并入B:4 红 3 白
剩1白:,并入B:3 红 4 白
B 箱条件概率
5红3白: ,,,,
4红3白: , ,,,
3红4 白:,,,,,
综上所述,的可能取值是0,1,2,3,4,
,
,
,
,
,
所以的分布列是
0
1
2
3
4
2.袋中有编号为1,2,3,4的小球各一个,每次从袋中摸出一个小球,记下编号后,将小球放回袋中,记为一轮摸球,如此循环.
(1)若摸三轮,求在不摸出1号球的条件下,恰有一个小球被摸出次数等于该小球编号的概率;
(2)如此循环,直到4个编号的小球均被摸出过或摸球次数达到停止摸球,记停止摸球时摸球次数为X.
①时,求;
②求.
【答案】(1);
(2)①;②
【分析】(1)先求出不摸出1号球的概率,再求出不摸出1号球且恰有一个小球被摸出次数等于该小球编号的概率,最后根据条件概率公式计算;
(2)①时,表示前4次摸球只出现了3个不同编号的小球,第5次摸出了第4个不同编号的小球,根据古典概型概率公式计算;表示前次摸球没有将4个编号的小球全部摸出,根据古典概型概率公式计算.
【详解】(1)设事件A为“三轮不摸出一号球”,事件B为“恰有一个小球被摸出次数等于该小球编号”,
∴.
(2)①表示前4次摸球只出现了3个不同编号的小球,第5次摸出了第4个不同编号的小球.
前4次摸球只出现3个不同编号的小球,从4个编号中选3个,有种选法,
将这3个编号的小球放入4次摸球中,且每个编号至少出现一次,
种情况.
第5次摸出剩下的1个编号的小球,有1种情况,而摸5次球,每次有4种选择,总共有种情况.
所以.
②由题意可知:表示在第次摸球停止,则前次的情况如下:
情形1:只摸出1种编号:4种;
情形2:只摸出2种编号:;
情形3:只摸出3种编号:,
∴.
3.亳州百草园为了让游客有更好的游玩体验,特推出代步自行车租用服务已知有脚踏自行车与电动自行车两种车型,采用分段计费的方式租用.型车每分钟收费元(不足分钟的部分按分钟计算),型车每分钟收费元(不足分钟的部分按分钟计算),现有甲、乙、丙、丁四人,分别相互独立地到租车点租车骑行(各租一车一次),设甲、乙、丙、丁不超过分钟还车的概率分别为、、、,并且四个人每人租车都不会超过分钟,甲、乙、丙均租用型车,丁租用型车.
(1)求甲、乙、丙、丁四人所付的费用之和为元的概率;
(2)求甲、乙、丙三人所付的费用之和等于丁所付的费用的概率;
(3)设甲、乙、丙、丁四人所付费用之和为随机变量,求的概率分布列.
【答案】(1)
(2)
(3)
P
【分析】(1)分析可知人均不超过分钟,利用独立事件的概率公式可求得所求事件的概率;
(2)分析可知丁还车超过分钟且不超过分钟,则所付的费用为元,甲、乙、丙三人有一人还车超过分钟且不超过分钟,另外两个人还车都不超过分钟,利用独立事件和互斥事件的概率公式求解即可;
(3)对每个人的停车事件进行分类讨论,确定每种情况下的取值,并求其概率,可得出随机变量的分布列.
【详解】(1)记“甲、乙、丙、丁四人所付的费用之和为元”为事件,即人均不超过分钟,
则.
(2)由题意,甲、乙、丙、丁在分钟以上且不超过分钟还车的概率分别为、、、,
设“甲、乙、丙三人所付费用之和等于丁所付费用”为事件,
由题意可知,丁还车超过分钟且不超过分钟,则丁所付的费用为元,
甲、乙、丙三人有一人还车超过分钟且不超过分钟,另外两个人还车都不超过分钟,
则.
(3)①若“人均不超过分钟”此时随机变量的值为,即为事件,
由(1)知.
②记“人中仅有一人超过分钟”为事件,
事件又分成两种情况“超过分钟的这一人是甲、乙、丙中的一个”和“超过分钟的这一人是丁”,
分别将上述两种情况记为事件和.
ⅰ.事件对应的的值为,
此时.
ⅱ.事件对应的的值为,此时.
③记“人中仅有两人超过分钟”为事件,
事件又分成两种情况“超过分钟的两人是甲、乙、丙中的两个”和“超过分钟的两人是甲、乙、丙中的一个和丁”,
分别将上述两种情况记为事件和.
ⅰ.事件对应的的值为,
此时.
ⅱ.事件对应的的值为,
此时.
④记“人中仅有三人超过分钟”为事件,
事件又分成两种情况“超过分钟的三人是甲、乙、丙”和“超过分钟的三人是甲、乙、丙中的两个和丁”,
分别将上述两种情况记为事件和.
ⅰ.事件对应的的值为,此时.
ⅱ.事件对应的的值为,
此时.
⑤记“人均超过分钟”为事件,则随机变量的值为,
此时.
综上:随机变量的所有取值为、、、、、,
且,,
,
,
,,
所以甲、乙、丙、丁四人所付费用之和的分布列为
P
4.某答题闯关游戏,开始时,先给每位参加者赋分3分,并规定:每答一题,答对加1分,否则减1分;当积分为6分时,闯关成功并结束游戏;当积分为0分时,闯关失败,也结束游戏.甲同学参加该游戏,假如他答对每道题的概率均为,且每道题答对与否相互独立.记游戏结束时甲的答题数为.
(1)证明:为奇数;
(2)当为奇数时,记甲答完第题时积分为4分、2分的概率分别为,,证明:;
(3)求的分布列.
【答案】(1)证明见解析
(2)证明见解析
(3)
3
5
7
9
其中, .
【分析】(1)设前题中甲答对了题,由答完第题时积分,结合题设即可得证;
(2)记的事件分别为,由题设可得,,利用数列的递推即可求证.
(3)由(2)可得,即可求解.
【详解】(1)设甲答完第题时甲的积分为,且前题中甲答对了题,
则.
若游戏结束时甲的答题数为,
则答完第题时积分,
则或6,即,而,故只能为奇数.
(2)由(1)知当为奇数时,甲答完第题时积分为必为偶数,
即.
记的事件分别为,第题答对的事件为,
则有
.
同理,
.
故有①,②
由①②得:,
又,即,故,即.
又,即,故,即.
(3)当为奇数时,把代入(2)得:.
故构成首项为,公比为的等比数列.
故.
由(1)知,的可能取值为:.
依题意知即或6.
当为偶数时,,
当为奇数,时,第题答完时,积分或2.
故
故.故的分布列为:
3
5
7
9
其中, .
【题型2 离散型随机变量的数学期望】
1.现有5个大小、质地相同的球,分别标上数字1,2,3,4,5.
(1)从中任取三个球,求1号球被取到的概率.
(2)从中有放回地随机取3次,每次取1个球.记为这5个球中至少被取出1次的球的个数,求的数学期望.
【答案】(1)
(2)
【分析】(1)由古典概率结合组合数计算可得;
(2)求出的可能取值和对应的概率,根据期望公式进行求解即可.
【详解】(1)从5个球中任取3个球的所有取法有种,(种)
若1号球被取到,那么只需从剩下的4个球中再取2个球即可,取法有种
设“1号球被取到”为事件,则.
(2)的所有可能取值为1,2,3,则
,
,
,所以的分布列为
所以.
2.甲,乙两队进行乒乓球双打比赛,规定采用五场三胜制,即先赢得三场比赛的队伍获胜.已知每场比赛甲队获胜的概率为,乙队获胜的概率为,且每场比赛的结果相互独立.
(1)求在甲队获胜的条件下,比赛恰好进行了四场的概率;
(2)记比赛结束时的场数为X,求X的分布列和数学期望.
【答案】(1);
(2)X分布为
3
4
5
.
【分析】(1)分别计算甲队获胜的概率和甲队获胜且比赛恰好4场的概率,然后利用条件概率求解;
(2)先确定的取值,并计算相应的概率,列出分布列,根据期望计算公式计算.
【详解】(1)设事件A表示“比赛恰好进行4场”,事件B表示“甲队获胜”.
甲队获胜包含三种情况:
比赛3场甲队获胜,其概率为.
比赛4场甲队获胜,即前3场甲队胜2场,第4场甲队胜,
概率为.
比赛5场甲队获胜,即前4场甲队胜2场,第5场甲队胜,
概率为.
∴甲队获胜的概率为.
甲队获胜且比赛恰好进行了4场的概率为.
∴在甲队获胜的条件下,比赛恰好进行了4场的概率为.
(2)X的可能取值为3,4,5.
;
;
.
∴X分布为
3
4
5
.
3.有两个罐子,罐中放有3个白球和2个黑球,罐中放有5个白球.
(1)若从罐不放回地摸2个球,求恰好摸到一个白球一个黑球的概率;
(2)若从罐不放回地摸2个球,求第二次摸到白球的概率;
(3)现在从两个罐子各摸一个球并交换,这样交换2次后,记罐中黑球的个数为,求的分布列和期望.
【答案】(1)
(2)
(3)的分布列为:
【分析】(1)结合古典概型概率公式求概率即可;
(2)利用全概率公式即可得到答案;
(3)首先分析知的取值为0,1,2,再分别计算对应概率值,再利用期望公式即可得到答案.
【详解】(1)所求概率为;
(2)根据全概率公式知第二次摸到白球的概率为;
(3)的取值为0,1,2,
则,
,
,
则的分布列为:
期望.
4.甲、乙两人进行某项比赛,采取三局两胜制,积分规则如下:比分为时,胜者积分,败者积分;比分为时,胜者积分,败者积分.设每局比赛甲取胜的概率均为.
(1)若甲以取胜的概率大于以取胜的概率,求的范围;
(2)若,求甲所得积分的分布列及数学期望.
【答案】(1)
(2)分布列见解析,
【分析】(1)根据独立事件概率的乘法公式,分析比分为和结束时的情况,求出事件概率,列出不等式,求出结果即可;
(2)根据比分情况,写出随机变量的所有取值,再根据独立事件概率的乘法公式,逐一求出事件概率,进而写出分布列,求出数学期望.
【详解】(1)每局比赛甲取胜的概率为,进行3局比赛,
若甲以取胜,则第三局甲胜,前两局甲胜一局,此时概率为,
若甲以取胜,则前两局甲胜,此时概率为,
则,因为,解得,
所以的范围为.
(2)可知随机变量可能的取值有,
当时,,
,
,
,
所以甲所得积分的分布列为:
0
1
2
3
数学期望为.
【题型3 离散型随机变量的方差】
1.甲、乙两队进行乒乓球双打比赛,规定每局比赛必须决出胜负,采用五局三胜制,即先赢得三局比赛的队伍获胜.已知每局比赛甲队获胜的概率为,且每局比赛的结果相互独立.
(1)设,记比赛结束时的场数为,求的分布、期望和方差;
(2)已知甲队获胜的条件下,比赛恰好进行了四局的概率为,求的值.
【答案】(1)答案见解析
(2)或
【分析】(1)先确定的取值并计算相应的概率,通过列出分布列再根据期望和方差的公式求解;
(2)分别计算甲队获胜的概率和甲队获胜且比赛恰好4局的概率,然后利用条件概率求解.
【详解】(1)可能的取值为,
,
,
,
所以的分布列为
,
.
(2)设甲队获胜为事件,比赛恰好进行4局为事件,
,
,
根据题目可知,,
代入条件概率公式可得,
化简可得 ,
令,可得 ,解得或,
所以或.
2.为激发学习数学的兴趣,高二年级举行数学知识竞赛,赛制规定:共进行5轮比赛,每轮比赛每个班可以从、两个题库中任选1题作答,在前两轮比赛中每个班的题目必须来自同一题库,后三轮比赛中每个班的题目必须来自同一题库,题库每题20分,题库每题30分,一班能正确回答、题库每题的概率分别为、,且每轮答题结果互不影响.
(1)若一班前两轮选题库,后三轮选题库,求其总分不少于100分的概率;
(2)若一班在前两轮比赛中选了题库,而且两轮得分60分,后三轮换成题库,设一班最后的总分为,求的分布、期望及方差.
【答案】(1)
(2)分布列见解析,,
【分析】(1)由概率的乘法公式与加法公式求解;
(2)随机变量的可能取值为,,,,求出相应的概率,即可求出分布列、期望与方差.
【详解】(1)由条件知,若一班在前两轮得分,后三轮得分,总分为分,
其概率为,
若一班在前两轮得分,后三轮得分或分,总分为或分,
其概率为,
于是一班总分不少于分的概率为 .
(2)依题意随机变量的可能取值为,,,,
所以,,
,.
所以的分布列为:
60
80
100
120
所以,
.
3.某中学选派12名学生参加上海市高中生志愿者的培训活动,他们参加培训的次数统计如下表所示:
培训次数
1
2
3
参加人数
2
4
6
(1)从这12名学生中任选3名,求这3名学生中至少有2名学生参加培训次数恰好相等的概率(结果用最简分数表示);
(2)从这12名学生中任选2名,用表示这2人参加培训次数之差的绝对值,求随机变量的期望与方差(结果用最简分数表示).
【答案】(1)
(2).
【分析】(1)由对立事件概率计算公式即可求解;
(2)确定的所有可能取值,求得对应概率,结合期望、方差计算公式即可求解.
【详解】(1)这3名学生中至少有2名学生参加培训次数恰好相等的概率;
(2)由题意知可能取值为0、1、2,
,
所以的期望,
,
4.“绿色出行,低碳环保”的理念已经深入人心,逐渐成为新的时尚.甲、乙、丙三人为响应“绿色出行,低碳环保”号召,他们计划每天选择“共享单车”或“地铁”两种出行方式中的一种.他们之间的出行互不影响,其中,甲每天选择“共享单车”的概率为,乙每天选择“共享单车”的概率为,丙在每月第一天选择“共享单车”的概率为,从第二天起,若前一天选择“共享单车”,后一天继续选择“共享单车”的概率为,若前一天选择“地铁”,后一天继续选择“地铁”的概率为,如此往复.
(1)求3月1日至少有一人选择“共享单车”出行的概率;
(2)记甲、乙、丙三人中3月1日选择“共享单车”出行的人数为,求的分布、期望与方差;
(3)求丙在3月份第天选择“共享单车”的概率,并帮丙确定在3月份中选择“共享单车”的概率大于“地铁”的概率的天数.
【答案】(1)
(2)分布列见解析;,
(3);2
【分析】(1)根据对立事件的概率求法,即可求得答案;
(2)确定X的取值,求出每个值相应的概率,可得分布列,继而求得期望和方差;
(3)确定与的关系式,从而构造数列求出的表达式,结合题意可得需满足,讨论n的奇偶性,即可求得答案.
【详解】(1)由题意可得3月1日至少有一人选择“共享单车”出行的概率为;
(2)由题意知X的可能取值为,
则,,
,
,
则X的分布列为:
X
0
1
2
3
P
故;
.
(3)由题意得,
则,
则,即得,
又,故数列是以为首项,以为公比的等比数列,
故,
在3月份中选择“共享单车”的概率大于“地铁”的概率需满足,即,
即,即,
当n为偶数时,上式显然不成立,
故当n为奇数时,有,
当时,成立;
当时,成立;
当时,,即不成立;
又随n的增大而减小,故时,均不成立;
则只有在第1天和第3天时有,
故在3月份中选择“共享单车”的概率大于“地铁”的概率的天数为2.
【题型4 二项分布】
1.某电台举办有奖知识竞答比赛,选手答题规则相同.甲每道题自己有把握独立答对的概率为,若甲自己没有把握答对,则在规定时间内连线亲友团寻求帮助,其亲友团每道题能答对的概率为p,假设每道题答对与否互不影响.
(1)当时,若甲答对了某道题,求该题是甲自己答对的概率;
(2)当时,甲答了4道题,计甲答对题目的个数为随机变量X,求随机变量X的分布列和数学期望;
(3)乙答对每道题的概率为(含亲友团),现甲乙两人各答两个问题,若甲答对题目的个数比乙答对题目的个数多的概率不低于,求甲的亲友团每道题答对的概率p的最小值.
【答案】(1)
(2)的分布列为:
0
1
2
3
4
数学期望为;
(3)
【分析】(1)利用条件概率公式求解;(2)求出的可能值,再利用二项分布的概率求出分布列及期望.
(3)利用相互独立事件、互斥事件的概率公式求出概率,再结合已知建立不等式求解.
【详解】(1)记事件为“甲答对了某道题”,事件为“甲自己答对”,
则,,
所以.
(2)可能取值为0,1,2,3,4,甲答对某道题的概率,
则,
所以的分布列为:
0
1
2
3
4
数学期望.
(3)记事件为“甲答对了道题”,事件为“乙答对了道题”,
其中甲答对某道题的概率为,答错某道题的概率为,
则,
,
,
所以甲答对题数比乙多的概率为:
,解得,
所以甲的亲友团答对的概率的最小值为.
2.从某校学生中随机抽出100名学生参加搏击操比赛,根据比赛成绩得到如图所示的频率分布直方图,数据的分组依次为[40,50)、[50,60)、[60,70)、[70,80)、[80,90)、[90,100].若成绩在前的学生可获得“优秀拳击手”称号.
(1)成绩至少要达到多少分才可以被评为“优秀拳击手”?
(2)从该校学生中随机抽取5人,设其中“优秀拳击手”的人数为,用频率估计概率,求的期望和方差;
(3)经过调查发现,该校高三学生中“优秀拳击手”的比例达到了,已知三个年级人数相同,现从该校的“优秀拳击手”中随机选一名学生,求这名学生来自高三的概率.
【答案】(1)84.17
(2)
(3)
【详解】(1)由频率分布直方图的性质,所有组的频率之和为,组距为10,因此:
,
即,解得.
从高分段向低分段累积频率:
组的频率为,
要达到前的频率,还需,
这部分来自组,对应分数为:.
因此成绩至少要达到分(约84.17分)才可被评为“优秀拳击手”.
(2)由直方图计算得优秀率.
由题意知,期望.
方差.
(3)设三个年级人数均为,则全校优秀人数为,高三优秀人数为,故所求概率.
3.为了调研某地区学生在“自由式滑雪”和“单板滑雪”两项活动的参与情况,在该地区随机选取了10所学校进行研究,得到如下数据:
(1)从这10所学校中随机选取1所,事件表示“该学校参与”自由式滑雪“人数超过40人”,事件N表示“该校参与”单板滑雪“超过30人”,求在事件发生的条件下,事件N发生的概率;
(2)已知参与“自由式滑雪”人数超过40人的学校评定为“基地学校”.现在从这10所学校中随机选取2所,设“基地学校”的个数为X,求X的分布列和数学期望;
(3)现在有一个“单板滑雪”集训营,对“滑行、转弯、停止”这3个动作技巧进行集训.并专门对这3个动作进行了多轮测试.规定:在一轮测试中,这3个动作中至少有2个动作达到“优秀”,则该轮测试记为“优秀”.在此集训测试中,李华同学3个动作中每个动作达到“优秀”的概率均为,每个动作互不影响,每轮测试也互不影响.如果李华同学在集训测试中想获得“优秀”的次数的均值达到5次,那么至少要进行多少轮测试?(结论不要求证明)
【答案】(1);
(2)分布列见解析,数学期望为;
(3)至少8轮
【分析】(1)借助条件概率公式计算即可得;
(2)由题意可得的可能取值为,分别计算其概率即可得分布列,再利用期望公式计算即可得其数学期望;
(3)计算出李华同学每轮测试达到优秀的概率后,可得李华同学测试获得优秀的次数服从二项分布,利用二项分布期望公式计算即可得解.
【详解】(1)设参与“自由式滑雪”人数超过40人的学校为事件,
参与“单板滑雪”超过30人的学校为事件,
则,
;
(2)由题知,“基地学校”有4个,则的可能取值为,
所以,
,
所以的分布列为
0
1
2
所以;
(3)因为李华同学每轮测试达到优秀的概率,
设李华同学测试获得优秀的次数为,则,
因为,解得,
因为,所以至少要进行8轮测试.
4.某大型企业准备把某一型号的零件交给甲工厂或乙工厂生产. 经过调研和试生产, 质检人员抽样发现: 甲工厂试生产的一批零件的合格品率为 94%; 乙工厂试生产的另一批零件的合格品率为 98%;若将这两批零件混合放在一起,则合格品率为 97%.
(1)设甲工厂试生产的这批零件有 件,乙工厂试生产的这批零件有 件,证明: ;
(2)用频率估计概率,记这 3 个零件中来自甲工厂的个数为 ,求 的分布列、数学期望和方差.
【答案】(1)证明见解析
(2)分布列见解析 数学期望为,方差为
【分析】(1)由全概率公式,根据混合后合格品率的计算公式建立等式来证明;
(2)先确定服从二项分布,再根据分布列的公式求出各取值的概率,进而计算期望和方差.
【详解】(1)设M事件为“抽取出来混放在一起的零件来自甲工厂”,
事件N为“抽取出来混放在一起的零件来自乙工厂”,
事件C为“混放在一起的某一个零件为合格品”,
则,
.
即 .
得.即,
所以
(2)由可知,零件来自甲工厂的概率为,来自乙工厂的概率为.
表示这个零件中来自甲工厂的个数,则服从参数为,的二项分布,即.
则,.
当时,;
当时,;
当时,;
当时,.
所以的分布列为:
则,所以期望为,
方差为.
【题型5 超几何分布】
1.2025年11月,教育部等五部门联合印发《关于实施学生体质强健计划的意见》,明确要求“中小学生每天综合体育活动时间不少于2小时”.某学校为了解政策落实情况,随机抽取了100名学生进行每周累计体育活动时长的调查,得到如下频率分布表:
每周活动总时长(单位:小时)
频率
0.15
0.25
0.35
0.15
0.1
我们将每天综合体育活动时间不少于2小时的学生定义为“达标学生”,否则为“未达标学生”.(一周按7天进行计算)
(1)已知小明同学是“达标学生”,求他每天综合体育活动时间不少于3小时的概率.
(2)从活动时长在和的学生中,按频率的比例抽取5人进行座谈.若从这5人中随机抽取2人,设为抽取的2人中活动时长在的人数,求的分布列和数学期望.
【答案】(1)
(2)的分布列为:
0
1
2
数学期望
【分析】(1)先换算每周活动达标时长,确定对应事件,算出相关概率,代入条件概率公式求解结果.
(2)依据区间频率比确定分层抽取人数,确定随机变量取值,用组合数计算各概率列出分布列,再计算数学期望.
【详解】(1)由题意,一周共7天,达标学生每周累计活动时长不少于小时.
每天活动时间不少于3小时对应每周时长不少于3小时.
设事件为“小明是达标学生”,事件为“小明每天活动时间不少于3小时”.
则:,.
根据条件概率公式,代入得.
(2)活动时长在和的频率比为.
根据该比例抽取5人时,从中抽取5人,从中抽取5人.
随机变量的所有可能取值为,计算对应概率:
,
,
,
因此的分布列如上
X
0
1
2
P
数学期望:.
2.为助力上海“城市数字化转型”,某社区开展“智慧社区APP使用熟练度”调查,随机抽取该社区120名居民进行评分(满分100分),绘制频率分布直方图(各组区间为、、、、),已知组的频率是 组频率的3倍,组的频数是组频数的2倍,且组的频率为,组的频率为.
(1)求频率分布直方图中、组的频率及组距对应的高度;
(2)求这120名居民评分的平均数(精确到)和中位数;
(3)从评分在的居民中随机抽取3人,记抽取的3人中评分在 的人数为,求的分布列及数学期望.
【答案】(1)组的频率为,高度为;组的频率为,高度为
(2);
(3)的分布列为
0
1
2
3
【分析】(1)先根据已知的倍数关系求出、的频率,再用频率/组距得到对应矩形的高度;
(2)平均数用每组数据组中值频率求和计算,中位数通过累计频率找到所在区间,再用公式计算即可;
(3)先确定和的人数,再根据超几何分布的概率公式求的分布列,最后用公式计算数学期望.
【详解】(1)因为[50,60)组的频率为,[70,80)组的频率是[50,60)组频率的3倍,
所以[70,80)组的频率为;
又因为[60,70)组的频率为,所以频数为,
因为[80,90)组的频数是[60,70)组频数的2倍,
所以[80,90)组的频数为,频率为,
所以[70,80)组的高度为;[80,90)组的高度为.
(2)由(1)知:组的频率为,
平均数:因为各组组中值分别为55、65、75、85、95,
所以平均数,
中位数:设中位数为,
累计频率:组累计频率为,
而组频率为,组频率为,
所以组累计频率为,故中位数为,位于组.
(3)组频数:,
组频数:,
组频数:,
所以的可能取值为,服从超几何分布,
,,,,
所以的分布列为
0
1
2
3
数学期望.
3.现有除颜色外都相同的个红球和个白球,随机取个球放入一个不透明的袋中,记袋中红球的个数为.从袋中随机摸出一个球,并放入一个另一种颜色的球,经过次摸球,袋中的红球个数记为.
(1)求和;
(2)求;
【答案】(1),;
(2);
【分析】(1)根据超几何分布的概率公式计算对应事件的概率;
(2)结合条件概率,通过全概率公式求解;
【详解】(1)因为表示从 个红球和个白球随机取个球的红球个数,所以服从超几何分布,
表示抽取的个球全为白球,故.
表示抽取的个球有个红球、个白球,故.
(2)由题意,的所有可能取值为,由(1)知,,
同理得,.
当时,袋中全为白球,摸出白球换为红球后,红球的个数为,则,故;
当时,袋中红白球,摸到红球换白球后,红球的个数为,则,
摸到白球换红球后,红球的个数为,则,故;
当时,袋中红白球,摸到红球换白球后,红球的个数为,则,
摸到白球换红球后,红球的个数为,则,故;
当时,袋中全为红球,摸出红球换为白球后,红球的个数为,则,故;
因此,由全概率公式:
4.一家水果店的店长为了解本店苹果的日销售情况,记录了过去20天苹果的日销售量(单位:kg),按从小到大的排序结果如下:62,74,75,84,84,85,85,85,86,87,89,92,93,94,97,99,101,104,107,117.
(1)求该水果店过去20天苹果日销售量的平均数;
(2)若以过去20天苹果的日销售量的第80百分位数作为下个月每日苹果的平均进货量,试确定下个月每日苹果的平均进货量;
(3)若从过去20天中随机抽取3天,分别求“3天中每天的苹果销售量均超过90kg”与“3天中恰有2天的苹果销售量超过90kg”的概率.
【答案】(1)
(2)
(3),
【分析】(1)根据平均数的定义即可求解;
(2)根据百分位数的定义即可求解;
(3)根据古典概率公式即可求解.
【详解】(1)该水果店过去20天苹果日销售量的平均数.
(2)因为,所以第百分位数为,所以下个月每日苹果的平均进货量为.
(3)20天中苹果销售量超过的有9天.
设“3天中每天的苹果销售量均超过”为事件,“3天中恰有2天的苹果销售量超过”为事件,
则,.
【题型6 正态分布】
1.质监部门从某超市销售的甲、乙两种食用油中各随机抽取100桶检测某项质量指标,由检测结果得到如下的频率分布直方图:
(1)写出频率分布直方图(甲)中的值;记甲、乙两种食用油100桶样本的质量指标的方差分别为,试比较与的大小(只要求写出结果);
(2)在甲、乙两种食用油中各随机抽取1桶,用频率估计概率,求恰有1桶的质量指标大于10且小于40的概率;
(3)由频率分布直方图可以认为,乙种食用油的质量指标值Z服从正态分布.其中近似为样本平均数近似为样本方差,现从乙种食用油中随机抽取10桶,设X表示质量指标值位于的桶数,求X的数学期望.(结果保留两位小数)
注:①同一组数据用该区间的中点值作代表;②若,则.
【答案】(1),
(2)
(3)
【分析】(1)根据矩形的面积和等于列出关于的方程,进而求出的值,再根据频率分布直方图中甲、乙食用油样本质量指标的波动程度,进而比较方差大小.
(2)分别求出在甲、乙两种食用油中抽取1桶,其质量指标位于的概率,然后求出恰有1桶食用油指标位于的概率.
(3)先根据频率分布直方图求出,然后求出从乙种食用油中随机抽取1桶,其质量指标位于的概率,最后根据二项分布的期望公式计算的数学期望.
【详解】(1)由题意,解得.
由频率分布直方图可得.
(2)记事件在甲种食用油中抽取1桶,其质量指标大于且小于.
记事件在乙种食用油中抽取1桶,其质量指标大于且小于.
记事件在甲、乙两种食用油中各随机抽取1桶,恰有1桶其质量指标大于且小于.
则,.
.
(3)由题意.
,又.
,
现从乙种食用油中随机抽取10桶,其质量指标位于的概率为.
,
2.某公司生产的糖果每包标识“净含量500g”,但公司承认实际的净含量存在误差. 已知每包糖果的实际净含量(单位:g)服从正态分布.
(1)随机抽取一包该公司生产的糖果,求其净含量误差超过5g的概率(精确到);
(2)随机抽取3包该公司生产的糖果,记其中净含量小于497.5g的包数为. 求的分布和期望(精确到).
参考数据:,,,其中为标准正态分布函数.
【答案】(1)
(2)
0
1
2
3
0.595
0.337
0.064
0.004
.
【分析】(1)根据正态分布的性质即可求解;
(2)先求任取一包糖果,净含量小于497.5g的概率,服从二项分布,二项分布即可求解.
【详解】(1)由题意,,的概率等于.
令,则.
因此,
.
故净含量误差超过5g的概率约为.
(2)可能的取值为0、1、2、3.
由(1)可知,任取一包糖果,净含量小于497.5g的概率为.
故服从二项分布,记,
,
从而的分布为
0
1
2
3
0.595
0.337
0.064
0.004
因此.
3.某市举行了一次大型宣传活动,结束后组办方分别从7个不同的地方的问卷调查中各随机抽取了相同数量的数据(人均得分)构成一个样本,依据相关标准,该样本中各地抽取的数据构成数列(n为各地区的编号),且由各地的数据可以认为各地人均得分服从正态分布,μ近似为抽取的样本中7个地方人均得分的平均值(得分的平均值四舍五入并取整数).
(1)利用正态分布的知识求.
(2)组办方为此次参加问卷调查的市民制订如下两种奖励方案.
方案一:(ⅰ)得分不低于μ的可以获赠2次随机话费,得分低于μ的可以获赠1次随机话费.
(ⅱ)每次获赠的随机话费和对应的概率为
获赠的随机话费/元
50
100
概率
方案二:参加此次问卷调查的市民可获得价值100元的大型晚会入场券.
参加此次问卷调查的市民可选择其中一种奖励方案.
①市民小李参加了此次问卷调查,他选择了方案一,记X(单位:元)为他获赠的话费,求X的分布列及数学期望.
②仅从奖励的价值考虑,如果你参加了问卷调查,你选择参加获赠随机话费活动,还是获得价值100元的大型晚会入场券?用统计中相关知识做出决策.
(附:若,则,,)
【答案】(1)
(2)①分布列见解析,;②应选择获得价值100元的大型晚会入场券
【分析】(1)根据正态分布曲线的对称性,求出均值,可得答案;
(2)利用3σ原则和正态曲线的对称性即可求解.
【小题1】样本中各地的人均得分分别为,,,,,,,
所以7个地方人均得分的平均值为,即μ可取123,所以.
,
,
所以.
【小题2】①由题意可得X所有可能的取值为50,100,150,200,
得50元的情况为得分低于μ,概率为.
得100元的情况为有1次机会且获得100元或有2次机会且2次均获得50元,概率为
.
得150元的情况为有2次机会且2次机会中有1次获得100元、1次获得50元,概率为
.
得200元的情况为有2次机会且2次均获得100元,概率为.
所以X的分布列为
X
50
100
150
200
P
故.
②由①知,所以应选择获得价值100元的大型晚会入场券.
4.辽宁、广东、河北、湖北、湖南、江苏、福建、重庆等八省市从2021年起全部采用“3+1+2”的新高考模式.“3”指的是语文、数学、外语,这三门科目考试参加统一高考,由教育部考试中心统一命题,以原始成绩计入考生总成绩;“1”指的是物理和历史中的一科,考生必须从物理和历史两个科目中选择一科,由各省自主命题,以原始成绩计入考生总成绩.为了让考生更好的适应新高考模式,某省几个地市进行了统一的高考适应性考试.在所有入考考生中有30000人选考物理,考后物理成绩X(满分100分)服从正态分布.
(1)分别估计成绩在和75分以上者的人数;(运算过程中精确到0.0001,最后结果保留为整数)
附1:,,;
(2)本次考试物理成绩X服从正态分布.令,则η~N(0,1),若本次考试物理成绩的前25%划定为优秀等级,试估计物理优秀等级划线分大约为多少分?(结果保留为整数)
附2:若η~N(0,1),则.
【答案】(1)成绩在的人数约为20481人,75分以上的人数约为684人;
(2)63分
【分析】(1)由题意可得,则可得,从而可估算出成绩在的人数,根据正态分布曲线的对称性求出,从而可估算出成绩在75分以上的人数;
(2)设该划线分为m,由题意可得,,则,从而可求出.
【详解】(1)因为,所以,
又,所以,
所以成绩在的人数约为人,
由正态分布曲线的对称性可得:,
则,
所以估计75分以上的人数约为人;
(2)设该划线分为m,由,得,,
令,
由题意因为η~N(0,1),,
所以,所以,
所以.
【题型7 线性回归】
1.绝对零度()是一个只能逼近而不能达到的最低温度,那么这个数据是如何得到的?小张同学通过查询资料了解到:①气体温度和气体压强存在线性关系;②当气体压强为时,气体温度达到绝对零度.小张同学在实验时,记录了某种气体温度和气体压强一组相关数据:
数据
1
2
3
4
5
6
温度
4.07
16.69
29.42
45.67
57.06
73.05
压强
103.095
107.734
112.461
118.469
122.706
128.758
(1)用上表数据建立气体压强与气体温度的线性回归方程,若这组实验数据的拟合误差小于0.05,则认为得到的线性回归是理想的.求出回归方程(精确到0.001),并判断所得回归方程是否理想?附:拟合误差
(2)估计该次实验下绝对零度的数值.(精确到)
【答案】(1),回归方程是理想的
(2)
【详解】(1),
,
,
将,即代入,
解得
回归方程为 ,
,
因为 ,所以回归方程是理想的.
(2)回归方程为,
令,解得(),
预估该次实验下绝对零度的数值为.
2.某汽车研发公司的工程师为了解一款新型汽车在不同行驶速度x(km/h)下油耗y(L/100km)的变化规律,进行了相关实验,记录不同速度下的油耗数据的散点图如下:
(1)根据散点图求y关于x的经验回归方程(精确到0.01);
(2)根据线性回归方程,绘制残差图,并分析线性回归方程的拟合效果(若残差的平方和小于0.775,则说明拟合效果良好,否则拟合效果较差).
附:,.
【答案】(1)
(2)作图见解析,拟合效果较好
【分析】(1)由图算出和的值,代入最小二乘法公式,得到回归方程;
(2)结合(1)的回归方程,求解出对应数据,列表画图,计算残差,算出其平方和,最后比大小即可.
【详解】(1)由图得,,
则,
故,
则y关于x的经验回归方程为.
(2)结合(1),计算得残差如下表:
行驶速度
60
70
80
90
100
110
油耗实际值
7.5
6.8
6.2
5.7
5.4
5
油耗估计值
7.35
6.85
6.35
5.85
5.35
4.85
残差
0.15
0.05
0.15
因此残差分布图如下:
因为,
所以经验回归方程的拟合效果较好.
3.某车间为了规定工时定额,需要确定加工零件所花费的时间,为此作了次试验,得到数据如下:
零件的个数x(个)
2
3
4
5
加工的时间y(小时)
2.5
3
4
4.5
参考公式:用最小二乘法求线性回归方程系数公式,
(1)求关于的线性回归方程;
(2)求各样本的残差;
(3)试预测加工个零件需要的时间.
【答案】(1);
(2)各样本的残差依次为:0.05,-0.15,0.15,-0.05.
(3)小时.
【分析】(1)根据表中数据求出、、、,进而由参考公式求出线性回归方程;
(2)计算每个对应的预测值,计算残差 ;
(3)将代入回归方程
【详解】(1)
,,
∴所求线性回归方程为.
(2)计算每个对应的预测值:
,
,
,
;
计算残差:
所以,各样本的残差依次为:.
(3)当时,,
∴预测加工个零件需要小时.
4.根据相关研究报告显示,预计年电商交易额突破亿元,网购用户规模接近亿.下表为某网店统计的近个月的利润(单位:万元),其中为月份代号.
月份
2024年12月
2025年1月
2025年2月
2025年3月
2025年4月
月份代号
1
2
3
4
5
利润/万元
8
6.3
5.1
3.2
2.4
(1)依据表中的统计数据,计算样本相关系数(精确到),判断是否可以用线性回归模型拟合与的关系;若可用,求出关于的经验回归方程,并估计年月该网店利润;若不可用,请说明理由;
(2)该专营店为了吸引顾客,推出两种抽奖方案.方案一:一次性购物金额超过元可抽奖三次,每次中奖的概率均为,且每次抽奖互不影响,中奖一次打折,中奖两次打折,中奖三次打折,其余情况不打折.方案二:从装有个形状大小、完全相同的小球(其中红球个,白球个,黑球个)的抽奖盒中,一次性摸出个球,其中奖规则为:若摸出个红球和一个白球打六折,摸出个黑球打八折,其余情况不打折.某顾客计划在此网店购买元的商品,请从实际付款金额的数学期望的角度分析选哪种方案更优惠.
参考:,,
【答案】(1)可以,万元
(2)选择方案二
【分析】(1)求出、的值,将数据代入相关系数公式,求出的值,可得出结论,再将代入经验回归方程,可得出结果;
(2)计算出方案一、二中实际付款金额,比较大小后可得出结论.
【详解】(1)由题意可得,,
,
,
,
所以,,
因为接近于,所以可以用线性回归模型拟合与的关系,
,则,
所以,关于的经验回归方程为,
将代入经验回归方程为,
故估计年月该网点利润估计知为万元.
(2)设方案一的中奖次数为,由题意可知,实际付款金额为万元,
则的可能取值有、、、,
则,,
,,
故,
设方案二实际付款金额为万元,由题意可知,的可能取值有、、,
,,,
故
因为,所以,从实际付款金额的数学期望的角度分析,选择方案二更优惠.
【题型8 非线性回归】
1.某芯片研究团队为制定下一年的研发投入计划,需要了解年研发资金投入量x(单位:亿元)对年销售额(单位:亿元)的影响,结合近12年的年研发资金投入量和年销售额的数据,该团队建立了两个模型:①;②,其中,,,均为常数,为自然对数的底数.经对历史数据的初步处理,得到右侧散点图,如图.令,,计算得如下数据:
20
66
770
200
14
460
4.20
3125000
0.308
21500
(1)设和的相关系数为,和的相关系数为,请从相关系数的角度,选择一个拟合程度更好的模型:
(2)(i)根据(1)的选择及表中数据,建立y关于x的回归方程(系数精确到0.01);
(ii)若下一年销售额y需达到80亿元,预测下一年的研发资金投入量x是多少亿元?(结果精确到0.01)
附:对于一组数据,样本相关系数
回归直线的斜率和截距的最小二乘估计分别为:
,.
【答案】(1)模型②;
(2)(i)(ⅱ)27.1亿元
【分析】(1)计算相关系数,根据相关系数的绝对值大小得出结论;
(2)(i)两边取自然对数,转化为线性回归方程求解,再转化为指数式即可;
(ii)根据(i)的结论预测销售额y达到80亿元时研发投入即可得解.
【详解】(1)由题意表格数据得,
同理,
∵0.86<0.91,即,
则从相关系数的角度,选择模型②的拟合程度会更好.
(2)(i)由(1)得,模型②,可建立关于x的线性回归方程,
则,又,
∴,∴,
∴,即.
(ii)由(i)得,
要使下一年销售额达到80亿元,即,,
∴,解得,
故下一年销售额达到80亿元,预测下一年的研发资金投入量是27.1亿元.
2.中国茶文化博大精深,饮茶深受大众喜爱,茶水的口感与茶叶类型和水的温度有关,某数学建模小组为了获得茶水温度y(单位:)关于时间x(单位:min)的回归方程模型,通过实验收集在室温,用同一温度的水冲泡的条件下,茶水温度随时间变化的7组数据,并对数据做初步处理得到如图所示散点图以及如表所示数据.
73.5
3.85
表中:,
(1)根据散点图判断: ①与②哪一个更适宜作为该茶水温度y关于时间x的经验回归方程类型?(给出判断即可,不必说明理由)
(2)根据(1)的判断结果及表中数据,建立该茶水温度y关于时间x的经验回归方程
(3)已知该茶水温度降至口感最佳,根据(2)中的经验回归方程,求在相同条件下,刚泡好的茶水,大约需要放置多长时间才能达到最佳饮用口感.
附:(1)对于一组数据,…,,其回归直线的斜率和截距的最小二乘估计分别为,
(2)参考数据:,,,,.
【答案】(1)②更适宜
(2)
(3)
【分析】(1)根据散点图选择②;
(2)取对数,再利用最小二乘法公式求出回归直线方程即可;
(3)利用(1)中回归方程,列出关于的方程求解即得.
【详解】(1)由散点图知,点的分布呈现出曲线的趋势,因此更适宜的回归方程为②,即.
(2)由,得,对等式两边取自然对数,得,
令,则,
,
,
结合表中数据,得,
结合参考数据可得,由,得结合参考数据可得,
所以茶水温度y关于时间x的回归方程为.
(3)依题意,室温下,茶水温度降至口感最佳,
即,整理得,
于是,解得,
所以在相同条件下,刚泡好的茶水大约需要放置7.5min才能达到最佳饮用口感.
3.某市开展“安全随我行”活动,交警部门在某个交通路口增设电子眼,并记录了某月该路口连续10日骑电动摩托车未佩戴头盔的人数与天数的情况,对统计得到的样本数据作了初步处理,得到下面的散点图及一些统计量的值.
5.5
8.7
1.9
301
385
79.75
表中,.
(1)依据散点图推断,与哪一个更适合作为未佩戴头盔人数与天数的回归方程类型?(给出判断即可,不必说明理由),并求出所选类型的回归方程;
(2)小张每天上班选择骑电动车或自行车,每月第一天他选择骑电动车或自行车的概率均为,从第二天起,若前一天选择骑电动车,则后一天选择骑自行车的概率为,若前一天选择骑自行车,则后一天选择骑电动车的概率为,每个月按照20个工作日计算,设他在某个月的第个工作日骑自行车上班的概率为.
(i)求数列的通项公式;
(ii)若,都是离散型随机变量,则,若小张该月累计骑自行车上班的次数为,求,保留到小数点后一位.
附:对于一组数据,,,,其回归直线的斜率和截距的最小二乘估计分别为:
,.
【答案】(1)更合适,
(2)(i);(ii)
【分析】(1)根据散点图的形状,可判断更适宜作为未佩戴头盔人数与天数的回归方程类型,将两边取对数,转化为线性回归方程,利用表中的数据和线性回归方程公式求解即可;
(2)(i)由全概率公式可得每个月的第个工作日骑自行车上班的概率的递推关系,通过构造等比数列得到通项公式;(ii)记为第天小张骑自行车上班,为第天小张骑电动车上班,则,利用期望的线性性质得到.
【详解】(1)由图可以判断,更适合作为未佩戴头盔人数与天数的回归方程类型,
由,得到, 因为,
则,
则,
所以,则.
(2)(i)设他在每个月的第个工作日骑自行车上班为事件,
则,,,
由全概率公式可得,
即,则,
且,可知数列是以为首项,公比为的等比数列,
则,所以;
(ii)记为第天小张骑自行车上班,为第天小张骑电动车上班,
则,则,
又,
所以.
4.生物污染是环境污染的主要类型之一,它会对生态环境造成极大的破坏.某种有害昆虫每只的平均产卵数(单位:个)和平均温度(单位:)有关.现收集到此类昆虫的平均产卵数(个)和温度的组观测数据,制成图1所示的散点图.现用两种模型
①,②分别进行拟合.
根据收集到的数据,计算得到如下值:
24
2.9
646
179
422688
62.65
70308
表中,,,;
(1)根据散点图,比较模型①、②,哪个模型比较合适?(无需说明理由),并根据所选择的模型,利用上表中的参考数据,求出关于的回归方程.
(2)根据以往统计,我国南方某地每年平均温度达到以上时此类昆虫会对当地生态环境造成严重破坏,需要人工防治,其他情况均不需要人工防治.设该地每年平均温度达到以上的概率为,该地今后年恰好需要次人工防治的概率为,求取得最大值时对应的概率,并以此估计该地未来年需要人工防治的次数.
附:对于一组数据,,,,其回归直线的斜率和截距的最小二乘估计分别为:,.
【答案】(1)②,
(2),2
【分析】(1)根据散点图可选模型②,再根据题设中的数据和公式可求回归方程;
(2)根据二项分布可求,利用导数可求其最大值;利用二项分布可求期望.
【详解】(1)②,理由如下:由散点图知,呈指数增长,所以模型②的拟合效果更好.
令,则,
则,
所以,
因此关于的线性回归方程为,
所以产卵数关于温度的回归方程为.
(2)由题意得,,
所以
令,得,
故当时,单调递增;
当时,单调递减.
所以取得最大值时对应的概率.
当时,,即每年需要人工防治的概率为,
且服从二项分布.所以,
估计该地未来年需要人工防治的次数为2.
【题型9 相关性分析】
1.某景区试卖一款纪念品,现统计了该款纪念品的定价(单位:元)与销量(单位:百件)的对应数据,如下表所示:
12
12.5
13
13.5
14
14
13
11
9
8
(1)求该纪念品定价的平均值和销量的平均值;
(2)计算与的相关系数;
(3)由(2)的计算结果,判断能否用线性回归模型拟合与的关系,并说明理由.
参考数据:.
参考公式:相关系数.
【答案】(1)13;11
(2)
(3)可以用线性回归模型拟合与之间的关系,理由见解析
【分析】(1)根据已知数据直接求平均值即可;
(2)分别求出和,再代入公式即可求解;
(3)根据相关系数的绝对值大于0.75且非常接近1判断即可.
【详解】(1)由题可知,;
(2)计算得,
故;
(3)由(2)可知,与的相关系数的绝对值近似为0.992,大于0.75且非常接近1,
说明与的线性相关性很强,从而可以用线性回归模型拟合与之间的关系.
2.某地用简单随机抽样的方法抽取15个村进行验收调查,调查得到的样本数据,其中和分别表示第个村中村户的年平均收入(单位:万元)和产业资金投入数量(单位:万元),并计算得到,,,,.
(1)试估计该地被调查村的村户年平均收入;
(2)根据样本数据,求该地被调查村中村户年平均收入与产业资金投入的相关系数;(精确到0.01)
(3)根据现有统计资料,各被调查村产业资金投入差异很大.为了准确地进行验收,请给出一种你认为更合理的抽样方法,并说明理由.
【答案】(1)(万元)
(2)
(3)采用分层抽样,理由见解析
【分析】(1)利用样本平均数的计算公式求解即可,(2)利用样本平均数的计算公式求解即可.(3)结合题意根据调查总体的分布特征选择分层抽样进行调查即可.
【详解】(1)该地被调查村的村户年平均收入的估计值为(万元);
(2)样本的相关系数为
;
(3)采用分层抽样,理由如下:
由(2)知被调查村的村户年平均收入与该村的产业投入资金有很强的正相关性,
由于各被调查村产业资金投入差异很大,因此被调查村的村户年平均收入差异也很大,
所以采用分层抽样的方法较好地保持了样本结构与总体结构得以执行,提高了样本的代表性,从而可以获得该地更准确的验收估计.
3.某公司研发了一款新型智能机器人,一经投放市场颇受欢迎,为了更好地服务广大用户,该公司对这款机器人的某个性能指数x()与用户的喜欢程度y()进行调查统计,得到如下数据表:
x
5
6
7
8
9
y
0.55
0.50
0.60
0.65
0.70
(1)请根据上表提供的数据,利用相关系数r,判断该性能指数与用户的喜欢程度的相关性强弱(当时,x与y的相关性很强);
(2)这款智能机器人的交互性很强,用户可通过语音给机器人发布指令,机器人执行命令的正确率为90%,出错率为10%.当机器人正确执行命令时,使用者满意的概率为90%;当机器人执行命令错误时,使用者满意的概率为30%.如果使用者对某次命令执行结果不满意,求机器人实际正确执行命令的概率(精确到0.01);
(3)该公司科技人员随机抽取一台这款智能机器人进行挑战答题,共准备了4道高难度的问题,若机器人答对的题数不小于3,则挑战成功.已知机器人答对前两道题的概率均为p,答对后两道题的概率均为q,每次答题结果互不影响.当时,求机器人挑战成功的概率的最大值.
附:相关系数.
【答案】(1)该性能指数与用户的喜欢程度的相关性很强
(2)
(3)
【分析】(1)由题意计算出样本均值以及方差、协方差的求和项,代入相关系数公式求出r,并结合给定的判断区间得出结论.
(2)先利用全概率公式求出“使用者对结果不满意”的总概率,再利用条件概率公式逆向推导出在“不满意”前提下“实际正确执行”的概率.
(3)根据独立事件乘法公式列出“挑战成功”的概率解析式,利用已知条件进行代数消元与换元将其转化为一元二次函数,由二次函数的性质即可求得最值.
【详解】(1)由题意知,,,
,
,.
所以
所以该性能指数与用户的喜欢程度的相关性很强.
(2)记事件:机器人正确执行命令;事件:使用者对执行结果满意,则
,,,.
所以,
所以,
故如果使用者对某次命令执行结果表示不满意,机器人实际正确执行命令的概率约为.
(3)设事件:机器人挑战成功,则
.
由,得 .令,
因为,,所以,所以
设,当,即或时,.
所以当时,机器人挑战成功的概率的最大值为.
4.某新能源汽车公司为研究电池容量对续航里程的影响,随机选取了10辆不同配置的车进行测试,测量每辆车的电池容量(单位:)和续航里程(单位:),得到如下数据:
样本号
1
2
3
4
5
6
7
8
9
10
总和
电池容量
35
40
45
50
55
65
70
75
80
85
600
续航里程
330
350
390
410
480
520
560
620
640
700
5000
并计算得.
(1)估计这10辆车的平均电池容量与平均续航里程;
(2)求电池容量与续航里程的样本相关系数;(精确到0.001)
(3)现该公司计划推出新款车型,电池容量为,已知续航里程与电池容量近似成正比,利用以上数据给出新款车型续航里程的估计值.(精确到1)
附:相关系数.
【答案】(1)平均电池容量,平均续航里程.
(2)0.995
(3)
【详解】(1)平均电池容量,
平均续航里程.
(2)
(3)由样本数据,可知续航里程与电池容量的比值约为,
故新款车型续航里程的估计值为.
【题型10 独立性检验】
1.直播带货是一种直播和电商相结合的销售手段,目前已被广大消费者所接受.针对这种现状,某公司决定逐月加大直播带货的投入,直播带货金额稳步提升,以下是该公司年前个月的带货金额:
月份
带货金额万元
(1)求关于的线性回归方程,并据此预测年月份该公司的直播带货金额;
(2)该公司随机抽取人进行问卷调查,得到如下不完整的列联表:
参加过直播带货
未参加过直播带货
总计
女性
男性
总计
请填写上表,并判断是否有的把握认为参加直播带货与性别有关?
参考公式:,;
,其中.
0.025
0.010
0.005
0.001
5.024
6.635
7.879
10.828
【答案】(1)
关于的线性回归方程为,预测年月份该公司直播带货金额为万元;
(2)
列联表见解析,有的把握认为参加直播带货与性别有关。
【分析】(1)先计算样本均值,代入回归系数公式求得线性回归方程,再将代入方程得到预测值;
(2)先根据已知数据补全列联表,再计算卡方统计量,与临界值对比判断是否存在相关性.
【详解】(1)由题意,得,。
根据参考数据,得,,则 ,
, 因此关于的线性回归方程为,
年月对应,代入得(万元),即预测月带货金额为万元.
(2)由题意,补全列联表如下:
参加过直播带货
未参加过直播带货
总计
女性
男性
总计
代入卡方公式,得,
由于,对应,因此有的把握认为参加直播带货与性别有关.
2.为了研究高三学生每天整理数学错题的情况,某校数学建模兴趣小组的同学在本校高三年级学生中采用随机抽样的方法抽取了40名学生,调查他们平时的数学成绩和整理数学错题的情况,现统计得部分数据如下:
数学成绩总评优秀人数
数学成绩总评非优秀人数
合计
每天都整理数学错题人数
14
不是每天都整理数学错题人数
15
20
合计
40
(1)完成上述样本数据的列联表,并计算:每天都整理数学错题且数学成绩总评优秀的经验概率;
(2)是否有的把握认为“数学成绩总评优秀与每天都整理数学错题有关”?
(3)从不是每天都整理数学错题的学生中随机抽取3名学生做进一步访谈,设恰好抽取到数学成绩总评优秀的人数为,求的分布列和期望.
附:;
0.10
0.01
0.001
2.706
6.635
10.828
【答案】(1)列联表如下:
数学成绩总评优秀人数
数学成绩总评非优秀人数
合计
每天都整理数学错题人数
14
6
20
不是每天都整理数学错题人数
5
15
20
合计
19
21
40
每天都整理数学错题且数学成绩总评优秀的经验概率为0.35.
(2)有的把握认为“数学成绩总评优秀与每天都整理数学错题有关”.
(3)的分布列如下表:
0
1
2
3
期望为.
【分析】(1)完善列联表,求出经验概率;
(2)求出的观测值,与临界值比对得解;
(3)求出的可能值及对应概率,列出分布列并求出期望.
【详解】(1)完善列联表如下:
数学成绩总评优秀人数
数学成绩总评非优秀人数
合计
每天都整理数学错题人数
14
6
20
不是每天都整理数学错题人数
5
15
20
合计
19
21
40
每天都整理数学错题且成绩优秀的人数为14,总样本数为40,因此经验概率为.
(2)由(1)得 ,
所以有的把握认为“数学成绩总评优秀与每天都整理数学错题有关”.
(3)不是每天都整理数学错题的学生有20人,其中数学成绩总评优秀人数为5,
的所有可能值为0,1,2,3,
,
,
所以的分布列如下表:
0
1
2
3
期望.
3.某科技公司共有员工人,其中男员工人,女员工人.为推广一款新工作软件,在全体员工中随机抽取人进行调查,得到他们对该软件的接受与否如下表:
接受
不接受
合计
男性
女性
合计
(1)是否有的把握认为该科技公司“性别与是否接受该软件”有关联;
(2)将样本中男性和女性对这款新工作软件各自的接受率作为总体中相应性别的接受率的估计.现从该公司所有员工中随机地取人,设事件为“员工接受该软件”,事件为“员工为女性”.
①求(精确到小数点后位):
②若该员工接受软件,求该员工为女性的概率(精确到小数点后位).
(参考公式:)
【答案】(1)没有的把握认为该科技公司“性别与是否接受该软件”有关联
(2)①;②
【分析】(1)根据列联表中的数据计算,与比较大小,得出结论.
(2)①根据题意得出,,,,利用全概率公式即可求解;②利用条件概率公式即可求解.
【详解】(1)提出原假设:“性别与是否接受该软件”无关
计算
由于,而,
因此没有95的把握认为该科技公司“性别与是否接受该软件”有关联.
(2)①由题意,,则,
,,
因此
②由题意,.
4.某商场为了解顾客购买手机的意愿,随机调查了位顾客购买手机的情况,得到数据如下表.
购买手机
购买无技术的手机
总计
男性顾客
女性顾客
总计
(1)根据表中数据,判断是否有的把握认为购买手机与顾客的性别有关?并说明理由;
(2)从这位男性顾客中随机挑选位,求其中至少有位购买手机的概率(精确到);
(3)为促进手机的销量,该商场为购买手机的顾客设置了抽奖环节,共设一、二等奖两种奖项,分别奖励元、元手机话费,抽中一、二等奖的概率分别为和,其余情况不中奖.每位顾客允许连续抽奖两次,且两次抽奖相互独立.记某位顾客两次抽中的奖金之和为元,求随机变量的数学期望.
参考公式及数据:①,其中.
②,,,.
【答案】(1)有的把握认为购买手机与顾客的性别有关,理由见解析
(2)
(3)
【分析】(1)根据题设中的数据计算,结合临界值表可判断的把握认为购买手机与顾客的性别有关;
(2)利用对立事件可求至少有位购买手机的概率;
(3)先求出的分布列,再根据期望公式可求,或者利用独立事件的期望公式求出.
【详解】(1)作原假设:购买手机与顾客的性别无关,取,
根据题意,代入数据,得 ,
因为,所以否定原假设,即有的把握认为购买手机与顾客的性别有关.
(2)由题意得.
(3)解法一:由题意得,随机变量的可能取值为 ,
而,,
,,
,,
故的分布列为
期望.
解法二:设第次抽中奖金为(),则,
由题设可得()的分布列为
从而,而,相互独立,
故.
1.已知常数,在成功概率为的伯努利试验中,记为首次成功时所需的试验次数,的取值为所有正整数,此时称离散型随机变量的概率分布为几何分布.经计算:.对于几何分布的拓展问题,在成功概率为的伯努利试验中,记首次出现连续两次成功时所需的试验次数的期望为,现提供一种求的方式:先进行第一次试验,若第一次试验失败,因为出现试验失败对出现连续两次成功毫无帮助,可以认为后续期望仍是,即总的试验次数为;若第一次试验成功,则进行第二次试验,当第二次试验成功时,试验停止,此时试验次数为2,若第二次试验失败,相当于重新试验,此时总的试验次数为,则的值为( )
A. B. C. D.
【答案】C
【分析】根据发生的三种可能情况,即可求解.
【详解】由条件可知,,
解得:.
故选:C
2.某公司员工食堂每天都有米饭和面食两种套餐,已知员工甲每天中午都会在这两种套餐中选择一种,米饭套餐的价格是每份18元,面食套餐的价格是每份12元,如果甲当天选择了某种套餐,他第二天会有60%的可能性换另一种类型的套餐,假如第1天甲选择了米饭套餐,第n天选择米饭套餐的概率为,给出以下论述:
①;
②;
③
④前天甲午餐总费用的数学期望为.
其中正确的是( )
A.②③④ B.①②④ C.①③④ D.①②③
【答案】B
【分析】先根据题意找到递推式,即可判断②,由递推式可求出,从而判断③,根据期望公式,期望的性质以及,即可判断④.
【详解】若甲在第天选择了米饭套餐,那么在第天有的可能性选择米饭套餐,
甲在第天选择了面食套餐,那么在第天有的可能性选择米饭套餐,
所以第天选择米饭套餐的概率,故②正确;
因为,所以甲在第1天选择了米饭套餐,所以,故①正确;
由②得,,所以,
又由题意得,,是以为首项,为公比的等比数列,
所以,所以,故③错误;
前天甲午餐总费用的数学期望为,故④正确.
故选:B.
3.某挑战赛设置了个连续关卡,分别记为第1关卡,第2关卡,⋯,第关卡,每个参赛团队的选手人数均为,每2名选手组成一个双人挑战组,共个双人挑战组,每个关卡均由其中1个双人挑战组进行挑战,各关卡参赛选手均不相同,关卡挑战从第1关卡开始依次挑战,每个关卡至少有1名选手挑战成功(即该关卡挑战成功),才能进入下一个关卡的挑战.若某参赛团队这个连续关卡均挑战成功,则该参赛团队的挑战赛通关.已知参赛团队的每名选手挑战成功的概率均为,且各选手的挑战结果相互独立,若在挑战赛通关的情况下,记内挑战不成功的选手总人数为,则__________.
【答案】8
【分析】求出双人挑战组关卡挑战成功的概率,再结合条件概率公式求出每个关卡挑战不成功人数的期望,进而列式求解.
【详解】依题意,当参赛团队挑战赛通关时,每个关卡至少有1名选手挑战成功,
在挑战赛通关的情况下,设第个双人挑战组的挑战不成功的选手人数为,
的可能值为,挑战不成功的选手总人数,于是,
双人挑战组关卡挑战成功的概率,则,
,,
所以.
4.甲、乙、丙三人相互做传球训练,每次传球时,传球者都等可能地将球传给另外两个人中的任何一人.若第一次由甲传出,共传5次结束,记表示5次传球过程中,甲接到球的总次数,则X的数学期望________.
【答案】
【分析】记第次传球后球在甲手中的概率为,则不在甲手中的概率为,所以第次传球后球在甲手中,当且仅当第次传球后球不在甲手中,且传球者将球传给甲,所以,根据题意可求出,因为每一次传球后球在甲手中的次数都服从两点分布,根据期望的线性性质可求得.
【详解】记第次传球后球在甲手中的概率为,则不在甲手中的概率为,所以第次传球后球在甲手中,当且仅当第次传球后球不在甲手中,且传球者将球传给甲,所以,
根据题意第一次由甲传出,所以第一次传球后球肯定不在甲手中,所以,
又共传5次结束,
所以.
记为示性变量,当第次传球后球在甲手中时,否则,即每次传球后球在甲手中的次数服从两点分布,
所以,
所以
.
故答案为:.
5.针对赛制对“强者”和“弱者”的影响进行建模分析.
设参赛人数为n(为2的幂次,如4,8,16),假设每场比赛只有两种可能结果:胜或负(忽略平局).各场比赛的结果相互独立.
赛制一、单败淘汰制:参赛者两两对决,胜者晋级,负者直接淘汰,直到决出冠军.
赛制二、双败淘汰制:参赛者随机分组进行初赛,胜者组、负者组分别组内随机抽签比赛,胜者组失败者掉入负者组,负者组失败者被淘汰,胜者组冠军和负者组冠军进行总决赛.
以4人为例,如图:
赛制三、单循环赛制:每位参赛者与其他所有参赛者都进行一场比赛.最终按总积分(或胜场数)排名.总积分(或胜场数)最高者为冠军(若积分相同再比较其他规则).
假设在强者(只有一人)与弱者单场比赛中,p为“强者”战胜“弱者”的概率.弱者实力均等,他们之间比赛时胜率均为r.表示“强者”最终赢得冠军的概率.
(1)当,,时,求赛制一、赛制二相应的;
(2)针对赛制三,、分别表示“强者”、“弱者”的胜场数,写出、;当,,时,计算并说明“强者”稳定夺冠的因素;
(3)评价三种赛制对“强者”和“弱者”的影响.
【答案】(1)
(2)强者一共打场比赛,,;
一个弱者打场比赛,对阵强者,赢的概率为,对阵其他个弱者(弱者之间
比赛胜率为),所以.
当,,时,
,
对于强者,,所以,即总是成立的.
强者要稳定夺冠,需要显著大于,实力差距越大,参赛人数越多,
强者预期胜场领先优势就越大.
(3)①时,若,,
若时,,
若,,则(约),
单败淘汰制对弱者最有利,原因在于强者需要连续赢下多场比赛(场),任何一
场失败(即使概率很小)都会导致其被淘汰.爆冷可能性随着比赛场次的增加而显著累积.
在同样条件()下,双败淘汰制的大于单败淘汰制的.
②双败淘汰制比单败淘汰制更有利于强者.原因在于双败淘汰制给了强者一次犯错(输一场)的机会.
对于实力顶尖的选手(很大),双败淘汰制显著优于单败淘汰制.它大大降低了强者因
单场意外失利而早早出局的风险.但对于实力中游的选手,双败淘汰制可能增加了他们遭
遇顶尖强者的次数(从胜者组掉下来后要在败者组打更多比赛),反而可能不利.
双败淘汰制比单败淘汰制更有利于真正的顶尖强者稳定夺冠,降低了冷门的总体影响.
③单循环赛制最有利于强者,原因在于比赛场次多(场),根据大数定律和中心极限
定理,实力更强()的选手在大量比赛中,其胜率会稳定地表现出来,极大地减
少了单场爆冷对最终排名的影响.强者有较多的机会证明自己的实力,弱者爆冷胜利(即
使发生)对强者最终积分的影响被稀释了.代价是比赛场次过多,时间成本高,不适合大
规模参赛.
【分析】(1)利用独立事件乘法、互斥事件加法公式求获得冠军的概率;
(2)分别求出不同赛制下获得冠军的概率,再作差即可比较大小;
(3)根据题意,计算出三种赛制单败淘汰制、双败淘汰制、单循环赛制下的值,据此判断即可.
【详解】(1)单败淘汰赛中,任何一场失利都意味着出局,
强者必须赢得其参加的所有场比赛才能夺冠,
当,时,.
双败淘汰制中,当,时,参赛者中不妨设强者为,
其赢得冠军有三种情况:
情况1、全胜(不输任何一场)夺冠,赢下参加的三场比赛:第一轮初赛、胜者组决
赛、总决赛,概率为;
情况2、在小组初赛输一次,但后面比赛中全胜,概率为;
情况3、在小组初赛胜,在胜者组初赛输一次,但在后面比赛中全胜,
所以.
(2)略
(3)略
6.已知一个不透明的盒中有个小球(小球除编号不同外其余均相同),这个小球的编号分别为1,2,3,…,(,).现进行如下摸球活动:
(1)若,从盒中一次性摸取2个小球,求这2个小球编号不相邻的概率;
(2)如果摸球前约定“固定重叠原则”:即随机摸取盒中个小球(,),记录编号后放回,再重复以上操作一次,记这两次操作中被重复摸取的小球数为.
(ⅰ)若,,求概率;
(ⅱ)求使概率取得最大值时m的值.
【答案】(1);
(2)(ⅰ);(ⅱ).
【分析】(1)先找出编号相邻的情况有4种.用组合数算出从5个里选2个的总情况数,再用1减去编号相邻的概率,就得到不相邻概率.
(2)(i)运用古典概型,结合组合数计算得到概率.
(ii)先确定“”的事件总数,再得出表达式.通过与1比较大小,得到的范围.比较和、大小.最后根据能否被整除,得出取最大值时的值.当时,也符合不能整除的情况.
【详解】(1)编号相邻的可能有“1,2”、“2,3”、“3,4”、“4,5”四种可能,所以2个小球编号不相邻的概率为.
(2)(ⅰ).
(ⅱ)当时,整数m满足,其中为0和的较大者,即.
“”所包含的事件总数为,
∴,
设,
.
令.
①当时,(比较与k大小)
②当时,(比较与大小)
∴.
则当能被整除即时,在或处达到最大值:
当不能被整除即时,在(表示不超过x的最大整数).
当时,只能取,此时符合上述不能被整除的情况.
综上:使概率取得最大值时.
1.江先生每天9点上班,上班通常开私家车加步行或乘坐地铁加步行,私家车路程近一些,但路上经常拥堵,所需时间(单位:分钟)服从正态分布,从停车场步行到单位要6分钟;江先生从家到地铁站需要步行5分钟,乘坐地铁畅通,但路线长且乘客多,所需时间(单位:分钟)服从正态分布,下地铁后从地铁站步行到单位要5分钟,从统计的角度出发,下列说法中合理的有( )
参考数据:若,则,,
A.若出门,则开私家车不会迟到
B.若出门,则乘坐地铁上班不迟到的可能性更大
C.若出门,则乘坐地铁上班不迟到的可能性更大
D.若出门,则乘坐地铁几乎不可能上班不迟到
【答案】D
【分析】对于A,由即可判断;对于BC,分别计算开私家车及乘坐地铁不迟到的概率即可判断;对于D,计算即可判断
【详解】对于A,当满足时,
江先生仍旧有可能迟到,只不过发生的概率较小,故A错误;
对于,若出门,
①江先生开私家车,
当满足时,
此时江先生开私家车不会迟到;
②江先生乘坐地铁,
当满足时,
此时江先生乘坐地铁不会迟到;
此时两种上班方式,江先生不迟到的概率相当,故B错误;
对于C,若出门,
①江先生开私家车,
当满足时,
此时江先生开私家车不会迟到;
②江先生乘坐地铁,
当满足时,此时江先生乘坐地铁不会迟到;
此时两种上班方式,显然江先生开私家车不迟到的可能性更大,故C错误;
对于D,若出门,
江先生乘坐地铁上班,
当满足时,江先生乘坐地铁不会迟到,
此时不迟到的可能性极小,故江先生乘坐地铁几乎不可能上班不迟到,故D正确.
故选:D.
2.一只小虫从数轴上的原点出发爬行,若一次爬行过程中,小虫等概率地向前或向后爬行1个单位,设爬行次后小虫所在位置对应的数为随机变量,则下列说法错误的是( )
A. B.
C. D.
【答案】C
【分析】由题意可知,且小虫向前或向后爬行1个单位的概率均为,结合二项分布求概率,然后逐个分析判断即可.
【详解】由题意可知,爬行次后小虫所在位置对应的数为随机变量,且小虫向前或向后爬行1个单位的概率均为,
所以设爬行后小虫一共向前爬行次,则向后爬行,
所以,
所以,
对于AB,的分布列为
…
…
…
…
所以,所以A正确,
因为
,
所以
,所以B正确,
对于C,因为,
所以,所以,所以C错误,
对于D,因为,
所以,
所以,所以D正确,
故选:C
3.飞行棋是一种家喻户晓的竞技游戏,玩家根据骰子(骰子为均匀的正六面体)正面朝上的点数确定飞机往前走的步数,刚好走到终点处算“到达”,如果玩家投掷的骰子点数超出到达终点所需的步数,则飞机须往回走超出点数对应的步数.在一次游戏中,飞机距终点只剩3步(如图所示),设该玩家到达终点时投掷骰子的次数为,则__________.
【答案】
【分析】先确定的分布列,再结合错位相减法及无穷数列的和求期望.
【详解】每次投掷,到达终点的概率为,不能到达终点的概率为,
,,,,
,
设①,
②,
则①②得
,
所以,
所以.
4.在维空间中,以单位长度为边长的“立方体”的顶点坐标可表示为维坐标,其中.定义:在维空间中两点与的曼哈顿距离为.在维“立方体”的顶点中任取两个不同的顶点,记随机变量为所取两点间的曼哈顿距离,则__________.
【答案】
【分析】先确定样本点总数,再得到的可能取值,求出概率,列出分布列,求出期望.
【详解】对于维坐标,其中.即有两种选择,
故共有种选择,即维“立方体”的顶点个数是个顶点;
当时,在坐标与中有个坐标值不同,即有个坐标值满足,剩下个坐标值满足,
则满足的个数为.
所以.
故分布列为:
则.
故答案为:.
5.设正方体的棱长为1,记该正方体的8个顶点构成集合.
(1)从集合中有放回地随机抽取两个点、,令随机变量为向量模长的平方,求的分布及期望;
(2)从集合中随机抽取四个不同的点、、、,设事件:,事件:,求和.
【答案】(1)分布列为
0
1
2
3
(2)
【分析】(1)可取,分别求解概率即可得出分布列,再根据期望公式计算即可;
(2)由题意分别求得,根据古典概型概率公式及条件概率公式即可求解.
【详解】(1)由题可知,,可取,
则,
,
,
,
则的分布为
0
1
2
3
则.
(2)由题可知,满足的情况共有种(即12条棱,且与不同),
再从剩下6个点中取2个点作为,由种,
则,
则,
分析满足的情况:①若,
先选取正方体的一条棱作为,共有种不同选法,
再从剩下的棱中选取一条棱作为,共有种不同选法,
所以此种情况共有种情况;
②若,若选取作为,则只能是,有2种选法,
因为共有条面对角线,即共有种情况,
所以此种情况共有种情况;
所以,
所以;
由上述可知,(即分类①),
所以.
6.不透明的口袋中装有编号分别为的个小球,小球除编号外完全相同.现从中有放回地任取次,每次取1个球,记取出的个球的最大编号为随机变量,则称服从参数为的“”分布,记为.
(1)若,求;
(2)若,且,求的最小值;
(3)若,求:当且的值.
【答案】(1)
(2)3
(3)
【分析】(1)根据组合数和独立事件乘法公式即可得到答案;
(2)计算得,再利用期望公式得,再根据的单调性即可得到最小值;
(3)利用期望公式即可求.
【详解】(1)由,得
(2)由,得.
则
.
令,得.
又在上单调递减,
且,
故的最小值为3.
(3)由,得
,
所以
.
1 / 2
学科网(北京)股份有限公司
$