第11章 高考解答题专项突破(6) 概率与统计的综合问题-【金版教程】2026年高考数学一轮复习解决方案全书word(基础版)
2025-11-24
|
24页
|
45人阅读
|
2人下载
教辅
资源信息
| 学段 | 高中 |
| 学科 | 数学 |
| 教材版本 | - |
| 年级 | 高三 |
| 章节 | - |
| 类型 | 教案-讲义 |
| 知识点 | 计数原理与概率统计 |
| 使用场景 | 高考复习-一轮复习 |
| 学年 | 2026-2027 |
| 地区(省份) | 全国 |
| 地区(市) | - |
| 地区(区县) | - |
| 文件格式 | DOCX |
| 文件大小 | 279 KB |
| 发布时间 | 2025-11-24 |
| 更新时间 | 2025-11-24 |
| 作者 | 河北华冠图书有限公司 |
| 品牌系列 | 金版教程·高考一轮复习 |
| 审核时间 | 2025-06-16 |
| 下载链接 | https://m.zxxk.com/soft/52587723.html |
| 价格 | 4.00储值(1储值=1元) |
| 来源 | 学科网 |
|---|
内容正文:
[考情分析] 概率与统计的综合问题是高考的热点,一般以解答题形式考查,通常以考查随机事件的概率、相互独立事件、样本的数字特征、离散型随机变量的分布列、期望及方差、回归分析、独立性检验为主,有时也与函数、数列、不等式等知识综合考查.
概率与独立性检验的综合
(2025·河北邯郸模拟)某地元宵节举行了灯展活动,为了解观众对该活动的观感情况(“一般”或“激动”),现从该活动现场的观众中随机抽取100名,得到下表:
性别
观感情况
合计
一般
激动
男性
45
60
女性
12
合计
100
(1)补全上面的2×2列联表,并依据小概率值α=0.1的独立性检验,能否认为观众对该活动的观感情况与性别有关?
(2)该活动现场还举行了有奖促销活动,凡当天消费每满100元,可抽奖一次.抽奖方案是:从装有3个红球、3个白球和4个黑球(形状、大小、质地完全相同)的抽奖箱里一次性摸出2个球,若摸出2个红球,则可获得100元现金的返现;若摸出1个红球,则可获得50元现金的返现;若没摸出红球,则不能获得任何现金返现.若某观众当天消费200元,记该观众参加抽奖获得的返现金额为X,求X的分布列和数学期望.
附:χ2=,其中n=a+b+c+d.
α
0.100
0.050
0.010
0.001
xα
2.706
3.841
6.635
10.828
解:(1)补全2×2列联表如下:
性别
观感情况
合计
一般
激动
男性
15
45
60
女性
12
28
40
合计
27
73
100
零假设为H0:观众对该活动的观感情况与性别无关.
根据表中数据,计算得χ2=≈0.304<2.706.
根据小概率值α=0.1的独立性检验,没有充分证据推断H0不成立,因此我们可以认为H0成立,即认为观众对该活动的观感情况与性别无关.
(2)设“一次摸球摸出2个红球”为事件A,“摸出1个红球”为事件B,“没摸出红球”为事件C,
则P(A)==,P(B)==,
P(C)==.
由题意,X的可能取值为200,150,100,50,0.
P(X=200)=×=,
P(X=150)=2××=,
P(X=100)=×+2××=,
P(X=50)=2××=,
P(X=0)=×=.
所以X的分布列为
X
200
150
100
50
0
P
E(X)=200×+150×+100×+50×+0×=60.
此类题目虽然涉及的知识点较多,但每个知识点考查的深度有限,所以解决此类问题,最主要的是正确掌握概率与统计的基本知识,并能对这些知识点进行有效的融合,把统计图表中的量转化为概率或分布列求解中有用的量是解决此类问题的关键.
1.一种疫苗在正式上市之前要进行多次人体临床试验接种,假设每次接种之间互不影响,每人每次接种成功的概率相等.某医学研究院研究团队研发了一种疫苗,并率先对此疫苗开展了Ⅰ期和Ⅱ期临床试验.Ⅰ期试验为了解疫苗接种剂量与接种成功之间的关系,选取了两种剂量接种方案(0.5 mL/次剂量组(低剂量)与1 mL/次剂量组(中剂量)),临床试验免疫结果对比如下:
剂量
接种结果
合计
接种成功
接种不成功
0.5 mL/次剂量组
28
8
36
1 mL/次剂量组
33
3
36
合计
61
11
72
(1)根据数据说明哪种方案接种效果好,并依据小概率值α=0.1的独立性检验,能否认为该疫苗接种成功与否与两种剂量接种方案有关?
(2)若以数据中的频率为概率,从两组不同剂量组中分别抽取1名试验者,以X表示这2人中接种成功的人数,求X的分布列和数学期望.
附:χ2=,其中n=a+b+c+d.
α
0.40
0.25
0.15
0.10
0.050
0.025
0.010
0.001
xα
0.708
1.323
2.072
2.706
3.841
5.024
6.635
10.828
解:(1)0.5 mL/次剂量组(低剂量)接种成功的概率为=,1 mL/次剂量组(中剂量)接种成功的概率为=,
因为>,
所以1 mL/次剂量组(中剂量)接种效果好.
零假设为H0:该疫苗接种成功与否与两种剂量接种方案无关.
由2×2列联表得χ2=≈2.683<2.706,
依据小概率值α=0.1的独立性检验,没有充分证据推断H0不成立.
因此我们可以认为H0成立,即认为该疫苗接种成功与否与两种剂量接种方案无关.
(2)X的所有可能取值为0,1,2,
P(X=0)=×=,
P(X=1)=×+×=,
P(X=2)=×=,
所以X的分布列为
X
0
1
2
P
E(X)=0×+1×+2×=.
概率与经验回归方程的综合
(2025·广东深圳模拟)我国在芯片领域的短板有光刻机和光刻胶,某风险投资公司准备投资芯片领域,若投资光刻机项目,据预期,每年的收益率为30%的概率为p,收益率为-10%的概率为1-p;若投资光刻胶项目,据预期,每年的收益率为30%的概率为0.4,收益率为-20%的概率为0.1,收益率为零的概率为0.5.
(1)已知投资以上两个项目,获利的期望是一样的,请你从风险角度考虑,为该公司选择一个较稳妥的项目;
(2)若该风险投资公司准备对以上你认为较稳妥的项目进行投资,4年累计投资数据如下表:
年份x
2021
2022
2023
2024
μ
1
2
3
4
累计投资金额y/亿元
2
3
5
6
请根据上表提供的数据,用最小二乘法求出y关于μ的经验回归方程=μ+,并预测到哪一年年末,该投资公司在芯片领域的投资收益预期能达到0.75亿元.
附:收益=投入的资金×获利的期望;经验回归方程=x+中,==,=-.
解:(1)若投资光刻机项目,设收益率为X,则X的分布列为
X
0.3
-0.1
P
p
1-p
所以E(X)=0.3p+(-0.1)(1-p)=0.4p-0.1.
若投资光刻胶项目,设收益率为Y,则Y的分布列为
Y
0.3
-0.2
0
P
0.4
0.1
0.5
所以E(Y)=0.3×0.4+(-0.2)×0.1+0×0.5=0.1.
因为投资以上两个项目,获利的期望是一样的,
所以0.4p-0.1=0.1,
所以p=0.5.
因为D(X)=(0.3-0.1)2×0.5+(-0.1-0.1)2×0.5=0.04,
D(Y)=(0.3-0.1)2×0.4+(-0.2-0.1)2×0.1+(0-0.1)2×0.5=0.03,
所以E(X)=E(Y),D(X)>D(Y),这说明光刻机项目和光刻胶项目获利相等,但光刻胶项目更稳妥.
综上所述,建议该风险投资公司投资光刻胶项目.
(2)因为==2.5,==4,
μiyi=1×2+2×3+3×5+4×6=47,
μ=12+22+32+42=30,
所以===1.4,
=-=4-1.4×2.5=0.5,
故经验回归方程为=1.4μ+0.5.
设该公司在芯片领域的投资收益为Z,则由Z=0.1×(1.4μ+0.5)≥0.75,解得μ≥5,故到2025年年末,该投资公司在芯片领域的投资收益预期能达到0.75亿元.
概率与经验回归方程的综合常涉及概率、分布列、离散型随机变量的数字特征、二项分布、超几何分布及经验回归方程等知识,主要考查学生的阅读能力、数据处理能力、运算求解能力及应用意识.
2.(2025·福建南平模拟)某大型商场的所有饮料自动售卖机在一天中某种饮料的销售量y(单位:瓶)与天气温度x(单位:℃)有很强的相关关系,为能及时给饮料自动售卖机添加该种饮料,该商场对天气温度x和饮料的销售量y进行了数据收集,得到下面的表格:
x
10
15
20
25
30
35
40
y
4
16
64
256
2048
4096
8192
经分析,可以用y=a·2kx作为y关于x的经验回归方程.
(1)根据表中数据,求y关于x的经验回归方程(结果精确到0.01);
(2)若饮料自动售卖机在一天中不需添加饮料的记1分,需添加饮料的记2分,每台饮料自动售卖机在一天中需添加饮料的概率均为,在商场的所有饮料自动售卖机中随机抽取3台,记总得分为随机变量X,求X的分布列与数学期望.
参考公式及数据:对于一组数据(x1,y1),(x2,y2),…,(xn,yn),经验回归方程=x+的斜率和截距的最小二乘估计公式分别为=,=-;=25, (xi-)2=700.
解:(1)设z=log2y,m=log2a,由y=a·2kx,可得z=log2y=kx+log2a=kx+m,
因为log24=2,log216=4,log264=6,log2256=8,log22048=11,log24096=12,log28192=13,
所以==8,
又=25,
则 (xi-)(zi-)=xizi-7=10×2+15×4+20×6+25×8+30×11+35×12+40×13-7×25×8=270,
所以===≈0.39,
则=-=8-×25≈-1.64,可得=0.39x-1.64,
所以y关于x的经验回归方程为=2=20.39x-1.64.
(2)由题意知,随机变量X的可能取值为3,4,5,6,
可得P(X=3)==,
P(X=4)=C××=,
P(X=5)=C××=,
P(X=6)==,
所以随机变量X的分布列为
X
3
4
5
6
P
数学期望E(X)=3×+4×+5×+6×=4.
统计、概率与正态分布的综合
(2025·山东菏泽第一中学高三模拟)襄阳市某中学一研究性学习小组为了了解襄阳市民每年旅游支出费用(单位:千元),寒假期间对游览某签约景区的100名襄阳市游客进行随机问卷调查,并把数据整理成如下表所示的频数分布表:
支出费用/千元
[0,2)
[2,4)
[4,6)
[6,8)
频数
3
4
8
11
支出费用/千元
[8,10)
[10,12)
[12,14)
[14,16]
频数
41
20
8
5
(1)从样本中随机抽取两位市民的旅游支出费用数据,求两人旅游支出费用均不低于10000元的概率;
(2)若襄阳市民的旅游支出费用X近似服从正态分布N(μ,σ2),μ近似为样本平均数(同一组中的数据用该组区间的中间值代表),σ近似为样本标准差s,并已求得s≈3,利用所得正态分布模型解决以下问题:
①假定襄阳市常住人口为500万人,试估计襄阳市有多少市民每年旅游支出费用在15000元以上;
②若在襄阳市随机抽取3位市民,设其中旅游支出费用在9000元以上的人数为Y,求随机变量Y的分布列和均值.
附:若X~N(μ,σ2),则P(μ-σ≤X≤μ+σ)≈0.6827,P(μ-2σ≤X≤μ+2σ)≈0.9545,P(μ-3σ≤X≤μ+3σ)≈0.9973.
解:(1)样本中总共100人,其中旅游支出费用不低于10000元的有33人,
所以从中随机抽取两位市民的旅游支出费用数据,
两人旅游支出费用均不低于10000元的概率为P===.
(2)①计算=1×+3×+5×+7×+9×+11×+13×+15×=9,
所以μ=9,σ=3,X~N(9,32),P(X>15)=P(X>9+2×3)=×[1-P(9-6≤X≤9+6)]≈×(1-0.9545)=0.02275,
500×0.02275=11.375(万),
估计襄阳市有11.375万市民每年旅游支出费用在15000元以上.
②由①知,μ=9,则P(X>9)=,故Y~B,
Y的所有可能取值为0,1,2,3,
P(Y=0)=C×=,
P(Y=1)=C××=,
P(Y=2)=C××=,
P(Y=3)=C×=,
所以随机变量Y的分布列为
Y
0
1
2
3
P
均值E(Y)=3×=.
利用正态分布求给定区间的概率时,注意给定区间与μ,σ的转化,使给定区间转化为3σ特殊区间,从而求出其概率.
3.(2025·山西名校高三联考)某高校对参加军训的4000名学生进行射击、体能、伤病自救等项目的综合测试,现随机抽取200名军训学生,对其测试成绩(满分:100分)进行统计,得到样本频率分布直方图,如图.
(1)根据频率分布直方图,求出a的值,并估计这200名学生测试成绩的平均数(单位:分).
(2)现该高校为了激励学生,举行了一场军训比赛,共有三个比赛项目,依次为“10千米拉练”“实弹射击”“伤病救援”,规则如下:三个环节均参与,三个项目通过各奖励200元、300元、500元,不通过则不奖励.学生甲在每个环节中通过的概率依次为,,,假设学生甲在各环节中是否通过是相互独立的.记学生甲在这次比赛中累计所获奖励的金额为随机变量Y,求Y的分布列和数学期望E(Y).
(3)若该高校军训学生的综合成绩X近似服从正态分布N(μ,100),其中μ近似为样本平均数,规定军训成绩高于98分的为“优秀标兵”,据此估计该高校军训学生中“优秀标兵”的人数(结果精确到1).
参考数据:若X~N(μ,σ2),则P(μ-σ≤X≤μ+σ)≈0.6827,P(μ-2σ≤X≤μ+2σ)≈0.9545,P(μ-3σ≤X≤μ+3σ)≈0.9973.
解:(1)由题图可得10×(0.010+a+0.025+0.035+a)=1,解得a=0.015,
平均数=(0.010×55+0.015×65+0.025×75+0.035×85+0.015×95)×10=78.
(2)Y的可能取值为0,200,300,500,700,800,1000,
P(Y=0)=××=,
P(Y=200)=××=,
P(Y=300)=××=,
P(Y=500)=××+××=,
P(Y=700)=××=,
P(Y=800)=××=,
P(Y=1000)=××=,
所以Y的分布列为
Y
0
200
300
500
700
800
1000
P
E(Y)=0×+200×+300×+500×+700×+800×+1000×=.
(3)μ==78,σ==10,
则P(X>98)=P(X>μ+2σ),
又P(μ-2σ≤X≤μ+2σ)≈0.9545,
故P(X>98)≈=0.02275,
又4000×0.02275=91,
故可估计该高校军训学生中“优秀标兵”的人数为91.
统计、概率与函数的综合
(2023·新课标Ⅱ卷)某研究小组经过研究发现某种疾病的患病者与未患病者的某项医学指标有明显差异,经过大量调查,得到如下的患病者和未患病者该指标的频率分布直方图:
利用该指标制定一个检测标准,需要确定临界值c,将该指标大于c的人判定为阳性,小于或等于c的人判定为阴性.此检测标准的漏诊率是将患病者判定为阴性的概率,记为p(c);误诊率是将未患病者判定为阳性的概率,记为q(c).假设数据在组内均匀分布,以事件发生的频率作为相应事件发生的概率.
(1)当漏诊率p(c)=0.5%时,求临界值c和误诊率q(c);
(2)设函数f(c)=p(c)+q(c),当c∈[95,105]时,求f(c)的解析式,并求f(c)在区间[95,105]的最小值.
解:(1)依题意可知,患病者该指标的频率分布直方图中第一个小矩形的面积为5×0.002=0.01>0.5%,所以95<c<100,
所以(c-95)×0.002=0.5%,解得c=97.5,
q(c)=0.01×(100-97.5)+5×0.002=0.035=3.5%.
(2)当c∈[95,100]时,f(c)=p(c)+q(c)=(c-95)×0.002+(100-c)×0.01+5×0.002=-0.008c+0.82≥0.02;
当c∈(100,105]时,f(c)=p(c)+q(c)=5×0.002+(c-100)×0.012+(105-c)×0.002=0.01c-0.98>0.02,
故f(c)=
所以f(c)在区间[95,105]的最小值为0.02.
在概率与统计的问题中,决策的工具是样本的数字特征或有关概率.决策方案的最佳选择是将概率最大(最小)或均值最大(最小)的方案作为最佳方案,这往往借助于函数、不等式或数列的有关性质去实现.
4.(2025·河南信阳模拟)一款击鼓小游戏的规则如下:每盘游戏都需击鼓三次,每次击鼓要么出现一次音乐,要么不出现音乐;每盘游戏击鼓三次后,出现三次音乐获得150分,出现两次音乐获得100分,出现一次音乐获得50分,没有出现音乐则获得-300分.设每次击鼓出现音乐的概率为p,且各次击鼓出现音乐相互独立.
(1)若一盘游戏中仅出现一次音乐的概率为f(p),求f(p)的最大值点p0;
(2)玩过这款游戏的许多人都发现,若干盘游戏后,与最初的分数相比,分数没有增加反而减少了.设每盘游戏的得分为随机变量X,请运用概率统计的相关知识分析分数减少的原因.
解:(1)由题可知,一盘游戏中仅出现一次音乐的概率为f(p)=Cp(1-p)2=3p3-6p2+3p,0<p<,f′(p)=3(3p-1)(p-1),
由f′(p)=0,得p=或p=1(舍去),
当p∈时,f′(p)>0;当p∈时,f′(p)<0,
∴f(p)在上单调递增,在上单调递减,
∴当p=时,f(p)有最大值,即f(p)的最大值点p0=.
(2)X的所有可能取值为-300,50,100,150,
P(X=-300)=(1-p)3,
P(X=50)=Cp(1-p)2,
P(X=100)=Cp2(1-p),
P(X=150)=p3,
∴E(X)=-300(1-p)3+50Cp(1-p)2+100Cp2(1-p)+150p3=300,
令g(p)=p3-3p2+p-1,0<p<,
则g′(p)=3p2-6p+=3(p-1)2+>0,
∴g(p)在上单调递增,
∴g(p)<g=-<0,故有E(X)<0.
这说明每盘游戏平均得分是负分,故由概率统计的相关知识可知,许多人经过若干盘游戏后,与最初的分数相比,分数没有增加反而会减少了.
概率与数列的综合
(2025·广东惠州期末)若数列{an}(1≤n≤k,n∈N*,k∈N*)满足an∈{0,1},则称数列{an}为k项0-1数列,由所有k项0-1数列组成集合Mk.
(1)若{an}是12项0-1数列,当且仅当n=3p(p∈N*,p≤4)时,an=0,求数列{(-1)nan}的所有项的和;
(2)从集合Mk中任意取出两个数列{an},{bn},记X=|ai-bi|.
①求随机变量X的分布列,并证明E(X)>;
②若用某软件产生k(k≥2)项0-1数列,记事件A=“第一次产生数字1”,B=“第二次产生数字1”,且0<P(A)<1,0<P(B)<1.若P(B|A)<P(B|),比较P(A|B)与P(A|)的大小.
解:(1)因为{an}是12项0-1数列,当且仅当n=3p(p∈N*,p≤4)时,an=0,
所以当n=3p-2和n=3p-1(p∈N*,p≤4)时,an=1.
设数列{(-1)nan}的所有项的和为S,则S=(-1)a1+(-1)2a2+(-1)4a4+(-1)5a5+(-1)7a7+(-1)8a8+(-1)10a10+(-1)11a11=(-1)+(-1)2+(-1)4+(-1)5+(-1)7+(-1)8+(-1)10+(-1)11=(-1)+1+1+(-1)+(-1)+1+1+(-1)=0,
所以数列{(-1)nan}的所有项的和为0.
(2)①因为数列{an},{bn}是从集合Mk中任意取出的两个数列,
所以数列{an},{bn}为k项0-1数列,所以X的可能取值为1,2,3,…,k.
因为集合Mk中元素的个数为C+C+C+…+C=2k,
当X=m(m=1,2,…,k)时,则数列{an},{bn}中有m项取值不同,有k-m项取值相同,所以P(X=m)==(m=1,2,…,k),
所以随机变量X的分布列为
X
1
2
3
…
k
P
…
因为mC=
=k·
=kC(m∈N*,1≤m≤k),
所以E(X)=1×+2×+…+k×=(1C+2C+3C+…+kC)=(C+C+C+…+C)=>=,
即E(X)>.
②由P(B|A)<P(B|),得<=,
所以P(AB)[1-P(A)]<P(A)[P(B)-P(AB)],
化简得P(AB)<P(A)P(B),
所以P(AB)-P(B)P(AB)<P(A)P(B)-P(B)P(AB),
则P(AB)[1-P(B)]<P(B)[P(A)-P(AB)],
即P(AB)P()<P(B)P(A),
所以<,
即P(A|B)<P(A|).
概率与数列交汇是新高考命题的一个重要趋势,常以新定义为背景出现在压轴题中,综合考查概率的计算、随机变量期望的应用、数列的通项与性质等.此类试题要求考生在短时间内阅读学习新定义的概念并进行运用解决相关问题,对学生的思维敏捷性和信息迁移能力要求较高.
5.(2025·广东大湾区调研)设离散型随机变量X,Y的取值分别为{x1,x2,…,xp},{y1,y2,…,yq}(p,q∈N*).定义X关于事件“Y=yj”(1≤j≤q)的条件数学期望为E(X|Y=yj)=xiP(X=xi|Y=yi).已知条件数学期望满足全期望公式:E(X)=E(X|Y=yi)P(Y=yi).解决如下问题:
为了研究某药物对于微生物A生存状况的影响,某实验室计划进行生物实验.在第1天上午,实验人员向培养皿中加入10个A的个体.从第1天开始,实验人员在每天下午向培养皿中加入该种药物.当加入药物时,A的每个个体立即以相等的概率随机产生1次如下的生理反应(设A的每个个体在当天的其他时刻均不发生变化,不同个体的生理反应相互独立):
①直接死亡;②分裂为2个个体.
设第n天上午培养皿中A的个体数为Xn.规定E(X1)=10,D(X1)=0.
(1)求E(X6|X5=6);
(2)求E(Xn);
(3)已知E(X|Xn-1=k)=k(k+1)(k∈N*),证明:D(Xn)随着n的增大而增大.
解:(1)在事件X5=6发生的条件下,如果在第5天下午加入药物后,有K个个体分裂,
则K~B,E(K)=6×=3,X6=2K,
所以E(X6|X5=6)=2E(K)=2×3=6.
(2)由(1)可类似得到,在事件Xn-1=k发生的条件下,如果在第n-1天下午加入药物之后,有m个个体分裂,则Xn的取值为k+m-(k-m)=2m.
在事件Xn-1=k发生的条件下,令随机变量Z表示第n-1天下午加入药物之后分裂的个体数,则Z~B且Xn=2Z.
因此E(Xn|Xn-1=k)=2mP(Xn=2m|Xn-1=k)=2mP(Z=m)=2E(Z)=2×k×=k.
设Xn-1的取值集合为{x1,x2,…,xr},则由全期望公式可知E(Xn)=E(Xn|Xn-1=xi)·P(Xn-1=xi)=xiP(Xn-1=xi)=E(Xn-1).
这表明{E(Xn)}是常数列,
所以E(Xn)=E(X1)=10.
(3)证明:由(2)可知E(X)=E(X|Xn-1=xi)P(Xn-1=xi)= (x+xi)P(Xn-1=xi)=E(X+Xn-1)=E(X)+10,
这表明{E(X)}是公差为10的等差数列.
又因为E(X)=D(X1)+[E(X1)]2=100,
所以E(X)=100+10(n-1),
从而D(Xn)=E(X)-[E(Xn)]2=10(n-1).
可以看出,D(Xn)随着n的增大而增大.
课时作业
基础题(占比20%) 中档题(占比50%) 拔高题(占比30%)
题号
1
2
3
4
5
6
难度
★
★★
★★
★★
★★★
★★★
考向
概率与独立性检验的综合
概率与经验回归方程的综合
概率与统计的综合
统计、概率与正态分布的综合
概率与数列的综合
概率与数列、集合的综合
考点
独立性检验;二项分布的分布列、均值
经验回归方程;超几何分布的分布列、均值
用频率估计概率;与互斥事件、独立事件有关的分布列;数字特征的计算
频率分布直方图;正态分布的实际应用;超几何分布的分布列、均值
全概率公式的应用;等比数列的应用
随机变量的分布列、均值;等差数列的应用;古典概型的概率计算
关联点
利用导数求最值
组合数的应用;新定义问题
1.(2025·河南焦作模拟)交通强国,铁路先行,每年我国铁路部门都会根据运输需求进行铁路调图,一铁路线l上有自东向西依次编号为1,2,…,21的21个车站.
(1)为调查乘客对调图的满意度,在编号为10和11两个站点多次乘坐列车P的旅客中,随机抽取100名旅客,得出数据(不完整)如下表所示:
车站编号
满意程度
合计
满意
不满意
10
28
40
11
3
合计
85
完善表格数据并计算分析:依据小概率值α=0.001的独立性检验,在这两个车站中,能否认为旅客满意程度与车站编号有关联?
(2)根据以往调图经验,列车P在编号为8至14的终到站每次调图时有的概率改为当前终到站的西侧一站,有的概率改为当前终到站的东侧一站,每次调图之间相互独立.已知原定终到站编号为11的列车P经历了3次调图,第3次调图后的终到站编号记为X,求X的分布列及均值.
附:χ2=,其中n=a+b+c+d.
α
0.1
0.01
0.001
xα
2.706
6.635
10.828
解:(1)补充列联表如下:
车站编号
满意程度
合计
满意
不满意
10
28
12
40
11
57
3
60
合计
85
15
100
零假设为H0:旅客满意程度与车站编号无关,
则χ2==≈11.765>10.828,
所以根据小概率值α=0.001的独立性检验,推断H0不成立,即认为旅客满意程度与车站编号有关联.
(2)由题意,知X的可能取值为8,10,12,14,
则P(X=8)==,
P(X=10)=C××=,
P(X=12)=C××=,
P(X=14)==,
所以X的分布列为
X
8
10
12
14
P
E(X)=8×+10×+12×+14×=10.
2.(2025·山东青岛模拟)设某幼苗从观察之日起,第x天的高度为y cm,测得的一些数据如下表所示:
第x天
1
4
9
16
25
36
49
高度y/cm
0
4
7
9
11
12
13
作出这组数据的散点图发现:y(单位:cm)与x(单位:天)之间近似满足关系式y=b+a,其中a,b均为大于0的常数.
(1)试借助一元线性回归模型,根据所给数据,用最小二乘法对a,b作出估计,并求出y关于x的经验回归方程;
(2)在作出的这组数据的散点图中,甲同学随机圈取了其中的4个点,记这4个点中幼苗的高度大于的点的个数为X,其中为表格中所给的幼苗高度的平均数,试求随机变量X的分布列和数学期望.
附:对于一组数据(v1,μ1),(v2,μ2),…,(vn,μn),其经验回归方程=+v的斜率和截距的最小二乘估计分别为=,=-.
解:(1)令μ=,则y=bμ+a,根据已知数据表得到如下表:
x
1
4
9
16
25
36
49
μ=
1
2
3
4
5
6
7
y
0
4
7
9
11
12
13
则==4,
==8,
可得μiyi=1×0+2×4+3×7+4×9+5×11+6×12+7×13=283,
μ=1+4+9+16+25+36+49=140,
得===,
=-=8-×4=-,
所以y关于x的经验回归方程为=-.
(2)由题意可知,7天中幼苗高度大于=8的有4天,小于等于8的有3天,
从散点图中任取4个点,即从这7天中任取4天,
所以这4个点中幼苗的高度大于的点的个数X的所有可能取值为1,2,3,4,则有
P(X=1)==,P(X=2)==,
P(X=3)==,P(X=4)==,
所以随机变量X的分布列为
X
1
2
3
4
P
数学期望E(X)=1×+2×+3×+4×=.
3.某高校“植物营养学专业”学生将鸡冠花的株高增量作为研究对象,观察长效肥和缓释肥对农作物影响情况.其中长效肥、缓释肥、未施肥三种处理下的鸡冠花分别对应1,2,3三组.观察一段时间后,分别从1,2,3三组随机抽取40株鸡冠花作为样本,得到相应的株高增量数据整理如下表:
株高增量/厘米
(4,7]
(7,10]
(10,13]
(13,16]
第1组鸡冠花株数
9
20
9
2
第2组鸡冠花株数
4
16
16
4
第3组鸡冠花株数
13
12
13
2
假设用频率估计概率,且所有鸡冠花生长情况相互独立.
(1)从第1组所有鸡冠花中随机选取1株,估计株高增量在(7,10]内的概率;
(2)分别从第1组、第2组、第3组的所有鸡冠花中各随机选取1株,记这3株鸡冠花中恰有X株的株高增量在(7,10]内,求X的分布列和数学期望E(X);
(3)用“Yk=1”表示第k组鸡冠花的株高增量在(4,10]内,“Yk=0”表示第k组鸡冠花的株高增量在(10,16]内,k=1,2,3,直接写出方差D(Y1),D(Y2),D(Y3)的大小关系.(结论不要求证明)
解:(1)设事件A为“从第1组所有鸡冠花中随机选取1株,株高增量在(7,10]内”,
根据题中数据,第1组所有鸡冠花中,有20株鸡冠花的株高增量在(7,10]内,
所以估计P(A)==.
(2)设事件B为“从第2组所有鸡冠花中随机选取1株,株高增量在(7,10]内”,
设事件C为“从第3组所有鸡冠花中随机选取1株,株高增量在(7,10]内”,
根据题中数据,估计P(B)==,P(C)==,
根据题意,X的所有可能取值为0,1,2,3,
且P(X=0)=P()=P()P()P()=××=,
P(X=1)=P(A+B+C)
=P(A)P()P()+P()P(B)P()+P()P()P(C)=,
P(X=2)=P(AB+AC+BC)
=P(A)P(B)P()+P(A)P()P(C)
+P()P(B)P(C)
=,
P(X=3)=P(ABC)=P(A)P(B)P(C)=,
则X的分布列为
X
0
1
2
3
P
E(X)=0×+1×+2×+3×=.
(3)D(Y1)<D(Y3)<D(Y2).
理由如下:
P(Y1=1)=,P(Y1=0)=,
所以E(Y1)=1×+0×=,
D(Y1)=×+×=;
P(Y2=1)==,P(Y2=0)=,
所以E(Y2)=1×+0×=,
D(Y2)=×+×==;
P(Y3=1)==,P(Y3=0)==,
所以E(Y3)=1×+0×=,
D(Y3)=×+×==,
所以D(Y1)<D(Y3)<D(Y2).
4.(2024·福建龙岩高三三模)某企业对某品牌芯片开发了一条生产线进行试产.其芯片质量按等级划分为五个层级,分别对应如下五组质量指标值:[45,55),[55,65),[65,75),[75,85),[85,95].根据长期检测结果,得到芯片的质量指标值X服从正态分布N(μ,σ2),并把质量指标值大于80的产品称为A等品,其他产品称为B等品.现从该品牌芯片的生产线中随机抽取100件作为样本,统计得到如图所示的频率分布直方图.
(1)根据长期检测结果,该芯片质量指标值的标准差s的近似值为11,用样本平均数作为μ的近似值,用样本标准差s作为σ的估计值.若从生产线中任取一件芯片,试估计该芯片为A等品的概率(精确到0.01);
①同一组中的数据用该组区间的中点值代表;②参考数据:若随机变量X服从正态分布N(μ,σ2),则P(μ-σ≤X≤μ+σ)≈0.6827,P(μ-2σ≤X≤μ+2σ)≈0.9545,P(μ-3σ≤X≤μ+3σ)≈0.9973.
(2)(ⅰ)从样本的质量指标值在[45,55)和[85,95]的芯片中随机抽取3件,记其中质量指标值在[85,95]的芯片件数为X′,求X′的分布列和数学期望;
(ⅱ)该企业为节省生产成本,采用随机混装的方式将所有的芯片按100件一箱包装.已知一件A等品芯片的利润是m(1<m<24)元,一件B等品芯片的利润是ln (25-m)元,根据(1)的计算结果,试求m的值,使得每箱产品的利润最大.
解:(1)由题意知,估计从该品牌芯片的生产线中随机抽取100件的质量指标值的平均数为
=10×(0.01×50+0.025×60+0.04×70+0.015×80+0.01×90)=69,
即μ≈=69,σ≈s≈11,所以X~N(69,112),
所以P(X>80)=
=≈=0.15865≈0.16,
所以从生产线中任取一件芯片,该芯片为A等品的概率约为0.16.
(2)(ⅰ)因为(0.01+0.01)×10×100=20,
所以所取样本的个数为20,
质量指标值在[85,95]的芯片件数为10,故X′的可能取值为0,1,2,3,
P(X′=0)==,
P(X′=1)==,
P(X′=2)==,
P(X′=3)==,
所以X′的分布列为
X′
0
1
2
3
P
数学期望E(X′)=0×+1×+2×+3×=.
(ⅱ)设每箱产品中A等品有Y件,则每箱产品中B等品有(100-Y)件,
设每箱产品的利润为Z元,
由题意知,Z=mY+(100-Y)ln (25-m)=[m-ln (25-m)]Y+100ln (25-m),
由(1)知,每箱产品中A等品的概率为0.16,
所以Y~B(100,0.16),所以E(Y)=100×0.16=16,所以E(Z)=E{[m-ln (25-m)]Y+100ln (25-m)}
=[m-ln (25-m)]E(Y)+100ln (25-m)
=16[m-ln (25-m)]+100ln (25-m)
=16m+84ln (25-m).
令f(x)=16x+84ln (25-x)(1<x<24),
由f′(x)=16-=0,得x=,
又当x∈时,f′(x)>0,f(x)单调递增,当x∈时,f′(x)<0,f(x)单调递减,
所以当x=∈(1,24)时,f(x)取得最大值.
所以当m=时,每箱产品的利润最大.
5.(2023·新课标Ⅰ卷)甲、乙两人投篮,每次由其中一人投篮,规则如下:若命中则此人继续投篮,若未命中则换为对方投篮.无论之前投篮情况如何,甲每次投篮的命中率均为0.6,乙每次投篮的命中率均为0.8.由抽签确定第1次投篮的人选,第1次投篮的人是甲、乙的概率各为0.5.
(1)求第2次投篮的人是乙的概率;
(2)求第i次投篮的人是甲的概率;
(3)已知:若随机变量Xi服从两点分布,且P(Xi=1)=1-P(Xi=0)=qi,i=1,2,…,n,则E(Xi)=qi.记前n次(即从第1次到第n次投篮)中甲投篮的次数为Y,求E(Y).
解:(1)记“第i次投篮的人是甲”为事件Ai,“第i次投篮的人是乙”为事件Bi,所以P(B2)=P(A1B2)+P(B1B2)=P(A1)P(B2|A1)+P(B1)P(B2|B1)=0.5×(1-0.6)+0.5×0.8=0.6.
(2)设P(Ai)=pi,依题可知,P(Bi)=1-pi,则P(Ai+1)=P(AiAi+1)+P(BiAi+1)
=P(Ai)P(Ai+1|Ai)+P(Bi)P(Ai+1|Bi),
即pi+1=0.6pi+(1-0.8)×(1-pi)=0.4pi+0.2,
构造等比数列{pi+λ},
设pi+1+λ=(pi+λ),解得λ=-,
则pi+1-=,
又p1=,p1-=,
所以是首项为,公比为的等比数列,
即pi-=×,
所以pi=×+.
(3)因为pi=×+,i=1,2,…,n,
所以当n∈N*时,E(Y)=p1+p2+…+pn=×+=+.
6.(2025·河北保定高三期末)已知有穷数列{an}共有m项(其中m≥4且m∈N*),集合A={(i,j,k)|ai<aj<ak且i<j<k},其中i,j,k均为小于等于m的正整数.
(1)若m=5,数列{an}的各项依次为1,2,5,3,4,请写出集合A中所有的元素;
(2)若m=6,且数列{an}为单调递增数列,从集合A中任取一个元素(i,j,k),设随机变量X=k,求随机变量X的分布列和数学期望;
(3)若数列{an}为公差大于0的等差数列,从集合A中任取一个元素(i,j,k),定义事件M=“ai+ak=2aj”,求事件M发生的概率P(M)(结果用m表示).
解:(1)根据题意,集合A中所有的元素为(1,2,3),(1,2,4),(1,2,5),(1,4,5),(2,4,5).
(2)由题意可知集合A中元素个数为C=20,随机变量X的可能取值为3,4,5,6,
P(X=3)==,
P(X=4)==,
P(X=5)==,
P(X=6)==,
所以随机变量X的分布列为
X
3
4
5
6
P
数学期望E(X)=3×+4×+5×+6×=.
(3)由题意知,事件M:ai+ak=2aj可等价于其角标成等差数列,即满足i+k=2j,
集合A中元素个数为C=,且2≤j≤m-1.
①若m为偶数,当j=2,3,4,…,时,
集合A中满足i+k=2j的元素个数依次为1,2,3,…,-1,
当j=+1,+2,+3,…,m-1时,
集合A中满足i+k=2j的元素个数依次为-1,-2,-3,…,1,
所以此时事件M包含的样本点个数为+=××2=,
所以P(M)==;
②若m为奇数,当j=2,3,4,…,时,
集合A中满足i+k=2j的元素个数依次为1,2,3,…,,
当j=+1,+2,+3,…,m-1时,
集合A中满足i+k=2j的元素个数依次为-1,-2,-3,…,1,
所以此时事件M包含的样本点个数为
+=××2-=,
所以P(M)==.
综上,P(M)=
12
学科网(北京)股份有限公司
$$
相关资源
由于学科网是一个信息分享及获取的平台,不确保部分用户上传资料的 来源及知识产权归属。如您发现相关资料侵犯您的合法权益,请联系学科网,我们核实后将及时进行处理。