独立性检验与正态分布 讲义-2026届高三数学一轮复习
2025-11-18
|
2份
|
25页
|
180人阅读
|
0人下载
普通
资源信息
| 学段 | 高中 |
| 学科 | 数学 |
| 教材版本 | - |
| 年级 | 高三 |
| 章节 | - |
| 类型 | 教案-讲义 |
| 知识点 | 独立性检验,正态分布 |
| 使用场景 | 高考复习-一轮复习 |
| 学年 | 2026-2027 |
| 地区(省份) | 全国 |
| 地区(市) | - |
| 地区(区县) | - |
| 文件格式 | ZIP |
| 文件大小 | 325 KB |
| 发布时间 | 2025-11-18 |
| 更新时间 | 2025-11-18 |
| 作者 | 匿名 |
| 品牌系列 | - |
| 审核时间 | 2025-11-17 |
| 下载链接 | https://m.zxxk.com/soft/54954837.html |
| 价格 | 1.00储值(1储值=1元) |
| 来源 | 学科网 |
|---|
内容正文:
独立性检验与正态分布
课前必备知识
课标要求
1.了解2×2列联表的统计意义,了解独立性检验(2×2列联表)的基本思想、方法及其简单应用.2.了解正态分布曲线的特点及曲线所表示的意义.3.会利用3σ原则及正态曲线的对称性计算有关概率.
知识梳理
1.2×2列联表与独立性检验
(1)我们经常会使用一种特殊的随机变量,以区别不同的现象或性质,这类随机变量称为分类变量.
(2)列出的两个分类变量的频数表,称为列联表.
(3)一般地,假设有两个分类变量X和Y,它们的值域分别为{x1,x2}和{y1,y2},其抽样数据列联表为
X
Y
合计
Y=y1
Y=y2
X=x1
a
b
a+b
X=x2
c
d
c+d
合计
a+c
b+d
n=a+b+c+d
计算统计量χ2=(其中n=a+b+c+d为样本容量),利用χ2的取值推断分类变量X和Y__是否独立__的方法称为χ2独立性检验,简称独立性检验.独立性检验即由统计量χ2的取值来确定在多大程度上可以认为“两个分类变量X和Y有关系”.
2.正态分布
(1)若随机变量X的概率分布密度函数f(x)=,x∈R,其中μ∈R,σ>0为参数,则称随机变量X服从正态分布,记为__X~N(μ,σ2)__.
(2)函数f(x)=,x∈R的图象称为正态密度曲线,简称正态曲线.
(3)正态曲线的特点:
①曲线是单峰的,它关于直线__x=μ__对称.
②曲线在x=μ时达到峰值____.
③当|x|无限增大时,曲线无限接近于__x轴__.
④曲线与x轴之间的区域的面积为1.
⑤当σ一定时,曲线的位置由μ确定,曲线随着μ的变化而沿x轴平移.
⑥当μ一定时,曲线的形状由σ确定,σ越大,曲线越“矮胖”,表示随机变量X的分布越__分散__;σ越小,曲线越“高瘦”,表示随机变量X的分布越__集中__.
(4)3σ原则
①X∈[μ-σ,μ+σ],P(X)≈0.6827;
②X∈[μ-2σ,μ+2σ],P(X)≈0.9545;
③X∈[μ-3σ,μ+3σ],P(X)≈0.9973.
课前训练
1.为调查中学生近视情况,测得某校男生150名中有80名近视,140名女生中有70名近视.在检验这些学生眼睛近视是否与性别有关时,用下列哪种方法最有说服力( )
A.回归分析 B.均值与方差
C.独立性检验 D.概率
解析:C “近视”与“性别”是两类变量,其是否有关,应用独立性检验判断.故选C.
2.已知正态分布密度函数f(x)=e-,x∈R,则μ,σ分别是( )
A.0和4 B.0和2
C.0和8 D.0和
解析:B 因为f(x)=e-=e-,所以μ=0,σ=2.故选B.
3.为了解某大学的学生是否爱好体育锻炼,用简单随机抽样的方法在校园内调查了120位学生,得到如下2×2列联表:
单位:人
性别
爱好体育锻炼
合计
爱好
不爱好
男
a
c
74
女
b
25
合计
73
则a-b-c=( )
A.7 B.8
C.9 D.10
解析:C 根据题意,可得c=120-73-25=22,a=74-22=52,b=73-52=21,所以a-b-c=52-21-22=9.故选C.
4.四川省将从2022年秋季入学的高一年级学生开始实行高考综合改革,高考采用“3+1+2”模式,其中“1”为首选科目,即物理与历史二选一.某校为了解学生的首选意愿,对部分高一学生进行了抽样调查,制作出如下两个等高堆积条形图.根据条形图信息,下列结论正确的是( )
A.样本中选择物理意愿的男生人数少于选择历史意愿的女生人数
B.样本中女生选择历史意愿的人数多于男生选择历史意愿的人数
C.样本中选择物理学科的人数较多
D.样本中男生人数少于女生人数
解析:C 样本中选择物理学科的人数多于选择历史意愿的人数,而选择物理意愿的男生比例高,选择历史意愿的女生比例低,所以样本中选择物理意愿的男生人数多于选择历史意愿的女生人数,A错误;
样本中女生选择历史意愿的人数不一定多于男生选择历史意愿的人数,B错误;
根据等高堆积条形图图1可知样本中选择物理学科的人数较多,C正确;
根据等高堆积条形图图2可知样本中男生人数多于女生人数,D错误.故选C.
5.(2022·新课标Ⅱ卷)已知随机变量X服从正态分布N(2,σ2),且P(2<X≤2.5)=0.36,则P(X>2.5)=__________.
解析:0.14 因为X~N(2,σ2),所以P(X<2)=P(X>2)=0.5,因此P(X>2.5)=P(X>2)-P(2<X≤2.5)=0.5-0.36=0.14.
课堂核心考点
考点1 独立性检验
【例1】 学校为提升高一年级学生自主体育锻炼的意识,拟将每周自主进行体育锻炼的时间不低于6小时的同学称为“体育迷”并予以奖励.为了确定奖励方案,先对学生自主体育锻炼的情况进行抽样调查,学校从高一年级随机抽取100名学生,将他们分为男生组、女生组,对每周自主体育锻炼的时间分段进行统计(单位:小时):第一段[0,2),第二段[2,4),第三段[4,6),第四段[6,8),第五段[8,10].将男生在各段的频率及女生在各段的频数用折线图表示如下:
(1)求折线图中m的值,并由样本估计该校高一年级学生中“体育迷”所占的比例.
(2)填写下列2×2列联表,并依据小概率值α=0.1的独立性检验,能否认为是否为“体育迷”与学生的性别有关联?
单位:人
性别
体育迷
合计
体育迷
非体育迷
男
女
合计
(3)若中学生每周自主体育锻炼的时间不低于5小时,才能保持身体的良好健康发展,试由样本估计该校高一年级学生的周平均锻炼时间是否达到保持身体良好健康发展的水平.(同一段中的数据用该组区间的中点值代表)
附:χ2=,n=a+b+c+d.
α
0.1
0.05
0.010
0.001
xα
2.706
3.841
6.635
10.828
解析:(1)由频率折线图可得m=1-0.04-0.20-0.24-0.16=0.36,
由频数折线图可知女生共有1+4+5+12+3=25(人),其中“体育迷”有12+3=15(人),
故男生共有100-25=75(人),其中“体育迷”有75×(0.24+0.16)=30(人).
因此由样本估计该校高一学生中“体育迷”所占比例约为=45%.
(2)
单位:人
性别
体育迷
合计
体育迷
非体育迷
男
30
45
75
女
15
10
25
合计
45
55
100
零假设为H0:是否为“体育迷”与学生的性别无关联.
根据表中的数据,计算得到χ2=≈3.030>2.706=x0.1.
根据小概率值α=0.1的独立性检验,我们推断H0不成立,即认为是否为“体育迷”与性别有关联.
(3)由频率折线图可知男生的锻炼时间在每组的频数分别为
75×0.04=3,75×0.20=15,75×0.36=27,75×0.24=18,75×0.16=12.
故这100名学生每周的锻炼时间在每组的频率分别为
(1+3)÷100=0.04,(4+15)÷100=0.19,(5+27)÷100=0.32,(12+18)÷100=0.30,(3+12)÷100=0.15.
所以由样本估计该校高一年级学生的周平均锻炼时间为1×0.04+3×0.19+5×0.32+7×0.30+9×0.15=5.66.
因为5.66>5,所以由样本估计该校高一年级学生的周平均锻炼时间达到了保持身体良好健康发展的水平.
(1)独立性检验的基本思想类似于反证法.要确认“两个分类变量有关系”这一结论成立的可信程度,首先假设该结论不成立,即假设结论“两个分类变量没有关系”成立,在该假设下构造的统计量χ2应该很小.如果由观测数据计算得到的χ2的概率值α很大,则在一定程度上说明假设不合理.
(2)独立性检验的一般步骤
①提出零假设H0:X和Y相互独立,并给出在问题中的解释.
②根据抽样数据整理出2×2列联表,计算χ2的值,并与临界值xα比较.
查下表确定临界值xα:
α
0.1
0.05
0.01
0.005
0.001
xα
2.706
3.841
6.635
7.879
10.828
③如果χ2≥xα,就推断“X与Y有关系”,这种推断犯错误的概率不超过α;否则,就认为在犯错误的概率不超过α的前提下,不能推断“X与Y有关系”.
变式探究
1.2023年11月,世界首届人工智能峰会在英国举行,我国因为在该领域取得的巨大成就受邀进行大会发言.为了研究不同性别的学生对人工智能的了解情况,某市某著名高中进行了一次抽样调查,分别抽取男、女生各50人作为样本.设事件A=“了解人工智能”,B=“学生为男生”,据统计P(A|)=,P(B|A)=.
(1)根据已知条件,填写下列2×2列联表,并依据小概率值α=0.01的独立性检验,能否推断该校学生对人工智能的了解情况与性别有关联?
单位:人
性别
人工智能的了解情况
合计
了解
不了解
男生
女生
合计
(2)(ⅰ)现从所抽取的女生中利用分层随机抽样的方法抽取20人,再从这20人中随机选取3人赠送科普材料,求选取的3人中至少有2人了解人工智能的概率;
(ⅱ)将频率视为概率,从我市所有参与调查的学生中随机抽取20人科普材料,记其中了解人工智能的人数为X,求随机变量X的数学期望和方差.
参考公式:χ2=,n=a+b+c+d.
常用的小概率值和相应的临界值如下表:
α
0.1
0.05
0.01
0.005
0.001
xα
2.706
3.841
6.635
7.879
10.828
解析:(1)因为P(A|)=,P(B|A)=,
所以了解人工智能的女生为50×=30,
了解人工智能的总人数为=70,
则了解人工智能的男生有70-30=40(人),
结合男生和女生各有50人,填写2×2列联表为
单位:人
性别
人工智能的了解情况
合计
了解
不了解
男生
40
10
50
女生
30
20
50
合计
70
30
100
零假设为H0:该校学生对人工智能的了解情况与性别无关.
根据表中的数据,计算得到χ2==≈4.762<6.635=x0.01,
根据小概率值α=0.01的独立性检验,没有充分证据推断H0不成立,因此认为H0成立,即认为该校学生对人工智能的了解情况与性别无关.
(2)(ⅰ)由题意可知,所抽取的20名女生中,了解人工智能的有20×=12(人),
不了解人工智能的有20×=8(人),
所以选取的3人中至少有2人了解人工智能的概率为P==.
(ⅱ)由2×2列联表可知,抽到了解人工智能的学生的频率为=,
将频率视为概率,所以,从该市高中生中任意抽取一人,恰好抽到了解人工智能学生的概率为,
由题意可知,X~B(20,),
所以E(X)=20×=14,D(X)=20××=.
考点2 正态分布
【例2】 (2025·广东广州阶段校考)某工厂一台设备生产一种特定零件,工厂为了解该设备的生产情况,随机抽检了该设备在一个生产周期中的100件产品的关键指标(单位:cm),经统计得到下面的频率分布直方图:
(1)由频率分布直方图估计抽检样本关键指标的平均数和方差s2.(用每组的中点代表该组的均值)
(2)已知这台设备正常状态下生产零件的关键指标服从正态分布N(μ,σ2),用直方图的平均数估计值作为μ的估计值,用直方图的标准差估计值s作为σ的估计值.
(ⅰ)为了监控该设备的生产过程,每个生产周期中都要随机抽测10个零件的关键指标,如果关键指标出现了(μ-3σ,μ+3σ)之外的零件,就认为生产过程可能出现了异常,需停止生产并检查设备.下面是某个生产周期中抽测的10个零件的关键指标:
0.8
1.2
0.95
1.01
1.23
1.12
1.33
0.97
1.21
0.83
利用μ和σ判断该生产周期是否需停止生产并检查设备.
(ⅱ)若设备状态正常,记X表示一个生产周期内抽取的10个零件关键指标在(μ-3σ,μ+3σ)之外的零件个数,求P(X≥1)及X的数学期望.
参考数据:若随机变量X服从正态分布N(μ,σ2),则P(μ-3σ≤X≤μ+3σ)≈0.9973,≈0.105,≈0.110,0.99739≈0.9760,0.997310≈0.9733.
解析:(1)由频率分布直方图,得=0.8×0.1+0.9×0.2+1×0.35+1.1×0.3+1.2×0.05=1.
s2=(0.8-1)2×0.1+(0.9-1)2×0.2+(1-1)2×0.35+(1.1-1)2×0.3+(1.2-1)2×0.05=0.011.
(2)(ⅰ)由(1)可知=1,=≈0.105,
所以-3≈1-0.315=0.685,
+3≈1+0.315=1.315,
显然抽查中的零件指标1.33>1.315,故需停止生产并检查设备.
(ⅱ)抽测一个零件关键指标在(μ-3σ,μ+3σ)之内的概率为0.9973,
所以抽测一个零件关键指标在(μ-3σ,μ+3σ)之外的概率为1-0.9973=0.0027,
故X~B(10,0.0027),所以P(X≥1)=1-P(X=0)=1-0.997310≈1-0.9733=0.0267,
X的数学期望E(X)=10×0.0027=0.027.
正态分布N(μ,σ2)是一种应用十分广泛的分布,对正态分布N(μ,σ2)的复习,应该注意:
(1)明确μ,σ的意义,其中μ,σ分别表示总体平均数和总体方差,常利用样本进行估计.
(2)求指定范围内的概率值时,要充分利用正态曲线的对称性及3σ原则.
(3)重视正态分布的实际应用及对数据的分析和处理能力的培养.
(4)重视数字运算能力的培养及参考数据的合理运用.
变式探究
2.为了严格监控某种零件的一条生产线的生产过程,某企业每天从该生产线上随机抽取10000个零件,并测量其内径(单位:cm).根据长期生产经验,认为这条生产线正常状态下生产的零件的内径X服从正态分布N(μ,σ2).如果加工的零件内径小于μ-3σ或大于μ+3σ均为不合格品,其余为合格品.
(1)假设生产状态正常,请估计一天内抽取的10000个零件中不合格品的个数.
(2)若生产的某件产品为合格品,则该件产品盈利;若生产的某件产品为不合格品,则该件产品亏损.已知每件产品的利润L(单位:元)与零件的内径X有如下关系:
L=
求该企业一天从生产线上随机抽取10000个零件的平均利润.
附:若随机变量X服从正态分布N(μ,σ2),有P(μ-σ≤X≤μ+σ)≈0.6827,P(μ-2σ≤X≤μ+2σ)≈0.9545,P(μ-3σ≤X≤μ+3σ)≈0.9973.
解析:(1)抽取的一个零件的尺寸在(μ-3σ,μ+3σ)之内的概率为0.9973,从而抽取一个零件为不合格品的概率为0.0027,因此一天内抽取的10000个零件中不合格品的个数约为10000×0.0027=27.
(2)结合正态分布曲线和题意可知:
P(X<μ-3σ)=0.00135,
P(μ-3σ≤X<μ-σ)=×(0.9973-0.6827)=0.1573,
P(μ-σ≤X≤μ+3σ)=0.9973-0.1573=0.84,
P(X>μ+3σ)=0.00135,
故随机抽取10000个零件的平均利润为
10000L=10000×(-5×0.00135+4×0.1573+6×0.84-5×0.00135)=56557(元).
考点3 独立性检验、正态分布的综合问题
【例3】 (2025·山西阶段练习)光明高级中学高三年级理科考生800人都参加了本学期的期中调研测试,学校把本次测试数学成绩达到120分以上(包含120分)的同学的数学成绩等第定为优秀,物理成绩达到90分以上(包含90分)的同学的物理成绩等第定为优秀.现从理科考生中随机抽取10名同学调研本次测试的数学和物理成绩,如下表:
数学/分
119
145
99
95
135
120
122
85
130
120
物理/分
84
90
82
84
83
81
83
81
90
82
(1)试列出2×2列联表,并依据α=0.1的独立性检验分析能否认为本次测试理科考生的数学成绩的等第优秀与物理成绩的等第是否优秀有关?
(2)如果本次测试理科考生的物理成绩X~N(μ,σ2),用样本估计总体,以10名同学物理成绩的平均数为μ,方差为σ2,若从参加考试的800名理科考生中随机抽取4人,求这4人中至少有1人的物理成绩的等第优秀的概率.
参考数据:取≈3,≈4,0.841354≈0.501,0.977254≈0.91206.
若X~N(μ,σ2),则P(μ-σ<X<μ+σ)≈0.6827,P(μ-2σ<X<μ+2σ)≈0.9545,P(μ-3σ<X<μ+3σ)≈0.9973.
χ2=,n=a+b+c+d.
α
0.1
0.05
0.01
0.005
xa
2.706
3.841
6.635
7.879
解析:(1)由题意可得:2×2列联表为
单位:人
数学成绩
物理成绩
合计
物理优秀
物理非优秀
数学优秀
2
4
6
数学非优秀
0
4
4
合计
2
8
10
零假设为H0:数学成绩的等第优秀与物理成绩的等第优秀无关.
可得χ2=≈1.667<2.706=x0.1,
依据小概率值α=0.1的独立性检验,可以推断H0成立,
即数学成绩的等第优秀与物理成绩的等第优秀无关.
(2)由题意可得,物理成绩的平均分为=(84+90+82+84+83+81+83+81+90+82)=84(分),
方差s2=[(84-84)2+(90-84)2+(82-84)2+(84-84)2+(83-84)2+(81-84)2+(83-84)2+(81-84)2+(90-84)2+(82-84)2]=10,
结合题意可知:X~N(84,10),即μ=84,σ=≈3,则μ+2σ=90,
可得P(X<90)=≈0.97725,
记“4人中至少1人物理成绩的等第优秀”为事件A,
可得P(A)=1-[P(X<90)]4≈1-0.977254≈0.08794,
所以4人中至少有1人物理成绩的等第优秀的概率为0.08794.
统计与概率是高中数学的重要内容,也是便于贴近生活立意的高考大题.考查重点是用样本估计总体,离散型随机变量的分布列、期望,应用回归分析与独立性检验思想方法解决简单实际问题的能力.试题强调应用性,以实际问题为背景,建构数学模型,突出考查统计与概率的思想和考生处理数据的能力及应用意识.
变式探究
3.(2025·上海浦东新阶段校考)环境监测部门为调研汽车流量对空气质量的影响,在某监测点统计每日过往的汽车流量x(单位:辆)和空气中的PM2.5的平均浓度y(单位:μg/m3).调研人员采集了50天的数据,制作了关于(xi,yi)(i=1,2,3,…,50)的散点图,并用直线x=1500与y=100将散点图分成如图所示的四个区域Ⅰ、Ⅱ、Ⅲ、Ⅳ,落入对应区域的样本点的个数依次为6,20,16,8.
(1)完成下面的2×2列联表,并依据小概率值α=0.01的独立性检验,能否认为“PM2.5的平均浓度不小于100 μg/m3”与“汽车日流量不小于1500辆”有关?
单位:天
PM2.5的
平均浓度y
汽车日流量x
合计
<1500
≥1500
<100
≥100
合计
(2)经计算得回归方程为=0.12x-73.36,且这50天的汽车日流量x的标准差sx=252,PM2.5的平均浓度y的标准差sy=36.
(ⅰ)求相关系数r,并判断该回归方程是否有价值;
(ⅱ)若这50天的汽车日流量x满足,试推算这50天的PM2.5日均浓度y的平均数.(精确到0.1)
参考公式:χ2=,其中n=a+b+c+d.
α
0.1
0.05
0.01
0.001
xα
2.706
3.841
6.635
10.828
回归方程,其中.
相关系数.若|r|≥0.75,则认为y与x有较强的线性相关性.
参考数据:≈382.14.
解析:(1)2×2列联表如下:
单位:天
PM2.5的
平均浓度y
汽车日流量x
合计
<1500
≥1500
<100
16
8
24
≥100
6
20
26
合计
22
28
50
零假设为H0:“PM2.5的平均浓度不小于100 μg/m3”与“汽车日流量不小于1500辆”无关.
因为χ2=≈9.62>6.635=x0.01,
所以根据小概率值α=0.01的独立性检验,我们推断H0不成立,即认为“PM2.5的平均浓度不小于100 μg/m3”与“汽车日流量不小于1500辆”有关.
(2)(ⅰ)因为回归方程为,所以,
又因为,,
所以=0.12×=0.84.
因为|r|=0.84>0.75,所以y与x有较强的相关性,所以该回归方程有价值.
(ⅱ)sx=252=,
解得≈1528.56,
而样本中心点(,)位于回归直线=0.12x-73.36上,
因此可推算≈0.12×1528.56-73.36≈110.1(μg/m3).
学科网(北京)股份有限公司
$
独立性检验与正态分布
课前必备知识
课标要求
1.了解2×2列联表的统计意义,了解独立性检验(2×2列联表)的基本思想、方法及其简单应用.2.了解正态分布曲线的特点及曲线所表示的意义.3.会利用3σ原则及正态曲线的对称性计算有关概率.
知识梳理
1.2×2列联表与独立性检验
(1)我们经常会使用一种特殊的随机变量,以区别不同的现象或性质,这类随机变量称为分类变量.
(2)列出的两个分类变量的频数表,称为列联表.
(3)一般地,假设有两个分类变量X和Y,它们的值域分别为{x1,x2}和{y1,y2},其抽样数据列联表为
X
Y
合计
Y=y1
Y=y2
X=x1
a
b
a+b
X=x2
c
d
c+d
合计
a+c
b+d
n=a+b+c+d
计算统计量χ2=(其中n=a+b+c+d为样本容量),利用χ2的取值推断分类变量X和Y__是否独立__的方法称为χ2独立性检验,简称独立性检验.独立性检验即由统计量χ2的取值来确定在多大程度上可以认为“两个分类变量X和Y有关系”.
2.正态分布
(1)若随机变量X的概率分布密度函数f(x)=,x∈R,其中μ∈R,σ>0为参数,则称随机变量X服从正态分布,记为__X~N(μ,σ2)__.
(2)函数f(x)=,x∈R的图象称为正态密度曲线,简称正态曲线.
(3)正态曲线的特点:
①曲线是单峰的,它关于直线__x=μ__对称.
②曲线在x=μ时达到峰值____.
③当|x|无限增大时,曲线无限接近于__x轴__.
④曲线与x轴之间的区域的面积为1.
⑤当σ一定时,曲线的位置由μ确定,曲线随着μ的变化而沿x轴平移.
⑥当μ一定时,曲线的形状由σ确定,σ越大,曲线越“矮胖”,表示随机变量X的分布越__分散__;σ越小,曲线越“高瘦”,表示随机变量X的分布越__集中__.
(4)3σ原则
①X∈[μ-σ,μ+σ],P(X)≈0.6827;
②X∈[μ-2σ,μ+2σ],P(X)≈0.9545;
③X∈[μ-3σ,μ+3σ],P(X)≈0.9973.
课前训练
1.为调查中学生近视情况,测得某校男生150名中有80名近视,140名女生中有70名近视.在检验这些学生眼睛近视是否与性别有关时,用下列哪种方法最有说服力( )
A.回归分析 B.均值与方差
C.独立性检验 D.概率
2.已知正态分布密度函数f(x)=e-,x∈R,则μ,σ分别是( )
A.0和4 B.0和2
C.0和8 D.0和
3.为了解某大学的学生是否爱好体育锻炼,用简单随机抽样的方法在校园内调查了120位学生,得到如下2×2列联表:
单位:人
性别
爱好体育锻炼
合计
爱好
不爱好
男
a
c
74
女
b
25
合计
73
则a-b-c=( )
A.7 B.8
C.9 D.10
4.四川省将从2022年秋季入学的高一年级学生开始实行高考综合改革,高考采用“3+1+2”模式,其中“1”为首选科目,即物理与历史二选一.某校为了解学生的首选意愿,对部分高一学生进行了抽样调查,制作出如下两个等高堆积条形图.根据条形图信息,下列结论正确的是( )
A.样本中选择物理意愿的男生人数少于选择历史意愿的女生人数
B.样本中女生选择历史意愿的人数多于男生选择历史意愿的人数
C.样本中选择物理学科的人数较多
D.样本中男生人数少于女生人数
5.(2022·新课标Ⅱ卷)已知随机变量X服从正态分布N(2,σ2),且P(2<X≤2.5)=0.36,则P(X>2.5)=__________.
课堂核心考点
考点1 独立性检验
【例1】 学校为提升高一年级学生自主体育锻炼的意识,拟将每周自主进行体育锻炼的时间不低于6小时的同学称为“体育迷”并予以奖励.为了确定奖励方案,先对学生自主体育锻炼的情况进行抽样调查,学校从高一年级随机抽取100名学生,将他们分为男生组、女生组,对每周自主体育锻炼的时间分段进行统计(单位:小时):第一段[0,2),第二段[2,4),第三段[4,6),第四段[6,8),第五段[8,10].将男生在各段的频率及女生在各段的频数用折线图表示如下:
(1)求折线图中m的值,并由样本估计该校高一年级学生中“体育迷”所占的比例.
(2)填写下列2×2列联表,并依据小概率值α=0.1的独立性检验,能否认为是否为“体育迷”与学生的性别有关联?
单位:人
性别
体育迷
合计
体育迷
非体育迷
男
女
合计
(3)若中学生每周自主体育锻炼的时间不低于5小时,才能保持身体的良好健康发展,试由样本估计该校高一年级学生的周平均锻炼时间是否达到保持身体良好健康发展的水平.(同一段中的数据用该组区间的中点值代表)
附:χ2=,n=a+b+c+d.
α
0.1
0.05
0.010
0.001
xα
2.706
3.841
6.635
10.828
(1)独立性检验的基本思想类似于反证法.要确认“两个分类变量有关系”这一结论成立的可信程度,首先假设该结论不成立,即假设结论“两个分类变量没有关系”成立,在该假设下构造的统计量χ2应该很小.如果由观测数据计算得到的χ2的概率值α很大,则在一定程度上说明假设不合理.
(2)独立性检验的一般步骤
①提出零假设H0:X和Y相互独立,并给出在问题中的解释.
②根据抽样数据整理出2×2列联表,计算χ2的值,并与临界值xα比较.
查下表确定临界值xα:
α
0.1
0.05
0.01
0.005
0.001
xα
2.706
3.841
6.635
7.879
10.828
③如果χ2≥xα,就推断“X与Y有关系”,这种推断犯错误的概率不超过α;否则,就认为在犯错误的概率不超过α的前提下,不能推断“X与Y有关系”.
变式探究
1.2023年11月,世界首届人工智能峰会在英国举行,我国因为在该领域取得的巨大成就受邀进行大会发言.为了研究不同性别的学生对人工智能的了解情况,某市某著名高中进行了一次抽样调查,分别抽取男、女生各50人作为样本.设事件A=“了解人工智能”,B=“学生为男生”,据统计P(A|)=,P(B|A)=.
(1)根据已知条件,填写下列2×2列联表,并依据小概率值α=0.01的独立性检验,能否推断该校学生对人工智能的了解情况与性别有关联?
单位:人
性别
人工智能的了解情况
合计
了解
不了解
男生
女生
合计
(2)(ⅰ)现从所抽取的女生中利用分层随机抽样的方法抽取20人,再从这20人中随机选取3人赠送科普材料,求选取的3人中至少有2人了解人工智能的概率;
(ⅱ)将频率视为概率,从我市所有参与调查的学生中随机抽取20人科普材料,记其中了解人工智能的人数为X,求随机变量X的数学期望和方差.
参考公式:χ2=,n=a+b+c+d.
常用的小概率值和相应的临界值如下表:
α
0.1
0.05
0.01
0.005
0.001
xα
2.706
3.841
6.635
7.879
10.828
考点2 正态分布
【例2】 (2025·广东广州阶段校考)某工厂一台设备生产一种特定零件,工厂为了解该设备的生产情况,随机抽检了该设备在一个生产周期中的100件产品的关键指标(单位:cm),经统计得到下面的频率分布直方图:
(1)由频率分布直方图估计抽检样本关键指标的平均数和方差s2.(用每组的中点代表该组的均值)
(2)已知这台设备正常状态下生产零件的关键指标服从正态分布N(μ,σ2),用直方图的平均数估计值作为μ的估计值,用直方图的标准差估计值s作为σ的估计值.
(ⅰ)为了监控该设备的生产过程,每个生产周期中都要随机抽测10个零件的关键指标,如果关键指标出现了(μ-3σ,μ+3σ)之外的零件,就认为生产过程可能出现了异常,需停止生产并检查设备.下面是某个生产周期中抽测的10个零件的关键指标:
0.8
1.2
0.95
1.01
1.23
1.12
1.33
0.97
1.21
0.83
利用μ和σ判断该生产周期是否需停止生产并检查设备.
(ⅱ)若设备状态正常,记X表示一个生产周期内抽取的10个零件关键指标在(μ-3σ,μ+3σ)之外的零件个数,求P(X≥1)及X的数学期望.
参考数据:若随机变量X服从正态分布N(μ,σ2),则P(μ-3σ≤X≤μ+3σ)≈0.9973,≈0.105,≈0.110,0.99739≈0.9760,0.997310≈0.9733.
正态分布N(μ,σ2)是一种应用十分广泛的分布,对正态分布N(μ,σ2)的复习,应该注意:
(1)明确μ,σ的意义,其中μ,σ分别表示总体平均数和总体方差,常利用样本进行估计.
(2)求指定范围内的概率值时,要充分利用正态曲线的对称性及3σ原则.
(3)重视正态分布的实际应用及对数据的分析和处理能力的培养.
(4)重视数字运算能力的培养及参考数据的合理运用.
变式探究
2.为了严格监控某种零件的一条生产线的生产过程,某企业每天从该生产线上随机抽取10000个零件,并测量其内径(单位:cm).根据长期生产经验,认为这条生产线正常状态下生产的零件的内径X服从正态分布N(μ,σ2).如果加工的零件内径小于μ-3σ或大于μ+3σ均为不合格品,其余为合格品.
(1)假设生产状态正常,请估计一天内抽取的10000个零件中不合格品的个数.
(2)若生产的某件产品为合格品,则该件产品盈利;若生产的某件产品为不合格品,则该件产品亏损.已知每件产品的利润L(单位:元)与零件的内径X有如下关系:
L=
求该企业一天从生产线上随机抽取10000个零件的平均利润.
附:若随机变量X服从正态分布N(μ,σ2),有P(μ-σ≤X≤μ+σ)≈0.6827,P(μ-2σ≤X≤μ+2σ)≈0.9545,P(μ-3σ≤X≤μ+3σ)≈0.9973.
考点3 独立性检验、正态分布的综合问题
【例3】 (2025·山西阶段练习)光明高级中学高三年级理科考生800人都参加了本学期的期中调研测试,学校把本次测试数学成绩达到120分以上(包含120分)的同学的数学成绩等第定为优秀,物理成绩达到90分以上(包含90分)的同学的物理成绩等第定为优秀.现从理科考生中随机抽取10名同学调研本次测试的数学和物理成绩,如下表:
数学/分
119
145
99
95
135
120
122
85
130
120
物理/分
84
90
82
84
83
81
83
81
90
82
(1)试列出2×2列联表,并依据α=0.1的独立性检验分析能否认为本次测试理科考生的数学成绩的等第优秀与物理成绩的等第是否优秀有关?
(2)如果本次测试理科考生的物理成绩X~N(μ,σ2),用样本估计总体,以10名同学物理成绩的平均数为μ,方差为σ2,若从参加考试的800名理科考生中随机抽取4人,求这4人中至少有1人的物理成绩的等第优秀的概率.
参考数据:取≈3,≈4,0.841354≈0.501,0.977254≈0.91206.
若X~N(μ,σ2),则P(μ-σ<X<μ+σ)≈0.6827,P(μ-2σ<X<μ+2σ)≈0.9545,P(μ-3σ<X<μ+3σ)≈0.9973.
χ2=,n=a+b+c+d.
α
0.1
0.05
0.01
0.005
xa
2.706
3.841
6.635
7.879
统计与概率是高中数学的重要内容,也是便于贴近生活立意的高考大题.考查重点是用样本估计总体,离散型随机变量的分布列、期望,应用回归分析与独立性检验思想方法解决简单实际问题的能力.试题强调应用性,以实际问题为背景,建构数学模型,突出考查统计与概率的思想和考生处理数据的能力及应用意识.
变式探究
3.(2025·上海浦东新阶段校考)环境监测部门为调研汽车流量对空气质量的影响,在某监测点统计每日过往的汽车流量x(单位:辆)和空气中的PM2.5的平均浓度y(单位:μg/m3).调研人员采集了50天的数据,制作了关于(xi,yi)(i=1,2,3,…,50)的散点图,并用直线x=1500与y=100将散点图分成如图所示的四个区域Ⅰ、Ⅱ、Ⅲ、Ⅳ,落入对应区域的样本点的个数依次为6,20,16,8.
(1)完成下面的2×2列联表,并依据小概率值α=0.01的独立性检验,能否认为“PM2.5的平均浓度不小于100 μg/m3”与“汽车日流量不小于1500辆”有关?
单位:天
PM2.5的
平均浓度y
汽车日流量x
合计
<1500
≥1500
<100
≥100
合计
(2)经计算得回归方程为=0.12x-73.36,且这50天的汽车日流量x的标准差sx=252,PM2.5的平均浓度y的标准差sy=36.
(ⅰ)求相关系数r,并判断该回归方程是否有价值;
(ⅱ)若这50天的汽车日流量x满足,试推算这50天的PM2.5日均浓度y的平均数.(精确到0.1)
参考公式:χ2=,其中n=a+b+c+d.
α
0.1
0.05
0.01
0.001
xα
2.706
3.841
6.635
10.828
回归方程,其中.
相关系数.若|r|≥0.75,则认为y与x有较强的线性相关性.
参考数据:≈382.14.
学科网(北京)股份有限公司
$
相关资源
由于学科网是一个信息分享及获取的平台,不确保部分用户上传资料的 来源及知识产权归属。如您发现相关资料侵犯您的合法权益,请联系学科网,我们核实后将及时进行处理。