内容正文:
第5讲 成对数据的统计分析
1
[考情分析]
成对数据的统计分析是高考的重点,主要考查回归方程、独立性检验等知识,中等难度,热点是概率与统计的交汇问题.
返回首页
二轮专题复习
考点一 独立性检验
基于小概率值α的检验规则是:
当χ2≥xα时,我们就推断H0不成立,即认为X和Y不独立,该推断犯错误的概率不超过α;
当χ2<xα时,我们没有充分证据推断H0不成立,可以认为X和Y独立.
返回首页
二轮专题复习
(2025·全国一卷)为研究某疾病与超声波检查结果的关系,从做过超声波检查的人群中随机调查了1 000人,得到如下列联表:
超声波检查结果
组别 正常 不正常 合计
患该疾病 20 180 200
未患该疾病 780 20 800
合计 800 200 1 000
返回首页
二轮专题复习
(1)记超声波检查结果不正常者患该疾病的概率为p,求p的估计值;
返回首页
二轮专题复习
P(χ2≥k) 0.050 0.010 0.001
k 3.841 6.635 10.828
返回首页
二轮专题复习
返回首页
二轮专题复习
【解题技法】 独立性检验的一般步骤
返回首页
二轮专题复习
(2025·湛江二模)为了研究观众对某档节目的喜爱情况与性别的关联性,分别调查了该档节目男、女观众各100人,发现共有70名观众喜爱该档节目,且不喜爱该档节目的女性观众数是喜爱该档节目的男性观众数的2倍.
(1)根据题中信息,完成下面列联表;
单位:人
性别 喜爱情况 合计
喜爱 不喜爱
男
女
合计
返回首页
二轮专题复习
解:设喜爱该档节目的男性观众数为x,则喜爱该档节目的女性观众数为70-x,不喜爱该档节目的女性观众数为2x,则70-x+2x=100,解得x=30.
故列联表完成如下.
单位:人
性别 喜爱情况 合计
喜爱 不喜爱
男 30 70 100
女 40 60 100
合计 70 130 200
返回首页
二轮专题复习
α 0.1 0.05 0.01
xα 2.706 3.841 6.635
返回首页
二轮专题复习
返回首页
二轮专题复习
考点二 回归分析
2.当|r|越接近1时,成对样本数据的线性相关程度越强;当|r|越接近0时,成对样本数据的线性相关程度越弱.
3.决定系数R2越大,拟合效果越好;R2越小,拟合效果越差.
4.残差图中带状区域宽度越窄,拟合效果越好;残差图中带状区域宽度越宽,拟合效果越差.
返回首页
二轮专题复习
在乒乓球练习中有一项打定点练习,就是把乒乓球打到对方球台的指定位置(称为“准点球”).每个周末,某乒乓球训练室教练会记录每个学员在练习时打的所有球中“准点球”所占的百分比,A学员已经练习了1年,下表记录了A学员最近七周“准点球”所占的百分比.
第x周 1 2 3 4 5 6 7
“准点球”所占的百分比y (%) 52 52.8 53.5 54 54.5 54.9 55.3
返回首页
二轮专题复习
(1)根据上表数据,计算y与z的样本相关系数r,并说明y与z的线性相关程度的强弱(若0.75≤|r|≤1,则认为y与z的线性相关程度很强;若0.3≤|r|<0.75,则认为y与z的线性相关程度一般;若|r|<0.3,则认为y与z的线性相关程度较弱).
返回首页
二轮专题复习
返回首页
二轮专题复习
返回首页
二轮专题复习
【解题技法】 求经验回归方程的步骤
返回首页
二轮专题复习
A
返回首页
二轮专题复习
返回首页
二轮专题复习
(2025·日照一模)某网购专营店统计了2025年1月5日到9日这5天到该专营店购物的人数y和天数x间的数据,列表如下:
考点三 概率与统计的综合问题
x 1 2 3 4 5
y 75 84 93 98 100
(1)由表中给出的数据判断是否可以用线性回归模型拟合人数y和天数x之间的关系?若可用,估计1月10日到该专营店购物的人数;若不可用,请说明理由(人数用四舍五入法取整数,若样本相关系数|r|>0.75,则认为y与x的线性相关程度很强,可以用线性回归模型拟合,r精确到0.01);
返回首页
二轮专题复习
返回首页
二轮专题复习
返回首页
二轮专题复习
返回首页
二轮专题复习
返回首页
二轮专题复习
【解】 若选方案一,需付款1 000-50=950元.
返回首页
二轮专题复习
【解题技法】 解决成对数据的统计分析与概率综合问题的策略
(1)从已知数表中获取关键信息,厘清数据及事件之间的关系.
(2)建立适当的数学模型,转化成各种概型或随机变量的分布、回归分析、独立性检验等问题.
(3)求解数学模型再回到实际问题.
返回首页
二轮专题复习
(2025·淄博一模)为调查某地大型水域的水质情况,设置若干站点检测水质指数(“M指数”),以这些站点所测“M指数”的平均值为依据,播报此大型水域的水质情况.下图是2024年11月份30天内该大型水域“M指数”的频率分布直方图,其中分组区间分别为[12,20),[20,28),[28,36),[36,44),[44,52),[52,60),[60,68),[68,76].
返回首页
二轮专题复习
(1)规定:“M指数”不超过50为“优质水源日”,否则称为“非优质水源日”.对该地区50名到此水域郊游的市民进行调查,得到如下列联表:
单位:人
出游 性别 合计
男 女
优质水源日 12 30
非优质水源日 6
合计 50
请完成上述列联表,并根据小概率值α=0.05的独立性检验,能否认为优质水源日出游与性别有关?
返回首页
二轮专题复习
解:
单位:人
出游 性别 合计
男 女
优质水源日 12 18 30
非优质水源日 14 6 20
合计 26 24 50
返回首页
二轮专题复习
α 0.1 0.05 0.01 0.005 0.001
xα 2.706 3.841 6.635 7.879 10.828
返回首页
二轮专题复习
返回首页
二轮专题复习
返回首页
二轮专题复习
(2)求y关于x的经验回归方程,并预测A学员第9周“准点球”所占的百分比(精确到0.01).
参考公式和数据:变量u和变量v的样本相关系数经验回归直线的斜率和截距的最小二乘估计公式分别为-72≈2.05,iyi≈729.99,≈1.925,≈53.86,≈103.7,≈4.12.
所以X的分布列为
X
0
1
2
3
P
所以E(X)=0×+1×+2×+3×=(或E(X)=3×=).
$