内容正文:
第四章 统计
章末总结
知识系统整合
规律方法收藏
学科思想培优
目录
知识系统整合
堵点自记:﹍﹍﹍﹍﹍﹍﹍﹍﹍﹍﹍﹍﹍﹍﹍﹍﹍﹍﹍﹍﹍﹍﹍﹍﹍﹍﹍﹍﹍
﹍﹍﹍﹍﹍﹍﹍﹍﹍﹍﹍﹍﹍﹍﹍﹍﹍﹍﹍﹍﹍﹍﹍﹍﹍﹍﹍﹍﹍﹍﹍﹍﹍﹍
知识系统整合
4
规律方法收藏
规律方法收藏
6
注意理解以下几点:
①确定线性相关关系
判断是否具有线性相关关系的依据是样本点的散点图.如果两个变量之间的关系近似地表现为一条直线,则称它们有线性相关关系;如果一个变量的取值完全依赖于另一个变量,各观测点落在一条直线上,则它们就是函数关系.如广告费用与销售量在一定条件下具有线性相关关系,而圆的周长与半径的关系是函数关系.
规律方法收藏
7
②回归方程的应用
利用回归方程可以对总体进行预测,虽然得到的结果不是准确值,但我们是根据统计规律得到的,因而所得结果的正确率是很大的,所以可以大胆地利用回归方程进行预测.
③借助散点图可以直观地看出两个变量之间是否有相关关系.用最小二乘法思想建立的回归直线方程,能定量地描述两个变量的关系.
规律方法收藏
8
规律方法收藏
9
学科思想培优
(1)分析两个变量间的相关关系时,可以利用样本数据画散点图.利用散点图,如果这些点大致分布在通过散点图中心的一条直线附近,那么就说这两个变量之间具有线性相关关系,这条直线称为回归直线,直线方程称为回归直线方程.
(2)回归方程的应用:利用回归方程可以对总体进行预测.
一、一元线性回归模型
学科思想培优
11
习近平总书记曾提到“人不负青山,青山定不负人”.某农村利用得天独厚的地理优势,建起了草莓采摘园,为农民增加了一份收入.该农村每年的草莓种植面积y(单位:百亩)和年份代码x的关系如下表,已知x与y之间有较强的线性相关性.
年份 2019 2020 2021 2022 2023
年份代码x 1 2 3 4 5
草莓种植面积y/百亩 6 6.4 7 7.6 8
学科思想培优
12
学科思想培优
13
独立性检验的基本思想:要研究X,Y两个分类变量彼此是否独立,提出统计假设H0,通过2×2列联表计算出χ2的值,并与临界值x0比较,根据检验规则得出推断结论.
二、独立性检验
学科思想培优
14
某网站就“民众是否支持加大修建城市地下排水设施的资金投入”进行投票.按照北京暴雨前后两个时间收集有效投票,暴雨后的投票收集了50份,暴雨前的投票也收集了50份,所得统计结果如下表:
单位:份
态度
时间 不支持 支持 合计
暴雨后 x y 50
暴雨前 30 20 50
合计 A B 100
学科思想培优
15
学科思想培优
16
P(χ2≥x0) 0.15 0.10 0.05 0.025
x0 2.072 2.706 3.841 5.024
P(χ2≥x0) 0.010 0.005 0.001
x0 6.635 7.879 10.828
学科思想培优
17
学科思想培优
18
学科思想培优
19
下表为收集到的一组数据:
(1)作出x与y的散点图,并猜测x与y之间的关系;
(2)建立x与y的关系,求回归直线方程;
(3)利用所得模型,预测x=40时y的值.
三、转化与化归思想在非线性回归分析中的应用
x 21 23 25 27 29 32 35
y 7 11 21 24 66 115 325
学科思想培优
20
学科思想培优
21
x 21 23 25 27 29 32 35
z 1.946 2.398 3.045 3.178 4.190 4.745 5.784
学科思想培优
22
R
1.一元线性回归模型
(1)一元回归分析:研究两个变量间的回归关系称为一元回归分析.
(2)一元线性回归模型
在回归直线方程=+x中,
==,
=-.
其中=xi,=yi,点(,)称为样本中心.
2.独立性检验
(1)利用χ2来确定在多大程度上可以认为“两个分类变量有关系”的方法称为两个分类变量的独立性检验.
(2)使用χ2统计量作独立性检验的一般步骤
①提出统计假设H0:X与Y之间没有关系;
②根据2×2列联表与公式χ2=
计算出χ2的观测值;
③比较上述χ2的值与相关的临界值,作出相应的判断.
(1)试用最小二乘法求出y关于x
的回归直线方程eq \o(y,\s\up6(^))=eq \o(b,\s\up6(^))x+eq \o(a,\s\up6(^));
(2)预测2025年该农村的草莓种植面积.
参考公式:eq \o(b,\s\up6(^))=2,i)eq \f(\o(∑,\s\up12(n),\s\do12(i=1))xiyi-n\o(x,\s\up6(-))\o(y,\s\up6(-)),\o(∑,\s\up12(n),\s\do12(i=1))x-n\o(x,\s\up6(-))2)
,eq \o(a,\s\up6(^))=eq \o(y,\s\up6(-))-eq \o(b,\s\up6(^))
eq \o(x,\s\up6(-)).
解 (1)==3,
==7,
∴xiyi-5=5.2,x-52=10,∴===0.52,
∴=-=7-0.52×3=5.44,∴y关于x的回归直线方程为=0.52x+5.44.
(2)令x=7,可得=0.52×7+5.44=9.08,
故2025年该农村草莓的种植面积约为9.08百亩.
已知工作人员从所有投票中任取一个,取到“不支持投入”的投票的概率为eq \f(2,5).
(1)求列联表中的数据x,y,A,B的值;
(2)绘制条形统计图,通过图形判断本次暴雨是否影响到民众对加大修建城市地下排水设施的投入的态度?
(3)能否认为北京暴雨与民众是否赞成加大修建城市地下排水设施的投入有关联?
附:χ2=eq \f(n(ad-bc)2,(a+b)(c+d)(a+c)(b+d)).
解 (1)设“从所有投票中抽取一个,取到不支持投入的投票”为事件M,
由已知得P(M)=eq \f(x+30,100)=eq \f(2,5),所以x=10,A=40,y=40,B=60.
(2)由(1)知北京暴雨后支持率为eq \f(40,50)=eq \f(4,5),不支持率为1-eq \f(4,5)=eq \f(1,5),
北京暴雨前支持率为eq \f(20,50)=eq \f(2,5),
不支持率为1-eq \f(2,5)=eq \f(3,5).
条形统计图如图所示,
由图可以看出暴雨影响到民众对
加大修建城市地下排水设施的投入的态度.
(3)统计假设为H0:北京暴雨与民众是否赞成加大修建城市地下排水设施的投入无关联.
χ2=eq \f(100×(10×20-40×30)2,50×50×40×60)=eq \f(50,3)≈16.7,
因为16.7>10.828,所以至少有99.9%的
把握认为北京暴雨与民众是否赞成加大修建城市地
下排水设施的投入有关联.
解 (1)作出散点图如图,从散点图可以看出x与y不具有线性相关关系,根据已有知识可以发现样本点分布在指数曲线y=c1ec2x的附近,其中c1,c2为待定的参数.
(2)对两边取对数把指数关系变为线性关系,令z=ln y,则有变换后的样本点应分布在直线z=bx+a,a=ln c1, b=c2的周围,这样就可以利用线性回归模型来建立y与x之间的非线性回归方程,数据可以转化为
求得回归直线方程为=0.272x-3.849,
∴=e0.272x-3.849.
(3)当x=40时,=e0.272×40-3.849≈1131.
$