内容正文:
统计案例——实习作业
探究:运动时长与感冒次数之间的关系
2
成果分享 应用巩固
确定问题①(小组全体成员)
运动对于提高免疫力有着重要作用,而感冒作为生活中最常见的疾病,其发病与免疫力有着密切的关系。因此,我们对“运动时间是否与感冒次数有关”问题做了研究。
确定问题②(小组全体成员)
需要注意的两条基本原则:
①学校每周规定的运动时间为2h(体育课40min*2、早晨跑操10min*4),:
②感冒与多种因素有关,一年内有不多几次属正常情况或不属于本次研究范围。
因此,我们将问题确定为“每周运动时间是否超过3h与一年内感冒次数是否少于两次之间是否有关”。
设计抽样
抽样范围:
本校高二年级2,3,4,7,9,11,13,14班
抽样过程: 2班 31人 3班 33人
7班 29人 9班 22人
11班 31人 13班 23人
14班 21人
(共190人)
数据采集
共采集数据190份,其中
每周运动时间3h以上且一年感冒两次以下 64人
每周运动时间3h以下且一年感冒两次以下 51人
每周运动时间3h以上且一年感冒两次以上 36人
每周运动时间3h以下且一年感冒两次以上 39人
数据分析
1) 2*2列联表:
每周运动时间3h以上 每周运动时间3h以下 总计
一年感冒两次以下 64 51 115
一年感冒两次以上 36 39 75
总计 100 90 190
一年感冒两次以下 每周运动3h以上 每周运动3h以下 64 51 一年感冒两次以上 每周运动3h以上 每周运动3h以下 36 39
2) 计算: k=[190*(64*39-51*36)²]/(100*90*115*75)≈1.06>0.708
∴P(K²≥k0)=0.4
P(K2.≥k0) 0.50 0.40 0.25 0.15 0.10 0.05
k0 0.455 0.708 1.323 2.072 2.706 3.841
综上所述,在错误概率不超过40%的情况下,“感冒的次数”与“运动时间”存在相关关系。
误差分析
1)系统误差:
① 样本容量较小,普遍性不足;
② 13班为文科班,14班为体育班,运动量可能与其他班出入较大;
③ 感冒本身存在多种因素,仅认为与运动量有关是不准确的。
2)人为误差:
① 抽样可能不均匀。
拓展问题
1)将样本容量扩大到本校高二、高三年级,以上误差是否会缩小?
2)实际上使人患感冒的因素有许多种,究竟哪一种与感冒的相关性最强?
3)根据上述调查和拓展问题研究,如何减少患感冒的几率?
4)在本问题中,我们利用独立性检验思想对问题做了研究,但只有60%的把握判定两个变量之间存在相关关系。那么,是否可以换用线性回归思想对“感冒的次数”与“运动时间”进行拟合?
我国GDP与年份之间的关系
成果分享 应用巩固
使用指数函数/二次函数模型拟合:
设y=c1ec2x
lny=lnc1+c2x
令z=lny b=c2 c=lnc1
则有:z=bx+a(a=lnc1,b=c2)
设y=c3x2+c4
即令t=x2
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
由拟合模型及数据代入线性回归公式:
可得:b=0.1348
a=-258.0263
即线性回归方程为:z=0.1348x-258.0263
因此该非线性回归方程为:
Y=e0.1348x-258.0263
根据散点图可得线性回归方程为:
Y=2.1214 t-8209417.579
即非线性回归方程为:
Y=2.1214x2-8209417.576
|
|
|
|
|
|
|
|
比较两个回归方程的拟合效果
通过残差来比较两个回归方程的拟合效果:
ei(1)=yi-yi(1)=yi-e0.1348x-258.0263,i=1,2……29
ei(2)=yi-yi(2) =yi-2.1214x2-8209417.576 ,i=1,2……29
由残差公式计算可知:指数函数残差绝对值小于二次函数残差绝对值,即指数函数模型拟合效果要好于二次函数模型拟合效果。
即使用回归方程: Y=e0.1348x-258.0263
对数据的解释
2001年11月10日,在卡塔尔多哈举行的世界贸易组织(WTO)第四届部长级会议通过了中国加入世贸组织法律文件,它标志着经过15年的艰苦努力,我国终于成为世贸组织新成员。
GDP总值(单位:亿元) 1992 1993 1994 1995 1996 1997 1998 1999 2000 2001 2002 2003 2004 2005 2006 200