内容正文:
高二数学上学期·期末复习大串讲
专题07 统计案例
北师大版(2019)
01
02
03
目
录
押题预测
题型剖析
考点透视
5大常考点:知识梳理、思维导图
8个题型典例剖析+技巧点拨
精选6道期末真题对应考点练
考点透视
01
PART
考点透视
考点1.直线拟合
1.散点图
每个点对应的一对数据(xi,yi),称为成对数据.这些点构成的图称为散点图.
2.曲线拟合
从散点图上可以看出,如果变量之间存在着某种关系,这些点会有一个大致趋势,这种趋势通常可以用一条光滑的曲线来近似地描述.这样近似描述的过程称为曲线拟合.
3.直线拟合
若在两个变量X和Y的散点图中,所有点看上去都在一条________附近波动,此时就可以用一条________来近似地描述这两个量之间的关系,称之为直线拟合.
直线
直线
考点透视
考点2. 一元线性回归方程
1.最小二乘法
对于给定的两个变量X和Y,可以把其成对的观测值(x1,y1),(x2,y2),…,(xn,yn)表示为平面直角坐标系中的n个点.由直线方程Y=a+bX计算出来的值a+bxi(x=1,2,…n),与实际观测值yi的差异尽可能小.换句话说,a,b的取值使[y1-(a+bx1)]2+[y2-(a2+bx2)]2+…+[yn-(a+bxn)]2达到最小.这个方法称为最小二乘法.
2.线性回归方程
直线方程Y=________称作Y关于X的线性回归方程,相应的直线称作Y关于X的回归直线,,是这个线性回归方程的系数.其中
+X
考点透视
考点3.相关系数
1.样本(线性)相关系数:一般地,设随机变量X,Y的n组观测值分别为(x1,y1),(x2,y2),…,(xn,yn),记r==,称r为随机变量X和Y的样本(线性)相关系数,为了计算的方便,再给出如下式子:r=
考点透视
考点3.相关系数
2.样本相关系数与相关程度
样本(线性)相关系数r的取值范围是[-1,1].
|r|值越接近____,随机变量之间的线性相关程度越强;
|r|值越接近____,随机变量之间的线性相关程度越弱.
当r>0时,两个随机变量的值总体上变化趋势相同,此时称两个随机变量______相关;
当r<0时,两个随机变量的值总体上变化趋势相反,此时称两个随机变量______相关;
当r=0时,此时称两个随机变量线性不相关.
1
0
正
负
考点透视
考点4.2×2列联表
1.2×2列联表给出了成对分类变量数据的 .
2.定义一对分类变量X和Y,我们整理数据如下表所示:
X Y 合计
Y=0 Y=1
X=0 a b a+b
X=1 c d c+d
合计 a+c b+d n=a+b+c+d
像这种形式的数据统计表称为2×2列联表.
交叉分类频数
考点透视
考点5.独立性检验的基本思想
1.定义:利用χ2的取值推断分类变量X和Y是否独立性的方法称为χ2独立性检验,读作“卡方独立性检验”,简称独立性检验.
2.公式:χ2=.
3.判断方法
(1)当χ2≤2.706时,没有充分的证据判断变量A,B有关联,可以认为变量A,B是没有关联的;
(2)当χ2>2.706时,有90%的把握判断变量A,B有关联;
(3)当χ2>3.841时,有95%的把握判断变量A,B有关联;
(4)当χ2>6.635时,有99%的把握判断变量A,B有关联.
题型剖析
02
PART
题型剖析
题型1.一元线性回归方程的特性
【例题2】已知x,y的取值如下表:
由所给数据在散点图上的位置分析可知y与x线性相关,且线性回归方程为=0.95x+,则=( )
A.1.45 B.1.55 C.1.65 D.1.80
x 0 1 4 5 6 8
y 1.3 1.8 5.6 6.1 7.4 9.3
解析:由题意,得==4,==5.25.∵y与x线性相关,且=0.95x+,∴5.25=0.95×4+,解得=1.45.故选A.
答案:A
题型剖析
题型2.求线性回归方程
【例题2】某个体服装店经营某种服装在某周内获得的纯利润y(元)与该周每天销售这种服装的件数x之间有如下一组数据:
已知=280,=45 309,=3 487.
(1)求;
(2)求纯利润y与每天销售件数x的线性回归方程;
(3)估计每天销售10件这种服装时,纯利润是多少元?
x 3 4 5 6 7 8 9
y 66 69 73 81 89 90 91
题型剖析
题型2.求线性回归方程
解析:(1)=(3+4+5+6+7+8+9)=6,
=(66+69+73+81+89+90+91)≈79.86.
(2)设线性回归方程为=x+,则==≈4.75
=-=79.86-4.75×6=51.36.
∴所求线性回归方程为=4.75x+51.36.
(3)当x=10时,y∧=98.86,估计每天销售10件这种服装时,可获纯利润为98.86元.
题型剖析
题型3.线性回归分析
【例题3】某公司为了预测下月产品销售情况,找出了近7个月的产品销售量y(单位:万件)的统计表:
但其中数据污损不清,经查证=9.32,=40.17,=0.55.
(1)求y关于t的线性回归方程(系数精确到0.01);
(2)公司经营期间的广告宣传费xi=(单位:万元)(i=1,2,…,7),每件产品的销售价为10元,预测第8个月的毛利润能否突破15万元,请说明理由.(毛利润等于销售金额减去广告宣传费)
参考公式及数据:≈1.414,≈2.646.
月份代码t 1 2 3 4 5 6 7
销售量y(万件) y1 y2 y3 y4 y5 y6 y7
题型剖析
题型3.线性回归分析
解析:(1)由题中和附注中的参考数据,得
=4,=28, =0.55,
==40.17-4×9.32=2.89,
又=≈1.331,
∴==≈0.103,
=-≈1.331-0.103×4≈0.92,
所以y关于t的线性回归方程为=0.10t+0.92.
(2)当t=8时,代入线性回归方程,得=0.10×8+0.92=1.72(万件),
所以第8个月的毛利润为z=10×1.72-=17.2-2×1.414=14.372(万元).
因为14.372<15,所以预测第8个月的毛利润不能突破15万元.
题型剖析
题型4. 相关关系的判断
【例题4】(多选题)如图所示的两个变量不具有相关关系的是( )
解析:A是确定的函数关系;B中的点大都分布在一条曲线周围;C中的点大都分布在一条直线周围;D中点的分布没有任何规律可言,x,y不具有相关关系.故选AD.
答案:AD
题型剖析
题型5.线性相关程度的判断
【例题5】某农场经过观测得到水稻产量和施化肥量的统计数据如表:
施化肥量x 15 20 25 30 35 40 45
水稻产量y 330 345 365 405 445 450 455
求水稻产量与施化肥量的相关系数,并判断相关性的强弱.
相关系数及线性回归直线方程系数公式:
题型剖析
题型5.线性相关程度的判断
解析:由已知数据计算可知,=30,≈399.3,
∴相关系数r=≈0.97
由于0.97与1十分接近,所以水稻产量与施化肥量的相关性强.
题型剖析
题型6.对独立性检验思想的理解
【例题6】为考察某动物疫苗预防某种疾病的效果,现对200只动物进行调研,并得到如下数据:
未发病 发病 合计
未接种疫苗 20 60 80
接种疫苗 80 40 120
合计 100 100 200
则下列说法正确的是( )
A.至少有99%的把握认为“发病与未接种疫苗有关”
B.至多有99%的把握认为“发病与未接种疫苗有关”
C.至多有99%的把握认为“发病与未接种疫苗无关”
D.“发病与未接种疫苗有关”的错误率至少有0.01%
答案:A
题型剖析
题型6.对独立性检验思想的理解
解析:χ2==>6.635
所以至少有99%的把握认为“发病与未接种疫苗有关”,故选A.
题型剖析
题型7.独立性检验的应用
【例题7】某生产线上,质量监督员甲在生产现场时,990件产品中有合格品982件,次品8件;不在生产现场时,510件产品中有合格品493件,次品17件.是否有99%的把握认为质量监督员甲在不在生产现场与产品质量好坏有关系?
题型剖析
题型7.独立性检验的应用
解析:根据题目所给数据得如下2×2列联表:
根据列联表中的数据,经计算得到
χ2=≈13.097>6.635.
所以有99%的把握认为质量监督员甲在不在生产现场与产品质量好坏有关.
合格品 次品 合计
甲在生产现场 982 8 990
甲不在生产现场 493 17 510
合计 1 475 25 1 500
题型剖析
题型8.独立性检验的综合应用
【例题8】某学校研究性学习小组对该校高三学生视力情况进行调查,在高三的全体1 000名学生中随机抽取了100名学生的体检表,并得到如图所示的频率分布直方图.
题型剖析
题型8.独立性检验的综合应用
(1)若频率分布直方图中后四组的频数成等差数列,试估计全年级视力在5.0以下的人数.
(2)学习小组成员发现,学习成绩突出的学生,近视的比较多,为了研究学生的视力与学习成绩是否有关系,对年级名次在1~50名和951~1 000名的学生进行了调查,得到下列2×2列联表,试问能否认为视力与学习成绩有关?
视力 学习成绩 合计
名次在1~50名 名次在951~1 000名
近视 41 32 73
不近视 9 18 27
合计 50 50 100
(3)在(2)中调查的100名学生中,按照分层抽样在不近视的学生中抽取了6人,进一步调查他们良好的护眼习惯,并且在这6人中任取2人,求抽取的2人中,恰有1人年级名次在1~50名的概率.
题型剖析
题型8.独立性检验的综合应用
解析:(1)由图可知第一组有3人,第二组有7人,第三组有27人.
因为后四组的频数成等差数列,且它们的和为90,公差小于0,
所以后四组的频数依次为27,24,21,18.
所以视力在5.0以下的人数为3+7+27+24+21=82(或者100-18=82),
故全年级视力在5.0以下的人数约为1 000×=820.
(2)由公式计算得χ2=≈4.110>3.841
所以有95%的把握认为视力与学习成绩有关.
(3)依题意得,6人中年级名次在1~50名的有2人,
年级名次在951~1 000名的有4人,
则从6人中任取2人的情况有
=8种,所以所求概率为.
押题预测
03
PART
题型剖析
1.分类变量X和Y的列表如下,则下列说法判断正确的是( )
y1 y2 合计
x1 a b a+b
x2 c d c+d
合计 a+c b+d a+b+c+d
A.ad-bc越小,说明X和Y关系越弱
B.ad-bc越大,说明X和Y关系越强
C.(ad-bc)2越大,说明X与Y关系越强
D.(ad-bc)2越接近于0,说明X与Y关系越强
答案:C
题型剖析
解析:列联表可以较为准确地判断两个变量之间的相关关系程度,
由χ2=
当(ad-bc)2越大,χ2越大,表明X与Y的关系越强.
(ad-bc)2越接近0,说明两个分类变量X和Y无关的可能性越大.
题型剖析
2.某服装厂引进新技术,其生产服装的产量x(百件)与单位成本y(元)满足回归直线方程=100.36-14.2x,则以下说法正确的是( )
A.产量每增加100件,单位成本约下降14.2元
B.产量每减少100件,单位成本约上升100.36元
C.产量每增加100件,单位成本约上升14.2元
D.产量每减少100件,单位成本约下降14.2元
解析:=-14.2<0表示产量每增加100件,单位成本约下降14.2元,故选A.
答案:A
题型剖析
3.已知x,y是两个变量,下列四个关系中,x,y呈负相关的是( )
A.y=x2-1 B.y=-x2+1
C.y=x-1 D.y=-x+1
解析:根据题意,依次分析选项:对于A,y=x2-1,当x增大时,y的值不一定减小,两个变量不是负相关,不符合题意;对于B,y=-x2-1,当x增大时,y的值不一定减小,两个变量不是负相关,不符合题意;对于C,y=x-1,当x增大时,y的值一定增大,两个变量正相关,不符合题意;对于D,y=-x+1,当x增大时,y的值一定减小,两个变量负相关,符合题意;故选D.
答案:D
题型剖析
4.对两个变量x,y的几组观测数据统计如表,则这两个相关变量的关系是( )
x 10 9 8 7 6 5
y 2 3 3.5 4 4.8 5
A.负相关 B.正相关
C.先正后负相关 D.先负后正相关
解析:根据两个变量x,y的几组观测数据统计表知,y随x的增大而减小,所以这两个相关变量负相关.
答案:A
题型剖析
5.某设备的使用年限x与所支出的维修费用y的统计数据如下表:
根据上表可得回归直线方程为=1.3x+,据此模型预测,若使用年限为14年,估计维修费约为________万元.
使用年限x(单位:年) 2 3 4 5 6
维修费用y(单位:万元) 1.5 4.5 5.5 6.5 7.0
解析:==4,==5,
则中心点为(4,5),代入回归直线方程可得=5-1.3×4=-0.2,=1.3x-0.2.
当x=14时,=1.3×14-0.2=18(万元),
即估计使用14年时,维修费用是18万元.
答案:18
题型剖析
6.在研究某种药物对“H7N9”病毒的治疗效果时,进行动物试验,得到以下数据,对150只动物服用药物,其中132只动物存活,18只动物死亡,对照组150只动物进行常规治疗,其中114只动物存活,36只动物死亡.
(1)根据以上数据建立一个2×2列联表.
(2)试问该种药物对治疗“H7N9”病毒是否有效?
题型剖析
解析:(1)2×2列联表如下:
(2)由(1)知χ2=≈7.317>6.635.
故我们有99%的把握认为该种药物对“H7N9”病毒有治疗效果.
存活数 死亡数 合计
服用药物 132 18 150
未服药物 114 36 150
合计 246 54 300
$$