内容正文:
三002
假期
书到用时方恨少,事非经过不知难。
必
33.统计与统计案例
完成日期:
《思维整合室
3.成对数据的统计分析
SI wel zheng he shi
1.随机抽样
样本相关系数
(1)相关系数r的计算
(1)简单随机抽样
简单随机抽样分为
简单随机抽样
(x,-)(y-)
和
简单随机抽样:
,-2-
常用方法:
和
(2)样本相关系数r的取值范围为
(2)分层随机抽样
当|r越接近1时,成对样本数据的线性相
当总体是由
的几个部分组成时,
关程度越
往往选用分层随机抽样。
当|越接近0时,成对样本数据的线性相
2.用样本的数字特征估计总体
关程度越
(1)总体百分位数的估计
4.一元线性回归模型
(1)经验回归方程与最小二乘法
定义
意义
经验回归方程:y=bx十a,其中
组数据的第p百分
反映该组
2(x,-x)(y,-)
位数是这样一个值,
数中小于
它使得这组数据中至
,-
百分
或等于该
少有p%的数据小于
a=y-bx.
位数
百分位数
或等于这个值,且至
(2)利用决定系数R2刻画回归效果
的分布
少有(100一p)%的数
特点
R2=1-
(y-y)
,R2越
,即拟合
据大于或等于这个值
(y.-y)
(2)常用样本的数字特征
效果越好,R越
,模型拟合效果越差.
来估计总体总体的集中趋势
5.列联表与独立性检验
(3)总体离散程度的估计
(1)2×2列联表
假设有两个分类变量X和Y,它们的取值
假设一组数据是x1,x2,…,xm,用x表示
分别为{x,x2}和{y,y2,其2×2列联
这组数据的平均数,那么这n个数的:
表为
①标准差
y
s=[+++,]:
合计
y=y
y=y2
②方差
x=T
6
a+b
=[(x-x)2+(2-x)+…+(x,
d
c+d
x)2].
合计
a+c
b+d
n=a+b+c+d
67
90-=
(2)临界值
3.某校为了研究“学生的性别”和“对待某一活
n(ad-bc)2
动的态度”是否有关,运用2×2列联表进行
x-(a+b)(cFd)(ate)(b+d'
对于任
独立性检验,经计算×=7.069,则认为“学
何小概率值a,可以找到相应的正实数x。,
生性别与支持某项活动有关系”的犯错误的
使得P(x≥x。)=a成立.我们称x。为a
概率不超过
(
的临界值.
A.0.1%
B.1%
D.99.9%
(3)独立性检验
C.99%
4.(2022·全国乙卷)分别统计了甲、乙两位同
当X≥x。时,我们就推断H。不成立,即认
学16周的各周课外体育运动时长(单位:h)
为X和Y不独立,该推断犯错误的概率不
得如下茎叶图:
超过a;
甲
当x<x。时,我们没有充分证据推断H。
615.
不成立,可以认为X和Y独立.
8530
6.
独立性检验中几个常用的小概率值和相应
7532
46
的临界值
64218.
12256666
429.
0238
0.1
0.05
0.01
0.005
0.001
10.
1
2.706
3.841
6.635
7.879
10.828
则下列结论中错误的是
(
技能提升台
A.甲同学周课外体育运动时长的样本中位
JI neng tl sheng tal
数为7.4
1.下列一组数据的第25百分位数是(
B.乙同学周课外体育运动时长的样本平均
2.1,3.0,3.2,3.8,3.4,4.0,4.2,4.4,
数大于8
5.3,5.6
C.甲同学周课外体育运动时长大于8的概
A.3.2
B.3.0
C.4.4
D.2.5
率的估计值大于0.4
2.从一批零件中抽取80个,测量其直径(单
D.乙同学周课外体育运动时长大于8的概
位:mm),将所得数据分为9组:[5.31,
率的估计值大于0.6
5.33),[5.33,5.35),…,[5.45,5.47),
5.(2022·全国甲卷)某社区通过公益讲座以
[5.47,5.49],并整理得到如下频率分布直
普及社区居民的垃圾分类知识.为了解讲座
方图,则在被抽取的零件中,直径落在区间
效果,随机抽取10位社区居民,让他们在讲
座前和讲座后各回答一份垃圾分类知识问
[5.43,5.47)内的个数为
卷,这10位社区居民在讲座前和讲座后问
纽啊
卷答题的正确率如下图:则
(
10.00
8.75
7.50
100%
6.25
95%
5.00
90%
3.75
2.50
*讲座前
1.25
75%
70%
·讲座后
5.315.335.355375,395.415.435.455.475.49
65%
古径mm
60%
0
45678910
A.10
B.18
C.20
D.36
居比编号
68
三0002
A.讲座前问卷答题的正确率的中位数小
由X=
n(ad-bc)2
于70%
(