内容正文:
第一部分·攻克六大堡垒
解:(1)两人所付费用相同,相同的费用可能为0,40,80
元,甲、乙两人2小时以上且不超过3小时离开的概率分
P=120)=×日+×号-子P=160)
翻为1-十)子,(1-日-号)=
1
×6=
1
24
,所以飞的分布列为
两人都付0元的概牵P=子×日=京两人都付0
40
80
120
160
元的瓶率P:=子×号合,两人每行80元的概奉P
P
1
1
1
1
24
4
12
24
=子×日-京,则两人所付费用相同的概率P=P十
E()=0X
24+40×+80×
2+120×
1+160×
P+P,=4+专+是
24=80.
(2)的所有可能取值为0,40,80,120,160,则P(5=0)
-×-,P(40)-×号+合×
D()=(0-80)2×
+(40-80)2X4+(80-80)2X
2
,Pg=80)=子×6+子×号+十×6=最
是+120-80)2×+160-80)2×27-40,
第3讲
统计与成对数据的统计分析
常入考入考点清单
CHANGKAO KAODIAN QINGDAN
考点一
随机抽样
(4)列频率分布表:落在各小组内的数据的个数叫做频
数,每小组的频数与样本容量的比值叫做这一小组的频
1.简单随机抽样
率,计算各小组的频率,列出频率分布表;
(1)定义:一般地,设一个总体含有N(N为正整数)个个
(5)画频率分布直方图:依据频率分布表画图,其中纵坐
体,从中逐个抽取n(1≤<N)个个体作为样本,如果抽
标(小长方形的高)表示频率与组距的比值,其相应组距
取是放回的,且每次抽取时总体内的各个个体被抽到的
上的频率等于该组上的小长方形的面积,即每个小长方
概率都相等,我们把这样的抽样方法叫做放回简单随机
形的面积=组距×频率/组距=频率.各个小长方形面积
抽样;如果抽取是不放回的,且每次抽取时总体内未进入
的总和等于1.
样本的各个个体被抽到的概率都相等,我们把这样的抽
2.用样本的数字特征估计总体的数字特征
样方法叫做不放回简单随机抽样,放回简单随机抽样和
不放回简单随机抽样统称为简单随机抽样.
数字
样本数据
频率分布直方图
(2)最常用的方法:随机数法和抽签法。
特征
2.分层随机抽样
出现次数最多的
取最高小长方形底边
(1)定义:一般地,按一个或多个变量把总体划分成若干
众数
数据
中点的横坐标
个子总体,每个个体属于且仅属于一个子总体,在每个子
总体中独立地进行简单随机抽样,再把所有子总体中抽
将数据按大小排
把频率分布直方图划
取的样本合在一起作为总样本,这样的抽样方法称为分
序,处在最中间
分为左右两个面积相
层随机抽样.
中位数位置的一个数据
等的部分,分界线与x
(2)应用范围:总体由差异明显的几个部分组成
(或最中间两个
轴交点的横坐标
(3)分层随机抽样的关键是根据样本特征的差异进行分
数据的平均数)
层,实质是等比例抽样,抽样比=样本容量/总体容量=
每个小长方形的面积
各层所抽取的个体数/各层个体数.
样本数据的算术
平均数
平均数
乘小长方形底边中点
考点二
用样本估计总体
的横坐标之和
1.频率分布表与频率分布直方图的绘制步骤
(1)求极差:一组数据中最大值一最小值;
方差:s2=1[(x1-x)2+(x2-x)2+…+(xw-x)2]:
n
(2)决定组距与组数;
(3)将数据分组;
标准差:7√[1-)2+(x2-)2+…+(x,-)2].
160
概率与统计《专题五
3.百分位数
(2)>0,表示成对样本数据正相关,散点图中点的分布
(1)把100个样本数据按从小到大排序,得到第p个和第
从左下角到右上角;r<0,表示成对样本数据负相关,散
p十1个数据分别为a,b.可以发现,区间(a,b)内的任意
点图中点的分布从左上角到右下角
一个数,都能把样本数据分成符合要求的两部分.一般
(3)r越接近于1,成对样本数据的线性相关程度越强,
地,我们取这两个数的平均数@十)=c,并称此数为这
4.刻画回归效果的方式
2
(1)残差图法
组数据的第p百分位数或p%分位数.
在残差图中,残差比较均匀地落在以取值为0的横轴为
(2)一般地,一组数据的第p百分位数是这样一个值,它
对称轴的水平带状区域内,说明选用的模型比较合适,这
使得这组数据中至少有%的数据小于或等于这个值,且
样的带状区域的宽度越窄,说明模型拟合精度越高。
至少有(100一p)%的数据大于或等于这个值.
(3)四分位数
(2)残差平方和法
常用的分位数有第25百分位数,第50百分位数(即中位
残差平方和为∑(y:一)2,残差平方和越小,模型拟合效
数),第75百分位数.这三个分位数把一组由小到大排列
果越好,
后的数据分成四等份,因此称为四分位数.其中第25百
(3)利用R2