内容正文:
用样本估计总体的数字特征
授课人:孙迎港
目
标
1
输入标题名称
2
输入标题名称
3
输入标题名称
4
输入标题名称
情景导入
1、我们已经学习了用图、表来组织、概括样本数据,并且学习了如何通过图、表提供的信息,用样本的频率分布估计总体的分布。但是在很多情况下,我们往往并不需要了解总体的分布形态,而是更关心总体的某一数字特征,如平均数、方差等。如何用数字的样本特征估计总体的数字特征呢?
2、在一次射击比赛中,甲、乙两名运动员各射击10次,命中环数如下:
甲:7、8、6、8、6、5、9、10、7、4
乙:9、5、7、8、7、6、8、6、7、7
根据上述数据,你能判断哪个运动员发挥的更稳定吗?
新知概念
一、众数、中位数、平均数、百分位数
1、众数、中位数、平均数、百分位数的概念
(1)众数:一组数据中出现次数最多的数据。一组数据的众数可能有多个也可能没有,反映了该组数据的集中趋势。
(2)中位数:一组数据按照从小(大)到大(小)的顺序排成一列,处于中间位置的数据(或中间两数的平均数)。一组数据的中位数是唯一的,反映了该组数据的集中趋势。
(3)平均数:一组数据的平均值,数据的平均数为代表该组数据的平均水平。任何一个数据的改变都有可能会引起平均数的变化。受最大值和最小值的影响较大。
(5)百分位数:一般地,当总体是连续变量时,给定一个百分数,总体的分位数有这样的特点:总体数据中的任意一个数小于或等于它的可能性是
(6)常用的百分位数:
四分位数:25%,50%,75%分位数是三个常用的百分位数。把总体数据按照从小到大的顺序排列后,这三个百分位数把总体数据分成了4个部分,在这4个部分取值的可能性都是,因此这三个百分位数也称为总体的四分位数,其中分位数也就是中位数。
(7)百分位数的性质:分位数是这样的一个值,指的是这组数据中至少有的数据小于或等于这个值,且至少有的数据大于或等于这个值。
(8)百分位数的计算:计算一组个数的分位数的一般步骤如下:
第一步:按照从小到大的顺序排列原始数据(并给数据编上序号)
第二步:计算(相当于计算数据的序号)
第三步:若不是整数,且大于的最小整数是,则分位数是第个数据;
若是整数,则分位数是第个数据和第个数据的平均值。
思考:分位数一定在该组数据中吗?
二、最值、极差、标准差、方差
1、最值、极差、标准差、方差的概念
(1)最值:一组数据中的最值指的是其中的最大值与最小值,最值反应的是这组数据最极端的情况。
(2)极差:一组数据中的最大值与最小值的差成为这组数据的极差。表示该组数据之间的差异情况。
(3)标准差:标准差是样本数据到样本平均数的一种平均距离,一般用表示,即。标准差描述的是一组数据围绕平均数的波动大小。标准差越大,数据越分散(离散),标准差越小,数据越集中。(可以适当引入求和符号)
(4)方差:标准差的平方,即与标准差的作用相同,描述一组数据围绕平均数波动的大小。方差的简化计算公式
三、平均数与方差(标准差)的性质
若的平均数为,方差为,标准差为,则:
(1)的平均数为,方差为,标准差为
(2)的平均数为,方差为,标准差为
(3)的平均数为,方差为,标准差为
简单的证明:
典例剖析
题型一 百分位数的计算
例1、(1)已知从某中学高一年级随机抽取20名女生,测量她们的身高(单位:cm),把这20名同学的身高数据从小到大排序:
148.0 149.0 150.0 152.0 154.0 154.0 155.0 155.5 157.0 157.0
158.0 159.0 161.0 162.0 163.0 164.0 165.0 170.0 171.0 172.0
则这组数据的第75百分位数是( )
A.163.0 B.164.0 C.163.5 D.164.5
(2)一组数据12,34,15,24,39,25,31,48,32,36,36,37,42,50的第25,75百分位数分别是______、________.
(3)某校从高一新生中随机抽取了一个容量为20的身高样本,数据从小到大排序如下(单位:):152,155,158,164,164,165,165,165,166,167,168,168,169,170,170,170,171,,174,175,若样本数据的第90百分位数是173,则的值为________.
题型二 平均数、方差、标准差的计算及性质
例2、(1)求一组数据7,6,8,8,5,9,7,7,6,7的方差和标准差
(2)【多选题】已知一组数据的平均数和方差均为2,则下列叙述正确的有( )
A、的平均数为3
B、的方差为3
C、的方差为4
D、的方差为8
(3)已知样本数据由小到大依次为2,3,3,7,12,13.7,18.3