内容正文:
精讲09 统计
[知识必备]
1.统计的相关概念
(1)总体:统计中所考察问题涉及的对象的全体叫做总体.
(2)个体:总体中每个对象叫做个体.
(3)样本:抽取的部分对象组成总体的一个样本.
(4)样本容量:一个样本中包含的个体数目叫做样本容量.
2.简单随机抽样
(1)简单随机抽样的定义及适用条件
一般地,简单随机抽样(也称为纯随机抽样)就是从总体中不加任何分组、划类、排队等,完全随机地抽取个体.简单随机抽样是其他各种抽样方法的基础.当总体中的个体之间差异程度较小和总体中个体数目较少时,通常采用这种方法.
(2)简单随机抽样的分类
3.随机数表法的抽样步骤
(1)对总体进行编号.
(2)在随机数表中任意指定一个开始选取的位置.
(3)按照一定规则选取编号,规则一经确定,就不能更改,在选取过程中,遇到超过编号范围或已经选取了的数字,应该舍弃.
(4)按照得到的编号找出对应的个体.
4.分层抽样
一般地,如果相对于要考察的问题来说,总体可以分成有明显差别的、互不重叠的几部分时,每一部分可称为层,在各层中按层在总体中所占比例进行随机抽样的方法称为分层随机抽样(简称为分层抽样).
5.数据的最值、平均数、中位数、百分位数、众数
定义
意义
百分位数
一组数的p%分位数指的是,将这组数按照从小到大的顺序排列后,处于p%位置的数.中位数就是一个50%分位数
反映该组数中小于该百分位数的分布特点
众数
一组数据中,某个数据出现的次数称为这个数据的频数,出现次数最多的数据称为这组数据的众数
描述一组数据趋势的量,反映一组数据的集中程度
最值
一组数据的最值指的是其中的最大值与最小值
最值反映的是这组数最极端的情况,最大值用max表示,最小值用min表示.
平均数
给定一组数是x1+x2+x3+…+xn,则这组数的平均数是
刻画一组数据的平均水平(或中心位置)
中位数
一般地,有时也可以借助中位数来表示一组数的中心位置:如果一组数有奇数个数,且按照从小到大排列后为x1,x2,…,x2n+1,则称xn+1为这组数的中位数;如果一组数有偶数个数,且按照从小到大排列后为x1,x2,…,x2n,则称为这组数的中位数.
描述一组数据趋势的量,通过排序得到,不受最大、最小两个极端数值影响.
6.极差、方差、标准差
不同
相同
极差
一组数的极差指的是这组数的最大值减去最小值所得的差.
数据的离散程度可以用极差、方差或标准差来描述.
方差
如果x1,x2,…,xn的平均数为,
则方差s2=[(x1-)2+(x2-)2+…+(xn-)2]
标准差
方差的算术平方根称为标准差
7.柱形图、折线图、扇形图
定义
作用
柱形图(也称为条形图)
条形图是用一个单位长度表示一定的数量,根据数量的多少画成长短不同的直条,然后把这些直条按照一定的顺序排列起来。
形象地比较各种数据之间的数量关系
折线图
折线图是用一个单位长度表示一定的数量,根据数量的多少描出各点,然后把各点用线段顺次连接起来。
折线统计图不但可以表示出数量的多少,而且能够清楚地表示出数量增减变化的情况。
扇形图
扇形图是用整个圆表示总数,用圆内各个扇形的大小表示各部分数量占总数的百分数。
扇形图可以形象地表示出各部分数据在全部数据中所占的比例情况。
8.频数(率)分布直方图
9.用样本的数字特征估计总体的数字特征
一般情况下,如果样本的容量恰当,抽样方法又合理的话,样本的特征能够反映总体的特征.特别地,样本平均数(也称为样本均值)、方差(也称为样本方差)与总体对应的值相差不会太大.在容许一定误差存在的前提下,可以用样本的数字特征去估计总体的数字特征,这样就能节省人力和物力等.所以,在估计总体的数字特征时,只需直接算出样本对应的数字特征即可.
10.分层抽样的均值与方差
以分两层抽样的情况为例.假设第一层有m个数,分别为x1,x2,…,xm,平均数为,方差为s2;第二层有n个数,分别为y1,y2,…,yn,平均数为,方差为t2.则
=xi,s2=(xi-)2,=,t2=.
如果记样本均值为,样本方差为b2,则可以算出
=(xi+yi)=,
b2=
=.
[题型精讲]
题型一 样本抽样
例1 (2021·山东烟台·高一期中)某全日制大学共有学生人,其中专科生有人,本科生有人,研究生有人,现采用分层抽样的方法调查学生利用因特网查找学习资料的情况,抽取的样本为人,则应在专科生、本科生与研究生这三类学生中分别抽取( )
A.人,人,人
B.人,人,人
C.人,人,人
D.人,人,人
【答案】A
【分析】
根据分层抽样计算出正确选项.
【详解】
专科生抽取人,
本科生抽取人,
研究所抽取人.
故选:A
例2