内容正文:
专题七
概率与统计
第 3讲 统计与统计案例
主 干 知 识 梳 理
热 点 分 类 突 破
真 题 与 押 题
1.该部分常考内容:样本数字特征的计算、各种统计图表、线性回归方程、独立性检验等;有时也会在知识交汇点处命题,如概率与统计交汇等.
2.从考查形式上来看,大部分为选择题、填空题,重在考查基础知识、基本技能,有时在知识交汇点处命题,也会出现解答题,都属于中、低档题.
考
情
解
读
主干知识梳理
1.随机抽样
(1)简单随机抽样特点是从总体中逐个抽取.适用范围:总体中的个体较少.
(2)系统抽样特点是将总体均分成几部分,按事先确定的规则在各部分中抽取.适用范围:总体中的个体数较多.
(3)分层抽样特点是将总体分成几层,分层进行抽取.适用范围:总体由差异明显的几部分组成.
2.常用的统计图表
(1)频率分布直方图
②各小长方形的面积之和等于1;
(2)茎叶图
在样本数据较少时,用茎叶图表示数据的效果较好.
3.用样本的数字特征估计总体的数字特征
(1)众数、中位数、平均数
数字特征 样本数据 频率分布直方图
众数 出现次数最多的数据 取最高的小长方形底边中点的横坐标
中位数 将数据按大小依次排列,处在最中间位置的一个数据(或最中间两个数据的平均数) 把频率分布直方图划分左右两个面积相等的分界线与x轴交点的横坐标
平均数 样本数据的算术平均数 每个小矩形的面积乘以小矩形底边中点的横坐标之和
4.变量的相关性与最小二乘法
(1)相关关系的概念、正相关和负相关、相关系数.
5.独立性检验
对于取值分别是{x1,x2}和{y1,y2}的分类变量X和Y,其样本频数列联表是
y1 y2 总计
x1 a b a+b
x2 c d c+d
总计 a+c b+d n
热点一 抽样方法
热点二 用样本估计总体
热点三 统计案例
热点分类突破
例1 (1)(2013·陕西)某单位有840名职工,现采用系统抽样方法抽取42人做问卷调查,将840人按1,2,…,840随机编号,则抽取的42人中,编号落入区间[481,720]的人数为( )
A.11 B.12 C.13 D.14
热点一 抽样方法
思维启迪
系统抽样时需要抽取几个个体,样本就分成几组,且抽取号码的间隔相同;
答案 B
解析 由 =20,即每20人抽取1人,
所以抽取编号落入区间[481,720]的人数为
=12.
(2)某学校共有师生3 200人,现用分层抽样的方法,从所有师生中抽取一个容量为160的样本,已知从学生中抽取的人数为150,那么该学校的教师人数是________.
思维启迪
分层抽样最重要的是各层的比例.
解析 本题属于分层抽样,设该学校的教师人数为x,
200
(1)随机抽样各种方法中,每个个体被抽到的概率都是相等的;(2)系统抽样又称“等距”抽样,被抽到的各个号码间隔相同;分层抽样满足:各层抽取的比例都等于样本容量在总体容量中的比例.
思
维
升
华
变式训练1
(1)某校高一、高二、高三分别有学生人数为495,493,482,现采用系统抽样方法,抽取49人做问卷调查,将高一、高二、高三学生依次随机按1,2,3,…,1 470编号,若第1组有简单随机抽样方法抽取的号码为23,则高二应抽取的学生人数为( )
A.15 B.16 C.17 D.18
解析 由系统抽样方法,知按编号依次每30个编号作为一组,共分49组,
高二学生的编号为496到988,在第17组到第33组内,第17组抽取的编号为16×30+23=503,为高二学生,第33组抽取的编号为32×30+23=983,为高二学生,
故共抽取高二学生人数为33-16=17,故选C.
答案 C
(2)(2014·广东)已知某地区中小学生人数和近视情况分别如图①和图②所示.为了解该地区中小学生的近视形成原因,用分层抽样的方法抽取2%的学生进行调查,则样本容量和抽取的高中生近视人数分别为( )
A.200,20 B.100,20
C.200,10 D.100,10
解析 该地区中、小学生总人数为
3 500+2 000+4 500=10 000,
则样本容量为10 000×2%=200,
其中抽取的高中生近视人数为
2 000×2%×50%=20,故选A.
答案 A
例2 (1)(2014·山东)为了研究某药品的疗效,选取若干名志愿者进行临床试验,所有志愿者的舒张压数据(单位:kPa)的分组区间为[12,13),[13,14),[14,15),[15,16),[16,17],将其按从左到右的顺序分别编号为第一组,第二组,…,第五组,如