内容正文:
第2讲 统计与成对数据的分析(讲·教师版)
高考定位
1.高考对本讲内容的考查往往以实际问题为背景,考查随机抽样、用样本估计总体以及变量的相关性,常以选择题、填空题中的形式呈现,难度较低.
2.回归分析、独立性检验问题常与概率、分布列、期望与方差综合考查,多以解答题形式出现,中等难度.
1.直方图的两个结论核心整合
(1)小长方形的面积=组距×=————.
(2)各小长方形的面积之和等于————.
2.统计中的四个数字特征
(1)众数:在样本数据中,出现次数————的那个数据.
(2)中位数:样本数据中,将数据按大小排列,位于————的数据.如果数据的个数为偶数,就取中间两个数据的————作为中位数.
(3)平均数:样本数据的算术平均数,即
=————————————————.
(4)方差与标准差
方差:s2=————————————————————.
标准差:s=———————————————————.
3.两个变量的线性相关
(1)从散点图上看,如果这些点从整体上看大致分布在通过散点图中心的一条直线附近,称两个变量之间具有————,这条直线叫————.
(2)从散点图上看,点分布在从左下角到右上角的区域内,两个变量的这种相关关系称为————,点分布在左上角到右下角的区域内,两个变量的相关关系为————.
(3)回归方程为=x+,其中=,=-.
(4)相关系数
当r>0时,表明两个变量————;当r<0时,表明两个变量————.
|r|越接近于1,表明两个变量的线性相关性————.|r|越接近于0,表明两个变量之间几乎不存在线性相关关系,通常|r|大于————时,认为两个变量有很强的线性相关性.
4.独立性检验
(1)2×2列联表:假设有两个分类变量X和Y,它们的取值分别为{x1,x2}和{y1,y2},其样本频数列联表(称2×2列联表)为:
y1
y2
总计
x1
a
b
————
x2
c
d
c+d
总计
a+c
————
a+b+c+d
(2)K2统计量
K2=(其中n=a+b+c+d为样本容量).
真题体验
1.(2021•全国高考甲卷文科)为了解某地农村经济情况,对该地农户家庭年收入进行抽样调查,将农户家庭年收入的调查数据整理得到如下频率分布直方图:
根据此频率分布直方图,下面结论中不正确的是( )
A. 该地农户家庭年收入低于4.5万元的农户比率估计为6%
B. 该地农户家庭年收入不低于10.5万元的农户比率估计为10%
C. 估计该地农户家庭年收入的平均值不超过6.5万元
D. 估计该地有一半以上的农户,其家庭年收入介于4.5万元至8.5万元之间
2.(多选题)(2021•全国新高考II卷)下列统计量中,能度量样本的离散程度的是( )
A.样本的标准差 B.样本的中位数
C.样本的极差 D.样本的平均数
3.(多选题)(2021•全国新高考Ⅰ卷)有一组样本数据,,…,,由这组数据得到新样本数据,,…,,其中(为非零常数,则( )
A. 两组样本数据的样本平均数相同
B. 两组样本数据的样本中位数相同
C. 两组样本数据的样本标准差相同
D. 两组样数据的样本极差相同
4.(2021•全国高考乙卷文、理科)某厂研制了一种生产高精产品的设备,为检验新设备生产产品的某项指标有无提高,用一台旧设备和一台新设备各生产了10件产品,得到各件产品该项指标数据如下:
旧设备
9.8
10.3
10.0
10.2
9.9
9.8
10.0
10.1
10.2
9.7
新设备
10.1
10.4
10.1
10.0
10.1
10.3
10.6
10.5
10.4
10.5
旧设备和新设备生产产品的该项指标的样本平均数分别记为和,样本方差分别记为和.
(1)求,,,;
(2)判断新设备生产产品的该项指标的均值较旧设备是否有显著提高(如果,则认为新设备生产产品的该项指标的均值较旧设备有显著提高,否则不认为有显著提高).
能力突破
考点一 统计
命题角度1 统计图表
【例1-1】 1.(多选题)(2021·山东日照市高三二模)某保险公司为客户定制了5个险种:甲,一年期短险;乙,两全保险;丙,理财类保险;丁,定期寿险:戊,重大疾病保险,各种保险按相关约定进行参保与理赔.该保险公司对5个险种参保客户进行抽样调查,得出如下的统计图例:
用该样本估计总体,以下四个选项正确的是( )
A.54周岁以上参保人数最少 B.18~29周岁人群参保总费用最少
C.丁险种更受参保人青睐 D.30周岁以上的人群约占参保人群
2.(2021·青海西宁市高三一模(理))某地区经过一年的新农村建设,农村的经济收入增加了一倍,实现翻番.为更好地了解该地区农村