内容正文:
第03讲 8.3 列联表与独立性检验
(8.3.1分类变量与列联表+8.3.2独立性检验)
课程标准
学习目标
①了解分类变量与数值变量的区别,了解回归与相关的区别。
②通过实例,理解通过比较相关比率,利用2×2列联表或等高图可以初步检验两个随机变量的独立性. 理解通过比较相关比率判断随机变量独立性得到的结果有可能会犯错误。
③理解通过比较相关比率判断随机变量独立性得到的结果有可能会犯错误。
本节课要求会通过比较相关比率,判断两个随机变量的独立性. 会对简单的数据分析案例进行初步独立性分析.恰当构造卡方统计量及利用小概率事件原理实现对两个分类变量的是否独立的科学检验.能解决简单的与独立性检验相关的实际问题
知识点1:分类变量与列联表
(1)分类变量
为了方便,会使用一种特殊的随机变量,区别不同的现象或性质,这随机变量称为分类变量.
(2)列联表
①2×2列联表给出了两个分类变量数据的交叉分类频数.
②定义一对分类变量和,我们整理数据如下表所示:
合计
合计
知识点2:独立性检验
(1)独立性检验定义:
利用的取值推断分类变量和是否独立的方法称为独立性检验,读作“卡方独立性检验”.简称独立性检验.
(2)独立性检验公式:
其中(注意使用公式时分子的平方不要忽略了)
【即学即练1】(2024上·江西九江·高二统考期末)某校随机调查了100名高中生是否喜欢篮球,按照男女区分得到列联表,经计算得.根据独立性检验的相关知识,对照下表,可以认为有( )把握喜欢篮球与性别有关.
0.05
0.01
0.005
0.001
3.841
6.635
7.879
10.828
A. B. C. D.
【答案】B
【详解】,
有把握认为与性别有关,
故选:B.
题型01通过等高堆积条形图判断两个分类变量是否存在差异
【典例1】(2014·吉林长春·统考三模)观察下列各图,其中两个分类变量x,y之间关系最强的是( )
A. B.
C. D.
【典例2】(2017·广东佛山·统考一模)现行普通高中学生在高一时面临着选科的问题,学校抽取了部分男、女学生意愿的一份样本,制作出如下两个等高堆积条形图:
根据这两幅图中的信息,下列哪个统计结论是不正确的( )
A.样本中的女生数量多于男生数量
B.样本中有两理一文意愿的学生数量多于有两文一理意愿的学生数量
C.样本中的男生偏爱两理一文
D.样本中的女生偏爱两文一理
【典例3】(2012下·山东青岛·高二山东省青岛第一中学校考期中)为了了解某高校学生喜欢使用手机支付是否与性别有关,抽取了部分学生作为样本,统计后作出如图所示的等高条形图,则下列说法正确的是( )
A.喜欢使用手机支付与性别无关
B.样本中男生喜欢使用手机支付的约
C.样本中女生喜欢使用手机支付的人数比男生多
D.女生比男生喜欢使用手机支付的可能性大些
【变式1】(2021·高二课时练习)在等高条形图中,下列哪两个比值相差越大,要推断的论述成立的可能性就越大( )
A.与 B.与
C.与 D.与
【变式2】(2023·四川达州·统考一模)四川省将从2022年秋季入学的高一年级学生开始实行高考综合改革,高考采用“3+1+2”模式,其中“1”为首选科目,即物理与历史二选一.某校为了解学生的首选意愿,对部分高一学生进行了抽样调查,制作出如下两个等高条形图,根据条形图信息,下列结论正确的是( )
A.样本中选择物理意愿的男生人数少于选择历史意愿的女生人数
B.样本中女生选择历史意愿的人数多于男生选择历史意愿的人数
C.样本中选择物理学科的人数较多
D.样本中男生人数少于女生人数
题型02 独立性检验的概念及辨析
【典例1】(2024上·全国·高三专题练习)根据分类变量与的观测数据,计算得到.依据的独立性检验,结论为( )
A.变量与不独立,这个结论犯错误的概率不超过
B.变量与不独立,这个结论犯错误的概率不超过
C.变量与独立,这个结论犯错误的概率不超过
D.变量与独立,这个结论犯错误的概率不超过
【典例2】(2024·全国·高三专题练习)针对时下的“短视频热”,某高校团委对学生性别和喜欢短视频是否有关联进行了一次调查,其中被调查的男生、女生人数均为人,男生中喜欢短视频的人数占男生人数的,女生中喜欢短视频的人数占女生人数的.零假设为:喜欢短视频和性别相互独立.若依据的独立性检验认为喜欢短视频和性别不独立,则的最小值为( )
附:,附表:
0.05
0.01
3.841
6.635
A.7 B.8 C.9 D.10
【变式1】(2024上·