9.2 独立性检验(题型专练,5基础&2提升题型+培优)高二数学苏教版选择性必修第二册

2026-02-05
| 2份
| 81页
| 336人阅读
| 10人下载
数海拾光
进店逛逛

资源信息

学段 高中
学科 数学
教材版本 高中数学苏教版选择性必修 第二册
年级 高二
章节 9.2 独立性检验
类型 作业-同步练
知识点 独立性检验
使用场景 同步教学-新授课
学年 2026-2027
地区(省份) 全国
地区(市) -
地区(区县) -
文件格式 ZIP
文件大小 2.92 MB
发布时间 2026-02-05
更新时间 2026-02-05
作者 数海拾光
品牌系列 上好课·上好课
审核时间 2026-02-05
下载链接 https://m.zxxk.com/soft/56352604.html
价格 3.00储值(1储值=1元)
来源 学科网

内容正文:

9.2 独立性检验 题型一 完善列联表 1.(25-26高三上·辽宁·期末)目前,AI赋能语音识别技术已从实验室的“概念验证”发展为改变人类生活的基础设施,随着大模型和多模态技术的融合,英文识别将不再是单一功能,也是智能系统理解世界的“耳朵”和“眼睛”,推动人机交互从“命令执行”向“自然对话”演进.现甲、乙两名同学通过英文指令与某AI智能体人机交互共生成200篇文章.若生成的文章达到专业要求,不用进一步改良,视为合格.现已知甲同学生成的文章有80篇合格,占甲同学生成文章总数的,乙同学生成的文章有一半合格. (1)请根据以上数据填写下面的列联表,并推断能否有95%的把握认为生成的文章是否合格与甲、乙(不同的)同学给出的指令有关? 生成的文章合格 生成的文章不合格 总计 甲同学 80 乙同学 总计 200 (2)经试验,若给出的指令够准确具体,该智能体生成文章合格的概率为,则在此条件下从该智能体生成的一批文章中随机调取3篇,请写出其中合格的篇数的分布列,并算出期望. 附:,其中(结果精确到0.001). 0.1 0.05 0.01 0.005 0.001 2.706 3.841 6.635 7.879 10.828 2.(24-25高二下·贵州遵义·月考)为了解居民体育锻炼情况,某地区对辖区内居民体育锻炼进行抽样调查.统计其中400名居民体育锻炼的次数与年龄,得到如下的频数分布表. 次数 年龄 每周次 每周次 每周次及以上 (1)若把年龄在的锻炼者称为青年,年龄在的锻炼者称为中年,每周体育锻炼不超过次的称为体育锻炼频率低,不低于次的称为体育锻炼频率高,请完成以下列联表,并判断在犯错误概率不超过的前提下,能否认为体育锻炼频率的高低与年龄有关联; 青年 中年 合计 体育锻炼频率低 体育锻炼频率高 合计 (2)从每周体育锻炼次及以上的样本锻炼者中,按照表中年龄段采用分层随机抽样的方法抽取人,再从这人中随机抽取人,记这人中年龄在与的人数分别为、,记,求的分布列与期望. 参考公式:,. 附: 3.(2026·新疆·模拟预测)某书包品牌代理对,两款书包的受欢迎情况进行调研,现从目标客户群中随机抽取100人,针对他们更喜欢款书包还是款书包做了调查,结果显示:,两款书包的受欢迎的程度相同,且更喜欢款书包的男生与女生人数相等,其中更喜欢款书包的女生占喜欢款书包的总人数的. (1)根据已知条件补全列联表,并依据小概率值的独立性检验,判断更喜欢款书包与性别是否有关联; 更喜欢款书包 更喜欢款书包 总计 男生 女生 总计 (2)在样本中,从更喜欢款书包的目标客户中按性别用比例分配的分层随机抽样的方法抽取5人,在这5人中任选2人,其中女生的人数为随机变量,求的分布列与数学期望. 参考公式:,其中. 参考数据: 0.1 0.05 0.005 2.706 3.841 7.879 4.(24-25高三上·贵州遵义·月考)为了调查学生喜欢跑步是否与性别有关,现从高三年级选取了200名学生进行问卷调查,得到如下的2×2列联表: 喜欢跑步 不喜欢跑步 合计 男生 64 女生 54 合计 已知在这200名学生中随机抽取1人抽到不喜欢跑步的概率为0.45. (1)判断是否有95%的把握认为喜欢跑步与性别有关? (2)从上述不喜欢跑步的学生中用分层抽样的方法抽取5名学生,再在这5人中随机抽取3人调查其喜欢的运动,用X表示3人中男生的人数,求X的分布列及数学期望. 附:,其中. 0.150 0.100 0.050 0.010 k 2.072 2.706 3.841 6.635 5.(25-26高三上·贵州黔西南·月考)长跑可提高呼吸系统和心血管系统机能,为了调查学生喜欢跑步是否与性别有关,某校从高三年级选取了200名学生进行问卷调查,得到如下的列联表.已知在这200名学生中随机抽取1人抽到喜欢跑步学生的概率为0.6. 性别 跑步 喜欢跑步 不喜欢跑步 总计 男生 80 女生 20 总计 (1)依小概率值的独立性检验,能否认为喜欢跑步与性别有关? (2)从上述不喜欢跑步的学生中用样本量按比例分配的分层随机抽样的方法抽取8名学生,再从这8人中抽取3人调查其喜欢的运动,用表示3人中女生的人数,求的分布列及数学期望. 附:,其中. 0.1 0.05 0.01 0.001 2.706 3.841 6.635 10.828 题型二 列联表分析 1.(2024·贵州·一模)【多选题】2018年12月1日,贵阳市地铁1号线全线开通,在一定程度上缓解了市内交通的拥堵状况.为了了解市民对地铁1号线开通的关注情况,某调查机构在地铁开通后的某两天抽取了部分乘坐地铁的市民作为样本,分析其年龄和性别结构,并制作出如下等高堆积条形图. 根据图中的信息,下列结论中一定正确的是(    ). A.样本中男性比女性更关注地铁1号线全线开通 B.样本中多数女性是35岁及以上 C.样本中35岁以下的男性人数比35岁及以上的女性人数多 D.样本中35岁及以上的人对地铁1号线的开通关注度更高 2.【多选题】(24-25高二下·江西上饶·月考)设,为两个变量,每一个变量都可以取两个值,即,,且,,,且,随机调查个样本数据后,得到如下列联表,则(   ) 合计 合计 A.若,则可以认为与独立 B.若变量与独立,则 C.若很大,则变量与不独立 D.若变量与不独立,则很大 3.【多选题】(24-25高二下·吉林长春·月考)一医疗团队为研究某地的一种地方性疾病与当地居民的卫生习惯(卫生习惯分为良好和不够良好两类)的关系,在已患该疾病的病例中随机调查了100例(称为病例组),同时在未患该疾病的人群中随机调查了100人(称为对照组),得到如下数据.从该地的人群中任选一人,设A表示事件“选到的人卫生习惯不够良好”,B表示事件“选到的人患有该疾病”,与的比值是卫生习惯不够良好对患该疾病风险程度的一项度量指标,记该指标为R.则下列选项正确的是(   ) 不够良好 良好 病例组 40 60 对照组 10 90 附:, 0.050 0.010 0.001 3.841 6.635 10.828 A.依据的独立性检验,可推断患该疾病群体与未患该疾病群体的卫生习惯有差异 B.利用该调查数据,可得到的估计值为0.4,的估计值为0.1 C.. D.利用该调查数据,可得到R的估计值为5 4.(2024高三·北京·专题练习)年月日太原地铁号线开通,在一定程度上缓解了市内交通的拥堵状况,为了了解市民对地铁号线开通的关注情况,某调查机构在地铁开通后两天抽取了部分乘坐地铁的市民作为样本,分析其年龄和性别结构.并制作出如下等高堆积条形图: 根据图中信息,下列结论不一定正确的是( ) A.样本中男性比女性更关注地铁号线开通 B.样本中多数女性是岁及以上 C.样本中岁以下的男性人数比岁及以上的女性人数多 D.样本中岁及以上的人对地铁号线的开通关注度更高 5.【多选题】(24-25高三上·广东潮州·期末)千百年来,我国劳动人民在生产实践中根据云的形状、走向、速度、厚度、颜色等的变化,总结了丰富的“看云识天气”的经验,并将这些经验编成了谚语,如“天上钧钧云,地上雨淋淋”“日落云里走,雨在半夜后”……小明同学为了验证“日落云里走,雨在半夜后”,观察了所在地区的100天的日落和夜晚天气,得到如下列联表:       夜晚天气日落云里走 下雨 不下雨 合计 出现 25 5 30 不出现 25 45 70 合计 50 50 100 临界值表 0.10 0.05 0.010 0.001 2.706 3.841 6.635 10.828 并计算得到,下列小明对地区天气判断正确的是(    ) A.夜晚下雨的概率约为 B.未出现“日落云里走”,但夜晚下雨的概率约为 C.出现“日落云里走”,有的把握认为夜晚会下雨 D.至少有的把握认为“‘日落云里走’是否出现”与“当晚是否下雨”有关 题型三 等高条形图 1.(25-26高三上·山东·期中)石墨烯发热膜在生产生活中应用广泛.从石墨中分离石墨烯的一种方法是化学气相沉积法,使石墨升华后附着在材料上再结晶.现在有A材料、B材料可供选择,研究人员对附着在A材料、B材料上的石墨各做了100次再结晶试验,得到如下等高堆积条形图. (1)根据等高堆积条形图,填写如下列联表,并依据的独立性检验,分析试验结果与材料是否有关; (单位:次) A材料 B材料 合计 试验成功 试验失败 合计 (2)制作1吨石墨烯发热膜有甲、乙两个环节,其中甲环节生产合格的概率为,乙环节生产合格的概率为,且各生产环节相互独立.若生产不合格还需进行修复,甲环节的修复费用为3万元,乙环节修复费用均为2万元.设随机变量为制作石墨烯发热膜所产生的修复费用,求的分布列及数学期望. 附:,其中. 0.1 0.01 0.001 2.706 6.635 10.828 2.(24-25高三上·江西新余·月考)如图为对某高中学生是否对父母说过“我爱你”这样的话的统计结果,则下列统计分析中不正确的是:(    ). A.男性被调查者没有对父母说过“我爱你”这样的话的人数比例高于女性 B.无论男女对母亲说“我爱你”这类话的比例都高于对父亲所说 C.大部分调查者没有对父母说过“我爱你”这样的话 D.经常对父母说“我爱你”这样的话的人数总计比例较女生比例有所下降,说明这张统计图的结果可能存在错误 3.【多选题】(23-24高二下·吉林白山·期末)暑假结束后,为了解假期中学生锻炼身体情况,学生处对所有在校学生做问卷调查,并随机抽取了180人的调查问卷,其中男生比女生少20人,并将调查结果绘制得到等高堆积条形图.已知,其中,,在被调查者中,下列说法正确的是(    ) A.男生中不经常锻炼的人数比女生中经常锻炼的人数多 B.男生中经常锻炼的人数比女生中经常锻炼的人多8人 C.经常锻炼者中男生的频率是不经常锻炼者中男生的频率的1.6倍左右 D.在犯错误的概率不大于0.01的条件下,可以认为假期是否经常锻炼与性别有关 4.(23-24高二下·重庆·期末)如图是学校高二1、2班本期中考试数学成绩优秀率的等高堆积条形图,如果再从两个班中各随机抽6名学生的期中考试数学成绩统计,那么(    ) A.两个班6名学生的数学成绩优秀率可能相等 B.1班6名学生的数学成绩优秀率一定高于2班 C.2班6名学生中数学成绩不优秀的一定多于优秀的 D.“两班学生的数学成绩优秀率存在差异”判断一定正确 5.【多选题】(2024·湖北·一模)某校为了解高一新生对数学是否感兴趣,从400名女生和600名男生中通过分层抽样的方式随机抽取100名学生进行问卷调查,将调查的结果得到如下等高堆积条形图和列联表,则(    ) 性别 数学兴趣 合计 感兴趣 不感兴趣 女生 男生 合计 100 参考数据:本题中 0.1 0.05 0.01 0.005 0.001 2.706 3.841 6.635 7.879 10.828 A.表中 B.可以估计该校高一新生中对数学不感兴趣的女生人数比男生多 C.根据小概率值的独立性检验,可以认为性别与对数学的兴趣有差异 D.根据小概率值的独立性检验,可以认为性别与对数学的兴趣没有差异 题型四 卡方的计算 1.(25-26高三上·江苏无锡·月考)为调查某地区老人是否需要志愿者提供帮助,用简单随机抽样方法从该地区调查了500位老年人,调查结果如下表: 男性 女性 需要 40 20 不需要 160 280 (1)在该地区男性老年人中,随机选择一位,他需要志愿者提供帮助的概率记为,求的估计值; (2)完成抽样数据列联表,并根据小概率值的独立性检验,分析该地区的老年人需要志愿者提供帮助与性别是否有关;并指出该调查中更优的抽样方法. 参考数据: 0.10 0.05 0.010 0.005 2.706 3.841 6.635 7.879 2.(25-26高三上·云南昆明·月考)北京冬奥会的成功举办,不仅让世界进一步了解新时代的中国,而且极大促进了全国群众参与冰雪运动,此后每年冬季,全国多地群众都会积极参与冰雪运动.某城市为调查居民对冰雪运动的了解情况,随机抽取了该市男女市民各60人进行统计,统计结果如下表:(单位:人) 性别 冰雪运动 合计 了解 不了解 男 60 女 60 合计 80 40 120 已知从参与调查的男性市民中随机抽取一名,他了解冰雪运动的概率为. (1)求表中m,n,p,q的值; (2)根据小概率值的独立性检验,分析并判断该市居民对冰雪运动的了解是否与性别有关联. 附: 0.050 0.010 0.005 3.841 6.635 7.879 3.(25-26高二上·陕西渭南·期末)某研究小组为探究给禾苗加化肥与禾苗生长情况的关系,将30株禾苗均分为两组:对照组(不加化肥)和实验组(加化肥).在其他条件均相同的情况下,实验结束后测得这30株禾苗的高度(单位:cm)如下: 对照组 18.5 18.8 19.1 19.5 20.3 22.3 23 23.6 24 24.8 25.5 26.7 27.7 28.5 39.8 实验组 19.7 20.1 22.6 23.5 24.8 25 25.2 25.6 26 27.1 28.3 29.5 29.6 31.4 31.4 当实验结束时,若禾苗的高度不低于25cm,则判断该禾苗生长良好;若禾苗的高度低于25cm,则判断该禾苗生长较差,将这30株禾苗高度的数据进行整理,得到如下列联表: 分组 禾苗的生长情况 生长良好 生长较差 合计 对照组 15 实验组 15 合计 30 (1)请完成列联表; (2)判断是否有90%的把握认为给禾苗加化肥与该禾苗的生长情况有关. 附:,其中. 当时,没有充分的证据判断变量有关联,可以认为变量是没有关联的;当时,有90%的把握判断变量有关联. 4.(25-26高二上·广西梧州·期末)近期,流感病毒阳性率正快速上升,其中99%以上为甲流,流行株以(H1N1)pdm09亚型为主.为考察某新药预防甲流的效果,进行了个体(单位:例)试验,得到如下列联表: 药物 疾病 总计 未患病 患病 未服用 80 180 服用 150 总计 250 400 (1)请完成列联表,记未服用新药的个体患甲流的概率为,给出的估计值; (2)根据小概率值的独立性检验,能否认为新药对预防甲流有效? 0.050 0.010 0.001 3.841 6.635 10.828 附: 5.(25-26高三上·辽宁·期末)某兴趣小组对校内学生对中国象棋的兴趣程度进行问卷调查,调查结果如下: 非常感兴趣 比较感兴趣 不感兴趣 男生 100 60 40 女生 50 50 100 用频率估计概率. (1)随机抽取一名男生,求他对中国象棋比较感兴趣的概率; (2)将非常感兴趣与比较感兴趣统称为感兴趣.根据小概率值的独立性检验,分析学生对中国象棋的兴趣程度是否与学生性别有关. 附:. 0.050 0.010 0.001 3.841 6.635 10.828 题型五 独立性检验解决实际问题 1.(25-26高三上·陕西榆林·月考)某中学对学生钻研奥数课程的情况进行调查,将每周独立钻研奥数课程超过6小时的学生称为“奥数迷”,否则称为“非奥数迷”,从调查结果中随机抽取100人进行分析,得到数据如表所示: 奥数迷 非奥数迷 合计 男 24 36 60 女 12 28 40 合计 36 64 100 a 0.10 0.05 0.010 0.005 0.001 2.706 3.841 6.635 7.879 10.828 (1)对照列联表,根据小概率的独立性检验,是否认为“奥数迷”与性别有关? (2)现从抽取的“奥数迷”中,按性别采用分层抽样的方法抽取3人参加奥数闯关比赛,已知其中男、女学生独立闯关成功的概率分别为、,在恰有两人闯关成功的条件下,求两人性别相同的概率. 参考数据与公式:,其中. 2.(2026高二·全国·专题练习)为探究某品种松树L的生长状况与浇水情况的关系,Santa从某人工林中随机调查了200棵松树L,得到如下列联表: 正常 不正常 合计 正常 70 30 100 不正常 50 50 100 合计 120 80 200 (1)根据小概率值的独立性检验,分析松树L的生长状况是否与浇水情况有关; (2)现从该人工林中再随机抽取3棵松树L,记其中浇水正常的松树棵数为随机变量,试用上述调查的频率估计概率,求的分布列和数学期望.     附:, 10.828 3.(2026·安徽黄山·一模)2025年我国多地推广“碳普惠”体系,鼓励市民参与绿色出行获取低碳积分.某社区随机抽取100名居民调查绿色出行情况,得到如下列联表(绿色出行定义为“日常通勤采用公交、骑行、步行”): 参与绿色出行 不参与绿色出行 总计 青年群体(40岁) 35 15 50 中老年群体(40岁) 20 30 50 总计 55 45 100 (1)依据小概率值的独立性检验,分析参与绿色出行是否与年龄群体有关? (2)若市民甲前一天参与了绿色出行,则后一天参与绿色出行的概率为;若前一天没有参与绿色出行,则后一天参与绿色出行的概率为.如果市民甲第一天参与了绿色出行的概率为,分别求出他在第二天、第三天参与了绿色出行的概率. 附: 0.100 0.050 0.010 2.706 3.841 6.635 4.(25-26高二上·陕西渭南·期末)为考察某种药物对预防疾病的效果,进行了动物(单位:只)试验,得到如下列联表: 药物 疾病 总计 未患病 患病 未服用 100 80 s 服用 150 70 220 总计 250 t 400 (1)求s,t; (2)记未服用药物的动物患疾病的概率为,给出的估计值; (3)能否有99%的把握判断药物对预防疾病有效? 附:. 0.010 0.005 0.001 6.635 7.879 10.828 5.(25-26高三上·河北·月考)利用错题去学习是比较高效的学习方法.为了研究学生每天整理数学错题的情况,某校数学建模兴趣小组的同学在本校高三年级学生中采用随机抽样的方法抽取了60名学生,调查他们的数学成绩和整理数学错题的情况,统计数据如下: 数学成绩总评优秀人数 数学成绩总评非优秀人数 合计 每天都整理数学错题人数 20 10 不是每天都整理数学错题人数 22 合计 60 (1)完成上述列联表,并估计本校高三年级学生中不是每天都整理数学错题且数学成绩总评优秀的概率; (2)根据小概率值的独立性检验,分析数学成绩总评优秀与每天都整理数学错题是否有关联? (3)从样本中每天都整理数学错题的学生中随机抽取3名学生做进一步访谈,设抽取到数学成绩总评优秀的人数为,求的分布列和数学期望. 附:,其中; 0.10 0.01 0.001 2.706 6.635 10.828 题型一 由卡方的计算求参数范围 1.(25-26高二上·全国·单元测试)为落实五育并举,同时增强高中生的综合素质,某校领导计划利用课间时间开展足球社团活动,为了使该活动顺利开展,了解学生是否对足球感兴趣与性别的关系,现从某年级的学生中随机抽取了男、女同学各50名,整理得到下列列联表: 性别 兴趣爱好 感兴趣 不感兴趣 总计 男 50 女 50 总计 80 20 100 使得“有但没有的把握认为男、女同学对足球感兴趣有差异”的的一个值为 . 2.(24-25高二下·上海·期末)针对“中学生追星问题”,某校团委对“学生性别和中学生追星是否有关”作了一次调查.在全校学生中随机抽取(是正整数)个学生,其中女生人数是男生人数的,男生追星的人数占男生人数的,女生追星的人数占女生人数的,若根据小概率值的独立性检验,判断中学生追星与性别有关,则男生至少有 人. 参考数据及公式如下: 0.050 0.010 0.001 3.841 6.635 10.828 参考公式:,其中. 3.(浙江省部分学校2024-2025学年高三下学期5月联考数学试题)小坤统计了“喜欢学习数学”和“性别为男性”的关系,统计男,女同学分别为60,40名,在男生中随机抽取三名同学,其中喜欢数学的人数恰有一人的概率为,则男生中喜欢数学的人数(大于男生中不喜欢数学的人数)为 经过计算,认为有的概率认为“喜欢学习数学”和“性别为男性”有关,则女同学中喜欢学习数学的人数的最大值为 (精确到1) 0.05 0.025 0.01 0.005 0.001 k 3.841 5.024 6.635 7.879 10.828 4.(24-25高二下·河南南阳·月考)某校对“学生性别和喜欢抖音是否有关”作了一次调查,其中被调查的男女生人数相同,男生喜欢抖音的人数占男生人数的,女生喜欢抖音的人数占女生人数的,若有95%的把握判断是否喜欢抖音和性别有关,则调查人数中男生可能有 人. 附: 0.100 0.050 0.010 2.706 3.841 6.635 5.(24-25高三上·江苏南通·月考)随着国家对中小学“双减”政策的逐步落实,其中增加中学生体育锻炼时间的政策引发社会的广泛关注.某教育时报为研究“支持增加中学生体育锻炼时间的政策是否与性别有关”,从某校男女生中各随机抽取80名学生进行问卷调查,得到如下数据通过计算有以上的把握认为“支持增加中学生体育锻炼时间的政策与性别有关”,则在这被调查的名女生中支持增加中学生体育锻炼时间的人数的最小值为 .   支持 不支持 男生 女生 附:,其中. 题型二 独立性检验的跨模块综合题型 1.(25-26高三上·河北沧州·月考)为了探究职场人士每季度进行职业技能培训的时长(单位:小时)和他们的季度绩效评分(单位:分)的关系,某调研机构开展了调查,得到如下数据: 3 6 9 12 15 70 80 84 96 100 (1)若该组数据中与之间的关系可用线性回归模型进行拟合,求关于的经验回归方程; (2)基于上述调查,某企业推行员工职业技能培训计划,经过一个季度的实施后,抽样调查了200位员工,按照参与职业技能培训与季度绩效提升情况得到如下列联表,请将表格补充完整,并依据的独立性检验,分析“参与职业技能培训与绩效提升”是否有关. 单位:人 绩效未提升 绩效提升 合计 参与职业技能培训 100 150 未参与职业技能培训 30 合计 参考公式:经验回归方程中斜率和截距的最小二乘估计公式分别为,, 其中. 0.1 0.05 0.01 0.005 0.001 2.706 3.841 6.635 7.879 10.828 2.(25-26高二上·江西·期末)某调查小组研究短视频播放量与内容类型的关联性,从平台抽取容量为200的样本,整理数据如下: 播放量\内容类型 知识类 娱乐类 合计 高播放 50 70 120 低播放 30 50 80 合计 80 120 200 (1)是否有99%的把握认为短视频播放量与内容类型有关联? (2)定义似然比R(B|A)=P(B|A)/P(Ā|B),当R(B|A)≥1.35时,认为事件A条件下B发生有优势.现从200个样本中任选1个,A表示“选到高播放视频”,B表示“选到娱乐类视频”,估计R(B|A)的值,并判断是否有优势; (3)从知识类样本中按播放量分层抽样选出8个视频,再从这8个视频中抽取2个分析内容质量,求抽取的2个视频中高播放视频的个数X的概率分布和数学期望. 附:,. 0.050 0.010 0.001 k 3.841 6.635 10.828 3.(23-24高二下·辽宁·期末)随着全国新能源汽车推广力度的加大,新能源汽车消费迎来了前所未有的新机遇. (1)为了更好了解大众对新能源汽车的接受程度,某城市汽车行业协会依据年龄采用分层随机抽样的方式,从40岁以下和40岁及以上两个年龄层中各抽取100名市民进行调查,并对他们选择新能源汽车,还是选择传统汽车进行意向调查,得到了以下统计数据: 选择新能源汽车 选择传统汽车 总计 40岁以下 70 40岁及以上 60 100 总计 200 完成列联表,并判断是否有的把握认为选择新能源汽车与年龄有关; (2)为了了解某一地区新能源汽车的销售情况,某机构根据统计数据,用最小二乘法得到该地区新能源汽车销售量y(单位:万台)关于年份x的线性回归方程,且销售量y的方差为,年份x的方差为.求y与x间的样本相关系数r,并据此判断该地区新能源汽车销售量y与年份x的线性相关性强弱. 附:(i)在线性回归方程中,,; (ii)样本相关系数,若,则可判断y与x线性相关性较强; (iii),其中. 4.(25-26高三上·湖南·月考)某人工智能研发公司为了开拓新产品市场,从最新研发的经典A型和卓越型两款机器人中(卓越型是A型的优化版),随机各抽取30台进行越野驾驶性能对比测试,测试在同等环境中进行,评定结果分为优秀和良好两种.得到了如下数据:经典A型优秀为7台,卓越型优秀为20台. (1)完成下面2×2列联表,并根据小概率值α=0.001的独立性检验,分析两款机器人的测试结果是否与越野驾驶性能优化有关. 款类 测试结果 总计 优秀 良好 型 20 30 A型 7 30 总计 (2)该公司为了进一步测试卓越型机器人的汉语智能性能,组织机器人队与人类队(母语为汉语)进行诗词抢答赛,每局比赛只有胜和负两种情况(无平局),每局人类战胜机器人的概率为胜者记2分,负者记1分.每个挑战者只能挑战一局,每局胜负不受其他因素的影响. (i)求三局比赛中,人类队累计得分X的分布列和数学期望; (ii)若采用“比赛赛满局,胜方至少获得局胜利”的赛制,人类队取胜的概率为;若采用“比赛赛满局,胜方至少获得局胜利”的赛制,人类队取胜的概率为,比较与的大小,并说明其统计意义. 参考公式: 0.1 0.05 0.01 0.001 2.706 3.841 6.635 10.828 5.(25-26高三上·河北张家口·期末)某省为了解高中生对足球赛事的了解情况,特地举办了一次足球常识问卷调查,问卷的满分为100分,统计结果显示,学生成绩,不低于60分为及格,高于80分为优秀,且优秀率为20%.根据某高中学校参加问卷的90名学生的调查结果,得到如下列联表: 性别 关注足球赛事 不关注足球赛事 合计 男 55 5 60 女 20 10 30 合计 75 15 90 (1)根据小概率值的独立性检验,分析该校学生对足球赛事的关注是否与性别有关; (2)在这90名学生中随机抽取一名,记事件表示抽到“学生关注足球赛事”,事件表示抽到“学生是女生”,求及的值; (3)从全省参与调查的学生中随机选出5人,这5人中及格的人数记作,求的期望与方差. 附:,其中. 常用的小概率值和相应的临界值: 0.05 0.01 0.001 3.841 6.635 10.828 1.(25-26高三上·湖北黄冈·期末)有媒体称DeepSeek开启了我国AI新纪元.某高校拟与某网络平台合作组织学生参加与AI知识有关的网络答题活动,为了解男女学生参与答题意愿的差异,男生、女生各取100人.设事件“学生愿意报名参加答题活动”,“学生为男生”,据统计. (1)根据已知条件,完成下列列联表,并依据小概率值的独立性检验,能否推断该校学生报名参加答题活动与性别有关? 性别 男生 女生 合计 不愿报名参加答题活动 愿意报名参加答题活动 合计 200 (2)网络答题规则:假设甲每道题回答是否正确相互独立,且每次答对的概率均为. (i)若答题活动设置且道题,甲仅答对其中10道题的概率最大,求的值. (ii)若答题活动设置4道题,且答题规则如下:每次答一题,一旦答对,则结束答题;答错则继续答题,直到4道题答完.已知甲同学报名参加答题活动,用表示在本次答题的题目数量,求的分布列和期望. 参考公式与数据:,其中. 0.10 0.05 0.01 0.005 0.001 2.706 3.841 6.635 7.879 10.828 2.(2025·四川内江·一模)某兴趣小组调查了某校100名学生100米短跑成绩的情况,其中有60 名学生的短跑成绩合格.这100名学生中有45名学生每周自主锻炼时间超过5小时,60名短跑成绩合格的学生中有35名学生每周自主锻炼时间超过5小时.现对短跑成绩不合格的学生进行跑步技巧培训,已知每周自主锻炼时间超过5小时的学生参加跑步技巧培训后,学生的短跑成绩合格的概率为,每周自主锻炼时间不超过5小时的学生参加跑步技巧培训后,学生的短跑成绩合格的概率为.用频率估计概率,从短跑成绩不合格的学生中随机抽取1名学生(记为甲)进行跑步技巧培训.依据小概率值的独立性检验,零假设为:学生短跑成绩合格与每周自主锻炼时间相互独立. (1)先填写列联表,再依据小概率值的独立性检验,判断是否能认为学生短跑成绩合格与每周自主锻炼时间超过5小时有关; 每周自主锻炼时间超过5小时 每周自主锻炼时间不超过5小时 合计 短跑成绩合格 短跑成绩不合格 合计 100 (2)求学生甲在培训后短跑成绩合格的情况下,每周自主锻炼时间不超过5小时的概率; (3)为提高学生锻炼的积极性,学校偶尔会在田径运动场举办锻炼有奖活动,记表示事件“田径运动场举办锻炼有奖的抽奖活动”,表示事件“小明去田径运动场锻炼”,.已知小明在田径运动场举办锻炼有奖的抽奖活动的情况下去运动场锻炼的概率,比不举办抽奖活动的情况下去运动场锻炼的概率大.证明:. 参考公式与数据:,其中,. 0.01 0.005 0.001 6.635 7.879 10.828 3.(25-26高三上·云南昆明·期中)某高校拟与某网络平台合作组织学生参加与知识有关的网络答题活动,为了解男女学生参与答题意愿的差异,在全体学生中抽取人调查,得到如下列联表: 活动             性别 男生 女生 合计 未报名参加答题活动 40 70 110 报名参加答题活动 60 30 90 合计 100 100 200 (1)根据小概率值的独立性检验,能否推断该校学生报名参加答题活动与性别有关联? (2)网络答题规则:答题活动不限时间,不限轮次,答多少轮由选手自行确定:每轮均设置道试题,选手参与该轮答题,一旦答对一题,则其本轮答题结束,答错则继续答题,直到第道试题答完,本轮答题结束已知甲同学报名参加答题活动,假设甲每道试题回答是否正确相互独立,且每次答对的概率均为. (i)当时,求甲同学在一轮答题过程中答题数量的数学期望; (ii)假设甲同学每轮答题答对前两题中的一道,本轮答题得分,否则得分记甲答题累计得分为的概率为,求数列的通项公式. 附:,其中. 4.(25-26高三上·贵州贵阳·月考)贵州“村超”以及江苏“苏超”的成功充分说明了足球是一项大众喜爱的运动. (1)为了解喜爱足球运动是否与性别有关,现随机抽取了男性和女性各100名观众进行调查,得到列联表如下: 喜爱足球运动 不喜爱足球运动 合计 男性 60 40 100 女性 20 80 100 合计 80 120 200 依据小概率值的独立性检验,能否认为喜爱足球运动与性别有关? (2)某足球队中的甲、乙、丙、丁四名球员将进行传球训练,第1次由甲将球传出,每次传球时、传球者都等可能地将球传给另外三个人中的任何一人,如此不停地传下去,且假定每次传球都能被接到.记开始传球的人为第1次触球者,第n次触球者是甲的概率记为,即. ①求,; ②证明:数列为等比数列,并判断第19次与第20次触球者是甲的概率的大小. 0.100 0.050 0.025 0.010 0.001 2.706 3.841 5.024 6.635 10.828 附:,. 5.【多选题】(25-26高三上·湖南长沙·月考)下列结论错误的是(    ) A.在回归模型中,决定系数越大,则回归拟合的效果越好 B.已知随机变量,随机变量,则 C.在对两个分类变量进行独立性检验时,如果列联表中所有数据都缩小为原来的十分之一,在相同的检验标准下,再去判断两变量的关联性时,结论不会发生改变() D.由两个分类变量的成对样本数据计算得到,依据的独立性检验(),可判断独立 1 / 10 学科网(北京)股份有限公司 $ 9.2 独立性检验 题型一 完善列联表 1.(25-26高三上·辽宁·期末)目前,AI赋能语音识别技术已从实验室的“概念验证”发展为改变人类生活的基础设施,随着大模型和多模态技术的融合,英文识别将不再是单一功能,也是智能系统理解世界的“耳朵”和“眼睛”,推动人机交互从“命令执行”向“自然对话”演进.现甲、乙两名同学通过英文指令与某AI智能体人机交互共生成200篇文章.若生成的文章达到专业要求,不用进一步改良,视为合格.现已知甲同学生成的文章有80篇合格,占甲同学生成文章总数的,乙同学生成的文章有一半合格. (1)请根据以上数据填写下面的列联表,并推断能否有95%的把握认为生成的文章是否合格与甲、乙(不同的)同学给出的指令有关? 生成的文章合格 生成的文章不合格 总计 甲同学 80 乙同学 总计 200 (2)经试验,若给出的指令够准确具体,该智能体生成文章合格的概率为,则在此条件下从该智能体生成的一批文章中随机调取3篇,请写出其中合格的篇数的分布列,并算出期望. 附:,其中(结果精确到0.001). 0.1 0.05 0.01 0.005 0.001 2.706 3.841 6.635 7.879 10.828 【答案】(1)列联表见解析,有95%的把握; (2)分布列见解析, 【分析】(1)根据题意,得出列联表,求得的值,结合附表,即可得到结论; (2)根据题意,得到的可能取值,得出服从二项分布,求得相应的概率,得出分布列,求得数学期望. 【详解】(1)由题意得 生成文章合格 生成文章不合格 总计 甲同学 80 40 120 乙同学 40 40 80 总计 120 80 200 , ∵, 所以有95%的把握认为生成文章是否合格与甲、乙(不同的)同学给出的指令有关;                                                                (2)合格的篇数的所有可能取值为,,, 由题意,   ,                                        故的分布列为 0 1 2 3 故期望. 2.(24-25高二下·贵州遵义·月考)为了解居民体育锻炼情况,某地区对辖区内居民体育锻炼进行抽样调查.统计其中400名居民体育锻炼的次数与年龄,得到如下的频数分布表. 次数 年龄 每周次 每周次 每周次及以上 (1)若把年龄在的锻炼者称为青年,年龄在的锻炼者称为中年,每周体育锻炼不超过次的称为体育锻炼频率低,不低于次的称为体育锻炼频率高,请完成以下列联表,并判断在犯错误概率不超过的前提下,能否认为体育锻炼频率的高低与年龄有关联; 青年 中年 合计 体育锻炼频率低 体育锻炼频率高 合计 (2)从每周体育锻炼次及以上的样本锻炼者中,按照表中年龄段采用分层随机抽样的方法抽取人,再从这人中随机抽取人,记这人中年龄在与的人数分别为、,记,求的分布列与期望. 参考公式:,. 附: 【答案】(1)列联表见解析,有关,理由见解析 (2)分布列答案见解析, 【分析】(1)求出卡方值并与临界值比较即可得到结论; (2)分析可知随机变量的可能取值有、、,求出随机变量在不同取值下的概率,可得出随机变量的分布列,进而可求得的值. 【详解】(1)零假设体育锻炼频率的高低与年龄无关, 由题意得如下列联表: 青年 中年 合计 体育锻炼频率低 体育锻炼频率高 合计 , 根据小概率值的独立性检验推断不成立, 即认为体育锻炼频率的高低与年龄有关,此推断犯错误的概率不大于. (2)由表格中的数据可知,四个年龄段的人比为, 利用分层抽样的方法抽取的人中,年龄分别在、的人数为、, 由题意可知,随机变量的可能取值有、、, 则,, , 所以随机变量的分布列如下表所示: 所以. 3.(2026·新疆·模拟预测)某书包品牌代理对,两款书包的受欢迎情况进行调研,现从目标客户群中随机抽取100人,针对他们更喜欢款书包还是款书包做了调查,结果显示:,两款书包的受欢迎的程度相同,且更喜欢款书包的男生与女生人数相等,其中更喜欢款书包的女生占喜欢款书包的总人数的. (1)根据已知条件补全列联表,并依据小概率值的独立性检验,判断更喜欢款书包与性别是否有关联; 更喜欢款书包 更喜欢款书包 总计 男生 女生 总计 (2)在样本中,从更喜欢款书包的目标客户中按性别用比例分配的分层随机抽样的方法抽取5人,在这5人中任选2人,其中女生的人数为随机变量,求的分布列与数学期望. 参考公式:,其中. 参考数据: 0.1 0.05 0.005 2.706 3.841 7.879 【答案】(1)列联表见表格;有关联 (2)分布列见解析,数学期望为. 【分析】(1)根据题意分别计算出喜欢,两款书包的男生、女生人数即可完善列联表,再计算卡方值,将其与小概率值对应的临界值比较即可判断; (2)根据分层随机抽样确定所抽取的5人中,男生1人,女生4人,则从中任选2人,则的可能值有1,2,利用古典概型概率公式和组合数公式求出对应的概率,列出分布列,求得数学期望即可. 【详解】(1)根据题意,,两款书包的受欢迎的程度相同,即在随机抽取的100人中,喜欢,两款书包的人各50人, 又因喜欢款书包的男生与女生人数相等,即喜欢款书包的男生25人,女生25人; 因喜欢款书包的女生占喜欢款书包的总人数的,故喜欢款书包的女生有人,男生有人. 则可补全列联表如下: 更喜欢款书包 更喜欢款书包 总计 男生 10 25 35 女生 40 25 65 总计 50 50 100 由, 因此依据小概率值的独立性检验,可认为更喜欢款书包与性别有关联. (2)因喜欢款书包的目标客户中,男生10人,女生40人,男女生比例为, 故分层抽取5人中,男生1人,女生4人,则从这5人中任选2人,其中女生的人数的可能值有1,2. 则,, 于是的分布列为: 1 2 故数学期望为. 4.(24-25高三上·贵州遵义·月考)为了调查学生喜欢跑步是否与性别有关,现从高三年级选取了200名学生进行问卷调查,得到如下的2×2列联表: 喜欢跑步 不喜欢跑步 合计 男生 64 女生 54 合计 已知在这200名学生中随机抽取1人抽到不喜欢跑步的概率为0.45. (1)判断是否有95%的把握认为喜欢跑步与性别有关? (2)从上述不喜欢跑步的学生中用分层抽样的方法抽取5名学生,再在这5人中随机抽取3人调查其喜欢的运动,用X表示3人中男生的人数,求X的分布列及数学期望. 附:,其中. 0.150 0.100 0.050 0.010 k 2.072 2.706 3.841 6.635 【答案】(1)有 (2)分布列见解析,期望 【分析】(1)根据卡方计算公式求解卡方,即可与临界值比较求解; (2)根据分层抽样比求解抽取人数,即可利用超几何分布的概率公式求解概率,进而即得. 【详解】(1)由题可知,从200名学生中随机抽取1人抽到不喜欢跑步的概率为0.45, 故不喜欢跑步的人有(人),喜欢跑步的人有(人). 喜欢跑步 不喜欢跑步 合计 男生 64 36 100 女生 46 54 100 合计 110 90 200 ∴,,,, 故有95%把握认为喜欢跑步与性别有关. (2)按分层抽样,设女生名,男生名,,解得,, ∴从不喜欢跑步的学生中抽取女生3名,男生2名,故可取. ,,, 故X的分布为: 0 1 2 ∴ 5.(25-26高三上·贵州黔西南·月考)长跑可提高呼吸系统和心血管系统机能,为了调查学生喜欢跑步是否与性别有关,某校从高三年级选取了200名学生进行问卷调查,得到如下的列联表.已知在这200名学生中随机抽取1人抽到喜欢跑步学生的概率为0.6. 性别 跑步 喜欢跑步 不喜欢跑步 总计 男生 80 女生 20 总计 (1)依小概率值的独立性检验,能否认为喜欢跑步与性别有关? (2)从上述不喜欢跑步的学生中用样本量按比例分配的分层随机抽样的方法抽取8名学生,再从这8人中抽取3人调查其喜欢的运动,用表示3人中女生的人数,求的分布列及数学期望. 附:,其中. 0.1 0.05 0.01 0.001 2.706 3.841 6.635 10.828 【答案】(1)不能 (2)分布列见解析, 【分析】(1)根据独立性检验进行判断; (2)根据分层抽样计算出男女生人数,结合超几何分布计算概率写出分布列,最后计算数学期望; 【详解】(1)由题可知,从200名学生中随机抽取1人抽到喜欢跑步学生的概率为0.6, 故喜欢跑步的有(人),不喜欢跑步的有(人). 补全列联表如下: 性别 跑步 喜欢跑步 不喜欢跑步 总计 男生 80 60 140 女生 40 20 60 总计 120 80 200 由列联表中的数据, 零假设:喜欢跑步与性别无关, 由, 根据小概率值的独立性检验,我们没有充分证据推断喜欢跑步与性别有关,即认为喜欢跑步与性别无关. (2)设抽取的8人中女生有名,男生有名,则,解得,, 所以从不喜欢跑步的学生中抽取女生2名,男生6名. 再从这8人中抽取3人(从8名学生(6名男生、2名女生)中抽取3名,典型的超几何分布模型), 故的可能取值为0,1,2, 且,,, 故的分布列为 X 0 1 2 P 方法一:数学期望. 方法二:服从超几何分布,且,,,所以. 题型二 列联表分析 1.(2024·贵州·一模)【多选题】2018年12月1日,贵阳市地铁1号线全线开通,在一定程度上缓解了市内交通的拥堵状况.为了了解市民对地铁1号线开通的关注情况,某调查机构在地铁开通后的某两天抽取了部分乘坐地铁的市民作为样本,分析其年龄和性别结构,并制作出如下等高堆积条形图. 根据图中的信息,下列结论中一定正确的是(    ). A.样本中男性比女性更关注地铁1号线全线开通 B.样本中多数女性是35岁及以上 C.样本中35岁以下的男性人数比35岁及以上的女性人数多 D.样本中35岁及以上的人对地铁1号线的开通关注度更高 【答案】ABD 【分析】通过等高堆积条形图构建列联表,根据条形图所呈现的信息得出列联表中各部分数量的大小关系,再依据这些关系对各个选项进行分析. 【详解】设等高堆积条形图对应的列联表如下: 项目 35岁及以上 35岁以下 合计 男性 a c 女性 b d 合计 根据第1个等高堆积条形图可知,35岁及以上的男性比女性多,即; 35岁以下的男性也比女性多,即, 根据第2个等高堆积条形图可知,男性中35岁及以上的比35岁以下的多,即; 女性中35岁及以上的也比35岁以下的多,即, 对于选项A,男性人数为,女性人数为,,,故A正确, 对于选项B,35岁及以上女性人数为,35岁以下女性人数为d,,故B正确, 对于选项C,35岁以下男性人数为c,35岁及以上女性人数为b,由,无法直接判断b与c的大小关系,故C不一定正确, 对于选项D,35岁及以上的人数为,35岁以下的人数为,, ,故D正确, 故选:ABD. 2.【多选题】(24-25高二下·江西上饶·月考)设,为两个变量,每一个变量都可以取两个值,即,,且,,,且,随机调查个样本数据后,得到如下列联表,则(   ) 合计 合计 A.若,则可以认为与独立 B.若变量与独立,则 C.若很大,则变量与不独立 D.若变量与不独立,则很大 【答案】AC 【分析】运用独立性检验的步骤原理推理判断即可. 【详解】用频率可以估计,用频率可以估计,用频率可以估计,若,则,可以认为与独立,故正确; 由于,,表示的是频率,是抽取的样本数据,故即使变量与独立,也不一定成立,故错误; 若很大,可以说明与不独立,故正确; 若变量与不独立,,但并不一定很大,故错误. 故选:AC. 3.【多选题】(24-25高二下·吉林长春·月考)一医疗团队为研究某地的一种地方性疾病与当地居民的卫生习惯(卫生习惯分为良好和不够良好两类)的关系,在已患该疾病的病例中随机调查了100例(称为病例组),同时在未患该疾病的人群中随机调查了100人(称为对照组),得到如下数据.从该地的人群中任选一人,设A表示事件“选到的人卫生习惯不够良好”,B表示事件“选到的人患有该疾病”,与的比值是卫生习惯不够良好对患该疾病风险程度的一项度量指标,记该指标为R.则下列选项正确的是(   ) 不够良好 良好 病例组 40 60 对照组 10 90 附:, 0.050 0.010 0.001 3.841 6.635 10.828 A.依据的独立性检验,可推断患该疾病群体与未患该疾病群体的卫生习惯有差异 B.利用该调查数据,可得到的估计值为0.4,的估计值为0.1 C.. D.利用该调查数据,可得到R的估计值为5 【答案】ABC 【分析】对于选项A,可由列联表,结合所给公式,求出的值,根据小概率值的独立性检验,即可判断;对于选项B,由已知条件,可直接求得的值,即可判断;对于选项C,可利用公式证明;对于选项D,由已知条件,分别求出的值,即可求出R的值,即可判断. 【详解】对于选项A,由列联表得 所以根据小概率值的独立性检验,认为患该疾病群体与未患该疾病群体的卫生习惯有差异,故选项A正确; 对于选项B,由已知得故选项B正确; 对于选项C,由题意得, 又 所以,故选项C正确; 对于选项D,由已知得, 所以,故选项D错误. 故答案选:ABC. 4.(2024高三·北京·专题练习)年月日太原地铁号线开通,在一定程度上缓解了市内交通的拥堵状况,为了了解市民对地铁号线开通的关注情况,某调查机构在地铁开通后两天抽取了部分乘坐地铁的市民作为样本,分析其年龄和性别结构.并制作出如下等高堆积条形图: 根据图中信息,下列结论不一定正确的是( ) A.样本中男性比女性更关注地铁号线开通 B.样本中多数女性是岁及以上 C.样本中岁以下的男性人数比岁及以上的女性人数多 D.样本中岁及以上的人对地铁号线的开通关注度更高 【答案】C 【分析】通过对等高堆积条形图的分析,结合所列列联表及不等式性质,逐一对每个选项进行推理判断即可. 【详解】设等高条形图对应列联表如下: 岁及以上 岁以下 总计 男性 女性 总计 根据第个等高条形图可知,岁及以上男性比岁及以上女性多,即; 岁以下男性比岁以下女性多,即. 根据第个等高条形图可知,男性中岁及以上的比岁以下的多,即; 女性中岁及以上的比岁以下的多,即, 对于A,男性人数为,女性人数为, 因为,所以,所以A正确; 对于B,岁及以上女性人数为,岁以下女性人数为, 因为,所以B正确; 对于C,岁以下男性人数为,岁及以上女性人数为, 无法从图中直接判断与的大小关系,所以C不一定正确; 对于D,岁及以上的人数为,岁以下的人数为, 因为,所以,所以D正确. 故选:C. 5.【多选题】(24-25高三上·广东潮州·期末)千百年来,我国劳动人民在生产实践中根据云的形状、走向、速度、厚度、颜色等的变化,总结了丰富的“看云识天气”的经验,并将这些经验编成了谚语,如“天上钧钧云,地上雨淋淋”“日落云里走,雨在半夜后”……小明同学为了验证“日落云里走,雨在半夜后”,观察了所在地区的100天的日落和夜晚天气,得到如下列联表:       夜晚天气日落云里走 下雨 不下雨 合计 出现 25 5 30 不出现 25 45 70 合计 50 50 100 临界值表 0.10 0.05 0.010 0.001 2.706 3.841 6.635 10.828 并计算得到,下列小明对地区天气判断正确的是(    ) A.夜晚下雨的概率约为 B.未出现“日落云里走”,但夜晚下雨的概率约为 C.出现“日落云里走”,有的把握认为夜晚会下雨 D.至少有的把握认为“‘日落云里走’是否出现”与“当晚是否下雨”有关 【答案】BD 【分析】根据已知条件,结合频率与频数的关系,以及独立性检验公式,即可求解. 【详解】由题意,把频率看作概率可得夜晚下雨的概率约为,A错误,不符合题意; 未出现“日落云里走”,但夜晚下雨的概率约为,B正确,符合题意; 由,可知至少有的把握认为“‘日落云里走’是否出现”与“当晩是否下雨”有关,故D正确,C错误, 故选:BD. 题型三 等高条形图 1.(25-26高三上·山东·期中)石墨烯发热膜在生产生活中应用广泛.从石墨中分离石墨烯的一种方法是化学气相沉积法,使石墨升华后附着在材料上再结晶.现在有A材料、B材料可供选择,研究人员对附着在A材料、B材料上的石墨各做了100次再结晶试验,得到如下等高堆积条形图. (1)根据等高堆积条形图,填写如下列联表,并依据的独立性检验,分析试验结果与材料是否有关; (单位:次) A材料 B材料 合计 试验成功 试验失败 合计 (2)制作1吨石墨烯发热膜有甲、乙两个环节,其中甲环节生产合格的概率为,乙环节生产合格的概率为,且各生产环节相互独立.若生产不合格还需进行修复,甲环节的修复费用为3万元,乙环节修复费用均为2万元.设随机变量为制作石墨烯发热膜所产生的修复费用,求的分布列及数学期望. 附:,其中. 0.1 0.01 0.001 2.706 6.635 10.828 【答案】(1)列联表见解析,试验结果与材料有关 (2)分布列见解析, 【分析】(1)利用等高堆积条形图作出列联表,根据卡方公式及独立性检验思想计算即可; (2)利用条件列出分布列计算期望即可. 【详解】(1)根据题中所给等高堆积条形图,得列联表如下: 单位:次 A材料 B材料 合计 试验成功 90 60 150 试验失败 10 40 50 合计 100 100 200 零假设为:试验结果与材料无关. 计算可得, 依据的独立性检验,推断不成立,即认为试验结果与材料有关. (2)的可能取值为0,2,3,5. ,,,, 则的分布列为 0 3 5 数学期望. 2.(24-25高三上·江西新余·月考)如图为对某高中学生是否对父母说过“我爱你”这样的话的统计结果,则下列统计分析中不正确的是:(    ). A.男性被调查者没有对父母说过“我爱你”这样的话的人数比例高于女性 B.无论男女对母亲说“我爱你”这类话的比例都高于对父亲所说 C.大部分调查者没有对父母说过“我爱你”这样的话 D.经常对父母说“我爱你”这样的话的人数总计比例较女生比例有所下降,说明这张统计图的结果可能存在错误 【答案】D 【分析】根据统计图中的数据进行分析,判断每个选项的正确性. 【详解】对于A选项,观察统计图,比较男性和女性未对父母说过“我爱你”的比例, 发现男性未说的比例高于女性,所以A选项正确. 对于B选项,分别对比男女对母亲和对父亲说“我爱你”的比例, 能看出无论男女对母亲说的比例都高于对父亲说的比例,所以B选项正确. 对于C选项,从统计图整体来看,未说过“我爱你”的人数比例较大, 所以大部分调查者没有对父母说过“我爱你”这样的话,C选项正确. 对于D选项,经常对父母说“我爱你”的人数总计比例较女生比例有所下降, 并不能直接说明统计图结果存在错误,有可能是实际调查结果就是如此,所以D选项错误. 故选:D 3.【多选题】(23-24高二下·吉林白山·期末)暑假结束后,为了解假期中学生锻炼身体情况,学生处对所有在校学生做问卷调查,并随机抽取了180人的调查问卷,其中男生比女生少20人,并将调查结果绘制得到等高堆积条形图.已知,其中,,在被调查者中,下列说法正确的是(    ) A.男生中不经常锻炼的人数比女生中经常锻炼的人数多 B.男生中经常锻炼的人数比女生中经常锻炼的人多8人 C.经常锻炼者中男生的频率是不经常锻炼者中男生的频率的1.6倍左右 D.在犯错误的概率不大于0.01的条件下,可以认为假期是否经常锻炼与性别有关 【答案】BCD 【分析】根据男生比女生少20人,建立等式求出男生、女生的人数,建立列联表,利用列联表中的信息解决ABC,利用独立性检验来解决D选项. 【详解】解:设男生人数为,则女生人数为, 由题得, 解得,即在被调查者中,男、女生人数为80,100,可得到如下列联表, 性别 锻炼情况 合计 经常锻炼 不经常锻炼 男 48 32 80 女 40 60 100 合计 88 92 180 由表可知,A显然错误, 男生中经常锻炼的人数比女生中经常锻炼的人数多B正确; 在经常锻炼者中是男生的频率为,在不经常锻炼者中是男生的频率为C正确; 零假设:假期是否经常锻炼与性别无关, 则,根据小概率值的独立性检验,我们推断不成立, 即认为假期是否经常锻炼与性别有关,此推断犯错误概率不大于0.01,D正确, 故选:BCD. 4.(23-24高二下·重庆·期末)如图是学校高二1、2班本期中考试数学成绩优秀率的等高堆积条形图,如果再从两个班中各随机抽6名学生的期中考试数学成绩统计,那么(    ) A.两个班6名学生的数学成绩优秀率可能相等 B.1班6名学生的数学成绩优秀率一定高于2班 C.2班6名学生中数学成绩不优秀的一定多于优秀的 D.“两班学生的数学成绩优秀率存在差异”判断一定正确 【答案】A 【分析】分析等高堆积条形图可直接得到答案. 【详解】原图是学校高二1、2班本期中期考试数学成绩优秀率的等高堆积条形图, 从两个班随机抽取的6名学生的期中考试数学成绩优秀率无法确定哪个班的比较高,2班6名学生数学成绩不优秀的和优秀的人数也不能确定,故A正确,BC错误; 两个班期中考试数学成绩的优秀率均在0.5左右,并不能直接确定“两班学生的数学成绩优秀率存在差异”,故D错误; 故选:A. 5.【多选题】(2024·湖北·一模)某校为了解高一新生对数学是否感兴趣,从400名女生和600名男生中通过分层抽样的方式随机抽取100名学生进行问卷调查,将调查的结果得到如下等高堆积条形图和列联表,则(    ) 性别 数学兴趣 合计 感兴趣 不感兴趣 女生 男生 合计 100 参考数据:本题中 0.1 0.05 0.01 0.005 0.001 2.706 3.841 6.635 7.879 10.828 A.表中 B.可以估计该校高一新生中对数学不感兴趣的女生人数比男生多 C.根据小概率值的独立性检验,可以认为性别与对数学的兴趣有差异 D.根据小概率值的独立性检验,可以认为性别与对数学的兴趣没有差异 【答案】ACD 【分析】根据分层抽样的定义及等高条形图的特点即可得出的列联表中的数据,利用列联表中的数据计算观测值,再跟临界值进行比较即可求解. 【详解】由题可知,抽取男生人数为人,女生抽取的人数人, 由等高条形图知,抽取男生感兴趣的人数为人,抽取男生不感兴趣的人数为人, 抽取女生感兴趣的人数为人,抽取女生不感兴趣的人数为人, 的列联表如下 性别 数学兴趣 合计 感兴趣 不感兴趣 女生 男生 合计 100 由此表可知,,故A正确; 女生不感兴趣的人数约为人,男生不感兴趣的人数约为人, 所以估计该校高一新生中对数学不感兴趣的女生人数比男生少,故B 错误; 零假设为:性别与对数学的兴趣没有差异 依据小概率值的独立性检验,有充分证据推断不成立, 因此可以认为不成立,即可以认为性别与对数学的兴趣有差异;故C正确; 零假设为:性别与对数学的兴趣没有差异 依据小概率值的独立性检验,没有充分证据推断不成立, 因此可以认为成立,即可以认为性别与对数学的兴趣没有差异;故D正确. 故选:ACD. 题型四 卡方的计算 1.(25-26高三上·江苏无锡·月考)为调查某地区老人是否需要志愿者提供帮助,用简单随机抽样方法从该地区调查了500位老年人,调查结果如下表: 男性 女性 需要 40 20 不需要 160 280 (1)在该地区男性老年人中,随机选择一位,他需要志愿者提供帮助的概率记为,求的估计值; (2)完成抽样数据列联表,并根据小概率值的独立性检验,分析该地区的老年人需要志愿者提供帮助与性别是否有关;并指出该调查中更优的抽样方法. 参考数据: 0.10 0.05 0.010 0.005 2.706 3.841 6.635 7.879 【答案】(1) (2)该地区的老年人需要志愿者提供帮助与性别有关,更优的抽样方法是分层抽样 【分析】(1)利用频率估计概率进行求解即可; (2)根据数据计算卡方值,将其与小概率值对应的临界值比较进行判断. 【详解】(1)抽取的样本中,男性老年人共有200人,需要志愿者提供帮助的有40人, 频率为,所以的估计值是. (2)列联表如下: 男性 女性 合计 需要 40 20 60 不需要 160 280 440 合计 200 300 500 ,所以根据小概率值的独立性检验, 认为该地区的老年人是否需要志愿者提供帮助与性别有关. 由于该地区老年人是否需要帮助与性别有关,并且从样本数据能看出男性老年人需要帮助的需求较高,与女性老年人有明显差异, 因此调查时先确定男女老年人的比例,然后按照男、女两层进行分层抽样,更优的抽样方法是分层抽样. 2.(25-26高三上·云南昆明·月考)北京冬奥会的成功举办,不仅让世界进一步了解新时代的中国,而且极大促进了全国群众参与冰雪运动,此后每年冬季,全国多地群众都会积极参与冰雪运动.某城市为调查居民对冰雪运动的了解情况,随机抽取了该市男女市民各60人进行统计,统计结果如下表:(单位:人) 性别 冰雪运动 合计 了解 不了解 男 60 女 60 合计 80 40 120 已知从参与调查的男性市民中随机抽取一名,他了解冰雪运动的概率为. (1)求表中m,n,p,q的值; (2)根据小概率值的独立性检验,分析并判断该市居民对冰雪运动的了解是否与性别有关联. 附: 0.050 0.010 0.005 3.841 6.635 7.879 【答案】(1), (2)不能判断该市居民对冰雪运动的了解与性别有关联,详细见解析 【分析】(1)根据已知条件先求出,进而根据表格数据求出其它参数. (2)根据公式先计算出卡方值,然后利用独立性检验原理判断即可. 【详解】(1)依题意,,所以. (2)零假设:该市市民对冰雪运动的了解与性别无关联. , 因此根据小概率值的独立性检验,不能判断该市居民对冰雪运动的了解与性别有关联. 3.(25-26高二上·陕西渭南·期末)某研究小组为探究给禾苗加化肥与禾苗生长情况的关系,将30株禾苗均分为两组:对照组(不加化肥)和实验组(加化肥).在其他条件均相同的情况下,实验结束后测得这30株禾苗的高度(单位:cm)如下: 对照组 18.5 18.8 19.1 19.5 20.3 22.3 23 23.6 24 24.8 25.5 26.7 27.7 28.5 39.8 实验组 19.7 20.1 22.6 23.5 24.8 25 25.2 25.6 26 27.1 28.3 29.5 29.6 31.4 31.4 当实验结束时,若禾苗的高度不低于25cm,则判断该禾苗生长良好;若禾苗的高度低于25cm,则判断该禾苗生长较差,将这30株禾苗高度的数据进行整理,得到如下列联表: 分组 禾苗的生长情况 生长良好 生长较差 合计 对照组 15 实验组 15 合计 30 (1)请完成列联表; (2)判断是否有90%的把握认为给禾苗加化肥与该禾苗的生长情况有关. 附:,其中. 当时,没有充分的证据判断变量有关联,可以认为变量是没有关联的;当时,有90%的把握判断变量有关联. 【答案】(1)列联表见解析 (2)有90%的把握认为给禾苗加化肥与该禾苗的生长情况有关. 【分析】(1)根据统计表格中的数据:分别求得对照组和实验组中生长较差和生长良好的株数,进而得出的列联表; (2)由的列联表中的数据,利用公式求得,集合附值,即可得到结论. 【详解】(1)解:根据统计表格中的数据: 对照组15株中,生长较差的有10株,生长良好有5株; 实验组15株中,生长较差的有5株,生长良好有10株; 所以的列联表为: 分组 禾苗的生长情况 生长良好 生长较差 合计 对照组 5 10 15 实验组 10 5 15 合计 15 15 30 (2)解:假设给禾苗加化肥与该禾苗的生长情况无关, 由的列联表中的数据,可得: 因为,所以有的把握判断变量有关联,所以拒绝假设, 所以有90%的把握认为给禾苗加化肥与该禾苗的生长情况有关. 4.(25-26高二上·广西梧州·期末)近期,流感病毒阳性率正快速上升,其中99%以上为甲流,流行株以(H1N1)pdm09亚型为主.为考察某新药预防甲流的效果,进行了个体(单位:例)试验,得到如下列联表: 药物 疾病 总计 未患病 患病 未服用 80 180 服用 150 总计 250 400 (1)请完成列联表,记未服用新药的个体患甲流的概率为,给出的估计值; (2)根据小概率值的独立性检验,能否认为新药对预防甲流有效? 0.050 0.010 0.001 3.841 6.635 10.828 附: 【答案】(1)表格见解析, (2)认为药物对预防甲流有效. 【分析】(1)根据列联表中数量关系补充完整即可,结合用样本频率估计总体概率的统计思想计算即可. (2)计算出,结合独立性检验推断即可. 【详解】(1)由题意可得列联表, 药物 疾病 总计 未患病 患病 未服用 100 80 180 服用 150 70 220 总计 250 150 400 未服用药物的个体有180,所以未服用药物的个体患甲流的频率为, 所以未服用药物的个体患甲流的概率的估计值为; (2)零假设为:药物对预防甲流无效, 由列联表得到, 根据小概率值的独立性检验,推断不成立,即认为药物对预防甲流有效,该推断错误的概率不超过0.01, 所以根据小概率值的独立性检验,能认为药物对预防甲流有效. 5.(25-26高三上·辽宁·期末)某兴趣小组对校内学生对中国象棋的兴趣程度进行问卷调查,调查结果如下: 非常感兴趣 比较感兴趣 不感兴趣 男生 100 60 40 女生 50 50 100 用频率估计概率. (1)随机抽取一名男生,求他对中国象棋比较感兴趣的概率; (2)将非常感兴趣与比较感兴趣统称为感兴趣.根据小概率值的独立性检验,分析学生对中国象棋的兴趣程度是否与学生性别有关. 附:. 0.050 0.010 0.001 3.841 6.635 10.828 【答案】(1) (2)与学生性别有关 【分析】(1)根据图表中的数据分析,结合古典概型的概率公式计算即可求解; (2)根据卡方的计算公式,结合独立性检验的思想即可下结论. 【详解】(1)注意到, (比较感兴趣的男生), 故. (2)可得如下列联表: 感兴趣 不感兴趣 合计 男生 160 40 200 女生 100 100 200 合计 260 140 400 零假设为:学生对中国象棋的兴趣程度与学生性别无关, , 不成立, 于是根据小概率值的独立性检验,学生对中国象棋的兴趣程度与学生性别有关. 题型五 独立性检验解决实际问题 1.(25-26高三上·陕西榆林·月考)某中学对学生钻研奥数课程的情况进行调查,将每周独立钻研奥数课程超过6小时的学生称为“奥数迷”,否则称为“非奥数迷”,从调查结果中随机抽取100人进行分析,得到数据如表所示: 奥数迷 非奥数迷 合计 男 24 36 60 女 12 28 40 合计 36 64 100 a 0.10 0.05 0.010 0.005 0.001 2.706 3.841 6.635 7.879 10.828 (1)对照列联表,根据小概率的独立性检验,是否认为“奥数迷”与性别有关? (2)现从抽取的“奥数迷”中,按性别采用分层抽样的方法抽取3人参加奥数闯关比赛,已知其中男、女学生独立闯关成功的概率分别为、,在恰有两人闯关成功的条件下,求两人性别相同的概率. 参考数据与公式:,其中. 【答案】(1)是否为“奥数迷”与性别无关 (2) 【分析】(1)计算并与临界值比较即可得出判断; (2)先按分层抽样确定男生与女生人数,再根据条件概率公式计算即可. 【详解】(1)零假设:“奥数迷”与性别无关, , 根据小概率的独立性检验,可以推断成立, 所以认为是否为“奥数迷”与性别无关. (2)根据分层抽样,抽取的男生人数为2人,女生人数为1人, 设“恰有2人闯关成功”为事件,“两人性别相同”为事件, 则, , 由条件概率公式得,, 所以在恰有两人闯关成功的条件下,两人性别相同的概率为. 2.(2026高二·全国·专题练习)为探究某品种松树L的生长状况与浇水情况的关系,Santa从某人工林中随机调查了200棵松树L,得到如下列联表: 正常 不正常 合计 正常 70 30 100 不正常 50 50 100 合计 120 80 200 (1)根据小概率值的独立性检验,分析松树L的生长状况是否与浇水情况有关; (2)现从该人工林中再随机抽取3棵松树L,记其中浇水正常的松树棵数为随机变量,试用上述调查的频率估计概率,求的分布列和数学期望.     附:, 10.828 【答案】(1)无关,; (2)答案见解析, 【分析】(1)根据独立性检验的基本思想,求出,然后与小概率值对应的临界值比较,即可判断; (2)利用二项分布概率计算公式可得各个随机变量取值的概率,进而可得分布列与期望. 【详解】(1)零假设松树L的生长状况与浇水情况无关;                     根据列联表的数据,经计算得到:; 根据小概率值的独立性检验,无法推断不成立,即认为松树L的生长状况与浇水情况无关. (2)用频率估计概率,可估算抽到浇水正常的松树的概率,     考虑到松树L足够多,因此可把随机变量视为二项分布,即,    ,. ,. 所以的分布列为: 0 1 2 3 则. 3.(2026·安徽黄山·一模)2025年我国多地推广“碳普惠”体系,鼓励市民参与绿色出行获取低碳积分.某社区随机抽取100名居民调查绿色出行情况,得到如下列联表(绿色出行定义为“日常通勤采用公交、骑行、步行”): 参与绿色出行 不参与绿色出行 总计 青年群体(40岁) 35 15 50 中老年群体(40岁) 20 30 50 总计 55 45 100 (1)依据小概率值的独立性检验,分析参与绿色出行是否与年龄群体有关? (2)若市民甲前一天参与了绿色出行,则后一天参与绿色出行的概率为;若前一天没有参与绿色出行,则后一天参与绿色出行的概率为.如果市民甲第一天参与了绿色出行的概率为,分别求出他在第二天、第三天参与了绿色出行的概率. 附: 0.100 0.050 0.010 2.706 3.841 6.635 【答案】(1)与年龄群体有关 (2), 【分析】(1)结合题中数据计算,然后与临界值比较即可判断. (2)设“市民甲第天参与了绿色出行”,“市民甲第天没有参与绿色出行”,根据全概率公式和对立事件概率公式求解即可. 【详解】(1)零假设:参与绿色出行与年龄群体无关, 则, 根据小概率值的独立性检验,不成立, 所以参与绿色出行与年龄群体有关. (2)设“市民甲第天参与了绿色出行”,“市民甲第天没有参与绿色出行”,. 由题意知:, ∴, ∴, ∴. ∴市民甲第二天参与了绿色出行的概率为,第三天参与了绿色出行的概率为. 4.(25-26高二上·陕西渭南·期末)为考察某种药物对预防疾病的效果,进行了动物(单位:只)试验,得到如下列联表: 药物 疾病 总计 未患病 患病 未服用 100 80 s 服用 150 70 220 总计 250 t 400 (1)求s,t; (2)记未服用药物的动物患疾病的概率为,给出的估计值; (3)能否有99%的把握判断药物对预防疾病有效? 附:. 0.010 0.005 0.001 6.635 7.879 10.828 【答案】(1), (2) (3)的把握认为药物A对预防疾病B有效 【分析】(1)根据列联表求和即可; (2)用频率估计概率,计算即可; (3)根据公式计算,然后根据临界值表分析判断即可. 【详解】(1)由列联表知,. (2)由列联表知,未服用药物A的动物有180只,未服用药物A且患疾病B的动物有80只, 所以未服用药物A的动物患疾病B的频率为, 所以未服用药物A的动物患疾病B的概率的估计值为. (3)零假设为:药物对预防疾病无 效, 由列联表得到, 所以有的把握认为药物A对预防疾病B有效. 5.(25-26高三上·河北·月考)利用错题去学习是比较高效的学习方法.为了研究学生每天整理数学错题的情况,某校数学建模兴趣小组的同学在本校高三年级学生中采用随机抽样的方法抽取了60名学生,调查他们的数学成绩和整理数学错题的情况,统计数据如下: 数学成绩总评优秀人数 数学成绩总评非优秀人数 合计 每天都整理数学错题人数 20 10 不是每天都整理数学错题人数 22 合计 60 (1)完成上述列联表,并估计本校高三年级学生中不是每天都整理数学错题且数学成绩总评优秀的概率; (2)根据小概率值的独立性检验,分析数学成绩总评优秀与每天都整理数学错题是否有关联? (3)从样本中每天都整理数学错题的学生中随机抽取3名学生做进一步访谈,设抽取到数学成绩总评优秀的人数为,求的分布列和数学期望. 附:,其中; 0.10 0.01 0.001 2.706 6.635 10.828 【答案】(1)表格见解析, (2)数学成绩总评优秀与每天都整理数学错题有关联. (3)分布列见解析,2 【分析】(1)根据题目数据完善列联表,然后利用频率估计概率即可求解; (2)利用列联表的数据求出的观测值,与临界值比较即可求解; (3)求出的可能值及对应的概率,列出分布列并求出期望即可. 【详解】(1)完善列联表,如下: 数学成绩总评优秀人数 数学成绩总评非优秀人数 合计 每天都整理数学错题人数 20 10 30 不是每天都整理数学错题人数 8 22 30 合计 28 32 60 估计不是每天都整理数学错题且数学成绩总评优秀的概率约为. (2)零假设:数学成绩总评优秀与每天都整理数学错题无关联, 利用(1)中数据,得, 根据小概率值的独立性检验,可以判断不成立,所以数学成绩总评优秀与每天都整理数学错题有关联. (3)由题意知的所有可能值为0,1,2,3, ,, ,, 所以的分布列为 0 1 2 3 . 题型一 由卡方的计算求参数范围 1.(25-26高二上·全国·单元测试)为落实五育并举,同时增强高中生的综合素质,某校领导计划利用课间时间开展足球社团活动,为了使该活动顺利开展,了解学生是否对足球感兴趣与性别的关系,现从某年级的学生中随机抽取了男、女同学各50名,整理得到下列列联表: 性别 兴趣爱好 感兴趣 不感兴趣 总计 男 50 女 50 总计 80 20 100 使得“有但没有的把握认为男、女同学对足球感兴趣有差异”的的一个值为 . 【答案】35(或36或44或45,答案不唯一) 【分析】由独立性检验公式可得,据此可得答案. 【详解】易知 ,依题意可知, 解得或, 又,,, 则,. 得或,故的可能取值为35,36,44,45. 故答案为:35(或36或44或45,答案不唯一) 2.(24-25高二下·上海·期末)针对“中学生追星问题”,某校团委对“学生性别和中学生追星是否有关”作了一次调查.在全校学生中随机抽取(是正整数)个学生,其中女生人数是男生人数的,男生追星的人数占男生人数的,女生追星的人数占女生人数的,若根据小概率值的独立性检验,判断中学生追星与性别有关,则男生至少有 人. 参考数据及公式如下: 0.050 0.010 0.001 3.841 6.635 10.828 参考公式:,其中. 【答案】 【分析】设男生人数为,依题意可得列联表;根据表格中的数据,代入求观测值的公式,求出观测值同临界值进行比较,列不等式即可得出结论. 【详解】因为抽取个学生,女生人数是男生人数的, 所以抽取个男生,个女生,为了便于计算,我们令, 设男生人数为,依题意可得列联表如下: 喜欢追星 不喜欢追星 总计 男生 女生 总计 根据小概率值的独立性检验,判断中学生追星与性别有关, 则,由,解得, 由题知应为6的整数倍, 而根据小概率值的独立性检验,判断中学生追星与性别有关, 则男生至少有30人, 故答案为:30. 3.(浙江省部分学校2024-2025学年高三下学期5月联考数学试题)小坤统计了“喜欢学习数学”和“性别为男性”的关系,统计男,女同学分别为60,40名,在男生中随机抽取三名同学,其中喜欢数学的人数恰有一人的概率为,则男生中喜欢数学的人数(大于男生中不喜欢数学的人数)为 经过计算,认为有的概率认为“喜欢学习数学”和“性别为男性”有关,则女同学中喜欢学习数学的人数的最大值为 (精确到1) 0.05 0.025 0.01 0.005 0.001 k 3.841 5.024 6.635 7.879 10.828 【答案】 50 23 【分析】设男生中喜欢数学的人数为人,由超几何分布的概率公式计算即可,设女生中喜欢数学的人数为人,由独立性检验的原理中的公式计算求解即可. 【详解】由题意可知,男同学有人,设男生中喜欢数学的人数为人,则且. 在男生中随机抽取三名同学,其中喜欢数学的人数恰有一人的概率为, 故,整理可得, 因为且,解得. 设女生中喜欢数学的人数为人, 则 男生 女生 合计 喜欢数学 50 不喜欢数学 10 合计 60 40 100 经过计算,认为有的概率认为“喜欢学习数学”和“性别为男性”有关, 则,即, 解得, 故最大值为. 故答案为:50;23. 4.(24-25高二下·河南南阳·月考)某校对“学生性别和喜欢抖音是否有关”作了一次调查,其中被调查的男女生人数相同,男生喜欢抖音的人数占男生人数的,女生喜欢抖音的人数占女生人数的,若有95%的把握判断是否喜欢抖音和性别有关,则调查人数中男生可能有 人. 附: 0.100 0.050 0.010 2.706 3.841 6.635 【答案】(答案不唯一) 【分析】设被调查的男女生为人,写出列联表,应用卡方公式求卡方值,结合求参数范围,进而确定被调查的男生为,即可答案. 【详解】由题意,设被调查的男女生为人,则男生喜欢抖音有人,女生喜欢抖音有人, 所以列联表如下: 喜欢抖音 不喜欢抖音 总计 男生 女生 总计 所以,则, 所以被调查的男生为, 又,则人数是5的整数倍, 所以大于等于45的5的整数倍都符合题意,即可能有人. 故答案为:(答案不唯一) 5.(24-25高三上·江苏南通·月考)随着国家对中小学“双减”政策的逐步落实,其中增加中学生体育锻炼时间的政策引发社会的广泛关注.某教育时报为研究“支持增加中学生体育锻炼时间的政策是否与性别有关”,从某校男女生中各随机抽取80名学生进行问卷调查,得到如下数据通过计算有以上的把握认为“支持增加中学生体育锻炼时间的政策与性别有关”,则在这被调查的名女生中支持增加中学生体育锻炼时间的人数的最小值为 .   支持 不支持 男生 女生 附:,其中. 【答案】 【分析】根据临界值表可得出关于的不等式,结合可得出的最小值,即可得出答案. 【详解】因为有以上的把握认为“支持增加中学生体育锻炼时间的政策与性别有关”, 所以,即, 因为函数在时单调递增, 且,,,所以的最小值为, 所以在这被调查的名女生中支持增加中学生体育锻炼时间的人数的最小值为. 故答案为:. 题型二 独立性检验的跨模块综合题型 1.(25-26高三上·河北沧州·月考)为了探究职场人士每季度进行职业技能培训的时长(单位:小时)和他们的季度绩效评分(单位:分)的关系,某调研机构开展了调查,得到如下数据: 3 6 9 12 15 70 80 84 96 100 (1)若该组数据中与之间的关系可用线性回归模型进行拟合,求关于的经验回归方程; (2)基于上述调查,某企业推行员工职业技能培训计划,经过一个季度的实施后,抽样调查了200位员工,按照参与职业技能培训与季度绩效提升情况得到如下列联表,请将表格补充完整,并依据的独立性检验,分析“参与职业技能培训与绩效提升”是否有关. 单位:人 绩效未提升 绩效提升 合计 参与职业技能培训 100 150 未参与职业技能培训 30 合计 参考公式:经验回归方程中斜率和截距的最小二乘估计公式分别为,, 其中. 0.1 0.05 0.01 0.005 0.001 2.706 3.841 6.635 7.879 10.828 【答案】(1) (2)表格见解析,有关 【分析】(1)根据统计表格中的数据,分别求得相应的数据,利用公式求得和的值,即可求解; (2)根据题意,补充完成的列联表,利用公式求得的值,结合附表,即可得到结论. 【详解】(1)解:由表格中的数据,可得,, 且,, 所以,则, 所以关于的经验回归方程为. (2)解:根据题意,补充的列联表: 绩效未提升 绩效提升 合计 参与职业技能培训 50 100 150 未参与职业技能培训 30 20 50 合计 80 120 200 零假设为:参与职业技能培训与绩效提升无关, 由表格数据,可得, 所以依据小概率值的独立性检验,我们可以推断不成立, 即认为参与职业技能培训与绩效提升有关,此推断犯错误的概率不大于. 2.(25-26高二上·江西·期末)某调查小组研究短视频播放量与内容类型的关联性,从平台抽取容量为200的样本,整理数据如下: 播放量\内容类型 知识类 娱乐类 合计 高播放 50 70 120 低播放 30 50 80 合计 80 120 200 (1)是否有99%的把握认为短视频播放量与内容类型有关联? (2)定义似然比R(B|A)=P(B|A)/P(Ā|B),当R(B|A)≥1.35时,认为事件A条件下B发生有优势.现从200个样本中任选1个,A表示“选到高播放视频”,B表示“选到娱乐类视频”,估计R(B|A)的值,并判断是否有优势; (3)从知识类样本中按播放量分层抽样选出8个视频,再从这8个视频中抽取2个分析内容质量,求抽取的2个视频中高播放视频的个数X的概率分布和数学期望. 附:,. 0.050 0.010 0.001 k 3.841 6.635 10.828 【答案】(1)没有99%的把握认为短视频播放量与内容类型有关联; (2),有优势; (3)答案见解析. 【分析】(1)由题中数据计算出进行判断; (2)根据表中数据计算进行判断; (3)按分层抽样从高播放抽取5个视频,从低播放抽取3个视频,服从超几何分布,得到分布列计算期望. 【详解】(1)假设短视频播放量与内容类型无关联,由题中数据可得 , 所以假设成立,即有99%的把握认为短视频播放量与内容类型有关联. (2)由题,,所以有优势. (3)从知识类样本中抽取个视频,则抽样比为, 所以从高播放抽取个视频,从低播放抽取个视频, 可取, ,,, 所以的分布列为 X 0 1 2 P 3.(23-24高二下·辽宁·期末)随着全国新能源汽车推广力度的加大,新能源汽车消费迎来了前所未有的新机遇. (1)为了更好了解大众对新能源汽车的接受程度,某城市汽车行业协会依据年龄采用分层随机抽样的方式,从40岁以下和40岁及以上两个年龄层中各抽取100名市民进行调查,并对他们选择新能源汽车,还是选择传统汽车进行意向调查,得到了以下统计数据: 选择新能源汽车 选择传统汽车 总计 40岁以下 70 40岁及以上 60 100 总计 200 完成列联表,并判断是否有的把握认为选择新能源汽车与年龄有关; (2)为了了解某一地区新能源汽车的销售情况,某机构根据统计数据,用最小二乘法得到该地区新能源汽车销售量y(单位:万台)关于年份x的线性回归方程,且销售量y的方差为,年份x的方差为.求y与x间的样本相关系数r,并据此判断该地区新能源汽车销售量y与年份x的线性相关性强弱. 附:(i)在线性回归方程中,,; (ii)样本相关系数,若,则可判断y与x线性相关性较强; (iii),其中. 【答案】(1)表格见解析,有的把握认为选择新能源汽车与年龄有关, (2)y与x线性相关性较强 【分析】(1)根据题中数据补全列联表即可:再由表中数据以及公式进行计算求解即可; (2)根据样本相关系数公式计算可得答案. 【详解】(1)补全列联表如下: 选择新能源汽车 选择传统汽车 总计 40岁以下 70 30 100 40岁及以上 40 60 100 总计 110 90 200 零假设为:选择新能源汽车与年龄无关, 则, 故有的把握认为选择新能源汽车与年龄有关; (2)因为,, 所以,又,,, 所以, 故y与x线性相关性较强. 4.(25-26高三上·湖南·月考)某人工智能研发公司为了开拓新产品市场,从最新研发的经典A型和卓越型两款机器人中(卓越型是A型的优化版),随机各抽取30台进行越野驾驶性能对比测试,测试在同等环境中进行,评定结果分为优秀和良好两种.得到了如下数据:经典A型优秀为7台,卓越型优秀为20台. (1)完成下面2×2列联表,并根据小概率值α=0.001的独立性检验,分析两款机器人的测试结果是否与越野驾驶性能优化有关. 款类 测试结果 总计 优秀 良好 型 20 30 A型 7 30 总计 (2)该公司为了进一步测试卓越型机器人的汉语智能性能,组织机器人队与人类队(母语为汉语)进行诗词抢答赛,每局比赛只有胜和负两种情况(无平局),每局人类战胜机器人的概率为胜者记2分,负者记1分.每个挑战者只能挑战一局,每局胜负不受其他因素的影响. (i)求三局比赛中,人类队累计得分X的分布列和数学期望; (ii)若采用“比赛赛满局,胜方至少获得局胜利”的赛制,人类队取胜的概率为;若采用“比赛赛满局,胜方至少获得局胜利”的赛制,人类队取胜的概率为,比较与的大小,并说明其统计意义. 参考公式: 0.1 0.05 0.01 0.001 2.706 3.841 6.635 10.828 【答案】(1)列联表见解析,认为测试结果与越野驾驶性能有关联 (2)(i)分布列见解析,4;(ii)答案见解析 【分析】(1)依题意列出2×2列联表,计算进行判断; (2)(i)X的所有可能取值为3,4,5,6,分别求其对应概率得到分布列;(ii)设“赛满局人类队获胜”为事件C,有事件:第一阶段赛满局人类队胜,事件:第一阶段赛满局人类队负,由求解. 【详解】(1)依题意,列出2×2列联表如下: 款类 测试结果 总计 优秀 良好 型 20 10 30 A型 7 23 30 总计 27 33 60 零假设为:测试结果与越野驾驶性能优化无关.根据表中数据可得: , 根据小概率值的独立性检验,我们推断不成立, 即认为测试结果与越野驾驶性能有关联,此推断犯错误的概率不大于0.001. (2)(i)X的所有可能取值为3,4,5,6, ,, ,. ∴X的分布列为 3 4 5 6 ∴数学期望. (ii)设“赛满局人类队获胜”为事件C,要使事件C发生,有两种情况:第一阶段赛满局人类队胜,记为事件,和第一阶段赛满局人类队负,记为事件, ∴,, ①若第一阶段人类队胜,则人类队在前局至少胜局,分为人类队至少胜局和人类队恰好胜局, (a)若人类队至少胜局,无论后面两局结果如何,最终人类队获胜; (b)若人类队恰好胜局,且后面两局中人类队均负的概率为, ∴(其中). ②若第一阶段赛满局人类队负,即前局人类胜局数,要使总赛满局后人类获胜,需满足:前局胜局,且后局全胜, 前局胜局的概率为,后局全胜的概率为, 因此 所以 代入,化简得, 所以 统计意义:对于单局胜率小于的挑战者,增加比赛总场次会降低其最终获胜的概率. 5.(25-26高三上·河北张家口·期末)某省为了解高中生对足球赛事的了解情况,特地举办了一次足球常识问卷调查,问卷的满分为100分,统计结果显示,学生成绩,不低于60分为及格,高于80分为优秀,且优秀率为20%.根据某高中学校参加问卷的90名学生的调查结果,得到如下列联表: 性别 关注足球赛事 不关注足球赛事 合计 男 55 5 60 女 20 10 30 合计 75 15 90 (1)根据小概率值的独立性检验,分析该校学生对足球赛事的关注是否与性别有关; (2)在这90名学生中随机抽取一名,记事件表示抽到“学生关注足球赛事”,事件表示抽到“学生是女生”,求及的值; (3)从全省参与调查的学生中随机选出5人,这5人中及格的人数记作,求的期望与方差. 附:,其中. 常用的小概率值和相应的临界值: 0.05 0.01 0.001 3.841 6.635 10.828 【答案】(1)该校学生对足球赛事的关注与性别有关. (2). (3). 【分析】(1)根据卡方计算公式,结合独立检验的思想即可下结论; (2)根据和事件的运算与条件概率的计算公式求解即可; (3)根据正态分布求得,结合二项分布的均值与方差公式计算即可求解. 【详解】(1)零假设为:学生对足球赛事的关注与性别无关. 根据列联表中的数据,得到, 根据小概率值的独立性检验,我们推断不成立, 即认为该校学生对足球赛事的关注与性别有关. (2)由题意得,,,, 故. (3)因为, 所以, 所以, 故, 即. 1.(25-26高三上·湖北黄冈·期末)有媒体称DeepSeek开启了我国AI新纪元.某高校拟与某网络平台合作组织学生参加与AI知识有关的网络答题活动,为了解男女学生参与答题意愿的差异,男生、女生各取100人.设事件“学生愿意报名参加答题活动”,“学生为男生”,据统计. (1)根据已知条件,完成下列列联表,并依据小概率值的独立性检验,能否推断该校学生报名参加答题活动与性别有关? 性别 男生 女生 合计 不愿报名参加答题活动 愿意报名参加答题活动 合计 200 (2)网络答题规则:假设甲每道题回答是否正确相互独立,且每次答对的概率均为. (i)若答题活动设置且道题,甲仅答对其中10道题的概率最大,求的值. (ii)若答题活动设置4道题,且答题规则如下:每次答一题,一旦答对,则结束答题;答错则继续答题,直到4道题答完.已知甲同学报名参加答题活动,用表示在本次答题的题目数量,求的分布列和期望. 参考公式与数据:,其中. 0.10 0.05 0.01 0.005 0.001 2.706 3.841 6.635 7.879 10.828 【答案】(1)列联表见解析,认为学生报名参加答题活动与性别有关联 (2)(i);(ii)的分布列见解析, 【分析】(1)根据题设,结合条件概率的定义求出数据,进而完成列联表,再计算出的值判断即可; (2)(i)设随机变量Y为甲答对题目的个数,则,根据二项分布的概率性质建立不等式组即可求解;(ii)写出的所有可能取值,结合独立事件的概率特征求出对应的概率,从而可写出的分布列及期望. 【详解】(1)因为,所以愿意报名参加答题活动人数为, 又因为,所以愿意报名参加答题活动的男生人数为,愿意报名参加答题活动的女生人数为,则可得到列联表为: 性别 男生 女生 合计 不愿报名参加答题活动 20 60 80 愿意报名参加答题活动 80 40 120 合计 100 100 200 零假设为:学生报名参加答题活动与性别无关, 则, 依据小概率值的独立性检验,我们推断不成立, 即认为学生报名参加答题活动与性别有关联,此推断犯错误的概率不大于0.001; (2)(i)设随机变量Y为甲答对题目的个数,则. 则, 假设最有可能答对题目的数量是10次,则 即: 解得,又,则; (ii)的所有可能取值为:1,2,3,4, ,,, , 所以的分布列为: X 1 2 3 4 P 故. 2.(2025·四川内江·一模)某兴趣小组调查了某校100名学生100米短跑成绩的情况,其中有60 名学生的短跑成绩合格.这100名学生中有45名学生每周自主锻炼时间超过5小时,60名短跑成绩合格的学生中有35名学生每周自主锻炼时间超过5小时.现对短跑成绩不合格的学生进行跑步技巧培训,已知每周自主锻炼时间超过5小时的学生参加跑步技巧培训后,学生的短跑成绩合格的概率为,每周自主锻炼时间不超过5小时的学生参加跑步技巧培训后,学生的短跑成绩合格的概率为.用频率估计概率,从短跑成绩不合格的学生中随机抽取1名学生(记为甲)进行跑步技巧培训.依据小概率值的独立性检验,零假设为:学生短跑成绩合格与每周自主锻炼时间相互独立. (1)先填写列联表,再依据小概率值的独立性检验,判断是否能认为学生短跑成绩合格与每周自主锻炼时间超过5小时有关; 每周自主锻炼时间超过5小时 每周自主锻炼时间不超过5小时 合计 短跑成绩合格 短跑成绩不合格 合计 100 (2)求学生甲在培训后短跑成绩合格的情况下,每周自主锻炼时间不超过5小时的概率; (3)为提高学生锻炼的积极性,学校偶尔会在田径运动场举办锻炼有奖活动,记表示事件“田径运动场举办锻炼有奖的抽奖活动”,表示事件“小明去田径运动场锻炼”,.已知小明在田径运动场举办锻炼有奖的抽奖活动的情况下去运动场锻炼的概率,比不举办抽奖活动的情况下去运动场锻炼的概率大.证明:. 参考公式与数据:,其中,. 0.01 0.005 0.001 6.635 7.879 10.828 【答案】(1)列联表详见解析,,根据小概率值的独立性检验,可以认为学生短跑成绩合格与每周自主锻炼时间超过5小时有关. (2). (3)证明详见解析. 【分析】(1)根据题意先完成列联表,根据表格中的数据计算即可进行独立性检验. (2)综合条件概率公式、全概率公式、贝叶斯公式求解. (3)根据条件概率公式与对立事件的概率公式化简求证. 【详解】(1)根据题意完善列联表如下: 每周自主锻炼时间超过5小时 每周自主锻炼时间不超过5小时 合计 短跑成绩合格 35 25 60 短跑成绩不合格 10 30 40 合计 45 55 100 根据列联表中的数据,计算得到 , 根据小概率值的独立性检验,我们推断不成立,即认为学生短跑成绩合格与每周自主锻炼时间超过5小时有关. (2)由(1)中的列联表知,短跑成绩不合格的学生有40人,其中每周自主锻炼时间超过5小时的有10人,每周自主锻炼时间不超过5小时的有30人. 记事件“甲在培训后短跑成绩合格”,事件“甲每周自主锻炼时间超过5小时”,则事件 “甲每周自主锻炼时间不超过5小时”, 用频率估计概率知 ,, 由题意知,, 由全概率公式知 . 由贝叶斯公式知 ,即学生甲在培训后短跑成绩合格的情况下,每周自主锻炼时间不超过5小时的概率为. (3)由题意知, 所以, 因为,所以, 所以, 整理得, 所以, 即, 因为,所以, 所以,即. 3.(25-26高三上·云南昆明·期中)某高校拟与某网络平台合作组织学生参加与知识有关的网络答题活动,为了解男女学生参与答题意愿的差异,在全体学生中抽取人调查,得到如下列联表: 活动             性别 男生 女生 合计 未报名参加答题活动 40 70 110 报名参加答题活动 60 30 90 合计 100 100 200 (1)根据小概率值的独立性检验,能否推断该校学生报名参加答题活动与性别有关联? (2)网络答题规则:答题活动不限时间,不限轮次,答多少轮由选手自行确定:每轮均设置道试题,选手参与该轮答题,一旦答对一题,则其本轮答题结束,答错则继续答题,直到第道试题答完,本轮答题结束已知甲同学报名参加答题活动,假设甲每道试题回答是否正确相互独立,且每次答对的概率均为. (i)当时,求甲同学在一轮答题过程中答题数量的数学期望; (ii)假设甲同学每轮答题答对前两题中的一道,本轮答题得分,否则得分记甲答题累计得分为的概率为,求数列的通项公式. 附:,其中. 【答案】(1)该校学生报名参加答题活动与性别有关联; (2)(i);(ii). 【分析】(1)根据题设给出的列联表,计算的值并与临界值比较即可, (2)(i)首先列出的概率表达式,然后用数学期望公式将它的数学期望表达式列出来,即可求解; (ii)根据题意可得,,时,,再利用构造法求出. 【详解】(1)零假设为:学生报名参加答题活动与性别无关, 则, 依据小概率值的独立性检验,我们推断不成立, 即认为学生报名参加答题活动与性别有关联,此推断犯错误的概率不大于0.001. (2)(i)设甲完成一轮答题,答题数量为随机变量,则的所有可能取值为, 其中,, 因此. (ii)每轮比赛甲得1分的概率为,得2分的概率为, 依题意,,,当时,则, 显然,且, 则数列是首项为,公比为的等比数列,, 又,则数列是常数列,即, 因此,解得, 所以数列的通项公式是. 4.(25-26高三上·贵州贵阳·月考)贵州“村超”以及江苏“苏超”的成功充分说明了足球是一项大众喜爱的运动. (1)为了解喜爱足球运动是否与性别有关,现随机抽取了男性和女性各100名观众进行调查,得到列联表如下: 喜爱足球运动 不喜爱足球运动 合计 男性 60 40 100 女性 20 80 100 合计 80 120 200 依据小概率值的独立性检验,能否认为喜爱足球运动与性别有关? (2)某足球队中的甲、乙、丙、丁四名球员将进行传球训练,第1次由甲将球传出,每次传球时、传球者都等可能地将球传给另外三个人中的任何一人,如此不停地传下去,且假定每次传球都能被接到.记开始传球的人为第1次触球者,第n次触球者是甲的概率记为,即. ①求,; ②证明:数列为等比数列,并判断第19次与第20次触球者是甲的概率的大小. 0.100 0.050 0.025 0.010 0.001 2.706 3.841 5.024 6.635 10.828 附:,. 【答案】(1)能认为喜爱足球运动与性别有关 (2)①,  ②证明见解析;第19次触球者是甲的概率大于第20次触球者是甲的概率. 【分析】(1)计算,依据小概率值的独立性检验作出判断; (2)①根据古典概型公式计算即可;②根据等比数列的定义证明数列为等比数列,并求得数列的通项公式,进而求得,比较与的大小即可. 【详解】(1)零假设: :喜爱足球运动与性别独立,即喜爱足球运动与性别无关. , 根据小概率值的独立性检验,我们推断不成立,即认为喜爱足球运动与性别有关,此推断犯错误的概率不超过0.001. (2) ①由题意得:第二次触球者为乙,丙,丁中的一个,所以第二次触球者是甲的概率记为; 第二次触球者必不是甲,第三次传给包括甲的三人中的一人,故传给甲的概率为,故. ②因为第n次触球者是甲的概率记为, 所以当时,第次触球者是甲的概率为,则第次触球者不是甲的概率为. 所以,所以, 因为,所以数列为首项是,公比是的等比数列。 所以,所以. 所以,, 所以,即第19次触球者是甲的概率大于第20次触球者是甲的概率. 5.【多选题】(25-26高三上·湖南长沙·月考)下列结论错误的是(    ) A.在回归模型中,决定系数越大,则回归拟合的效果越好 B.已知随机变量,随机变量,则 C.在对两个分类变量进行独立性检验时,如果列联表中所有数据都缩小为原来的十分之一,在相同的检验标准下,再去判断两变量的关联性时,结论不会发生改变() D.由两个分类变量的成对样本数据计算得到,依据的独立性检验(),可判断独立 【答案】BCD 【分析】本题可根据回归模型、正态分布、独立性检验的相关知识,对每个选项逐一进行分析. 【详解】对于A选项,在回归模型中,决定系数越接近1,说明回归模型对数据的拟合效果越好,越大(越接近1),则回归拟合的效果越好,该选项正确; 对于B选项,,, 所以,故B错误; 对于C选项,若列联表中所有数据都缩小为原来的,则的值变为原来的,所以结论可能会发生改变,故C错误; 对于D选项,由可得出“零假设与独立”不成立,所以有的把握说有关,故D错误. 故选:BCD 1 / 10 学科网(北京)股份有限公司 $

资源预览图

9.2 独立性检验(题型专练,5基础&2提升题型+培优)高二数学苏教版选择性必修第二册
1
9.2 独立性检验(题型专练,5基础&2提升题型+培优)高二数学苏教版选择性必修第二册
2
9.2 独立性检验(题型专练,5基础&2提升题型+培优)高二数学苏教版选择性必修第二册
3
所属专辑
相关资源
由于学科网是一个信息分享及获取的平台,不确保部分用户上传资料的 来源及知识产权归属。如您发现相关资料侵犯您的合法权益,请联系学科网,我们核实后将及时进行处理。