8.第八章 成对数据的统计分析-高二数学必刷100题(人教A版2019)

2024-10-23
| 79页
| 128人阅读
| 9人下载
镇江明理教育培训中心有限公司
进店逛逛

资源信息

学段 高中
学科 数学
教材版本 高中数学人教A版选择性必修第三册
年级 高二
章节 小结
类型 题集-综合训练
知识点 统计
使用场景 同步教学-单元练习
学年 2025-2026
地区(省份) 全国
地区(市) -
地区(区县) -
文件格式 DOCX
文件大小 2.77 MB
发布时间 2024-10-23
更新时间 2024-10-28
作者 镇江明理教育培训中心有限公司
品牌系列 -
审核时间 2024-10-23
下载链接 https://m.zxxk.com/soft/48146672.html
价格 3.00储值(1储值=1元)
来源 学科网

内容正文:

8.高二第八章成对数据的统计分析必刷100题(人教版) 1.(19-20高二下·重庆沙坪坝·期末)某学校食堂对高三学生偏爱蔬菜还是肉类与性别的关系进行了一次调查,根据独立性检验原理,处理所得数据之后发现,有的把握但没有的把握认为偏爱蔬菜还是肉类与性别有关,则的观测值可能为(    ) 0.10 0.05 0.025 0.010 0.005 0.001 2.706 3.841 5.024 6.635 7.879 10.828 A. B. C. D. 2.(11-12高二·黑龙江绥化·单元测试)下面是一个2×2列联表: y1 y2 总计 x1 a 21 73 x2 8 25 33 总计 b 46 则表中a、b处的值分别为 A.94、96 B.52、50 C.52、60 D.54、52 3.(23-24高二上·全国·课后作业)手机给人们的生活带来便捷,但同时也对中学生的生活和学习造成了一定的影响.某校几个学生成立研究性学习小组,就使用手机对学习成绩的影响随机抽取了该校100名学生的期末考试成绩并制成如下的表,则下列说法正确的是(  ) 手机使 用情况 成绩 成绩优秀 成绩不优秀 总计 不用手机 40 10 50 使用手机 5 45 50 总计 45 55 100 (参考公式:,其中) A.在犯错误的概率不超过0.01的前提下认为使用手机与学习成绩无关 B.在犯错误的概率不超过0.1的前提下认为使用手机与学习成绩无关 C.有99%的把握认为使用手机对学习成绩有影响 D.无99%的把握认为使用手机对学习成绩有影响 4.(13-14高一·全国·课后作业)某工厂为了确定工效,进行了5次试验,收集数据如下: 加工零件个数(个) 10 20 30 40 50 加工时间(分钟) 64 69 75 82 90 经检验,这组样本数据的两个变量与具有线性相关关系,那么对于加工零件的个数与加工时间这两个变量,下列判断正确的是(     ) A.负相关,其回归直线经过点 B.正相关,其回归直线经过点 C.负相关,其回归直线经过点 D.正相关,其回归直线经过点 5.(18-19高二上·湖南益阳·期末)根据如表样本数据: x 3 5 7 9 y 6 3 2 得到回归方程,(回归方程的斜率,截距,满足:),则下列结论: ①变量x与y是线性正相关关系,②变量x与y是线性负相关关系,③,④,其中正确的是(    ) A.①③ B.②③ C.①④ D.②④ 6.(19-20高一下·河南·期末)某车间加工零件的数量x与加工时间y的统计数据如表: 零件数x(个) 9 11 14 15 16 加工时间y(分30钟) 30 32 36 40 42 该车间的负责人作出散点图,发现x,y是线性相关的,并求出y关于x的线性回归方程(其中b是常数),据此回归模型可以预测,加工20个零件所需要的加工时间约为(    ) A.45分钟 B.46分钟 C.47分钟 D.48分钟 7.(21-22高二·全国·课后作业)根据一组样本数据,,…,,求得经验回归方程为,且.现发现这组样本数据中有两个样本点(1.2,2.2)和(4.8,7.8)误差较大,去除后重新求得的经验回归直线l的斜率为1.2,则(    ) A.变量x与y具有正相关关系 B.去除两个误差较大的样本点后,重新求得的经验回归方程为 C.去除两个误差较大的样本点后,y的估计值增加速度变快 D.去除两个误差较大的样本点后,相应于样本点(2,3.75)的残差为0.05 8.(22-23高二下·浙江金华·期末)兰溪杨梅从5月15日起开始陆续上市,据调查统计,得到杨梅销售价格(单位:Q元/千克)与上市时间t(单位:天)的数据如下表所示: 时间t/(单位:天) 10 20 70 销售价格Q(单位:元/千克) 100 50 100 根据上表数据,从下列函数模型中选取一个描述杨梅销售价格Q与上市时间t的变化关系:.利用你选取的函数模型,在以下四个日期中,杨梅销售价格最低的日期为(    ) A.6月5日 B.6月15日 C.6月25日 D.7月5日 9.(2021·广西贵港·模拟预测)设两个相关变量和分别满足,,,2,…,6,若相关变量和可拟合为非线性回归方程,则当时,的估计值为(    ) A.32 B.63 C.64 D.128 10.(24-25高三上·全国·阶段练习)研究数据表明,某校高中生的数学成绩与物理成绩、物理成绩与化学成绩均有正相关关系.现从该校抽取某班50位同学的数学、物理、化学三科成绩作为样本,设数学、物理、化学成绩分别为变量x,y,z若x,y的样本相关系数为,y,z的样本相关系数为,则x、z的样本相关系数的最大值为(    ) 附:相关系数 A. B. C. D.1 11.(16-17高二下·河北衡水·期末)若关于的线性回归方程是由表中提供的数据求出,那么表中的值为 3 4 5 6 3 4 A. B. C. D. 12.(20-21高一下·陕西宝鸡·阶段练习)设有一个回归方程,变量x增加一个单位时(    ) A.y大约增加3个单位 B.y大约减少5个单位 C.y大约增加5个单位 D.y大约减少3个单位 13.(17-18高二下·河南郑州·期中)下列说法错误的是(  ) A.线性回归直线至少经过其样本数据点中的一个点 B.在统计学中,独立性检验是检验两个分类变量是否有关系的一种统计方法 C.在回归分析中,相关指数越大,模拟的效果越好 D.在残差图中,残差分布的带状区域的宽度越狭窄,其模拟的效果越好 14.(17-18高二下·黑龙江哈尔滨·期中)某产品的广告费用x与销售额y的统计数据如表 广告费用万元 4 2 3 5 销售额万元 49 26 39 54 根据上表可得回归方程中的为,据此模型预报广告费用为10万元时销售额为   A.万元 B.万元 C.万元 D.万元 15.(2024·黑龙江·二模)根据分类变量x与y的成对样本数据,计算得,依据的独立性检验,结论为(    )参考值: 0.1 0.05 0.01 2.706 3.841 6.635 A.x与y不独立 B.x与y不独立,这个结论犯错误的概率不超过0.05 C. x与y独立 D.x与y独立,这个结论犯错误的概率不超过0.05 16.(22-23高二下·河南郑州·期末)下列四个命题中,正确命题的个数为(    ) ①甲乙两组数据分别为:甲:28,31,39,42,45,55,57,58,66;;乙:,29,34,35,48,42,46,55,53,55,67.则甲乙的中位数分别为45和44. ②相关系数,表明两个变量的相关性较弱. ③若由一个列联表中的数据计算得的观测值,那么有99%的把握认为两个变量有关. ④用最小二乘法求出一组数据,的回归直线方程后要进行残差分析,相应于数据,的残差是指.      0.10 0.05 0.025 0.010 0.005 0.001      2.706 3.841 5.024 6.635 7.879 10.828 A.1 B.2 C.3 D.4 17.(23-24高二下·浙江湖州·期末)商家为了解某品牌电风扇的月销售量(台)与月平均气温之间的关系,随机统计了某4个月该品牌电风扇的月销售量与当月平均气温,其数据如下表; 平均气温 27 29 31 33 月销售量(台) 24 33 40 55 由表中数据算出线性回归方程中的,据此估计平均气温为的那个月,该品牌电风扇的销售量约为(    )台. A.63 B.61 C.59 D.57 18.(16-17高二下·河南商丘·阶段练习)设有一个回归方程为,变量增加一个单位时,则(   ) A.平均增加1.5个单位 B.平均增加0.5个单位 C.平均减少1.5个单位 D.平均减少0.5个单位 19.(22-23高二下·河南南阳·阶段练习)相关变量的样本数据如下表, x 1 2 3 4 5 6 7 y 2.9 3.3 3.6 4.4 4.8 a 5.9 经回归分析可得y与x线性相关,并由最小二乘法求得回归直线方程为,下列说法正确的是(    ) A.x增加1时,y一定增加2.3 B.变量x与y负相关 C.当y为6.3时,x一定是8 D.a=5.2 20.(21-22高二下·广西玉林·期中)通过随机询问50名性别不同的大学生是否爱好某项运动,得到如下的列联表, 爱好 不爱好 合计 男生 20 5 25 女生 10 15 25 合计 30 20 50 0.010 0.005 0.001 6.635 7.879 10.828 经计算得,参照附表,得到的正确结论是(    ) A.有99.5%以上的把握认为“爱好该项运动与性别有关” B.有99.5%以上的把握认为“爱好该项运动与性别无关” C.在犯错误的概率不超过0.1%的前提下,认为“爱好该项运动与性别有关” D.在犯错误的概率不超过0.1%的前提下,认为“爱好该项运动与性别无关” 21.(2020·四川凉山·二模)随着社会经济高速发展,人民的生活水平越来越高,部分学校安装了中央空调,某校数学建模队调查了某品牌中央空调,得到该设备使用年限x(单位:年)和维修总费用y(单位:万元)的统计表如下:(每年年底维修保养) 使用年限x(单位:年) 2 3 4 5 6 维修总费用y(单位:万元) 1 3 4 由上表可得线性回归方程,则根据此模型预报该品牌中央空调第8年年底的维修费用约为(    ) A.万元 B.万元 C.万元 D.万元 22.(20-21高二下·安徽蚌埠·阶段练习)给出下列实际问题,其中不可以用独立性检验解决的是(  ) A.喜欢参加体育锻炼与性别是否有关 B.喝酒者得胃病的概率 C.喜欢喝酒与性别是否有关 D.青少年犯罪与上网成瘾是否有关 23.(18-19高二下·河南洛阳·期中)已知的几组数据如下表: 1 2 3 4 5 6 0 2 1 3 3 6 根据上表由最小二乘法可得回归直线的方程:,则点(      ) A.在直线下方 B.在直线上方 C.在直线上 D.可能在上也可能不在 24.(21-22高二上·江西抚州·期末)某市2015年至2019年新能源汽车年销量(单位:百台)与年份代号的数据如下表:若根据表中的数据用最小二乘法求得关于的回归直线方程为,则表中的值为(    ) 年份 2015 2016 2017 2018 2019 年份代号 0 1 2 3 4 年销量 10 15 20 35 A.25.5 B.28.5 C.30 D.32.5 25.(23-24高二下·河北张家口·阶段练习)某学生在研究性学习中,收集到某品牌汽车今年前5个月的销售量(单位:万辆)的数据如下表所示,若x,y线性相关,线性回归方程为,则以下判断正确的是(    ) x(月份) 1 2 3 4 5 y(万辆) 5 6 7 8 10 A.x增加1个单位长度,则y一定增加1.2个单位长度 B.x减少1个单位长度,则y必减少1.2个单位长度 C.当时,y的预测值为10.8万辆 D.线性回归直线经过点 26.(20-21高二上·湖北·期末)已知x与y之间的一组数据如下表: x 3 4 5 6 y 30 40 60 50 若y与x线性相关,根据上表求得y与x的线性回归方程,中的为8,据此模型预报时y的值为(    ) A.70 B.63 C.65 D.66 27.(21-22高三·云南昆明·阶段练习)尽管目前人类还无法准确预报地震,但科学家通过研究,已经知道地震时释放出的能量E(单位:焦耳)与地震里氏震级M之间的关系为.2011年3月11日,日本东北部海域发生里氏9.0级地震,它所释放出来的能量大约是2022年1月2日在云南丽江市宁蒗县发生5.5级地震所释放能量的倍数为(    ) A. B. C. D. 28.(23-24高二下·江苏南京·阶段练习)为了研究关于的线性相关关系,收集了组样本数据(见下表): 若已求得一元线性回归方程为,则下列选项中正确的是(      ) (其中相关系数) A. B.当时,的预测值为 C.样本数据的第40百分位数为 D.去掉样本点后,与的样本相关系数不会改变 29.(22-23高二下·四川泸州·期中)已知与之间的一组数据:若关于的线性回归方程为,则的值为(    ) 1 2 3 4 3.2 4.8 7.5 A.1 B.0.85 C.0.7 D.0.5 30.(23-24高二下·江西吉安·阶段练习)下列说法中正确的是(    ) A.公式中的和不具有线性相关关系 B.已知变量的对数据为,则回归直线可以不经过点,其中 C.若相关系数的绝对值越接近1,则两个变量的线性相关性越强 D.对于变量与的统计量来说,越大,判断“与有关系”的把握越大 31.(20-21高二下·广东茂名·期中)下列说法正确的是(    ) A.设有一个经验回归方程=3-5x,变量x增加一个单位时,y平均增加5个单位 B.若两个具有线性相关关系的变量的相关性越强,则样本相关系数r的值越接近于1 C.在残差图中,残差点分布的水平带状区域越窄,说明模型的拟合精度越高 D.在一元线性回归模型中,决定系数R2越接近于1,说明回归的效果越好 32.(2024·浙江·三模)下列说法正确的是(    ) A.数据7,5,3,10,2的第40百分位数是3 B.已知随机变量服从正态分布越小,表示随机变量分布越集中 C.已知一组数据的方差为3,则的方差为3 D.根据一组样本数据的散点图判断出两个变量线性相关,由最小二乘法求得其回归直线方程为,若其中一个散点为,则 33.(20-21高二下·山东滨州·期末)研究变量、得到一组样本数据,进行回归分析,以下说法正确的是(    ) A.经验回归直线至少经过点、、、中的一个 B.用决定系数来比较两个模型拟合效果,越大,表示残差平方和越小,即模型的拟合效果越好 C.在经验回归方程中,当解释变量每增加个单位时,响应变量平均增加个单位 D.若变量和之间的相关系数为,则变量和之间的负相关很强 34.(2023·云南大理·模拟预测)已知变量,之间的经验回归方程为,且变量,的数据如图所示,则下列说法正确的是(    ) 2 3 5 9 11 12 10 7 3 A.该回归直线必过 B.变量,之间呈正相关关系 C.当时,变量的值一定等于 D.相应于的残差估计值为 35.(20-21高二上·河北保定·期末)某工厂节能降耗技术改造后,在生产某产品过程中记录的产量x(吨)与相应的生产能耗y(吨)的几组对应数据如下表,现发现表中有个数据看不清,已知回归直线方程为,下列说法正确的是(    ) x 2 3 4 5 6 y 19 25 ★ 40 44 A.看不清的数据★的值为32 B.回归直线恰好经过样本点 C.回归系数6.3的含义是产量每增加1吨,相应的生产能耗实际增加6.3吨 D.据此模型预测产量为8吨时,相应的生产能耗为50.9吨 36.(22-23高二下·重庆渝中·期中)下列说法正确的序号是(    ) A.在回归直线方程中,当解释变量x每增加一个单位时,响应变量平均平均增加0.8个单位; B.利用最小二乘法求回归直线方程,就是使得最小的原理; C.已知X,Y是两个分类变量,若它们的随机变量的观测值越大,则“X与Y有关系”的把握程度越小; D.在一组样本数据…,(…,不全相等)的散点图中,若所有样本(…)都在直线上,则这组样本数据的线性相关系数为. 37.(2024·浙江金华·三模)某班主任用下表分析高三前5次考试中本班级在年级中的成绩排名y与考试次数x的相关性时,忘记了第二次和第四次考试排名,但他记得平均排名,于是分别用和得到了两个经验回归方程:,,对应的样本相关系数分别为,,排名y对应的方差分别为,,则(    ) x 1 2 3 4 5 y 10 m 6 n 2 附:,,. A. B. C. D. 38.(22-23高三·重庆渝中·阶段练习)小明在家独自用下表分析高三前5次月考中数学的班级排名y与考试次数x的相关性时,忘记了第二次和第四次月考排名,但小明记得平均排名,于是分别用m=6和m=8得到了两条回归直线方程:,,对应的相关系数分别为、,排名y对应的方差分别为、,则下列结论正确的是(   ) x 1 2 3 4 5 y 10 m 6 n 2 (附:,) A. B. C. D. 39.(23-24高二下·山东菏泽·期末)假设变量与变量的对观测数据为,两个变量满足一元线性回归模型要利用成对样本数据求参数的最小二乘估计,即求使取最小值时的的值,若某汽车品牌从2020~2024年的年销量为(万辆),其中年份对应的代码为,如表, 年份代码 1 2 3 4 5 销量(万辆) 4 9 14 18 25 根据散点图和相关系数判断,它们之间具有较强的线性相关关系,可以用线性回归模型描述 令变量,且变量与变量满足一元线性回归模型则下列结论正确的有(    ) A. B. C. D.2025年的年销售量约为34.4万辆 40.(21-22高二下·江苏南通·期末)对于样本相关系数,下列说法不正确的是(    ) A.越大,成对样本数据的线性相关程度越强 B.,成对样本数据没有任何相关关系 C.刻画了样本点集中于某条直线的程度 D.成对样本数据相关的正负性与的符号正负相同 41.(23-24高二上·广西北海·期末)下列各组的两个变量中呈正相关关系的是(    ) A.学生的身高与学生的化学成绩 B.汽车行驶的里程与它的耗油量 C.人的年龄与年收入 D.水果的重量与它的总价 42.(20-21高二·全国·课后作业)(多选)2020年2月,全国“停课不停学”期间,各地教师通过网络直播、微课推送等方式来指导学生线上学习.为了调查学生对网络课程是否喜爱,研究人员随机调查了相同人数的男、女学生,发现男生中有80%喜欢网络课程,女生中有40%不喜欢网络课程,且有95%的把握认为喜欢网络课程与性别有关,但没有99%的把握认为喜欢网络课程与性别有关,则被调查的男、女学生的总人数可能为(    ) A.120 B.130 C.240 D.250 43.(22-23高二下·河北邯郸·期中)由一组样本数据,,,,利用最小二乘法得到两个变量的回归直线方程为,则下面说法正确的是(    ) A.直线至少经过点,,,中的一个点 B.直线必经过点 C.相关系数r与回归系数同号 D.相关系数r越大,两个变量之间的线性相关性越强 44.(2023·全国·模拟预测)人口问题始终是战略性、全局性的问题.年末我国人口比上年末减少万人,为年来的首次人口负增长,其中生育率持续降低受到了人们的广泛关注.为促进人口长期均衡发展,国家制定了一系列优化生育政策:年正式全面开放二胎;年实施三孩生育政策,并配套生育支持措施.为了了解中国人均(单位:万元)和总和生育率以及女性平均受教育年限(单位:年)的关系,采用近十年来的数据绘制了散点图,并得到经验回归方程,,对应的决定系数分别为,,则(    ) A.人均和女性平均受教育年限正相关 B.女性平均受教育年限和总和生育率负相关 C. D.未来三年总和生育率将继续降低 45.(23-24高二上·江苏常州·期末)已知由样本数据组成的一个样本,根据最小二乘法求得线性回归方程为且,去除两个异常数据和后,得到新的线性回归直线的斜率为3,则下列结论中正确的是(    ) A.相关变量,具有正相关关系 B.去除异常数据后,新的平均数 C.去除异常数据后的线性回归方程为 D.去除异常数据后,随值增加,的值增加速度变大 46.(23-24高三上·江苏常州·阶段练习)下列命题正确的是(    ) A.若样本数据的方差为2,则数据的方差为7 B.若,则. C.在一组样本数据,(,,不全相等)的散点图中,若所有样本点都在直线上,则这组样本数据的线性相关系数为 D.以模型去拟合一组数据时,为了求出经验回归方程,设,求得线性回归方程为,则的值分别是和4 47.(23-24高二下·广东广州·期末)变量的一组样本数据如下表所示: 6 8 10 12 6 3 2 通过散点图发现样本点分布在一条直线附近,并通过最小二乘法求得经验回归方程为,则(    ) A.变量之间呈负相关关系 B.变量之间的相关系数 C. D.样本点的残差为 48.(2024·广东深圳·模拟预测)下列说法中,正确的是(    ) A.若随机变量,且,则 B.一组数据6,7,7,9,13,14,16,17,21的第70百分位数为15 C.在一元线性回归模型分析中,决定系数用来刻画模型的拟合效果,若值越小,则模型的拟合效果越好 D.设随机事件,,已知事件发生的概率为,在事件发生的条件下事件发生的概率为,在事件不发生的条件下事件发生的概率为,则事件发生的概率为 49.(24-25高二下·全国·课堂例题)下列两个变量存在相关关系的为(    ) A.扇形的半径与面积之间的关系 B.降雪量与交通事故的发生率之间的关系 C.人的身高与体重之间的关系 D.家庭的支出与收入之间的关系 50.(2023·浙江·模拟预测)下列说法正确的是(    ) A.样本数据的上四分位数为9.5 B.若随机变量服从两点分布,若,则 C.若随机变量服从正态分布,且是偶函数,则 D.若两个具有线性相关关系的变量的相关性越强,则样本相关系数的值越接近于1 51.(2023·江苏徐州·模拟预测)某研究小组采集了组数据,作出如图所示的散点图.若去掉后,下列说法正确的是(    )    A.相关系数变小 B.决定系数变大 C.残差平方和变大 D.解释变量与预报变量的相关性变强 52.(20-21高二·全国·单元测试)下列说法中正确的有(    ) A.在对分类变量和进行独立性检验时,随机变量的值越大,则“与有关”可信程度越小 B.在回归方程中,当解释变量每增加一个单位时,预报变量增加0.1个单位 C.两个变量的线性相关性越强,相关系数的绝对值越接近于1 D.在回归分析模型中,若相关指数越大,则残差平方和越小,模型的拟合效果越好 53.(20-21高二上·河北·阶段练习)下列有关线性回归的说法,正确的有(    ) A.相关关系的两个变量不一定是因果关系 B.散点图能直观地反映数据的相关程度 C.回归直线最能代表线性相关的两个变量之间的关系 D.任一组数据都有线性回归方程 54.(22-23高二下·广西钦州·期中)下列说法正确的是(    ) A.在回归直线方程中,与具有负线性相关关系 B.两个随机变量的线性相关性成强,则相关系数的绝对值就越小 C.已知随机变量服从二项分布,若,则 D.随机变量服从正态分布,若,则 55.(23-24高二下·福建南平·期中)以下有关直线拟合效果的说法正确的是   A.相关系数越小,表明两个变量相关性越弱 B.越接近1,表明直线拟合效果越好 C.通过最小二乘法得到的线性回归直线经过样本点的中心 D.最小二乘法求回归直线方程,是求使最小的,的值 56.(22-23高二下·河北邢台·阶段练习)5G技术的运营不仅提高了网络传输速度,更拓宽了网络资源的服务范围.日前,我国加速了5G技术的融合与创新,前景美好,某手机商城统计了5个月的5G手机销量,如下表所示: 月份 2020年6月 2020年7月 2020年8月 2020年9月 2020年10月 月份编号x 1 2 3 4 5 销量y(部) 52 95 a 185 227 若与线性相关,由上表数据求得线性回归方程为 ,则下列说法正确的是(    ) A. B.5G手机的销量逐月增加,平均每个月增加约30台 C.与正相关 D.预计12月份该手机商城的5G手机销量约为318部 57.(21-22高二下·辽宁·期末)已知具有相关关系的两个变量,的一组观测数据,,…,,由此得到的线性方程为,则下列说法中正确的是(    ) A.回归直线至少经过点,,…,中的一个点 B.若,,则回归直线定经过点 C.若点,,…,都在直线上,则变量,的相关系数 D.若变量增加一个单位时,则变量平均增加或减少个单位 58.(22-23高三上·江苏扬州·阶段练习)下面命题中,正确的有(     ) A.回归直线方程对应的回归直线必经过样本中心点 B.设两个变量x,y之间的线性相关系数为r,则 r越接近1,,的相关性越强 C.一列数据:7,6,5,4,3,2,这列数据的上四分位数为6 D.在残差的散点图中,残差分布的水平带状区域的宽度越窄,其模型的拟合效果越好 59.(18-19高二下·河南·阶段练习)有两个分类变量和,其中一组观测值为如下的2×2列联表: 总计 15 50 总计 20 45 65 其中,均为大于5的整数,则 时,在犯错误的概率不超过的前提下为“和之间有关系”.附: 60.(22-23高二下·江苏·课后作业)某部门所属的10个工业企业的固定资产价值x与工业增加值y资料如下表(单位:百万元): 固定资产价值x 3 3 5 6 6 7 8 9 9 10 工业增加值y 15 17 25 28 30 36 37 42 40 45 根据上表资料计算的相关系数约为 . 61.(2024·江西南昌·模拟预测)某公司为了了解某商品的月销售量(单位:万件)与月销售单价(单位:元/件)之间的关系,随机统计了个月的销售量与销售单价,并制作了如下对照表: 月销售单价(元/件) 10 15 20 25 30 月销售量(万件) 11 10 8 6 5 由表中数据可得回归方程中,则 . 62.(22-23高二下·河南驻马店·期中)已知某品牌的新能源汽车的使用年限(单位:年)与维护费用单位:千元)之间有如表数据: 使用年限年 维护费用千元 与之间具有线性相关关系,且关于的线性回归方程为(为常数).据此估计,使用年限为年时,维护费用约为 千元. 63.(23-24高二下·河北秦皇岛·阶段练习)由4对样本数据,,,得到的y关于x的经验回归方程为,则 . 64.(21-22高二·全国·单元测试)某商会从2017年开始向浦东养老院捐赠物资和现金,下表记录了第x年(2017年为第一年)捐赠现金y(万元)的数据情况,由表中数据得到y关于x的线性回归方程为,预测2022年该商会捐赠现金 万元. x 2 3 4 5 y 3.5 4 4 4.5 65.(21-22高二下·福建福州·期末)根据散点图中的四个观测点,利用最小二乘法计算得关于的线性回归方程为,据此 . 66.(21-22高二下·河南郑州·期末)用最小二乘法得到一组数据(其中、2、3、4、5)的线性回归方程为,若、,则当时,y的预报值为 . 67.(19-20高一下·江苏无锡·期中)已知变量线性相关,由观测数据算得样本的平均数,线性回归方程中的系数满足,则线性回归方程为 . 68.(21-22高二下·陕西延安·阶段练习)已知与之间的一组数据: 0 1 3 4 1 3 5 7 则与的线性回归方程为必过点 . 69.(21-22高二·全国·课后作业)给出下列说法,其中说法正确的序号是 . ①可以刻画线性回归模型的拟合效果,越大,说明线性回归模型的拟合效果越好; ②在线性回归模型中,表示解释变量对于响应变量变化的贡献率,越接近于1,表示解释变量和响应变量的线性相关程度越强; ③比较两个模型的拟合效果,可以比较残差平方和的大小,残差平方和越小的模型的拟合效果越好; ④若残差图中个别点的残差比较大,则应确认在采集样本点的过程中是否有人为的错误或模型是否恰当. 70.(2023·四川绵阳·模拟预测)针对“中学生追星问题”,某校团委对“学生性别和中学生追星是否有关”作了一次调查,调查样本中女生人数是男生人数的,男生追星人数占男生人数的,女生追星的人数占女生人数的,若有95%的把握认为是否追星和性别有关,则调查样本中男生至少有 人. 参考数据及公式如下: 0.050 0.010 0.001 3.841 6.635 10.828 71.(18-19高二下·广东·期末)在吸烟与患肺病是否相关的判断中,有下面的说法: (1)从独立性分析可知在犯错误的概率不超过0.05的前提下,认为吸烟与患肺病有关系时,是指有的可能性使得推断错误. (2)从独立性分析可知在犯错误的概率不超过0.01的前提下,认为吸烟与患肺病有关系时,若某人吸烟,则他有的可能患有肺病; (3)若,则在犯错误的概率不超过0.01的前提下,认为吸烟与患肺病有关系,那么在100个吸烟的人中必有99人患有肺病; 其中说法正确的是 . 72.(22-23高二下·陕西西安·阶段练习)下列命题中,正确的命题有 (将所有正确的序号写在横线上). ①回归直线恒过样本点的中心; ②将一组数据的每个数据都加一个相同的常数后,方差不变; ③用相关指数来刻画回归效果,越接近0,说明模型的拟合效果越好; ④用等距系统抽样法从160名学生中抽取容量为20的样本,将160名学生从1~160编号,按编号顺序平均分成20组(1~8号,9~16号,…,153~160号),若第16组抽出的号码为126,则第一组中用抽签法确定的号码为6号. 73.(20-21高二上·河北邢台·阶段练习)邢台市物价部门对市区的天一城、北国商城、恒大城、家乐园、中北世纪城5家商场的某件商品在7月15号一天销售量及其价格进行调查,5家商场的售价元和销售量件之间的一组数据如下表所示: 价格 8.5 9 11 11.5 销售量 12 6 7 5 已知销售量与价格之间有较强的线性相关关系,其线性回归方程是,且,则其中的 . 74.(2024·上海金山·二模)为了考察某种药物预防疾病的效果,进行动物试验,得到如下图所示列联表: 药物 疾病 合计 未患病 患病 服用 50 未服用 50 合计 80 20 100 取显著性水平,若本次考察结果支持“药物对疾病预防有显著效果”,则()的最小值为 . (参考公式:;参考值:) 75.(2023·广西·模拟预测)某单位为了调查性别与对工作的满意程度是否具有相关性,随机抽取了若干名员工,所得数据统计如下表所示,其中,且,若有的把握可以认为性别与对工作的满意程度具有相关性,则的所有可能取值个数是 个 对工作满意 对工作不满意 男 女 附:,其中. 0.10 0.05 0.025 0.010 0.005 0.001 2.706 3.841 5.024 6.635 7.879 10.828 76.(16-17高二下·河南洛阳·期末)某工厂为了对新研发的一种产品进行合理定价,将该产品按事先拟定的价格进行试销,得到如下数据: 单价(元) 8 9 销量(件) 90 84 83 80 75 68 由表中的数据得线性回归方程为,其中,预测当产品价格定为(元)时,销量约为 件. 77.(18-19高一下·广西桂林·期中)一商场对每天进店人数和商品销售件数进行了统计,得到如下表: 人数x 10 15 20 25 30 35 40 件数y 4 7 12 15 20 23 27 据上表预测:当进店人数为90时,商品销售件数为(结果保留整数) . 参考数据:. 78.(2023·上海静安·二模)某运动生理学家在一项健身活动中选择了10名男性参与者,以他们的皮下脂肪厚度来估计身体的脂肪含量,其中脂肪含量以占体重(单位:kg)的百分比表示.得到脂肪含量和体重的数据如下 个体编号 体重x(kg) 脂肪含量y(%) 1 89 28 2 88 27 3 66 24 4 59 23 5 93 29 6 73 25 7 82 29 8 77 25 9 100 30 10 67 23 建立男性体重与脂肪含量的回归方程为: .(结果中回归系数保留三位小数) 79.(15-16高二下·福建莆田·期中)某汽车销售公司为确定下一年度投入某种产品的宣传费,需了解年宣传费(单位:千元)对年销售量(单位:百辆)的影响,对近8年的年宣传费和年销售量数据作了初步处理,得到年销售量与年宣传费具有近似关系:以及一些统计量的值如下:372.8,4504,54.4,76.2 . 已经求得近似关系中的系数,请你根据相关回归分析方法预测当年宣传费(千元)时,年销售量 (百辆). 80.(24-25高三·上海·课堂例题)已知某次考试之后,班主任从全班同学中随机抽取一个容量为8的样本,他们的数学、物理成绩散点图对应如图: 根据以上信息,判断下列结论: ①根据散点图,可以判断数学成绩与物理成绩具有线性相关关系; ②根据散点图,可以判断数学成绩与物理成绩具有一次函数关系; ③从全班随机抽取甲、乙两名同学,若甲同学数学成绩为80分,乙同学数学成绩为60分,则甲同学的物理成绩一定比乙同学的物理成绩高. 其中正确的个数为 . 81.(18-19高二下·山东菏泽·阶段练习)面对竞争日益激烈的消费市场,众多商家不断扩大自己的销售市场,以降低生产成本.某白酒酿造企业市场部对该企业9月份的产品销量(单位:千箱)与单位成本(单位:元)的资料进行线性回归分析,结果如下:,,,,,,则销量每增加1000箱,单位成本下降 元. 82.(12-13高三·湖南·阶段练习)某工厂的某种型号的机器的使用年限和所支出的维修费用(万元)有下表的统计资料: 2 3 4 5 6 2.2 3.8 5.5 6.5 7.0 根据上表可得回归方程,据此模型估计,该型号机器使用年限为10年时维修费用约 万元(结果保留两位小数). 83.(20-21高二·全国·单元测试)如下是一个2×2列联表,则 . x y 合计 x1 a 35 45 x2 7 b n 合计 m 73 s 84.(19-20高二下·江苏盐城·期末)某公司统计了第x年(2013年是第一年)的经济效益为y(千万元),得到如表表格: x 3 4 5 6 y 2.5 3 4 4.5 若由表中数据得到的线性回归方程是,则可预测2020年经济效益大约是 千万元. 85.(23-24高二下·云南昆明·期中)盲盒里面通常装的是动漫、影视作品的周边,或者设计师单独设计出来的玩偶.由于盒子上没有标注,购买者只有打开才会知道自己买到了什么,因此这种惊喜吸引了众多年轻人,形成了“盲盒经济”.某销售网点为了调查是否购买该款盲盒与性别的关系,得到如下列联表: 女生 男生 总计 购买 40 20 60 未购买 70 70 140 总计 110 90 200 则认为是否购买该款盲盒与性别有关出错的可能性为 . 附: 0.10 0.05 0.025 0.010 0.005 0.001 2.706 3.841 5.024 6.635 7.879 10.828 ,其中. 86.(19-20高二下·广西·期中)已知x与y之间的一组数据如下表: x 0 1 2 3 y 2 4 6 8 则可求得y与x的线性回归方程必过点 . 87.(17-18高二下·河北邢台·期末)春节期间,某销售公司每天销售某种取暖商品的销售额 (单位:万元)与当天的平均气温 (单位:℃)有关.现收集了春节期间这个销售公司天的与的数据列于下表: 平均气温(℃) 销售额(万元) 由以上数据,求得与之间的线性回归方程的系数,则 88.(22-23高三上·上海黄浦·开学考试)已知由样本数据组成的一个样本,得到回归直线方程为,且,其中发现两个歧义点和偏差过大,去除这两点后,得到新的回归直线的斜率为3,则新的回归直线方程为 . 89.(2023·全国·模拟预测)如表是降耗技术改造后生产某产品过程中记录的产量(吨)与相应的生产能耗(吨标准煤)的几组对应数据,根据表中提供的数据,求出y关于x的线性回归方程,那么表中m的值为 . x 3 4 5 6 y 2.9 m 4 4.1 90.(23-24高二下·天津·期末)已知变量之间具有线性相关关系,根据下表中的数据求得经验回归方程为,则实数的值为 . 2 4 5 6 8 30 40 60 50 70 91.(20-21高二·全国·课后作业)有两个变量与,的取值为,,的取值为,,得到下表: 其中,均为大于的整数,则当 时,有的把握认为与之间有关系. 92.(15-16高二下·福建龙岩·阶段练习)如下表是对于喜欢足球与否的统计列联表依据表中的数据,得到 . 93.(23-24高三上·天津滨海新·阶段练习)新冠肺炎疫情发生以来,中医药全面参与疫情防控救治,做出了重要贡献.某中医药企业根据市场调研与模拟,得到研发投入(亿元)与产品收益(亿元)的数据统计如下表: 研发投入(亿元) 1 2 3 4 5 产品收益(亿元) 3 7 9 10 11 用最小二乘法求得关于的经验回归直线方程是,当研发投入亿元时,相应的产品收益估计值为 . 94.(17-18高二下·山东济宁·期中)博鳌亚洲论坛2018年年会于4月8日至11日在海南博鳌举行.为了搞好对外宣传工作,会务组选聘了50名记者担任对外翻译工作,在右面“性别与会俄语”的列联表中, . 95.(22-23高二下·广东广州·期末)某机构近期对某种二手车的使用年数与再销售价格(单位:万元/台)进行数据收集,得到如下统计表: 使用年数 2 4 6 8 10 再销售价格 16 13 9.5 7 5 根据上表数据该种二手车的使用年数与再销售价格之间的经验回归方程为:,现有一台该种二手车使用了9年,估计这台手车的再销售价格为 万元. 96.(21-22高二·全国·单元测试)某艺校在一天的6节课中随机安排语文、数学、外语三门文化课和其他三门艺术课各1节,则在课表上的相邻两节文化课之间最多间隔1节艺术课的排法有 种. 97.(21-22高二·全国·课后作业)某种机械设备随着使用年限的增加,它的使用功能逐渐减退,使用价值逐年减少,通常把它使用价值逐年减少的“量”换算成费用,称之为“失效费”.某种机械设备的使用年限x(单位:年)与失效费y(单位:万元)的统计数据如下表所示: 使用年限x(单位:年) 1 2 3 4 5 6 7 失效费y(单位:万元) 2.90 3.30 3.60 4.40 4.80 5.20 5.90 由上表数据可知,y与x的相关系数为 . (精确到0.01,参考公式和数据:,,,) 98.(23-24高三下·江西吉安·期中)用模型拟合一组数据组,其中.设,变换后的线性回归方程为,则 . 99.(19-20高三上·黑龙江哈尔滨·期末)有如下四个命题: ①甲乙两组数据分别为甲:28,31,39,42,45,55,57,58,66;乙:29,34,35,48,42,46,55,53,55,67.则甲乙的中位数分别为45和44. ②相关系数,表明两个变量的相关性较弱. ③若由一个22列联表中的数据计算得的观测值,那么有95%的把握认为两个变量有关. ④用最小二乘法求出一组数据的回归直线方程后要进行残差分析,相应于数据的残差是指.         以上命题“错误”的序号是 100.(21-22高一·湖南·课后作业)下表是中国近年来人口数据(不包括香港、澳门特别行政区和台湾省): 年份 2013 2014 2015 2016 人口数 13.61亿 13.68亿 13.75亿 13.83亿 (1)在平面直角坐标系内标出这四个点,再把这些点连接成线; (2)选择其中合适的两个点,建立一次函数模拟,用模拟函数预测2017年中国人口数; (3)能否用“更好”的直线来模拟这组数据的变化?也就是说,能否确定,的值,使式子的值最小?(按如下步骤进行预测) ①化简S,使之成为字母的二次三项式; ②当取何值时(设为),二次三项式S取最小值(设为),这里和都应该是含字母的式子,且是字母的二次三项式; ③求的值,使取最小值; ④求出对应于上述的值; ⑤用一次函数模拟数据的变化,用模拟函数预测2017年中国人口数. (4)把所得到的两个预测数据和2017年中国实际人口数进行比较. 试卷第24页,共29页 试卷第1页,共30页 学科网(北京)股份有限公司 参考答案: 题号 1 2 3 4 5 6 7 8 9 10 答案 C C C D B D A C C B 题号 11 12 13 14 15 16 17 18 19 20 答案 C B A B C B A D D A 题号 21 22 23 24 25 26 27 28 29 30 答案 C B C C C C A D D ACD 题号 31 32 33 34 35 36 37 38 39 40 答案 CD BC BD AD AB AB AD BD AC AB 题号 41 42 43 44 45 46 47 48 49 50 答案 BD AB BC AB AD BD ACD AD BCD AC 题号 51 52 53 54 55 56 57 58 答案 BD CD ABC AD BCD ACD BCD ACD 1.C 【难度】0.94 【知识点】独立性检验的概念及辨析 【分析】根据把握率确定的观测值区间范围,即可作出选择. 【详解】因为有的把握但没有的把握,所以的观测值区间范围为 因此的观测值可能为 故选:C 【点睛】本题考查独立性检验原理,考查数据处理与应用能力,属基础题. 2.C 【难度】0.94 【知识点】完善列联表 【分析】根据汇总数据计算即可. 【详解】, 故选:C. 3.C 【难度】0.85 【知识点】独立性检验解决实际问题、卡方的计算 【分析】根据给定的数表,求出的观测值,再与临界值表比对判断作答. 【详解】由列联表中的数据,计算, 所以在犯错误的概率不超过0.01的前提下认为使用手机与学习成绩有关,AB错误; 有99%的把握认为使用手机对学习成绩有影响,C正确,D错误. 故选:C 4.D 【难度】0.85 【知识点】判断正、负相关、计算样本的中心点 【详解】由表中数据可得随的增大而增大,故与成正相关关系. 又, ∴样本中心为. 又回归直线过样本中心, ∴其回归直线经过点. 故选:D. 5.B 【难度】0.65 【知识点】判断正、负相关、根据样本中心点求参数 【分析】由表达式判断应为负相关,由样本中心经过回归方程反推出值即可 【详解】由题可知,变量x与y是线性负相关关系,求得,由样本中心过线性回归方程得,由 故正确序号为:②③ 故选:B 【点睛】本题考查线性回归方程的辨析,样本中心经过线性回归方程为重要特征,属于中档题 6.D 【难度】0.65 【知识点】根据样本中心点求参数 【分析】求出样本数据的中心坐标,代入回归直线方程,求出,得到回归直线方程,然后求解加工20个零件所需要的加工时间,得到答案. 【详解】由题意,根据表中的数据,可得, ,即样本中心点为, 将样本中心点为代入回归方程,可得,解得, 所以回归方程为, 当时,(分钟). 故选:D. 【点睛】本题主要考查了线性回归方程的求法及应用,其中解答中熟记回归直线方程经过样本中心点是解答的关键,着重考查推理与运算能力. 7.A 【难度】0.65 【知识点】解释回归直线方程的意义、求回归直线方程、残差的计算 【分析】对A:根据经验回归方程为,,即可求解;对B:由线性回归方程的性质,即可求解;对C:比较原线性回归方程的斜率和新回归方程的斜率,即可求解;对D:利用残差公式,即可求解. 【详解】解:对A:经验回归方程为,, 变量与具有正相关关系,故选项A正确; 对B:当时,,所以样本中心为, 去掉两个样本点为和,,, 样本中心不变, 去除后重新求得的经验回归直线的斜率为1.2, ,解得, 故去除两个误差较大的样本点后,重新求得的回归方程为,故选项B错误; 对C:, 去除两个误差较大的样本点后,的估计值增加速度变慢,故选项C错误; 对D:, , 去除两个误差较大的样本点后,相应于样本点(2,3.75)的残差为,故选项D错误. 故选:A. 8.C 【难度】0.65 【知识点】非线性回归、根据回归方程进行数据估计 【分析】根据表中数据,描述杨梅销售价格Q与上市时间t的变化关系不可能是常数函数、也不可能是单调函数,应选取进行描述,将表中数据代入可得,利用配方法结合日期可得答案. 【详解】根据表中数据,描述杨梅销售价格Q与上市时间t的变化关系不可能是常数函数、也不可能是单调函数, 函数在时均为单调函数,这与表格中的数据不吻合, 所以应选取进行描述, 将表中数据代入可得 ,解得,所以, ,所以当时杨梅销售价格最低, 而6月5日时,6月15日时,6月25日时,7月5日时, 所以时杨梅销售价格最低. 故选:C. 9.C 【难度】0.4 【知识点】求回归直线方程 【分析】先通过换元把非线性回归方程转化为线性回归直线方程,从而可以利用公式求系数的值,然后把的值代入即可得到答案. 【详解】令,则 , ,, 所以 ,, 所以,即, 所以当时, . 故选:C. 10.B 【难度】0.4 【知识点】已知两角的正、余弦,求和、差角的余弦、向量夹角的计算、相关系数的计算 【分析】利用相关系数公式,可看成两个维向量的夹角公式,从而把相关系系数问题转化为向量夹角问题,即可得解. 【详解】设,,, 则有,,, 由相关系数公式可知:, 设与夹角为,与夹角为, 由x,y的样本相关系数为,所以,, 由这两个夹角均为锐角且,所以与夹角的可能性是, 则与夹角余弦值的最大值为,此时x与z样本相关系数最大, 即, 故选:B. 11.C 【难度】0.94 【知识点】根据回归方程求原数据中的值 【详解】由表可得样本中心点的坐标为,根据线性回归方程的性质可得,解出,故选C. 12.B 【难度】0.94 【知识点】根据回归方程进行数据估计 【分析】由回归方程确定x增加一个单位前后,的取值的变化,由此确定变量y的变化情况. 【详解】令f(x)=3-5x,则f(x+1)-f(x)=-5(x+1)-(-5x)=-5x-5+5x=-5,则变量x增加一个单位,y大约减少5个单位, 故选:B. 13.A 【难度】0.85 【知识点】解释回归直线方程的意义、相关系数的意义及辨析、残差的计算、独立性检验的概念及辨析 【分析】由题意,结合相关概念、实际意义判断所给的说法,找到错误的说法即可. 【详解】A:线性回归直线至少经过其样本数据点的样本中心点,但是不一定经过数据中的一个点,错误; B:在统计学中,独立性检验是检验两个分类变量是否有关系的一种统计方法,正确; C:在回归分析中,相关指数越大,模拟的效果越好,正确; D:在残差图中,残差分布的带状区域的宽度越狭窄,其模拟的效果越好,正确; 故选:A 14.B 【难度】0.85 【知识点】用回归直线方程对总体进行估计 【分析】先计算出回归方程,然后求出当广告费用为万元时的销售额 【详解】由题意可得 由回归方程可得,解得 故回归方程为 当广告费用为万元时,即, 故选 【点睛】本题考查了线性回归方程的求解,根据题意得到样本中心,代入后求出的值,写出线性回归方程,将数值代入即可得到结果,较为简单 15.C 【难度】0.85 【知识点】独立性检验的基本思想、独立性检验解决实际问题 【分析】利用独立性检验的基本思想即可得解. 【详解】零假设为:x与y独立, 由,依据的独立性检验,可得成立, 故可以认为x与y独立. 故选:C. 16.B 【难度】0.65 【知识点】计算几个数的中位数、相关系数的意义及辨析、残差的计算、独立性检验解决实际问题 【分析】求出两组数据的中位数判断①;利用相关系数的意义判断②;利用的观测值与要求的临界值对判断③;利用残差的意义判断④作答. 【详解】对于①,甲组数据的中位数为45,乙组数据的中位数为,①错误; 对于②,相关系数时,两个变量有很强的相关性,②错误; 对于③,的观测值约为,那么有99%的把握认为两个变量有关,③正确; 对于④,残差分析中,相应数据的残差,④正确, 所以命题正确的序号是③④. 故选:B. 17.A 【难度】0.65 【知识点】计算几个数的平均数、计算样本的中心点、根据回归方程进行数据估计、根据样本中心点求参数 【分析】根据表格中的数据,求得的值,将代入回归方程,求得的值,得出回归直线方程,代入时,即可求解. 【详解】根据表格中的数据,可得, 又由点在回归方程上,其中, 所以,解得,即, 当时,,即估计平均气温为的那个月,该品牌电风扇的销售量约为件. 故选:A. 18.D 【难度】0.65 【知识点】判断正、负相关、解释回归直线方程的意义 【分析】由线性回归方程中的意义即可得出结论. 【详解】,一次项系数为, 所以变量增加一个单位时,平均减少0.5个单位. 故选:D 19.D 【难度】0.65 【知识点】判断正、负相关、解释回归直线方程的意义、用回归直线方程对总体进行估计、根据回归方程求原数据中的值 【分析】根据回归直线方程的几何意义判断A、B错误;令求解判断C,计算并代入回归直线方程中,求得a的值,判断D正确. 【详解】根据回归直线方程知,x增加1时,估计y增加,故A错误; 由知,,故变量x与y正相关,故B错误; 时,,解得,估计的值应为8,故C错误; 又,, 代入回归直线方程中,则,解得,故D正确. 故选:D 20.A 【难度】0.94 【知识点】独立性检验的概念及辨析 【分析】根据给出的数据与表中数据对比判断即可. 【详解】由题意知, 对照临界值得出,有99.5%以上的把握认为“爱好该项运动与性别有关”. 故选:A. 21.C 【难度】0.94 【分析】先由表中的数列求出, ,然后将其值代入回归方程中求出,从而可得到回归方程,再将代入回归方程中可求出结果. 【详解】解:由,,得样本中心点 在线性回归直线上,得, 回归方程为. 当时,. 所以根据此模型预报该品牌中央空调第8年年底的维修费用约为万元. 故选:C 【点睛】本小题以国家经济高速发展的国情为背景考查学生生活常识、平均数、线性回归方程及其性质,用样本进行预测等基本知识,考查应用意识,数学建模,统计知识应用等素养,渗透时事,属于基础题. 22.B 【难度】0.94 【知识点】独立性检验的概念及辨析 【分析】利用独立性检验的定义,即可得出结论. 【详解】解:独立性检验是对两个分类变量是否有关进行检验,A,C,D选项中均是对两个分类变量是否有关进行检验,而B选项不是. 故选:B. 23.C 【难度】0.85 【分析】求出样本中心点,由回归直线过样本中心点,可得出答案. 【详解】由题意,,, 即样本中心点为, 因为回归直线过样本中心点,所以点在直线上. 故选:C. 【点睛】本题考查回归直线,注意回归直线过样本中心点,属于基础题. 24.C 【难度】0.85 【知识点】根据样本中心点求参数、计算样本的中心点 【分析】根据数表求出样本的中心点,再代入回归直线方程计算作答. 【详解】依题意,,, 于是回归直线经过点,则,解得, 所以的值为30. 故选:C 25.C 【难度】0.85 【知识点】根据样本中心点求参数、根据回归方程进行数据估计、解释回归直线方程的意义 【分析】首先求得平均数,代入求得回归直线方程,再对选项再对选项逐一判断,即可得出结果. 【详解】,, 代入线性回归方程中得,所以, 故线性回归方程为, 对于A:回归直线方程是点分布在直线附近或在直线上,x增加1个单位长度, 则y可能增加1.2个单位长度,A错误; 对于B:回归直线方程是点分布在直线附近或在直线上,x减少1个单位长度, 则y可能减少1.2个单位长度,B错误; 对于C:当时,,故C正确; 对于D:线性回归直线必经过点,故D错误. 故选:C 26.C 【难度】0.85 【知识点】求回归直线方程、根据回归方程进行数据估计 【解析】根据表中数据,求得,代入公式,即可求得,进而可得线性回归方程,令代入方程,即可求得答案. 【详解】由表中数据可知:, 所以,所以, 令,, 故选:C 27.A 【难度】0.85 【知识点】对数函数模型的应用(2) 【分析】根据已知直接求出相应能量,然后可得. 【详解】设日本地震释放的能量为,云南地震释放的能量为,则,,所以. 故选:A 28.D 【难度】0.65 【知识点】相关系数的计算、根据回归方程进行数据估计、根据样本中心点求参数、总体百分位数的估计 【分析】A项,求出,将样本中心点代入回归直线方程可求;B项,利用回归直线方程代值运算预测即可;C项,按百分位数求法步骤求解;D项,新样本平均值没有变化,由相关系数公式可知. 【详解】A项,, 所以样本点的中心坐标为, 将它代入得,,解得,故A错误; B项,当时,的预测值为,故B错误; C项,由为整数,则样本数据的第40百分位数为,故C错误; D项,去掉样本点后,新样本数据的平均值没有变化,即仍然成立, 不妨设为第组数据,即,则,其余数据没有变化. 则由相关系数公式可知, 即新样本数据与的相关系数与原数据相关系数相等, 即与的样本相关系数不会改变,故D正确. 故选:D. 29.D 【难度】0.65 【知识点】根据回归方程求原数据中的值、计算样本的中心点 【分析】求出样本数据中心点坐标,代入回归直线方程求解. 【详解】, , 因为关于的线性回归方程为, 所以, 解得, 故选:D 30.ACD 【难度】0.94 【知识点】相关关系与函数关系的概念及辨析、解释回归直线方程的意义、相关系数的意义及辨析、独立性检验的概念及辨析 【分析】A选项,根据线性相关的定义进行判断;B选项,回归直线一定经过样本中心点;C选项,由相关系数的性质进行判断;D选项,根据的定义判断D正确. 【详解】A选,公式中的和为二次函数关系,故不具有线性相关关系,A正确; B选项,回归直线一定经过样本中心点,即,B错误; C选项,若相关系数的绝对值越接近1,则两个变量的线性相关性越强,C正确; D选项,对于变量与的统计量来说,越大,判断“与有关系”的把握越大,D正确. 故选:ACD 31.CD 【难度】0.94 【知识点】相关指数的计算及分析、残差的计算、相关系数的意义及辨析、线性回归 【分析】根据线性回归方程的含义即可判断A,由相关系数以及决定系数的定义即可判断BD,由残差的含义即可判断C. 【详解】A选项,因为=3-5x,所以变量x增加一个单位时,y平均减少5个单位,故A错误;B选项,线性相关性具有正负,相关性越强,则样本相关系数r的绝对值越接近于1,故B错误; C选项,在残差图中,残差点分布的水平带状区域越窄,说明波动越小,即模型的拟合精度越高,故C正确; D选项,在一元线性回归模型中,决定系数R2越接近于1,说明模型拟合的精度越高,即回归的效果越好,故D正确. 故选:CD 32.BC 【难度】0.85 【知识点】各数据同时加减同一数对方差的影响、解释回归直线方程的意义、正态曲线的性质、总体百分位数的估计 【分析】根据百分位数的定义即可判断A;根据正态曲线的性质即可判断B;根据方差的性质即可判断C;根据观测值与预测值的区别即可判断D. 【详解】对于A,数据按照从小到大的顺序排列为, 因为, 所以数据7,5,3,10,2的第40百分位数是,故A错误; 对于B,越小,即方差越小,随机变量分布越集中,故B正确; 对于C,已知一组数据的方差为3, 则的方差为,故C正确; 对于D,散点不一定在回归直线为上, 所以由散点无法求出的值,故D错误. 故选:BC. 33.BD 【难度】0.85 【知识点】相关指数的计算及分析、相关系数的意义及辨析、解释回归直线方程的意义 【分析】利用经验回归直线与样本点的关系可判断A选项的正误;利用决定系数的大小与模型拟合效果的关系可判断B选项的正误;利用经验回归方程中两个变量的关系可判断C选项的正误;利用相关系数与相关性的关系可判断D选项的正误. 【详解】对于A选项,回归直线经过样本中心点,不一定经过样本点,A错; 对于B选项,用决定系数来比较两个模型拟合效果,越大,表示残差平方和越小,即模型的拟合效果越好,B对; 对于C选项,在经验回归方程中,当解释变量每增加个单位时,响应变量平均减少个单位,C错; 对于D选项,若变量和之间的相关系数为,则变量和之间的负相关很强,D对. 故选:BD. 34.AD 【难度】0.65 【知识点】计算样本的中心点、残差的计算、用回归直线方程对总体进行估计、判断正、负相关 【分析】根据回归直线一定经过样本中心点,及残差概念等来逐项判断. 【详解】对于A,由表格数据得,,,所以该回归直线必过,故A正确; 对于B,因为回归直线方程为,,当变量增加,变量相应值减少两个变量之间呈负相关关系,故B错误; 对于C,当时,,变量的值可能为,故C错误; 对于D,由残差定义知,观测值减去预测值为残差,当时,得预测值,则相应于的残差估计值为,故D正确. 故选:AD. 35.AB 【难度】0.65 【知识点】根据回归方程进行数据估计、计算样本的中心点、根据回归方程求原数据中的值、解释回归直线方程的意义 【分析】对A,根据回归直线方程过样本点中心,代入,即可计算出★的值;对B,根据回归直线方程过样本点中心,即可判断;对C,根据的含义进行分析;对D,将代入回归直线方程进行计算即可. 【详解】解:对A,因为, 将代入, , ★,故A正确; 对B,, 必经过,故B正确; 对C,回归系数6.3的含义是产量每增加1吨,相应的生产能耗大约增加6.3吨,故C错误; 对D,当时,,故D错误. 故选:AB. 36.AB 【难度】0.65 【知识点】最小二乘法的概念及辨析、解释回归直线方程的意义、相关关系与函数关系的概念及辨析 【分析】根据回归方程的定义和性质知AB正确,随机变量的观测值越小,则“ 与 有关系”的把握程度越小,C错误,样本相关系与回归直线斜率无关,D错误,得到答案. 【详解】对于选项A:在回归直线方程中,当解释变量每增加一个单位时,响应变量平均增加0.8个单位,正确; 对于选项B:用随机误差的平方和,即,并使之达到最小,这样回归直线就是所有直线中取最小值的那一条, 由于平方又叫二乘,所以这种使 “随机误差的平方和为最小”的方法叫做最小二乘法, 所以利用最小二乘法求回归直线方程,就是使得 最小的原理,正确; 对于选项C:对分类变量与,对它们的随机变量的观测值越小,则“ 与 有关系”的把握程度越小,错误; 对于选项D:样本相关系数反映的是两变量之间线性相关程度的强弱,与回归直线斜率无关,题中样本数据的线性相关系数为,错误. 故选:. 37.AD 【难度】0.65 【知识点】相关系数的计算、求回归直线方程、计算几个数据的极差、方差、标准差 【分析】当时,根据相关数据结合,可求得,进而利用可求,利用相关系数公式可求得,利用方差公式可求得,同理计算时,,,,,进而可得结论. 【详解】当时,,,解得, 则 , ,得, , ; 同理,当时,,,,, 所以,,,. 故选:AD. 38.BD 【难度】0.4 【知识点】计算几个数的平均数、计算几个数据的极差、方差、标准差、求回归直线方程、相关系数的计算 【分析】根据表格中的数据和最小二乘法、相关系数的计算公式分别计算当、时的、相关系数(r)和方差(),进而比较大小即可. 【详解】当时,,解得, 则, ,, , , 所以, 得, , ; 同理,当时,,, 所以, 故选:BD. 39.AC 【难度】0.4 【知识点】根据回归方程进行数据估计、非线性回归、求回归直线方程 【分析】利用线性回归方程待定系数公式,再由变量的线性代换关系进行计算,最后恒过样本点,就可得到线性回归方程. 【详解】由可得:, 同理由,可得, 根据公式,故A正确;B错误; 由表格中数据可得:, , , 所以, 由于,所以与的回归方程必过原点,, 又由于,代入得: ,整理得:,故C正确; 当,即表示2025年,此时, 所以2025年的年销售量约为万辆,故D错误; 故选:AC. 40.AB 【难度】0.94 【知识点】相关系数的意义及辨析 【分析】相关系数是一个绝对值小于等于1的量,并且它的绝对值越大就说明相关程度越大,根据相关系数的概念即可求解. 【详解】解:相关系数是用来衡量两个变量之间的线性相关程度的,相关系数是一个绝对值小于等于1的量,并且它的绝对值越大就说明相关程度越大,所以A错误, 相关系数为0说明两变量不存在直线相关关系,但这并不意味着两个变量之间不存在其他类型的关系,所以B不正确, C、D的阐述均正确. 故选:AB. 41.BD 【难度】0.94 【知识点】判断两个变量是否有相关关系 【分析】根据相关关系的概念,逐项判定,即可求解. 【详解】由题意知,选项A,为非确定性关系, 选项B为相关关系,且为正相关关系. 选项C,为非确定性关系, 选项D,为相关关系,且为正相关关系. 故选:BD 42.AB 【难度】0.85 【知识点】完善列联表、卡方的计算 【分析】根据题意设男、女生的人数各为,建立列联表,计算,列不等式组求出的取值范围,即可确定满足条件的选项. 【详解】解:依题意,设男、女学生的人数均为(),则被调查的男、女学生的总人数为.建立下表: 喜欢网络课程的情况 性别 喜欢 不喜欢 总计 男 女 总计 则.由题意可知,即.故A,B符合题意. 故选:AB 43.BC 【难度】0.85 【知识点】相关系数的意义及辨析、解释回归直线方程的意义 【分析】根据回归直线、相关系数、回归系数的概念逐项分析可得答案. 【详解】对于A,直线有可能不经过点,,,中的任何一个点,故A不正确; 对于B,显然正确; 对于C,当两个变量正相关时,相关系数r与回归系数同为正号,当两个变量负相关时,相关系数r与回归系数同为负号,故C正确; 对于D,相关系数r的绝对值越大,两个变量之间的线性相关性越强,故D不正确. 故选:BC 44.AB 【难度】0.85 【知识点】用回归直线方程对总体进行估计、判断正、负相关 【分析】根据回归方程判断选项A,写出女性平均受教育年限和总和生育率的关系式,从而判断选项B,根据散点图的拟合效果判断选项C,由回归方程可预测未来趋势,但实际值不一定会继续降低,从而判断选项D. 【详解】由回归方程可知, 人均和女性平均受教育年限正相关,A正确; 因为,, 可得女性平均受教育年限和总和生育率的关系式为, 所以女性平均受教育年限和总和生育率负相关,B正确. 由散点图可知,回归方程相对拟合效果更好, 所以,C错误; 根据回归方程预测,未来总和生育率预测值有可能降低, 但实际值不一定会降低,D错误. 故选:AB 45.AD 【难度】0.65 【知识点】相关系数的意义及辨析、计算样本的中心点 【分析】A选项,根据正相关的定义得到A正确;B选项,根据新的得到B错误;C选项,先求出,进而得,结合新的经验回归直线的斜率得到新的经验回归方程判断;D选项,去除异常数据后,斜率由增大到3,故值增加的速度变大,故D对; 【详解】A选项,因为回归方程的斜率为正,所以相关变量,具有正相关关系,所以A正确; B选项,因为,所以去除两个异常数据和后, 得到新的,故B错; 且,得, 因为得到的新的经验回归直线的斜率为3,所以, 去除异常数据后的线性回归方程为,故C错; 因为经验回归直线的斜率为正数,所以变量x,y具有正相关关系,且去除异常数据后,斜率由2增大到3,故值增加的速度变大,故D对; 故选:AD 46.BD 【难度】0.65 【知识点】相关系数的意义及辨析、非线性回归、各数据同时乘除同一数对方差的影响、各数据同时加减同一数对方差的影响 【分析】利用方差的概念,条件概率公式,线性回归分析等知识分别对每个选项逐一判断即可. 【详解】对于选项A:若样本数据的方差为2,则数据的方差为,故A不正确; 对于选项B:若,则 ,故B正确; 对于选项C:在一组样本数据,(,,不全相等)的散点图中,若所有样本点都在直线上,其中是线性回归方程的一次项系数,不是相关系数,相关系数是刻画一组数据线性相关程度一个量,范围是[−1,1],当相关系数为正时呈正相关关系,为负时呈负相关关系,故C不正确; 对于选项D:以模型去拟合一组数据时,为了求出经验回归方程,设, 则,由题线性回归方程为,则,故的值分别是和4,故D正确. 故选:BD. 47.ACD 【难度】0.65 【知识点】解释回归直线方程的意义、相关系数的计算、相关指数的计算及分析、根据样本中心点求参数 【分析】根据线性回归方程的性质可判断A,根据相关系数的公式可判断B,根据线性回归方程必过点可判断C,根据残差的定义可判断D. 【详解】对于A.根据线性回归方程为,可知回归系数,故判断,之间呈现负相关关系,故正确,符合题意; 对于B.相关系数,故错误,不符合题意; 对于C.根据表中数据,计算,, 代入回归方程,得,解得,正确,符合题意; 对于D.由可知, 所以样本点的残差为,故正确,符合题意. 故选:ACD. 48.AD 【难度】0.65 【知识点】线性回归、指定区间的概率、总体百分位数的估计、利用全概率公式求概率 【分析】利用正态分布中概率的计算得到A选项;由百分位数的计算得到B选项;根据回归分析中决定系数的利用判断C选项;由乘法公式和全概率公式得到D选项. 【详解】A选项,因为,且,所以,故A正确; B选项,数据共有9个数,,所以第70百分位数是第7个数16,故B错误; C选项,在一元线性回归分析中可以用决定系数来刻画回归的效果,若的值越小,则模型的拟合效果越差,故C错误; D选项,, 所以, 又因为,则, 所以,故D正确. 故选:AD. 49.BCD 【难度】0.94 【知识点】判断两个变量是否有相关关系 【分析】根据相关关系的定义即可求解. 【详解】扇形的半径与面积之间的关系是函数关系,其余均为相关关系. 故选:BCD 50.AC 【难度】0.94 【知识点】总体百分位数的估计、正态曲线的性质、两点分布的方差、相关系数的意义及辨析 【分析】求出上四分位数判断A;求出两点分布的方差判断B;利用正态分布的对称性求出u判断C;利用相关系数与相关性强弱的关系判断D作答. 【详解】对于A,样本数据,由,得上四分位数为,A正确; 对于B,,B错误; 对于C,由是偶函数,得, 又,因此,C正确; 对于D,两个具有线性相关关系的变量的相关性越强,则样本相关系数的绝对值越接近于1,D错误. 故选:AC 51.BD 【难度】0.94 【知识点】相关指数的计算及分析、残差的计算、相关系数的意义及辨析、根据散点图判断是否线性相关 【分析】 根据散点图判断出去掉点后,与的线性相关性相关性以及残差平方和、决定系数的关系逐项判断即可得出合适的结论. 【详解】根据散点图可知,去掉点后,与的线性相关性加强,且为正相关, 相关系数变大,则A错D对, 去掉点后,残差平方和变小,则变大,B对C错. 故选:BD. 52.CD 【难度】0.85 【知识点】解释回归直线方程的意义、相关系数的意义及辨析、相关指数的计算及分析、独立性检验的基本思想 【分析】A.根据的值越大,分类变量的有关联的可信度就越大判断;B.根据回归方程中回归系数的含义判断;C.根据相关系数的绝对值越接近1,两个变量的相关性就越强判断;D.根据相关指数越大,则残差平方和越小判断. 【详解】由题意得,根据的值越大,分类变量有关联的可信度就越大,故A错误; 根据经验回归方程中回归系数的含义,可知在回归方程中,当解释变量每增加一个单位时,预报变量平均增加0.1个单位,故B错误; 根据相关系数的计算公式可知,相关系数的绝对值越接近1,两个变量的相关性就越强,故C正确; 根据回归分析的基本思想可知相关指数越大,则残差平方和越小,模型的拟合效果越好,故D正确. 故选:CD. 53.ABC 【难度】0.85 【知识点】相关关系与函数关系的概念及辨析、根据散点图判断是否线性相关、解释回归直线方程的意义 【解析】根据相关关系的两个变量的关系以及散点图的作用和线性回归分析的相关概念可判断得出答案. 【详解】根据两个变量具有相关关系的概念,可知A正确, 散点图能直观地描述呈相关关系的两个变量的相关程度,且回归直线最能代表它们之间的相关关系,所以B、C正确. 只有线性相关的数据才有回归直线方程,所以D不正确. 故选:ABC 54.AD 【难度】0.85 【知识点】判断正、负相关、相关系数的意义及辨析、二项分布的均值、指定区间的概率 【分析】A选项,根据作出判断;B选项,由相关系数的定义作出判断;C选项,根据题意列出方程组,求出;D选项,根据正态分布对称性进行求解. 【详解】A选项,因为,故与具有负线性相关关系,A正确; B选项,两个随机变量的线性相关性成强,则相关系数的绝对值就越大,越接近于1,B错误; C选项,,解得,C错误; D选项,服从正态分布,故, 则,即, 则,D正确. 故选:AD 55.BCD 【难度】0.85 【知识点】解释回归直线方程的意义、相关系数的意义及辨析 【分析】根据线性回归直线的定义,相关指数,相关系数的定义判断. 【详解】对于A:相关系数的绝对值越小,表明两个变量相关性越弱,越接近于1,相关性越强,故A错误; 对于B:越接近1,表明回归的效果越好,越接近于0,效果越差,故B正确. 对于C:线性回归直线一定经过样本的中心,故C正确; 对于D:最小二乘法求回归直线方程,就是求使最小的的值,故D正确; 故选:BCD. 56.ACD 【难度】0.85 【知识点】解释回归直线方程的意义、用回归直线方程对总体进行估计、计算样本的中心点、根据样本中心点求参数 【分析】计算样本中心点代入线性回归方程可得A项,由可一一判定B、C、D三项. 【详解】由表格得代入可得,故A正确; 由线性回归方程可知:5G手机的销量逐月增加,平均每个月增加约44台左右,故B错误; 因为,故与正相关,即C正确; 将代入线性回归方程可得,故D正确. 故选:ACD 57.BCD 【难度】0.65 【知识点】解释回归直线方程的意义 【分析】对AB,由样本中心点定义,以及回归直线一定经过样本中心点可判断; 对C,根据相关系数的含义即可判断; 对D,根据回归系数的含义即可判断 【详解】对AB,回归直线一定经过样本中心点, 而样本中心点并不一定是,,…,中的一个点,故A错、B对; 对C,直线斜率为1,且所有样本点都在直线上,故样本数据完全正相关,相关系数达到最大值1,故C对; 对D, 根据回归系数的含义,变量增加一个单位时,则变量平均增加或减少个单位,故D对, 故选:BCD 58.ACD 【难度】0.65 【知识点】总体百分位数的估计、相关系数的意义及辨析、解释回归直线方程的意义 【分析】回归直线必经过样本中心点,A正确;,的相关性越强,则 r越接近1或,错误;根据百分位数定义计算得到C正确;宽度越窄,拟合精度越高,D正确,得到答案. 【详解】对选项A:回归直线方程对应的回归直线必经过样本中心点,正确; 对选项B:,的相关性越强,则 r越接近1或,错误; 对选项C:7,6,5,4,3,2,,取第2个数据为,正确; 对选项D:残差分布的水平带状区域的宽度越窄,拟合精度越高,拟合效果越好,正确; 故选:ACD 59.9 【难度】0.4 【知识点】独立性检验的概念及辨析、卡方的计算、独立性检验解决实际问题 【分析】由题意,计算,列出不等式求出的取值范围,再根据题意求得的值. 【详解】解:由题意知:, 则, 解得:或, 因为:且,, 综上得:,, 所以:. 故答案为:9. 【点睛】本题考查独立性检验的应用问题. 60. 【难度】0.4 【知识点】相关系数的计算 【分析】根据表格中的数据,结合相关系数的公式,准确计算,即可求解. 【详解】根据表格中的数据,可得, , 则. 故答案为:. 61. 【难度】0.94 【知识点】根据样本中心点求参数 【分析】因为样本中心点满足回归方程,所以求出代入回归方程可求出实数的值. 【详解】因为,, 又回归方程为,所以,解得. 故答案为: 62./ 【难度】0.94 【知识点】根据回归方程求原数据中的值、计算样本的中心点、根据回归方程进行数据估计 【分析】 先根据条件写出,代入关于的线性回归方程为,求出,确定关于的线性回归方程,令即可得到结果. 【详解】由已知得: , 因为关于的线性回归方程为, 所以, 解得, 所以关于的线性回归方程为, 则当时,千元. 故答案为:. 63. 【难度】0.94 【知识点】根据样本中心点求参数 【分析】由线性回归方程必过样本中心点,代入即可求出答案. 【详解】由题意得,,则,解得. 故答案为: 64.4.75 【难度】0.94 【知识点】根据样本中心点求参数、根据回归方程进行数据估计、计算样本的中心点 【分析】由题可得样本中心,进而可得回归方程,进而即得. 【详解】由题可得, , 所以,即, ∴,当时,, 即预测2022年该商会捐赠现金4.75万元. 故答案为:4.75. 65./. 【难度】0.85 【知识点】根据样本中心点求参数 【分析】根据四个观测点求得其样本中心,代入回归直线的方程,即可求解. 【详解】由题意,散点图中的四个观测点, 可得,, 即样本中心为, 将其代入回归方程,可得,解得. 故答案为: 66.23 【难度】0.85 【知识点】根据回归方程进行数据估计、根据样本中心点求参数 【分析】由已知可得,根据样本中心求参数,进而应用回归直线估计的预报值. 【详解】由题设,,而样本中心在回归直线上, 所以,得,故, 则,有. 故答案为:23 67. 【难度】0.85 【知识点】根据样本中心点求参数 【分析】根据回归直线过样本点的中心,可列出方程组,即可解得的值,从而写出回归直线方程. 【详解】由题知,点在回归直线上,则, 又, 所以,即回归直线方程为:. 故答案为:. 【点睛】本题考查了回归直线过样本点中心这一特征,考查了方程的思想,属于基础题. 68. 【难度】0.85 【知识点】计算样本的中心点 【分析】由线性回归方程性质可知,线性回归方程必过样本中心点,结合已知条件求样本中心点即可. 【详解】由已知条件可知,,, 由线性回归方程必过样本中心点可知,与的线性回归方程为必过点. 故答案为:. 69.①②③④ 【难度】0.85 【知识点】相关指数的计算及分析 【分析】根据相关指数的定义和性质分别进行判断即可. 【详解】解:①相关指数可以刻画回归模型的拟合效果,越接近于1,说明模型的拟合效果越好;故①正确. ②在线性回归模型中,表示解释变量对预报变量的贡献率,越接近于1,表示解释变量和预报变量的线性相关关系越强;故②正确. ③比较两个模型的拟合效果,可以比较残差平方和的大小,残差平方和越小,则相关越接近于1,故残差平方和越小的模型的拟合效果越好;故③正确. ④若残差图中个别点的残差比较大,则应确认在采集样本点的过程中是否有人为的错误或模型是否恰当.故④正确,只有这样才能保证样本采集的正确性, 故答案为:①②③④. 70.12 【难度】0.85 【知识点】卡方的计算、独立性检验解决实际问题 【分析】设男生人数为,得到列联表,根据题意得到,列出不等式,求得的取值范围,结合,为整数,即可求解. 【详解】设男生人数为,依题 意可得列联表如下: 喜欢追星 不喜欢追星 总计 男生 女生 总计 若在犯错误的概率不超过95%的前提下认为是否喜欢追星和性别有关,则, 由,解得,因为,为整数, 所以若在犯错误的概率不超过95%的前提下认为是否喜欢追星和性别有关, 则男生至少有12人. 故答案为:. 71.(1) 【难度】0.65 【知识点】独立性检验的基本思想、独立性检验的概念及辨析 【分析】根据题意,利用独立性检验的定义与基本思想,对题目中的命题进行逐个分析、判断,即可求解出答案. 【详解】根据独立性检验的基本思想,在犯错误的概率不超过0.05的前提下,认为吸烟与患肺病有关系的意思为有的把握认为这个推理是正确的,所以(1)正确.从独立性分析可知在犯错误的概率不超过0.01的前提下,认为吸烟与患肺病有关系的意思为有的把握认为这个推理是正确的,而不是说某个人吸烟就有的可能患有肺病,所以(2)错误.同(2)中的推论,所以也不能在100个吸烟的人中必有99人患有肺病,故(3)错误.故答案为(1). 【点睛】本题主要考查了独立性检验的基本思想,是检验两个事件相关程度的量,是相关关系,是反映有关和无关的概率. 72.①②④ 【难度】0.65 【知识点】相关指数的计算及分析、解释回归直线方程的意义、各数据同时加减同一数对方差的影响、等距抽样的组距与编号 【分析】根据回归方程的性质可判断①的正误,根据方差的公式可判断②的正误,根据的性质可判断③,根据系统抽样的性质可判断④的正误. 【详解】对于①,因为,故回归直线恒过样本点的中心,①正确; 对于②,对于给定的一组数据, 其均值为,其方差为, 若该组数据同时加上常数,得新的一组数据:, 其均值为,方差为, 此时两个方差相等,故②正确. 对于③,当越接近1,说明模型的拟合效果越好,故③错误. 对于④,设第一组中用抽签法确定的号码为, 则第16组抽出的号码为,故, 故第一组中用抽签法确定的号码为,故④正确. 故答案为:①②④ 73.10 【难度】0.65 【知识点】根据回归方程求原数据中的值 【解析】先求样本平均值,,再根据样本中心点在回归直线上列方程求解即可得答案. 【详解】解:依题意,, 代入回归直线方程得①, 根据题意②, 解①②组成的方程组得. 故答案为:. 【点睛】本题考查已知回归方程求原始数据,考查运算能力,解题的关键是样本中心点在回归直线上,是基础题. 74. 【难度】0.65 【知识点】卡方的计算、独立性检验的基本思想 【分析】由题意列出不等式,结合近似计算求出m的取值范围,即可得答案. 【详解】由题意可知, 则, 解得或,而, 故m的最小值为44. 故答案为:44. 75.6 【难度】0.65 【知识点】卡方的计算、独立性检验的基本思想 【分析】由列联表及卡方公式列不等式求范围,结合题设即可确定值的可能个数. 【详解】,解得, 因为且, 所以或或或或或. 故答案为:6 76.60 【难度】0.65 【知识点】根据回归方程进行数据估计、根据样本中心点求参数 【分析】求出,由回归直线过中心点求得系数,得回归方程,由回归方程可得预测值. 【详解】 , , ,  所以回归直线方程 , 当 时, ,所以当销售单价定为元时销售约为 件, 故答案为:. 77. 【难度】0.65 【知识点】根据回归方程进行数据估计、根据样本中心点求参数 【分析】将数据中心点为,代入回归方程,解得,再计算得到答案. 【详解】数据中心点为,代入回归方程,解得. 当时, . 故答案为:. 【点睛】本题考查了利用回归方程进行预测,根据中心点计算是解题的关键. 78. 【难度】0.65 【知识点】求回归直线方程 【分析】根据表格数据,结合最小二乘估计求解相关数据,即可得回归方程. 【详解】由表格数据可得: ,,,, 设回归直线方程为,其斜率和截距的最小二乘估计公式分别为,, 所以,, 故回归方程为. 故答案为:. 79.780.6 【难度】0.65 【知识点】根据回归方程进行数据估计、根据样本中心点求参数 【分析】由题可得,进而即得. 【详解】因为54.4,4504, 所以,, 所以 , 当时,, 所以年销售量780.6 故答案为:780.6. 80.1 【难度】0.94 【知识点】根据散点图判断是否线性相关、随机现象 【分析】由散点图知两变量间是相关关系,不是函数关系;利用概率的知识进行预测,得到的结论有一定的随机性. 【详解】对于①,根据散点图知,各点分布在一条直线附近,两变量间是线性相关关系,①正确; 对于②,根据散点图知,两变量不是确定的一次函数关系,②错误; 对于③,利用概率的知识进行预测,得到的结论有一定的随机性,③错误, 所以正确的个数为1. 故答案为:1 81.1.8182/ 【难度】0.94 【知识点】根据回归方程进行数据估计、求回归直线方程 【分析】求出线性回归方程可得答案. 【详解】由,,所以, 销售量每增加1000箱,则, 所以单位成本下降1.8182元. 故答案为:1.8182. 82.12.38 【难度】0.94 【知识点】根据回归方程进行数据估计 【详解】试题分析:,中心点代入回归方程得,当时 考点:回归方程 点评:回归直线过中心点,其中是x的平均值,是y的平均值 83.62 【难度】0.94 【知识点】完善列联表 【分析】利用2×2列联表求解. 【详解】根据2×2列联表可知, 解得, 则, 又由,解得, 则, 故. 故答案为:62 84.5.95 【难度】0.94 【知识点】根据回归方程进行数据估计 【分析】根据线性回归直线过样本中心可得的值,再取代入可求解. 【详解】由表格中的数据求得. 所以样本点的中心坐标为(4.5,3.5),代入,得3.5=4.5m+0.35,解得m=0.7. ∴线性回归方程为,取x=8,得. 故答案为:5.95. 85. 【难度】0.94 【知识点】卡方的计算、独立性检验的基本思想、独立性检验解决实际问题 【分析】根据列联表中的数据,代入卡方公式计算,再与对应的小概率值比较,选择比结果小的最接近的值对应的概率即可. 【详解】因, 故认为是否购买该款盲盒与性别有关出错的可能性为. 故答案为:. 86. 【难度】0.85 【知识点】计算样本的中心点 【解析】算出即可. 【详解】由表中数据可得, 所以y与x的线性回归方程必过点 故答案为: 【点睛】本题考查的是线性回归的知识,较简单. 87. 【难度】0.85 【知识点】求回归直线方程 【分析】求出样本中心,代入回归直线方程.求解即可. 【详解】由题意可得:==﹣4,==25, ∴==25+=. 故答案为:. 【点睛】回归直线中样本中心一定在回归直线上,可以利用这一条件求出方程中的参数. 88. 【难度】0.85 【知识点】根据样本中心点求参数、求回归直线方程、计算几个数的平均数 【分析】由题可得,进而可得新的平均数,根据回归直线方程过样本中心结合条件即得. 【详解】因为,且, 所以, 去除两个歧义点和后新的平均数为: ,,又新的回归直线的斜率为3, 所以, 所以新的回归直线方程为. 故答案为:. 89./ 【难度】0.85 【知识点】根据回归方程求原数据中的值 【分析】将样本中心点代入回归方程后求解 【详解】由已知中的数据可得:, ∵数据中心点一定在回归直线上, ∴,解得. 故答案为: 90./ 【难度】0.85 【知识点】根据样本中心点求参数 【分析】因为样本中心点满足回归方程,所以求出代入回归方程可求出实数的值. 【详解】因为,, 回归方程为, 所以,解得. 故答案为: 91.或 【难度】0.85 【知识点】独立性检验的基本思想 【分析】根据独立性检验思想可知,代入可能的取值验证不等式是否成立,由此得到结果. 【详解】要有的把握认为与之间有关系,则, 即. 且,,, 代入不等式验证可知均满足要求. 当或时,有的把握认为与之间有关系. 92. 【难度】0.85 【知识点】卡方的计算 【详解】试题分析:. 考点:独立性检验. 93.亿元 【难度】0.85 【知识点】用回归直线方程对总体进行估计、根据样本中心点求参数 【分析】将样本中心点的坐标代入回归直线方程,求出的值,可得出回归直线方程,再将代入回归直线方程,可得结果. 【详解】由表格中的数据可得,, 将样本中心点代入回归直线方程可得,解得, 所以,回归直线方程为, 当时,(亿元), 因此,当研发投入亿元时,相应的产品收益估计值为亿元. 故答案为:亿元. 94.28. 【难度】0.85 【知识点】列联表分析 【分析】根据2×2列联表得到关于a,b,d的方程组,解方程组即得a,b,d的值,即得 的值. 【详解】由题得,解之得a=12,b=8,d=24.所以a-b+d=28. 故答案为:28 95.5.9 【难度】0.85 【知识点】根据回归方程进行数据估计、根据样本中心点求参数 【分析】由已知条件求出样本点的中心,根据回归方程必过样本点的中心求出回归方程,最后利用回归方程估计即可. 【详解】由已知得 ,, 则该回归方程必经过样本点的中心,代入回归方程得, 所以回归方程为, 所以一台该种二手车使用了9年后再销售价格为万元, 故答案为:. 96.432 【难度】0.65 【知识点】排列组合综合、相邻问题的排列问题、不相邻排列问题 【分析】相邻两节文化课之间最多间隔1节艺术课的排法,可以分两种情况,①文化课之间不间隔艺术课,利用捆绑法求解即可;②文化课之间间隔一节,这种情况又分为文化课间都间隔一节、两个文化课间隔一节,与另一个文化课不间隔两种情况;分别求得排法种数,相加即可. 【详解】间隔1节艺术课的排法有种; 间隔0节艺术课的排法有种; 故最多间隔1节艺术课的排法有种, 故答案为:432 97.0.99 【难度】0.65 【知识点】相关系数的计算 【分析】分别求出,,,再利用参考公式和数据计算即可. 【详解】由题意,知, , . 所以. 所以y与x的相关系数近似为0.99. 故答案为:0.99. 98. 【难度】0.65 【知识点】用回归直线方程对总体进行估计、计算样本的中心点、根据回归方程进行数据估计 【详解】根据回归直线方程,必过样本点中心,再利用换元公式,以及对数运算公式,化简求值. 【分析】因为线性回归方程为恒过, 因为,所以, 即, ,, , 故答案为:. 99.② 【难度】0.65 【知识点】计算几个数的中位数、相关指数的计算及分析、独立性检验的概念及辨析 【分析】利用中位数、相关系数、的观测值、残差分析的相关知识逐个分析即可. 【详解】①由甲的数据可知它的中位数为45,乙的中位数为,故正确; ②相关系数时,两个变量有很强的相关性,故②错误; ③由于的观测值,满足,故有95%的把握认为两个变量有关,所以③正确; ④用最小二乘法求出一组数据的回归直线方程后要进行残差分析,相应于数据的残差是指,是正确的. 故答案为②. 【点睛】本题考查了中位数、相关系数、的观测值、残差分析,属于基础题. 100.(1)图象见解析; (2)选择见解析,预测2017年中国人口数为13.89亿; (3)①;②,;③;④;⑤,预测2017年中国人口数13.9亿. (4)答案见解析; 【难度】0.4 【知识点】绘制散点图、根据回归方程进行数据估计、统计新定义 【分析】(1)根据所给数据,画出图象即可; (2)选择两组数据,代入求解,即可求得模拟直线方程,进而可预测2017年人口数; (3)根据题意及数据,逐一求解各个参数,可得模拟方程,进而可预测2017年人口数; (4)查阅2017年人数,分析比较,即可得答案. 【详解】(1)如图所示: (2)不妨选择前两组数据建立一次函数模拟,设模拟方程为, 令2013年对应x为1,则2014年对应x为2,选取两点进行模拟, 代入可得, 解得,所以, 2017年,即时,, 故预测2017年中国人口数为亿(选其他数据,计算合理也正确) (3)① ②所以当时,S有最小值, 所以, ③由②可得当时,有最小值,即, ④当时,, ⑤,2017年对应x=5,代入可得, 所以预测2017年中国人口数为13.9亿. (4)查阅可得2017人口总数为13.9亿,比较可得第二种方法算的更准确,误差更小. 【点睛】解题的关键是读懂题意,根据所给数据,代入求解,考查分析理解,计算求值的能力,计算难度大,属难题. 答案第4页,共45页 答案第4页,共45页 学科网(北京)股份有限公司 $$

资源预览图

8.第八章 成对数据的统计分析-高二数学必刷100题(人教A版2019)
1
8.第八章 成对数据的统计分析-高二数学必刷100题(人教A版2019)
2
8.第八章 成对数据的统计分析-高二数学必刷100题(人教A版2019)
3
所属专辑
相关资源
由于学科网是一个信息分享及获取的平台,不确保部分用户上传资料的 来源及知识产权归属。如您发现相关资料侵犯您的合法权益,请联系学科网,我们核实后将及时进行处理。