第6章 统计学初步 章末综合提升-【正禾一本通】2025-2026学年高中数学必修第一册同步课堂高效讲义配套课件(湘教版)
2025-12-25
|
85页
|
46人阅读
|
5人下载
教辅
资源信息
| 学段 | 高中 |
| 学科 | 数学 |
| 教材版本 | 高中数学湘教版必修 第一册 |
| 年级 | 高一 |
| 章节 | 小结与复习 |
| 类型 | 课件 |
| 知识点 | - |
| 使用场景 | 同步教学-单元练习 |
| 学年 | 2025-2026 |
| 地区(省份) | 全国 |
| 地区(市) | - |
| 地区(区县) | - |
| 文件格式 | PPTX |
| 文件大小 | 5.56 MB |
| 发布时间 | 2025-12-25 |
| 更新时间 | 2025-12-25 |
| 作者 | 山东正禾大教育科技有限公司 |
| 品牌系列 | 正禾一本通·高中同步课堂高效讲义 |
| 审核时间 | 2025-12-10 |
| 下载链接 | https://m.zxxk.com/soft/55356337.html |
| 价格 | 4.00储值(1储值=1元) |
| 来源 | 学科网 |
|---|
摘要:
该高中数学单元复习课件系统梳理了统计学初步的核心知识,通过“实际问题—数据收集—整理分析—推断决策”的流程构建知识网络,涵盖抽样方法、统计图表、集中趋势与离散程度等知识点,逻辑脉络清晰。
其亮点在于聚焦数据分析素养,设计分层探究活动,如结合中小学生近视调查培养数据处理能力,通过药物疗效比较发展统计推断思维,高考真题溯源分析对接考情。单元检测卷分层设计,助力教师精准教学,提升学生知识巩固与应用能力。
内容正文:
章末综合提升
第6章 统计学初步
体系构建
1
分层探究
2
考教衔接
3
单元检测卷
4
内容索引
体 系 构 建
返回
返回
分 层 探 究
返回
素养 数据分析
数据分析是指针对研究对象获取数据,运用数学方法对数据进行整理、分析和推断,形成关于研究对象知识的素养.数据分析过程主要包括:收集数据,整理数据,提取信息,构建模型,进行推断,获得结论.
数据分析主要表现为:收集和整理数据,理解和处理数据,获得和解释结论,概括和形成知识.
题型一 图表数据分析
已知某地区中小学生人数和近视情况分别如图(1)(2)所示.为了解该地区中小学生近视形成的原因,用分层抽样的方法抽取2%的学生进行调查.则样本量和抽取的高中生近视人数分别为
A.100,10
B.200,10
C.100,20
D.200,20
典例
1
易知样本量为(3 500+4 500+2 000)×2%=200.抽取的高中生人数为2 000×2%=40,由于其近视率为50%,所以近视的人数为40×50%=20.
√
某旅游城市为向游客介绍本地的气温情况,绘制了一年中各月平均最高气温和平均最低气温的雷
达图(如图所示).图中A点表示十月的平均最高气温约为15 ℃,B点表示四月的平均最低气温约为5 ℃.下面叙述不正确的是
A.各月的平均最低气温都在0 ℃以上
B.七月的平均温差比一月的平均温差大
C.三月和十一月的平均最高气温基本相同
D.平均最高气温高于20 ℃的月份有5个
典例
2
√
由图可知0 ℃在虚线框内,所以各月的平均最低气温都在0 ℃以上,A正确;由图可知七月的平均温差大于5 ℃,而一月的平均温差小于5 ℃,所以七月的平均温差比一月的平均温差大,B正确;由图可知三月和十一月的平均最高气温都约为10 ℃,基本相同,故C正确;由图可知平均最高气温高于20 ℃的月份只有2个,所以D不正确.
“腾笼换鸟”的政策促进了某地的产业转型,空气质量也有所改观,现从当地天气网站上收集该地区近两年11月份(30天)的空气质量指数(AQI)资料如图及表格所示:
2023年11月份AQI数据频率分布直方图 2024年11月份AQI数据
典例
3
日期 1 2 3 4 5 6 7 8 9 10
AQI 89 55 52 87 124 72 65 26 46 48
日期 11 12 13 14 15 16 17 18 19 20
AQI 58 36 63 78 89 97 74 78 90 117
日期 21 22 23 24 25 26 27 28 29 30
AQI 137 139 77 63 63 77 64 65 55 45
(1)请填写如下所示的2024年11月份AQI数据频率分布表,并完成频率分布直方图;
2024年11月份AQI数据频率分布表 2024年11月份AQI数据频率分布直方图
分组 频数 频率
[20,40)
[40,60)
[60,80)
[80,100)
[100,120)
[120,140]
解:频率分布表如下,频率分布直方图如图所示.
2024年11月份AQI数据频率分布表
分组 频数 频率
[20,40) 2
[40,60) 7
[60,80) 12
[80,100) 5
[100,120) 1
[120,140] 3
2024年11月份AQI数据频率分布直方图
(2)该地区环保部门2024年12月1日发布的11月份环评报告中声称该地区“比去年同期空气质量的优良率提高了20多个百分点”(当AQI<100时,空气质量为优良).试问图表中的数据信息是否支持该观点?
2023年11月份AQI数据频率分布直方图
2024年11月份AQI数据
日期 1 2 3 4 5 6 7 8 9 10
AQI 89 55 52 87 124 72 65 26 46 48
日期 11 12 13 14 15 16 17 18 19 20
AQI 58 36 63 78 89 97 74 78 90 117
日期 21 22 23 24 25 26 27 28 29 30
AQI 137 139 77 63 63 77 64 65 55 45
解:支持.
2023年11月份的优良率为20×(×0.005+0.005+0.015+0.01)=.
2024年11月份的优良率为+++=.
因为-=≈23.3%>20%,
所以图表中的数据信息可支持“比去年同期空气质量的优良率提高了20多个百分点”.
2023年11月份AQI数据频率分布直方图
2024年11月份AQI数据
日期 1 2 3 4 5 6 7 8 9 10
AQI 89 55 52 87 124 72 65 26 46 48
日期 11 12 13 14 15 16 17 18 19 20
AQI 58 36 63 78 89 97 74 78 90 117
日期 21 22 23 24 25 26 27 28 29 30
AQI 137 139 77 63 63 77 64 65 55 45
题型二 评价结论
为了比较两种治疗失眠症的药(分别称为A药,B药)的疗效,随机地选取20位患者服用A药,20位患者服用B药,这40位患者在服用一段时间后,记录他们日平均增加的睡眠时间(单位:h).试验的观测结果如下.
服用A药的20位患者日平均增加的睡眠时间:
0.6 1.2 2.7 1.5 2.8 1.8 2.2 2.3 3.2 3.5
2.5 2.6 1.2 2.7 1.5 2.9 3.0 3.1 2.3 2.4
服用B药的20位患者日平均增加的睡眠时间:
3.2 1.7 1.9 0.8 0.9 2.4 1.2 2.6 1.3 1.4
1.6 0.5 1.8 0.6 2.1 1.1 2.5 1.2 2.7 0.5
(1)分别计算两组数据的平均数,从计算结果看,哪种药的疗效更好?
典例
4
解:设A药观测数据的平均数为,B药观测数据的平均数为,由观测结果可得
=×(0.6+1.2+1.2+1.5+1.5+1.8+2.2+2.3+2.3+2.4+2.5+2.6+2.7+2.7+2.8+2.9+3.0+3.1+3.2+3.5)=2.3,
=×(0.5+0.5+0.6+0.8+0.9+1.1+1.2+1.2+1.3+1.4+1.6+1.7+1.8+1.9+2.1+2.4+2.5+2.6+2.7+3.2)=1.6.
由以上计算结果可得>,因此可看出A药的疗效更好.
(2)根据两组数据,除了平均数还有哪个数字特征能评价哪种药的疗效
更好?
解:由于中位数与平均数都可以描述数据集中程度,因此除了平均数还可以用中位数评价疗效.
题型三 合理决策、方案或建议
某公司计划购买1台机器,该种机器使用三年后即被淘汰.机器有一易损零件,在购进机器时,可以额外购买这种零件作为备件,每个200元.在机器使用期间,如果备件不足再购买,则每个500元.现需决策在购买机器时应同时购买几个易损零件,为此搜集并整理了100台这种机器在三年使用期内更换的易损零件数,得条形图如图所示:
记x表示1台机器在三年使用期内需更换的易损零件数,y表示1台机器在购买易损零件上所需的费用(单位:元),n表示购机的同时购买的易损零件数.
典例
5
(1)若n=19,求y与x的函数解析式;
解:当x≤19时,y=3 800;
当x>19时,y=3 800+500(x-19)=500x-5 700.
所以y与x的函数解析式为
y=x∈N.
(2)若要求“需更换的易损零件数不大于n”的频率不小于0.5,求n的最
小值;
解:由图知,需更换的零件数不大于18的频率为=0.46,不大于19的频率为=0.7,故n的最小值为19.
(3)假设这100台机器在购机的同时每台都购买19个易损零件,或每台都购买20个易损零件,分别计算这100台机器在购买易损零件上所需费用的平均数,以此作为决策依据,购买1台机器的同时应购买19个还是20个易损零件?
解:若每台机器在购机同时都购买19个易损零件,则这100台机器中有70台在购买易损零件上的费用为3 800元,20台的费用为4 300元,10台的费用为4 800元,因此这100台机器在购买易损零件上所需费用的平均数为×(3 800×70+4 300×20+4 800×10)=4 000(元).
若每台机器在购机同时都购买20个易损零件,则这100台机器中有90台在购买易损零件上的费用为4 000元,10台的费用为4 500元,因此这100台机器在购买易损零件上所需费用的平均数为×(4 000×90+4 500×10)=4 050(元).
比较两个平均数可知,购买1台机器的同时应购买19个易损零件.
寒假期间,很多同学都喜欢参加“迎春花市摆档口”的社会实践活动,下表是今年某个档口某种商品的销售数据.
已知摊位租金900元/档,售余商品可以按进货价退回厂家.
(1)求表中10个销售数据的中位数和平均数;
解:中位数为=44.5,
平均数为
=45.
典例
6
日期 2月14日 2月15日 2月16日 2月17日 2月18日
销售
量/件 白天 35 32 43 39 51
晚上 46 42 50 52 60
(2)明年花市期间甲、乙两位同学想合租一个摊位销售同样的商品,其中甲、乙分别承包白天、晚上的商品销售,承包时间段内销售所获利润归承包者所有.如果其他条件不变,以今年的数据为依据,甲、乙两位同学应如何分担租金才较为合理?
日期 2月14日 2月15日 2月16日 2月17日 2月18日
销售
量/件 白天 35 32 43 39 51
晚上 46 42 50 52 60
解:由题知,今年花市期间该摊位所售商品的销售量与时间段有关,明年合租摊位的租金较为合理的分摊方法是根据今年的平均销售量按比例分担.
今年每天白天的平均销售量为=40(件),
今年每天晚上的平均销售量为=50(件),
所以甲同学应分担的租金为900×=400(元),
乙同学应分担的租金为900×=500(元).
日期 2月14日 2月15日 2月16日 2月17日 2月18日
销售
量/件 白天 35 32 43 39 51
晚上 46 42 50 52 60
返回
考 教 衔 接
返回
(2023·新课标Ⅱ卷改编)某学校为了解学生参加体育运动的情况,用比例分配的分层随机抽样法作抽样调查,拟从初中部和高中部共抽取60名学生,已知该校初中部和高中部分别有400名和200名学生,则在初中部和高中部抽取的人数分别为________.
真题
1
由题意,初中部和高中部学生人数之比为=,所以抽取的60名学生
中初中部应有60×=40(人),高中部应有60×=20(人).
40,20
溯源:(湘教P221习题6.2T3)为引导广大学生立志做有理想、敢担当、能吃苦、肯奋斗的新时代好青年,某市团委举办“传承红色基因,赓续红色血脉”知识竞赛活动.某校高一、高二、高三年级学生分别有600人,500人、700人,学校现要组建一个18人的高中生队伍参加全市的知识竞赛,应从高三学生中抽取多少人?
点评:高考题与教材习题都是考查分层抽样,解决问题知识点和方法技巧完全相同.
(多选)(2020·新高考Ⅱ卷)我国新冠肺炎疫情进入常态化,各地有序推进复工复产,下面是某地连续11天复工复产指数折线图.下列说法正确的是
A.这11天复工指数和复产指数均逐日增加
B.这11天期间,复产指数增量大于复工指数的增量
C.第3天至第11天复工复产指数均超过80%
D.第9天至第11天复产指数增量大于复工指数的增量
真题
2
√
√
由题图可知,复产指数第7天到第9天逐日减少,复工指数第1天到第2天、第7天到第8天、第10天到第11天逐日减少,故A错误;由题图可知,第1天复产指数与复工指数的差大于第11天复产指数与复工指数的差,所以这11天期间,复产指数的增量小于复工指数的增量,故B错误;由题图可知,第3天至第11天复工复产指数均在80% 以上,故C正确;由题图可知,第9天至第11天复产指数的增量大于复工指数的增量,故D正确.故选CD.
溯源:(湘教P232习题6.3T5)某城市为了解游客人数的变化规律,提高旅游服务质量,收集并整理了连续三年的月接待游客量的数据,绘制了下面的折线图.
根据该折线图,下列结论正确的有__________.
A.月接待游客量逐月增加
B.年接待游客量逐年增加
C.各年的月接待游客量高峰期大致在7-8月
D.各年1月至6月的月接待游客量相对于7月至12月,波动性更小,变化比较平稳
点评:高考题与教材习题都是通过对折线图的分析,准确的判断选项的正误.考查的知识点和方法技能完全一致.
(2021·全国甲卷)为了解某地农村经济情况,对该地农户家庭年收入进行抽样调查,将农户家庭年收入的调查数据整理得到如下频率分布直方图:
根据此频率分布直方图,下面结论中不正确的是
A.该地农户家庭年收入低于4.5万元的农户比率估计为6%
B.该地农户家庭年收入不低于10.5万元的农户比率估计为10%
C.估计该地农户家庭年收入的平均值不超过6.5万元
D.估计该地有一半以上的农户,其家庭年收入介于4.5万元至8.5万元之间
真题
3
√
由频率分布直方图可得,该地农户家庭年收入低于4.5万元和不低于10.5万元的频率分别为0.06和0.1,则农户比率分别为6%和10%,故A,B正确;家庭年收入介于4.5万元至8.5万元之间的频率为0.1+0.14+0.2+0.2=0.64,故D正确;家庭年收入的平均值为0.02×3+0.04×4+0.1×5+0.14×6+0.2×7+0.2×8+0.1×9+0.1×10+0.04×11+0.02×12+0.02×13+0.02×14=7.68万元,因为7.68>6.5,所以估计该地区农户家庭年收入的平均值超过6.5万元,故C中结论不正确.故选C.
溯源:(湘教P267复习题六T13)某市政府为了鼓励居民节约用水,计划调整居民生活用水收费方案,拟确定一个合理的月用水量标准:一位居民的月用水量不超过x t的部分按平价收费,超出x t的部分按议价收费.为了解居民用水情况,通过抽样,获得了某年100位居民每人的月均用水量(单位:t),将数据按照[0,0.5),[0.5,1),…,[4,4.5)分成9组,制成了如图所示的频率分布直方图.
(1)求直方图中a的值,并估计居民月均用水量的中位数;
(2)设该市有30万居民,估计全市居民中月均用水量不低于3 t的人数,并说明理由;
(3)若该市政府希望使85%的居民月用水量不超过标准x t,估计x的值,并说明理由.
点评:这两题考查相同的知识点,设问的本质也是一样的,都是考查用样本估计总体分布,教材中的题目的设问更具体,高考题的设问更开放.
(2024·新课标Ⅱ卷)某农业研究部门在面积相等的100块稻田上种植一种新型水稻,得到各块稻田的亩产量(单位:kg)并整理得下表:
根据表中数据,下列结论中正确的是
A.100块稻田亩产量的中位数小于1 050 kg
B.100块稻田中亩产量低于1 100 kg的稻田所占比例超过80%
C.100块稻田亩产量的极差介于200 kg至300 kg之间
D.100块稻田亩产量的平均值介于900 kg至1 000 kg之间
真题
4
√
亩产量 [900,950) [950,1 000) [1 000,1 050)
频数 6 12 18
亩产量 [1 050,1 100) [1 100,1 150) [1 150,1 200)
频数 30 24 10
对于A,因为前3组的频率之和0.06+0.12+0.18=0.36<0.5,前4组的频率之和0.36+0.30=0.66>0.5,所以100块稻田亩产量的中位数所在的区间为[1 050,1 100),故A不正确;对于B,100块稻田中亩产量低于1 100 kg的稻田
所占比例为×100%=66%,故B不正确;对于C,因为1 200-900
=300,1 150-950=200,所以100块稻田亩产量的极差介于200 kg至300 kg
之间,故C正确;对于D,100块稻田亩产量的平均值约为×(925×6+
975×12+1 025×18+1 075×30+1 125×24+1 175×10)=1 067(kg),故D不正确.故选C.
亩产量 [900,950) [950,1 000) [1 000,1 050)
频数 6 12 18
亩产量 [1 050,1 100) [1 100,1 150) [1 150,1 200)
频数 30 24 10
溯源:(湘教P254习题6.4T2)下面是国外某城市某日在不同观测点对细颗粒物(PM2.5)浓度的观测值:
275 268 237 208 225 396 168 199 157 166 176 173 188 221 176 159 168 150 173 198 177 129 144 163 141 142 157 142 112 136 140 166 102 110 98
(单位:μg/m3)
(1)数据中有无众数?
(2)计算数据的中位数与均值,它们相等吗?
(3)若数据中的最大值比现有的最大值多25,数据的极差、中位数、众数、平均数发生改变了吗?
(4)根据上述数据,估计该市当日细颗粒物浓度的中位数、众数.
点评:高考题与教材习题都是根据样本数据信息,估计样本或总体的数字特征,不同的是高考题给出频数分布,而教材习题给出了原始数据,解题的思想方法基本相同.
(多选)(2023·新课标Ⅰ卷)有一组样本数据x1,x2,…,x6,其中x1是最小值,x6是最大值,则
A.x2,x3,x4,x5的平均数等于x1,x2,…,x6的平均数
B.x2,x3,x4,x5的中位数等于x1,x2,…,x6的中位数
C.x2,x3,x4,x5 的标准差不小于 x1,x2,…,x6的标准差
D.x2,x3,x4,x5的极差不大于x1,x2,…,x6的极差
真题
5
√
√
对于选项A,当x2,x3,x4,x5的平均数不等于x1,x6的平均数时,A选项不成立,故A错误;对于选项B,不妨设x1≤x2≤x3≤x4≤x5≤x6,可
知x2,x3,x4,x5的中位数等于x1,x2,…,x6的中位数,均为,故
B正确;对于选项C,因为x1是最小值,x6是最大值,则x2,x3,x4,x5的波动性不大于x1,x2,…,x6的波动性,即x2,x3,x4,x5的标准差不大于x1,x2,…,x6的标准差,例如: 1,4,4,4,4,7,则平均数n
=×(1+4×4+7)=4,标准差s1=,4,4,4,4,则平均数m=4,
标准差s2=0,显然>0,即s1>s2,故C错误;对于选项D,不妨设x1≤x2≤x3≤x4≤x5≤x6,则x6-x1≥x5-x2,当且仅当x1=x2,x5=x6时,
等号成立,故D正确.故选BD.
(多选)(2021·新高考Ⅰ卷)有一组样本数据x1,x2,…,xn,由这组数据得到新样本数据y1,y2,…,yn,其中yi=xi+c(i=1,2,…,n),c为非零常数,则
A.两组样本数据的样本平均数相同
B.两组样本数据的样本中位数相同
C.两组样本数据的样本标准差相同
D.两组样本数据的样本极差相同
真题
6
√
设样本数据x1,x2,…,xn的平均数、中位数、标准差、极差分别为,m,σ,t,依题意得,新样本数据y1,y2,…,yn的平均数、中位数、标准差、极差分别为+c,m+c,σ,t,因为c≠0,所以A,B不正确,C,D正确.故选CD.
√
溯源:(湘教P264复习题六T4)在某次测量中得到的A样本数据为:82,84,84,86,86,86,88,88,88,88.若B样本数据恰好是A样本数据每个都加2后所得数据,则A,B两样本的下列数字特征对应相同的是
A.众数 B.平均数
C.中位数 D.标准差
点评:这两道高考题与教材习题都是考查数据的数字特征,即平均数、中位数、标准差、极差、众数等的定义、计算公式等基础知识,所不同的是两道高考试题中的数据是抽象的,教材习题中的数据是具体的.
返回
单 元 检 测 卷
返回
1.一个田径队,有男运动员56人,女运动员42人,比赛后,立即用分层抽样的方法,从全体队员中抽出一个容量为28的样本进行尿样兴奋剂检查,其中男运动员应抽的人数为
A.16
B.14
C.28
D.12
因为每个个体被抽到的概率等于=,根据分层抽样方法的原理可
得样本中男运动员的人数为56×=16,故选A.
√
1
2
3
4
5
6
7
8
9
10
11
12
13
14
15
16
17
18
19
2.在某次测量中得到的A样本数据如下:82,84,84,86,86,86,88,88,88,88.若B样本数据恰好是A样本数据都加2后所得数据,则A,B两样本的下列数字特征对应相同的是
A.众数 B.平均数
C.中位数 D.标准差
√
1
2
3
4
5
6
7
8
9
10
11
12
13
14
15
16
17
18
19
A样本数据:82,84,84,86,86,86,88,88,88,88,
B样本数据84,86,86,88,88,88,90,90,90,90,
众数分别为88,90,不相等,A错.平均数分别为86,88,不相等,
B错.
中位数分别为86,88,不相等,C错.
A样本方差s2=[(82-86)2+2(84-86)2+3×(86-86)2+4(88-86)2]=4,标准差s=2,
B样本方差s2=[(84-88)2+2(86-88)2+3×(88-88)2+4(90-88)2]=4,标准差s=2,D正确.
1
2
3
4
5
6
7
8
9
10
11
12
13
14
15
16
17
18
19
3.已知某地A,B,C三个村的人口户数及贫困情况分别如图(1)和图(2)所示,为了解该地三个村的贫困原因,当地政府决定采用分层抽样的方法抽取10%的户数进行调査,则样本容量和抽取C村贫困户的户数分别是
A.100,20
B.100,10
C.200,20
D.200,10
√
由图(1)得样本容量为(350+200+450)×10%=1 000×10%=100,
C村抽取的户数为200×10%=20户,则抽取C村贫困户的户数为20×0.5=10户.
1
2
3
4
5
6
7
8
9
10
11
12
13
14
15
16
17
18
19
4.某地区对当地3 000户家庭的2020年所得年收入情况调查统计,年收入的频率分布直方图如图所示,数据(单位:千元)的分组依次为[20,40),[40,60),[60,80),[80,100],则年收入不超过6万的家庭大约为
A.900户
B.600户
C.300户
D.150户
由频率分布直方图可得,年收入不超过6万的家庭的频率为(0.005+0.010)×20=0.3.可得年收入不超过6万的家庭大约为3 000×0.3=900户.故选A.
√
1
2
3
4
5
6
7
8
9
10
11
12
13
14
15
16
17
18
19
5.已知一组数据x1,x2,x3,x4,x5的平均数是2,方差是,那么另一组数3x1-2,3x2-2,3x3-2,3x4-2,3x5-2的平均数,方差分别是
A.2,
B.2,1
C.4,3
D.4,
√
1
2
3
4
5
6
7
8
9
10
11
12
13
14
15
16
17
18
19
由题意可得=2,
=,
则新数据的平均数为
=
=-2=3×2-2=4,
方差为
s2=
==9×=3.故选C.
1
2
3
4
5
6
7
8
9
10
11
12
13
14
15
16
17
18
19
6.学校为了调查学生在课外读物方面的支出情况,抽取了一个容量为n的样本,其频率分布直方图如图所示,其中支出在[50,60)的同学有30人,则n的值为
A.100
B.1 000
C.90
D.900
√
由频率分布直方图可知,支出在[50,60)的同学的频率为:0.03×10=0.3,
所以n==100,故选A.
1
2
3
4
5
6
7
8
9
10
11
12
13
14
15
16
17
18
19
7.某城市为了解游客人数的变化规律,
提高旅游服务质量,收集并整理了2020
年1月至2022年12月期间月接待游客量(单
位:万人)的数据,绘制了下面的折线图.
根据该折线图,下列结论错误的是
A.年接待游客量逐年增加
B.各年的月接待游客量高峰期大致在8月
C.2020年1月至12月月接待游客量的中位数为30万人
D.各年1月至6月的月接待游客量相对于7月至12月,波动性更小,变化比较平稳
√
1
2
3
4
5
6
7
8
9
10
11
12
13
14
15
16
17
18
19
由2020年1月至2022年12月期间月接待游客量的折线图得:
在A中,年接待游客量虽然逐月波动,但总体上逐年增加,故A正确;
在B中,各年的月接待游客量高峰期都在8月,故B正确;
在C中,2020年1月至12月月接待游客量的中位数小于30万人,故C错误;
在D中,各年1月至6月的月接待游客量相对于7月至12月,波动性更小,变化比较平稳,故D正确.故选C.
1
2
3
4
5
6
7
8
9
10
11
12
13
14
15
16
17
18
19
8.若某同学连续三次考试的名次(第一名为1,第二名为2,以此类推,且可以有名次并列的情况)均不超过3,则称该同学为班级的尖子生.根据甲、乙、丙、丁四位同学过去连续三次考试的名次数据,推断一定不是尖子生的是
A.甲同学:平均数为2,中位数为2
B.乙同学:平均数为2,方差小于1
C.丙同学:中位数为2,众数为2
D.丁同学:众数为2,方差大于1
√
1
2
3
4
5
6
7
8
9
10
11
12
13
14
15
16
17
18
19
甲同学名次数据的平均数为2,说明名次之和为6,由中位数为2,得出三次考试名次均不超过3,断定甲是尖子生;乙同学名次数据的平均数为2,说明名次之和为6,由方差小于1,得出三次考试名次均不超过3,断定乙是尖子生;丙同学名次数据的中位数为2,众数为2,说明三次考试中至少有两次名次为2,故丙可能是尖子生;丁同学名次数据的众数为2,说明某两次名次为2,设另一次名次为x,经验证,当x=1,2,3时,方差均小于1,故x>3,断定丁一定不是尖子生.
1
2
3
4
5
6
7
8
9
10
11
12
13
14
15
16
17
18
19
9.对下面三个事件最适宜采用的抽样方法判断正确的是
①从某厂生产的6 000件产品中抽取1 000件进行质量检验;
②一次数学竞赛中,某班有5人的成绩在110分以上,45人的成绩在90~100分,10人的成绩低于90分,现在从中抽取12人的成绩了解有关情况;
③运动会服务人员为参加200 m决赛的6名同学安排跑道.
A.①②适宜采用分层抽样
B.②③适宜采用分层抽样
C.②适宜采用分层抽样
D.③适宜采用简单随机抽样
√
√
1
2
3
4
5
6
7
8
9
10
11
12
13
14
15
16
17
18
19
①从某厂生产的6 000件产品中抽取1 000件进行质量检验,不满足分层抽样的方法;
②总体由差异明显且互不重叠的几部分组成,若要从中抽取12人的成绩了解有关情况,适合采用分层抽样的方法;
③运动会服务人员为参加200 m决赛的6名同学安排跑道,具有随机性,适合用简单随机抽样.
故选CD.
1
2
3
4
5
6
7
8
9
10
11
12
13
14
15
16
17
18
19
10.在某次高中学科知识竞赛中,对4 000名考生的参赛成绩进行统计,可得到如图所示的频率分布直方图,其中分组的区间为[40,50),[50,60),[60,70),[70,80),[80,90),[90,100],60分以下视为不及格,若同一组中数据用该组区间中间值作代表值,则下列说法中正确的是
A.成绩在[70,80)的考生人数最多
B.不及格的考生人数为1 000
C.考生竞赛成绩的平均分约为70.5分
D.考生竞赛成绩的中位数为75分
√
√
√
1
2
3
4
5
6
7
8
9
10
11
12
13
14
15
16
17
18
19
由频率分布直方图可得,成绩在[70,80)的频率
最高,因此考生人数最多,故A正确;成绩在[40,
60)的频率为0.01×10+0.015×10=0.25,因此,不
及格的人数为4 000×0.25=1 000,故B正确;考生
竞赛成绩的平均分约为45×0.1+55×0.15+65×0.2+75×0.3+85×0.15+95×0.1=70.5,故C正确;
因为成绩在[40,70)的频率为0.45,在[70,80)的频率为0.3,
所以中位数为70+10×≈71.67,故D错误.故选ABC.
1
2
3
4
5
6
7
8
9
10
11
12
13
14
15
16
17
18
19
11.下图为某地区2010~2022年地方财政预算内收入、城乡居民储蓄年末余额折线图.根据该折线图可知,该地区2010~2022年
A.财政预算内收入、城乡居民储蓄年末余额均呈增长趋势
B.财政预算内收入、城乡居民储蓄年末余额的逐年增长速度相同
C.财政预算内收入年平均增长量高于城乡居民储蓄年末余额年平均增长量
D.城乡居民储蓄年末余额与财政预算内收入的差额逐年增大
√
√
1
2
3
4
5
6
7
8
9
10
11
12
13
14
15
16
17
18
19
由图可以看出两条曲线均在上升,从而选项A正确;
图中两曲线间隔越来越大,说明年增长速度不同,差额逐年增大,故选项B错误,选项D正确;
又从图中可以看出财政预算内收入年平均增长量应该小于城乡居民储蓄年末余额年平均增长量,所以选项C错误;
故选AD.
1
2
3
4
5
6
7
8
9
10
11
12
13
14
15
16
17
18
19
12.下列数据的百分位数P70=_____.
20,14,26,18,28,30,24,26,33,12,35,22.
把所给的数据按照从小到大的顺序排列可得:
12,14,18,20,22,24,26,26,28,30,33,35,
因为有12个数据,所以12×70%=8.4,不是整数,所以数据的百分位数P70=28.
28
1
2
3
4
5
6
7
8
9
10
11
12
13
14
15
16
17
18
19
13.某校为了解高一学生身体素质情况,从某项体育测试成绩中随机抽取n个学生的成绩进行分析,得到成绩频率分布直方图(如图所示),已知成绩在[90,100]的学生人数为8,则n=____;估计该校高一学生此项体育测试平均成绩为_____.
50
76.4
1
2
3
4
5
6
7
8
9
10
11
12
13
14
15
16
17
18
19
因为从体育测试成绩中随机抽取n个学生的成绩,
且成绩在[90,100]的学生人数为8,
所以根据直方图的性质得,0.016×10n=8,则n=50,
由(0.012+0.016+0.018+0.024+x)×10=1,得x=0.03,
所以估计该校高一学生此项体育测试平均成绩为
55×0.012×10+65×0.018×10+75×0.03×10+85×0.024×10+95×0.016×10=76.4.
1
2
3
4
5
6
7
8
9
10
11
12
13
14
15
16
17
18
19
14.为了考察某校各班参加课外书法小组的人数,在全校随机抽取5个班级,把每个班级参加该小组的人数作为样本数据.已知样本平均数为7,样
本方差为4,且样本数据互不相同,则样本数据中的最大值为____.
设五个班级中参加的人数分别为x1,x2,x3,x4,x5.
由题意知=7,(x1-7)2+(x2-7)2+(x3-7)2+(x4-7)2+(x5-7)2=5×4=20,即五个整数的平方和为20,又样本数据互不相同,则有0+1+1+9+9=20.
由|x-7|=3,得x=10或x=4;
由|x-7|=1,得x=8或x=6,则参加的人数为4,6,7,8,10,故最大值为10.
10
1
2
3
4
5
6
7
8
9
10
11
12
13
14
15
16
17
18
19
15.(13分)某大学艺术专业400名学生参加某次测评,根据男女学生人数比例,使用分层抽样的方法从中随机抽取了100名学生,记录他们的分数,将数据分成7组:[20,30),[30,40),…,[80,90],并整理得到频率分布直方图(如图所示).
(1)已知样本中分数小于40的学生有5人,试估计总体中分数在区间[40,50)内的人数;
1
2
3
4
5
6
7
8
9
10
11
12
13
14
15
16
17
18
19
解:根据题意,样本中分数不小于50的频率为(0.01+0.02+0.04+0.02)×
10=0.9,分数在区间[40,50)内的人数为100-100×0.9-5=5.
所以总体中分数在区间[40,50)内的人数估计为400×=20.
1
2
3
4
5
6
7
8
9
10
11
12
13
14
15
16
17
18
19
(2)已知样本中有一半男生的分数不小于70,且样本中分数不小于70的男女生人数相等.试估计总体中男生和女生人数的比例.
解:由题意可知,样本中分数不小于70的学生人数为(0.02+0.04)×10×100=60,
所以样本中分数不小于70的男生人数为60×=30.
所以样本中的男生人数为30×2=60,女生人数为100-60=40,男生和女生人数的比例为60∶40=3∶2.
所以根据分层抽样原理,总体中男生和女生人数的比例估计为3∶2.
1
2
3
4
5
6
7
8
9
10
11
12
13
14
15
16
17
18
19
16.(15分)某中学举行了为期3天的新世纪体育运动会,同时进行全校精神文明擂台赛.为了了解这次活动在全校师生中产生的影响,分别在全校500名教职员工、3 000名初中生、4 000名高中生中进行问卷调查,如果要在所有问卷中抽出120份用于评估.
(1)应如何抽取才能得到比较客观的评价结论?
解:由于这次活动对教职员工、初中生和高中生产生的影响不会相同,
所以应当采取分层抽样的方法进行抽样.
因为样本容量为120,总体容量为500+3 000+4 000=7 500,则抽样比为
=,
1
2
3
4
5
6
7
8
9
10
11
12
13
14
15
16
17
18
19
所以500×=8,3 000×=48,4 000×=64,
所以在教职员工、初中生、高中生中抽取的问卷数分别是8,48,64.
分层抽样的步骤:
①分层:分为教职员工、初中生、高中生,共三层;
②根据抽样比确定每层抽取问卷的数目,在教职员工、初中生、高中生中抽取的问卷数分别是8,48,64;
③各层分别按简单随机抽样的方法抽取样本;
④综合每层抽样,组成样本.
这样便完成了整个抽样过程,就能得到比较客观的评价结论.
1
2
3
4
5
6
7
8
9
10
11
12
13
14
15
16
17
18
19
(2)要从3 000份初中生的问卷中抽取一个容量为48的样本,若采用简单随机抽样,则应如何操作?
解:如果用抽签法,要做3 000个号签,费时费力,因此采用随机数表法抽取样本,步骤是:
①编号:将3 000份答卷都编上号码:0001,0002,0003,…,3 000;
②在随机数表上随机选取一个起始位置;
③规定读数方向:向右连续取数字,以4个数为一组,若读取的4位数大于3 000,则去掉,若遇到相同号码则只取一个,这样一直到取满48个号码为止;
④找出抽取号码对应的问卷组成样本.
1
2
3
4
5
6
7
8
9
10
11
12
13
14
15
16
17
18
19
17.(15分)甲、乙两人参加某体育项目训练,近期的五次测试成绩(单位:分)如图所示:
(1)分别求出甲、乙两人成绩的平均数与方差;
1
2
3
4
5
6
7
8
9
10
11
12
13
14
15
16
17
18
19
解:由题图可得甲、乙两人五次测试的成绩分别为
甲:10分,13分,12分,14分,16分;
乙:13分,14分,12分,12分,14分.
==13,
==13,
=×[(10-13)2+(13-13)2+(12-13)2+(14-13)2+(16-13)2]=4,
=×[(13-13)2+(14-13)2+(12-13)2+(12-13)2+(14-13)2]=0.8.
1
2
3
4
5
6
7
8
9
10
11
12
13
14
15
16
17
18
19
(2)根据(1)的结果,对两人的成绩作出评价.
解:由>,可知乙的成绩较稳定.
从题图看,甲的成绩基本呈上升趋势,而乙的成绩上下波动,因此甲的成绩在不断提高,而乙的成绩则无明显提高.
1
2
3
4
5
6
7
8
9
10
11
12
13
14
15
16
17
18
19
18.(17分)某校从参加某次知识竞赛测试的学生中随机抽出60名学生,将其成绩(百分制)(均为整数)分成六段[40,50),[50,60),…,[90,100]后得到如下部分频率分布直方图.观察图形的信息,回答下列问题:
(1)求分数在[70,80)内的频率,并补全这个频率分布直方图;
1
2
3
4
5
6
7
8
9
10
11
12
13
14
15
16
17
18
19
解:设分数在[70,80)内的频率为x,
根据频率分布直方图,可知:
(0.01+0.015×2+0.025+0.005)×10+x=1,
解得x=0.3,
所以分数在[70,80)内的频率为0.3.
频率分布直方图如图所示.
1
2
3
4
5
6
7
8
9
10
11
12
13
14
15
16
17
18
19
(2)根据频率分布直方图,从图中估计总体的众数是多少分?中位数是多
少分?
解:因为分数在[70,80)内的小矩形最高,众数是最高小矩形中点的横坐标,
所以众数为75.
因为分数在[40,70)内的频率为(0.01+0.015+0.015)×10=0.4,
分数在[40,80)内的频率为0.7,
所以中位数在[70,80)内,
因为中位数要平分直方图的面积,所以中位数为70+≈73.3.
1
2
3
4
5
6
7
8
9
10
11
12
13
14
15
16
17
18
19
(3)统计方法中,同一组数据常用该组区间的中点值作为代表,据此估计本次考试的平均分.
解:抽样学生的平均分为:
45×0.1+55×0.15+65×0.15+75×0.3+85×0.25+95×0.05=71,
所以估计这次考试的平均分是71分.
1
2
3
4
5
6
7
8
9
10
11
12
13
14
15
16
17
18
19
19.(17分)某重点中学100位学生在市统考中的理科综合分数,以[160,180),[180,200) ,[200,220),[220,240),[240,260),[260,280),[280,300]分组的频率分布直方图如图.
(1)求直方图中x的值;
解:由(0.002+0.009 5+0.011+0.012 5+x+0.005+0.002 5)×20=1,
解得x=0.007 5,所以直方图中x的值为0.007 5.
1
2
3
4
5
6
7
8
9
10
11
12
13
14
15
16
17
18
19
(2)求理科综合分数的众数和中位数;
解:理科综合分数的众数是=230,
因为(0.002+0.009 5+0.011)×20=0.45<0.5,
所以理科综合分数的中位数在[220,240)内,设中位数为a,
则(0.002+0.009 5+0.011)×20+0.012 5×(a-220)=0.5,
解得a=224,即中位数为224.
1
2
3
4
5
6
7
8
9
10
11
12
13
14
15
16
17
18
19
(3)在理科综合分数为[220,240),[240,260),[260,280),[280,300]的四组学生中,用分层抽样的方法抽取11名学生,则理科综合分数在[220,240)的学生中应抽取多少人?
1
2
3
4
5
6
7
8
9
10
11
12
13
14
15
16
17
18
19
解:理科综合分数在[220,240)的学生有0.012 5×20×100=25(位),
同理可求理科综合分数为[240,260),[260,280),[280,300]的学生分别有15位、10位、5位,
故抽样比为=,
所以从理科综合分数在[220,240)的学生中应抽取25×=5人.
返回
1
2
3
4
5
6
7
8
9
10
11
12
13
14
15
16
17
18
19
谢 谢 观 看
章末综合提升
返回
$
相关资源
由于学科网是一个信息分享及获取的平台,不确保部分用户上传资料的 来源及知识产权归属。如您发现相关资料侵犯您的合法权益,请联系学科网,我们核实后将及时进行处理。