专题08 统计九种考法(知识清单+方法讲解+重难点例题及变式+限时冲刺练)-2024-2025学年高一数学下学期期末复习专题(苏教版2019必修第二册)

2025-06-06
| 2份
| 46页
| 719人阅读
| 29人下载
高中数学精品馆
进店逛逛

资源信息

学段 高中
学科 数学
教材版本 高中数学苏教版必修 第二册
年级 高一
章节 第14章统计
类型 题集-专项训练
知识点 统计
使用场景 同步教学-期末
学年 2025-2026
地区(省份) 江苏省
地区(市) -
地区(区县) -
文件格式 ZIP
文件大小 3.58 MB
发布时间 2025-06-06
更新时间 2025-06-06
作者 高中数学精品馆
品牌系列 -
审核时间 2025-06-06
下载链接 https://m.zxxk.com/soft/52460172.html
价格 3.00储值(1储值=1元)
来源 学科网

内容正文:

专题08 统计九种考法 一、知识清单 知识梳理 随机抽样 1.统计的相关概念 名称 定义 总体 调查对象的全体称为整体 个体 组成整体的每一个调查对象称为个体 样本 从总体中抽取的那部分个体称为样本 样本容量 样本中包含的个体数称为样本容量 样本与样本量的区别:样本是从总体中抽取的个体组成的集合,是对象;样本量是样本中个体的数目,是一个数. 2.简单随机抽样 定义 设一个总体含有个个体,从中逐个不放回抽取个个体作为样本(),如果每次抽取时总体内的各个个体被抽到的机会都相等,就把这种抽样方法叫做简单随机抽样 方法 抽签法 把总体中的个个体编号,把号码写在号签上,将号签放在一个容器中,搅拌均匀后,每次从中抽取一个号签,连续抽取n次,就得到一个容量为n的样本 随机数法 利用随机数表、随机数骰子或计算机产生的随机数进行抽样 抽签法与随机数法 相同点 ①都属于简单随机抽样,并且要求被抽取样本的总体的个体数有限; ②都是从总体中逐个不放回地进行抽取 不同点 ①抽签法比随机数法操作简单; ②随机数法更适用于总体中个体数较多的时候,而抽签法适用于总体中个体数较少的情况 利用随机数法抽取个体时的注意事项: ①定起点:事先应确定以表中的哪个数(哪行哪列)作为起点. ②定方向:读数的方向(向左、向右、向上或向下都可以). ③读数规则:读数时结合编号的特点进行读取,编号为两位数则两位两位地读取,编号为三位数则三位三位地读取,如果出现重复则跳过,直到取满所需的样本个体数. 3.分层抽样 ①定义:在抽样时,将总体分成互不交叉的层,然后按照一定的比例,从各层独立地抽取一定数量的个体,将各层取出的个体合在一起作为样本,这种抽样方法叫做分层抽样. ②应用范围:当总体是由差异明显的几个部分组成时,往往选用分层抽样. 注意:分层抽样是按比例抽样,每一层入样的个体数为该层的个体数乘以抽样比. 频率直方图及数据特征 1.频率分布直方图 1.画频率分布直方图的步骤 第1步:求极差(即一组数据中最大值与最小值的差);第2步:决定组距与组数; 第3步:将数据分组;第4步:列频率分布表; 第5步:画频率分布直方图(以横轴表示样本分组,纵轴表示频率与组距的比值). 2.频率分布直方图的性质: 落在各小组内的频率用各小长方形的面积表示,且各小长方形的面积的和等于1. 2、数字特征 (1)众数、中位数、平均数 数字特征 样本数据 频率分布直方图 众数 出现次数最多的数据 取最高的小长方形底边中点的横坐标 中位数 将数据按大小依次排列,处在最中间位置的一个数据(或最中间两个数据的平均数) 把频率分布直方图划分左右两个面积相等的分界线与x轴交点的横坐标 平均数 样本数据的算术平均数 每个小矩形的面积乘以小矩形底边中点的横坐标之和 (2)极差、方差和标准差 极差:即一组数据中最大值与最小值的差. 方差:. 标准差:. 注:方差和标准差反映了数据波动程度的大小.标准差、方差越大,数据的离散程度越大,越波动;标准差、方差越小,数据的离散程度越小,越稳定. (3)性质 ①若的平均数为,那么的平均数为. ②数据与数据的方差相等,即数据经过平移后方差不变. ③若的方差为s2,那么的方差为. 3.百分位数 (1)定义:一组数据的第p百分位数是这样一个值,它使得这组数据中至少有的数据小于或等于这个值,且至少有的数据大于或等于这个值. (2)计算一组几个数据第p百分位数的步骤 第1步,按从小到大排列原始数据;第2步,计算.第3步,若i不是整数,而大于i的比邻整数为j,则第p百分位数为第j项数据;若i是整数,则第p百分位数为第i项与第(i+1)项数据的平均数. (3)四分位数 即把所有数值由小到大排列并分成四等份,处于三个分割点位置的数值就是四分位数. 其中第25百分位数也称为第一四分位数或下四分位数等,第75百分位数也称为第三四分位数或上四分位数等. 二、方法讲解 1.抽签法与随机数表法 利用随机数表进行抽样的具体步骤: ①给总体中的每个个体编号; ②在随机数表中随机抽取某行某列作为抽样的起点,并规定读取方法; ③依次从随机数表中抽取样本号码,凡是抽到编号范围内的号码,就是样本的号码,并剔除相同的号码,直到抽满为止. 2.分层抽样 分层随机抽样中有关计算的方法: (1)抽样比=; (2)总体中某两层的个体数之比=样本中这两层抽取的个体数之比. 3.统计图表 (1)条形图是用一个单位长度表示一定的数量或频率,根据数量的多少或频率的大小画成长短不同的矩形条,条形图能清楚地表示出每个项目的具体数目或频率; (2)扇形图是用整个圆面积表示总数(100%),用圆内的扇形面积表示各个部分所占总数的百分数; (3)折线统计图反映数据随时间的变化趋势. 4.频率分布直方图 (1)由于频率分布直方图中的纵坐标为,因此涉及纵坐标中含参数的问题,应根据频率之和为1列式求解; (2)根据频率分布直方图(表)求样本数据在某一区间内的频率就是样本数据在该区间内的各组频率的和,而求解相应的频数还要根据频率乘以样本容量; (3)若所求区间包含频率分布直方图中非分组的端点,可以利用“比例法”求解. 5.频率分布直方图与平均数、众数、中位数 用频率分布直方图估计总体数字特征的方法: (1)众数:最高小长方形底边中点的横坐标; (2)中位数:平分频率分布直方图面积且垂直于横轴的直线与横轴交点的横坐标; (3)平均数:频率分布直方图中每个小长方形的面积乘小长方形底边中点的横坐标之和. 6.百分位数 (1)求一组数据的百分位数时,一定要先将该组数据按照从小到大的顺序排列; (2)根据频率分布直方图计算样本数据的百分位数,首先要理解频率分布直方图中各组数据频率的计算方法,其次估计百分位数在哪一组,再应用方程的思想方法及比例法,设出百分位数,利用比例列方程求解. 7.样本的数字特征 (1)平均数、中位数、众数描述其集中趋势,方差和标准差描述波动大小. (2)方差的简化计算公式:或写成,即方差等于原数据平方的平均数减去平均数的平方. 8.总体离散程度的估计 标准差(方差)反映了数据的离散与集中、波动与稳定的程度.标准差(方差)越大,数据的离散程度越大;标准差(方差)越小,数据的离散程度越小. 9.由特征数解决实际问题 三、重难点例题及变式 类型一、抽签法与随机数表法 例.(1)用抽签法进行抽样有以下及格步骤: ①把号码写在形状、大小相同的号签上(号签可以用小球、卡片、纸条制作) ②将总体中的个体编号; ③从这容器中逐个不放回地抽取号签,将取出号签所对应的个体作为样本; ④将这些号签放在一个容器内并搅拌均匀; 这些步骤的先后顺序应为 ( ) A.②①④③ B.②③④① C.①③④② D.①④②③ (2)某厂质检员利用随机数表对生产的600个产品进行抽样调查,先将这600个产品进行编号:001,002,003,…,600.从中抽取120个样本,下图是随机数表的第2行到第3行,若从随机数表的第2行第5列开始从左向右读取数据,则得到的第5个编号是( ) 32 12 67 12 31 02 37 02 14 72 31 09 81 47 80 25 13 25 46 08 71 20 34 51 19 72 01 38 47 18 04 92 51 28 02 31 27 46 51 30 A. 098 B. 147 C. 513 D. 310 【变式训练1】某单位拟从40名员工中选1人赠送电影票,可采用下面两种选法: 选法一:将这40名员工按1至40进行编号,并相应地制作号码为1至40的40个号签,把这40个号签放在一个暗箱中搅匀,最后随机地从中抽取1个号签,与这个号签编号一致的员工是幸运人选; 选法二:将39个白球与1个红球(除颜色外,其他完全相同)混合放在一个暗箱中搅匀,让40名员工逐一从中不放回地摸取1个球,则摸到红球的员工是幸运人选.试问: (1)这两种选法是否都是抽签法,为什么? (2)这两种选法中每名员工被选中的可能性是否相等? 【变式训练2】总体由编号为01,02,…,30的30个个体组成.利用所给的随机数表选取6个个体,选取的方法是从随机数表第1行的第3列开始,由左到右一次选取两个数字,则选出来的第5个个体的编号为( ) (第一行)1712    1340    3320    3826    1389    5103    7417    7637 (第二行)1304    0774    2119    3056    6218    3735    9683    5087 A.20 B.26 C.17 D.03 类型二、分层抽样 例.某学校为了解高一学生每天阅读时长,从高一男生和女生中采用分层抽样的方法抽取部分学生进行调查分析.已知该学校高一学生中男生和女生的比例是,在抽取的学生中男生比女生多24人,则被抽取的学生人数是 . 【变式训练1】从24名数学教师,16名物理教师,8名化学教师中,用分层抽样的方法抽取一个容量为6的样本,则抽取数学教师的人数是( ) A.1 B.2 C.3 D.4 【变式训练2】某校高中年级举办科技节活动,开设A,B两个会场,其中每个同学只能去一个会场且25%的同学去A会场,剩下的同学去B会场.已知A,B会场学生年级及比例情况如下表所示: 高一 高二 高三 A会场 50% 40% 10% B会场 40% 50% 10% 记该校高一、高二、高三年级学生所占总人数的比例分别为x,y,z,利用分层随机抽样的方法从参加活动的全体学生中抽取一个容量为n的样本. (1)求的值; (2)若抽到的B会场的高二学生有150人,求n的值以及抽到的A会场高一、高二、高三年级的学生人数. 类型三、统计图表 例.我国新冠肺炎疫情进入常态化,各地有序推进复工复产,下面是某地连续11天复工复产指数折线图,下列说法正确的是( ) A.这11天复工指数和复产指数均逐日增加; B.这11天期间,复产指数增量大于复工指数的增量; C.第3天至第11天复工复产指数均超过80%; D.第9天至第11天复产指数增量大于复工指数的增量; 【变式训练1】某保险公司为客户定制了5个险种:甲,一年期短期;乙,两全保险;丙,理财类保险;丁,定期寿险;戊,重大疾病保险.各种保险按相关约定进行参保与理赔.该保险公司对5个险种参保客户进行抽样调查,得到如图所示的统计图表.则下列说法中一定错误的是( ) A.丁险种参保人数超过五成 B.41岁以上参保人数超过总参保人数的五成 C.18-29周岁人群参保的总费用最少 D.人均参保费用不超过5000元 【变式训练2】(多选)2021年7月至2022年7月,我国居民消费价格保持平稳,居民消费价格涨跌幅如图所示,则以下一定正确的序号为( ) 备注:,. A.2021年7月至2022年7月全国居民消费价格环比增长率的极差为1% B.2021年7月至2022年7月全国居民消费价格同比增长率的中位数与众数相同 C.从同比增长率看,2022年1月与2022年2月全国居民消费价格一定相同 D.从环比增长率看,2022年6月全国居民消费价格与2022年5月全国居民消费价格相同 类型四、频率分布直方图 例.为贯彻五育并举的教育方针,某校对全体高一年级学生进行了体育测试,并将成绩(单位:分)分为6组:加以统计,得到如图所示的频率分布直方图.已知高一年级共有750名同学参加测试,则成绩达标的(不少于60分)学生人数为 . 【变式训练1】为了解全市高三学生的体能素质情况,在全市高三学生中随机抽取了1000名学生进行体能测试,并将这1000名学生的体能测试成绩整理成如下频率分布直方图.则直方图中实数的值为 . 【变式训练2】某研究小组经过研究发现某种疾病的患病者与未患病者的某项医学指标有明显差异,经过大量调查,得到如下的患病者和未患病者该指标的频率分布直方图: 利用该指标制定一个检测标准,需要确定临界值c,将该指标大于c的人判定为阳性,小于或等于c的人判定为阴性.此检测标准的漏诊率是将患病者判定为阴性的概率,记为;误诊率是将未患病者判定为阳性的概率,记为.假设数据在组内均匀分布,以事件发生的频率作为相应事件发生的概率.则当漏诊率时,误诊率 . 类型五、频率分布直方图与平均数、众数、中位数 例.某校从参加高二年级学业水平测试的学生中抽出80名学生,其数学成绩(均为整数,单位:分)的频率分布直方图如图所示.    (1)求这次测试数学成绩的众数; (2)求这次测试数学成绩的中位数. (3)延伸探究:若本例的条件不变,求数学成绩的平均分. (4)若本例条件不变,求80分以下的学生人数. 【变式训练1】某校抽取100名高二学生期中考试的语文成绩,绘制频率分布直方图(如图所示),其中样本数据分组区间为:.    (1)求频率分布直方图中的值; (2)根据频率分布直方图,估计这100名学生语文成绩的众数和平均数. 【变式训练2】(多选)某社区通过简单随机抽样,获得了100户居民的月均用水量数据,并绘制出如图所示的频率分布直方图,由该图可以估计( ) A.平均数>中位数 B.中位数>平均数 C.中位数>众数 D.众数>平均数 类型六、百分位数 例.已知一组数据为,则这组数据第60百分位数为 . 【变式训练1】(多选)若一组数据14,17,11,9,12,15,,8,10,7的第65百分位数为12,则的值可能为( ) A.8 B.10 C.13 D.14 【变式训练2】已知18个整数的中位数为5,第75百分位数也为5,那么这18个数中,5的个数的最小可能值为 . 类型七、样本的数字特征 例.从甲队60人、乙队40人中,按照分层抽样的方法从两队共抽取10人,进行一轮答题.相关统计情况如下:甲队答对题目的平均数为1,方差为1;乙队答对题目的平均数为1.5,方差为0.4,则这10人答对题目的方差为( ) A.0.8 B.0.675 C.0.74 D.0.82 【变式训练1】(多选)设一组样本数据满足,则( ) A.拿走,这组数据的方差变大 B.拿走,这组数据的方差变大 C.拿走,这组数据的方差减小 D.拿走,这组数据的方差减小 【变式训练2】已知一组统计数据的平均数为,方差为,则函数的最小值为 . 类型八、总体离散程度的估计 例.(多选)下列统计量中,能度量样本的离散程度的是( ) A.样本的标准差 B.样本的中位数 C.样本的极差 D.样本的平均数 【变式训练1】某校高一(1)班、(2)班的学生人数分别为40,42,在某次测验中,记(1)班所有学生的成绩分别为,,…,,平均成绩为,方差为,已知,. (1)求,; (2)记(2)班所有学生的成绩分别为,,…,,其平均成绩为82,,试求两个班的所有学生的平均成绩(结果保留整数),并说明哪一个班的成绩比较稳定. 【变式训练2】(多选)一个同学投掷10次骰子,记录出现的点数,根据统计结果,在下列情况中可能出现点数6的有( ) A.平均数为3,中位数为4 B.中位数为4,众数为3 C.平均数为2,方差为2.1 D.中位数为3,方差为0.85 类型九、由特征数解决实际问题 例.为进一步推动防范电信网络诈骗工作,预防和减少电信网络诈骗案件的发生,某市开展防骗知识大宣传活动.举办了“网络防骗”知识竞赛,从所有答卷中随机抽取100份作为样本,将样本的成绩(满分100分,成绩均为不低于40分的整数)分成六段:,,…,得到如图所示的频率分布直方图. (1)求图中的值,根据频率分布直方图计算样本成绩的平均数和下四分位数; (2)已知若总体划分为2层,通过分层随机抽样,各层抽取的样本量、样本平均数和样本方差分别为:,,;,,,记总的样本平均数为,样本方差为. 证明:; (3)已知落在的平均成绩是59,方差是7,落在的平均成绩为65,方差是4,求两组样本成绩的总平均数和总方差. 【变式训练1】在2024年世界泳联跳水世界杯蒙特利尔站和柏林站女子10米台跳水决赛中,全红婵奉献了高水准的精彩表现,在决赛中的五个动作惊艳了全世界.在这两场决赛中,7名裁判给选手的五个跳水动作打分,两站裁判对全红婵的打分记录如下:(为了方便计算,采取分数四舍五入取整) A组(蒙特利尔站):80  80  82  78  93 B组(柏林站):81  80  86  99  86 (1)请写出这10个分数的众数、极差以及A,B两组各自的平均成绩; (2)请你根据所学的统计知识,分析两站比赛中,哪一站全红婵发挥更稳定?并说明理由. 【变式训练2】某快递公司招聘快递骑手,该公司提供了两种日工资方案:方案1:规定每日底薪元,快递骑手每完成一单业务提成元;方案2:规定每日底薪元,快递业务的前单没有提成,从第单开始,每完成一单业务提成元,该快递公司记录了每天骑手的人均业务量.现随机抽取天的数据,将样本数据分为、、、、、、七组,整理得到如图所示的频率分布直方图. (1)求频率分布直方图中的值; (2)若仅从人均日收入的角度考虑,请你利用所学的统计学知识为新聘骑手做出日工资方案的选择,并说明理由(同组中的每个数据用该组区间的中点值代替). 四、限时冲刺练 1.某中学有高一学生1400人,高二学生1100人,高三学生1000人,用比例分配的分层随机抽样方法从该校学生中抽取若干人参加荒山绿化活动,若抽取的高三学生人数比抽取的高二学生人数少5,则抽取的高一学生人数为( ) A.60 B.65 C.70 D.75 2.从一个含有个个体的总体中抽取一容量为的样本,当选取抽签法、随机数法和分层随机抽样三种不同方法时,总体中每个个体被抽中的概率分别为,三者关系可能是( ) A. B. C. D. 3.国家统计局发布的2018年至2022年我国居民消费水平情况如图所示,则下列说法正确的是(居民消费水平)( )    A.2018年至2022年我国居民消费水平逐年提高 B.2018年至2022年我国城镇居民消费水平逐年提高 C.2018年至2022年我国居民消费水平数据的极差为6463元 D.2022年我国城镇人口数比农村人口数的1.5倍还要多 4.为深入贯彻落实习近平总书记对天津工作“三个着力”重要要求,天津持续深化改革,创建全国文明城区,城市文明程度显著提升,人民群众的梦想不断实现.在创建文明城区的过程中,中央文明办对某小区居民进行了创建文明城区相关知识网络问卷调查,从本次问卷中随机抽取了50名居民的问卷结果,统计其得分数据,将所得50份数据的得分结果分为6组:,并整理得到如下的频率分布直方图,则该小区居民得分的第70百分位数为( )    A.89.09 B.86.52 C.84.55 D.81.32 5.已知某4个数据的平均值为6,方差为3,现加入数据8和10,则这6个数据的方差为( ) A.2 B. C. D. 6.(多选)某火锅店做营业额分析,规定连续5天的日营业额小于10万元即为进入淡季,需制订优惠活动,将连续5天的日营业额的数据记录作为一组样本(记录数据都是自然数),现有4组样本,4组样本中一定符合进入淡季指标的共有( ) A.平均数 B.平均数且极差小于或等于3 C.平均数且标准差 D.众数等于5且极差小于或等于4 7.(多选)有一组样本数据,其中是最小值,是最大值,则( ) A.的平均数等于的平均数 B.的中位数等于的中位数 C.的标准差不小于的标准差 D.的极差不大于的极差 8.(多选)为了解“全民齐参与城市更美丽”的志愿服务情况,随机抽取了100名志愿者进行问卷调查,将这100名志愿者问卷调查的得分按,,,,分成5组,并绘制出频率分布直方图,如图所示,则下列结论正确的是( ) A. B.估计这100名志愿者问卷调查得分的分位数为85 C.这100名志愿者问卷调查得分的平均数为75(同一组中的数据用该组区间的中点值为代表) D.若采用分层随机抽样从得分在,内的志愿者中抽取8人,则抽取的这8名志愿者得分在内的人数为6 9.(多选)有一组样本数据,,…,,由这组数据得到新样本数据,,…,,其中(为非零常数,则( ) A.两组样本数据的样本平均数相同 B.两组样本数据的样本中位数相同 C.两组样本数据的样本标准差相同 D.两组样本数据的样本极差相同 10.现利用随机数表法从编号为00,01,02,…,18,19的20支水笔中随机选取6支,选取方法是从下列随机数表第1行的第9个数字开始由左到右依次选取两个数字,则选出来的第6支水笔的编号为 . 95226000 49840128 66175168 39682927 43772366 27096623 92580956 43890890 06482834 59741458 29778149 64608925 11.为培养学生的阅读习惯,某校开展了为期一年的“弘扬传统文化,阅读经典名著”活动.在了解全校学生每年平均阅读了多少本文学经典名著时,甲同学抽取了一个容量为10的样本,并算得样本的平均数为5,方差为9;乙同学抽取了一个容量为8的样本,并算得样本的平均数为6,方差为16.已知甲、乙两同学抽取的样本合在一起组成一个容量为18的样本,则合在一起后的样本平均数为 ,方差为 .(精确到0.1) 12.互不相等的4个正整数从小到大排序为,若它们的平均数为4,且这4个数据的极差是中位数的2倍,则这4个数据的中位数为 . 13.唐三彩,中国古代陶瓷烧制工艺的珍品,它吸取了中国国画、雕塑等工艺美术的特点,在中国文化中占有重要的历史地位,在中国的陶瓷史上留下了浓墨重彩的一笔,唐三彩的生产至今已有1300多年的历史,对唐三彩的复制和仿制工艺,至今也有百余年的历史.某陶瓷厂在生产过程中,随机抽取件工艺品测得其质量指标数据,将数据分成以下六组、、、…、,得到如下频率分布直方图. (1)求出直方图中的值; (2)利用样本估计总体的思想,估计该厂所生产的工艺品的质量指标值的众数和中位数(中位数精确到); (3)现规定质量指标值小于的为二等品,质量指标值不小于的为一等品.已知该厂某月生产了件工艺品,试利用样本估计总体的思想,估计其中一等品和二等品分别有多少件. 14.某地区有小学生9000人,初中生8600人,高中生4400人,教育局组织网络“防溺水”网络知识问答,现用分层抽样的方法从中抽取220名学生,对其成绩进行统计分析,得到如下图所示的频率分布直方图所示的频率分布直方图. (1)根据频率分布直方图,估计该地区所有学生中知识问答成绩的平均数和众数; (2)成绩位列前10%的学生平台会生成“防溺水达人”优秀证书,试估计获得“防溺水达人”的成绩至少为多少分; (3)已知落在内的平均成绩为67,方差是9,落在内的平均成绩是73,方差是29,求落在内的平均成绩和方差. (附:设两组数据的样本量、样本平均数和样本方差分别为:.记两组数据总体的样本平均数为,则总体样本方差) 学科网(北京)股份有限公司 学科网(北京)股份有限公司 $$ 专题08 统计九种考法 一、知识清单 知识梳理 随机抽样 1.统计的相关概念 名称 定义 总体 调查对象的全体称为整体 个体 组成整体的每一个调查对象称为个体 样本 从总体中抽取的那部分个体称为样本 样本容量 样本中包含的个体数称为样本容量 样本与样本量的区别:样本是从总体中抽取的个体组成的集合,是对象;样本量是样本中个体的数目,是一个数. 2.简单随机抽样 定义 设一个总体含有个个体,从中逐个不放回抽取个个体作为样本(),如果每次抽取时总体内的各个个体被抽到的机会都相等,就把这种抽样方法叫做简单随机抽样 方法 抽签法 把总体中的个个体编号,把号码写在号签上,将号签放在一个容器中,搅拌均匀后,每次从中抽取一个号签,连续抽取n次,就得到一个容量为n的样本 随机数法 利用随机数表、随机数骰子或计算机产生的随机数进行抽样 抽签法与随机数法 相同点 ①都属于简单随机抽样,并且要求被抽取样本的总体的个体数有限; ②都是从总体中逐个不放回地进行抽取 不同点 ①抽签法比随机数法操作简单; ②随机数法更适用于总体中个体数较多的时候,而抽签法适用于总体中个体数较少的情况 利用随机数法抽取个体时的注意事项: ①定起点:事先应确定以表中的哪个数(哪行哪列)作为起点. ②定方向:读数的方向(向左、向右、向上或向下都可以). ③读数规则:读数时结合编号的特点进行读取,编号为两位数则两位两位地读取,编号为三位数则三位三位地读取,如果出现重复则跳过,直到取满所需的样本个体数. 3.分层抽样 ①定义:在抽样时,将总体分成互不交叉的层,然后按照一定的比例,从各层独立地抽取一定数量的个体,将各层取出的个体合在一起作为样本,这种抽样方法叫做分层抽样. ②应用范围:当总体是由差异明显的几个部分组成时,往往选用分层抽样. 注意:分层抽样是按比例抽样,每一层入样的个体数为该层的个体数乘以抽样比. 频率直方图及数据特征 1.频率分布直方图 1.画频率分布直方图的步骤 第1步:求极差(即一组数据中最大值与最小值的差);第2步:决定组距与组数; 第3步:将数据分组;第4步:列频率分布表; 第5步:画频率分布直方图(以横轴表示样本分组,纵轴表示频率与组距的比值). 2.频率分布直方图的性质: 落在各小组内的频率用各小长方形的面积表示,且各小长方形的面积的和等于1. 2、数字特征 (1)众数、中位数、平均数 数字特征 样本数据 频率分布直方图 众数 出现次数最多的数据 取最高的小长方形底边中点的横坐标 中位数 将数据按大小依次排列,处在最中间位置的一个数据(或最中间两个数据的平均数) 把频率分布直方图划分左右两个面积相等的分界线与x轴交点的横坐标 平均数 样本数据的算术平均数 每个小矩形的面积乘以小矩形底边中点的横坐标之和 (2)极差、方差和标准差 极差:即一组数据中最大值与最小值的差. 方差:. 标准差:. 注:方差和标准差反映了数据波动程度的大小.标准差、方差越大,数据的离散程度越大,越波动;标准差、方差越小,数据的离散程度越小,越稳定. (3)性质 ①若的平均数为,那么的平均数为. ②数据与数据的方差相等,即数据经过平移后方差不变. ③若的方差为s2,那么的方差为. 3.百分位数 (1)定义:一组数据的第p百分位数是这样一个值,它使得这组数据中至少有的数据小于或等于这个值,且至少有的数据大于或等于这个值. (2)计算一组几个数据第p百分位数的步骤 第1步,按从小到大排列原始数据;第2步,计算.第3步,若i不是整数,而大于i的比邻整数为j,则第p百分位数为第j项数据;若i是整数,则第p百分位数为第i项与第(i+1)项数据的平均数. (3)四分位数 即把所有数值由小到大排列并分成四等份,处于三个分割点位置的数值就是四分位数. 其中第25百分位数也称为第一四分位数或下四分位数等,第75百分位数也称为第三四分位数或上四分位数等. 二、方法讲解 1.抽签法与随机数表法 利用随机数表进行抽样的具体步骤: ①给总体中的每个个体编号; ②在随机数表中随机抽取某行某列作为抽样的起点,并规定读取方法; ③依次从随机数表中抽取样本号码,凡是抽到编号范围内的号码,就是样本的号码,并剔除相同的号码,直到抽满为止. 2.分层抽样 分层随机抽样中有关计算的方法: (1)抽样比=; (2)总体中某两层的个体数之比=样本中这两层抽取的个体数之比. 3.统计图表 (1)条形图是用一个单位长度表示一定的数量或频率,根据数量的多少或频率的大小画成长短不同的矩形条,条形图能清楚地表示出每个项目的具体数目或频率; (2)扇形图是用整个圆面积表示总数(100%),用圆内的扇形面积表示各个部分所占总数的百分数; (3)折线统计图反映数据随时间的变化趋势. 4.频率分布直方图 (1)由于频率分布直方图中的纵坐标为,因此涉及纵坐标中含参数的问题,应根据频率之和为1列式求解; (2)根据频率分布直方图(表)求样本数据在某一区间内的频率就是样本数据在该区间内的各组频率的和,而求解相应的频数还要根据频率乘以样本容量; (3)若所求区间包含频率分布直方图中非分组的端点,可以利用“比例法”求解. 5.频率分布直方图与平均数、众数、中位数 用频率分布直方图估计总体数字特征的方法: (1)众数:最高小长方形底边中点的横坐标; (2)中位数:平分频率分布直方图面积且垂直于横轴的直线与横轴交点的横坐标; (3)平均数:频率分布直方图中每个小长方形的面积乘小长方形底边中点的横坐标之和. 6.百分位数 (1)求一组数据的百分位数时,一定要先将该组数据按照从小到大的顺序排列; (2)根据频率分布直方图计算样本数据的百分位数,首先要理解频率分布直方图中各组数据频率的计算方法,其次估计百分位数在哪一组,再应用方程的思想方法及比例法,设出百分位数,利用比例列方程求解. 7.样本的数字特征 (1)平均数、中位数、众数描述其集中趋势,方差和标准差描述波动大小. (2)方差的简化计算公式:或写成,即方差等于原数据平方的平均数减去平均数的平方. 8.总体离散程度的估计 标准差(方差)反映了数据的离散与集中、波动与稳定的程度.标准差(方差)越大,数据的离散程度越大;标准差(方差)越小,数据的离散程度越小. 9.由特征数解决实际问题 三、重难点例题及变式 类型一、抽签法与随机数表法 例.(1)用抽签法进行抽样有以下及格步骤: ①把号码写在形状、大小相同的号签上(号签可以用小球、卡片、纸条制作) ②将总体中的个体编号; ③从这容器中逐个不放回地抽取号签,将取出号签所对应的个体作为样本; ④将这些号签放在一个容器内并搅拌均匀; 这些步骤的先后顺序应为 ( ) A.②①④③ B.②③④① C.①③④② D.①④②③ 【答案】A 【解析】由抽签法的定义可知,抽签法的步骤为: 将总体中的个体编号; 把号码写在形状、大小相同的号签上(号签可以用小球、卡片、纸条制作) 将这些号签放在一个容器内并搅拌均匀; 从这容器中逐个不放回地抽取号签,将取出号签所对应的个体作为样本; 即过程为:②①④③. 故选:A (2)某厂质检员利用随机数表对生产的600个产品进行抽样调查,先将这600个产品进行编号:001,002,003,…,600.从中抽取120个样本,下图是随机数表的第2行到第3行,若从随机数表的第2行第5列开始从左向右读取数据,则得到的第5个编号是( ) 32 12 67 12 31 02 37 02 14 72 31 09 81 47 80 25 13 25 46 08 71 20 34 51 19 72 01 38 47 18 04 92 51 28 02 31 27 46 51 30 A. 098 B. 147 C. 513 D. 310 【答案】C 【解析】由题意可知得到的编号依次为231,023,147,098,513,…,则得到的第5个编号是513. 故选:C 【变式训练1】某单位拟从40名员工中选1人赠送电影票,可采用下面两种选法: 选法一:将这40名员工按1至40进行编号,并相应地制作号码为1至40的40个号签,把这40个号签放在一个暗箱中搅匀,最后随机地从中抽取1个号签,与这个号签编号一致的员工是幸运人选; 选法二:将39个白球与1个红球(除颜色外,其他完全相同)混合放在一个暗箱中搅匀,让40名员工逐一从中不放回地摸取1个球,则摸到红球的员工是幸运人选.试问: (1)这两种选法是否都是抽签法,为什么? (2)这两种选法中每名员工被选中的可能性是否相等? 【答案】(1)选法一是抽签法,选法二不是抽签法;理由见解析;(2)相等 【解析】(1)选法一满足抽签法的特征,是抽签法.选法二不是抽签法,因为抽签法要求所有的号签编号互不相同,而选法二中的39个白球无法相互区分; (2)由于选法一中抽取每个签和选法二中摸到每个球都是等可能的, 因此选法一中抽取1个号签的概率和选法二中摸到红球的概率相等,均为 故这两种选法中每名员工被选中的可能性相等,均为. 【变式训练2】总体由编号为01,02,…,30的30个个体组成.利用所给的随机数表选取6个个体,选取的方法是从随机数表第1行的第3列开始,由左到右一次选取两个数字,则选出来的第5个个体的编号为( ) (第一行)1712    1340    3320    3826    1389    5103    7417    7637 (第二行)1304    0774    2119    3056    6218    3735    9683    5087 A.20 B.26 C.17 D.03 【答案】D 【解析】从随机数表第1行的第3列开始,由左到右一次选取两个数字, 选出的编号依次为:12,13,40,33,20,38,26,13,89,51,03,…, 剔除掉总体编号以外的编号,以及重复的编号, 则选出来的个体的编号依次为:12,13,20,26,03,…, 所以选出来的第5个个体的编号为03. 故选:D. 类型二、分层抽样 例.某学校为了解高一学生每天阅读时长,从高一男生和女生中采用分层抽样的方法抽取部分学生进行调查分析.已知该学校高一学生中男生和女生的比例是,在抽取的学生中男生比女生多24人,则被抽取的学生人数是 . 【答案】168 【解析】设抽取的学生中男生人数为a,女生人数为b, 则,且,解得a=96,b=72, 则被抽取的学生人数是96+72=168. 故答案为:168. 【变式训练1】从24名数学教师,16名物理教师,8名化学教师中,用分层抽样的方法抽取一个容量为6的样本,则抽取数学教师的人数是( ) A.1 B.2 C.3 D.4 【答案】C 【解析】从24名数学教师,16名物理教师,8名化学教师中, 用分层抽样的方法抽取一个容量为6的样本, 则应抽取的数学教师人数是人. 故选:C. 【变式训练2】某校高中年级举办科技节活动,开设A,B两个会场,其中每个同学只能去一个会场且25%的同学去A会场,剩下的同学去B会场.已知A,B会场学生年级及比例情况如下表所示: 高一 高二 高三 A会场 50% 40% 10% B会场 40% 50% 10% 记该校高一、高二、高三年级学生所占总人数的比例分别为x,y,z,利用分层随机抽样的方法从参加活动的全体学生中抽取一个容量为n的样本. (1)求的值; (2)若抽到的B会场的高二学生有150人,求n的值以及抽到的A会场高一、高二、高三年级的学生人数. 【答案】(1);(2),50,40,10. 【解析】(1)设该校高一、高二、高三年级的人数分别为a,b,c, 则去A会场的学生总数为,去B会场的学生总数为,     则对应人数如下表所示: 高一 高二 高三 A会场 B会场 则. (2)依题意,,解得,则抽到的A会场的学生总数为100人, 所以高一年级人数为,高二年级人数为,高三年级人数为. 类型三、统计图表 例.我国新冠肺炎疫情进入常态化,各地有序推进复工复产,下面是某地连续11天复工复产指数折线图,下列说法正确的是( ) A.这11天复工指数和复产指数均逐日增加; B.这11天期间,复产指数增量大于复工指数的增量; C.第3天至第11天复工复产指数均超过80%; D.第9天至第11天复产指数增量大于复工指数的增量; 【答案】CD 【解析】由图可知,第1天到第2天复工指数减少,第7天到第8天复工指数减少,第10天到第11复工指数减少,第8天到第9天复产指数减少,故A错误; 由图可知,第一天的复产指标与复工指标的差大于第11天的复产指标与复工指标的差,所以这11天期间,复产指数增量小于复工指数的增量,故B错误; 由图可知,第3天至第11天复工复产指数均超过80%,故C正确; 由图可知,第9天至第11天复产指数增量大于复工指数的增量,故D正确; 故选:CD 【变式训练1】某保险公司为客户定制了5个险种:甲,一年期短期;乙,两全保险;丙,理财类保险;丁,定期寿险;戊,重大疾病保险.各种保险按相关约定进行参保与理赔.该保险公司对5个险种参保客户进行抽样调查,得到如图所示的统计图表.则下列说法中一定错误的是( ) A.丁险种参保人数超过五成 B.41岁以上参保人数超过总参保人数的五成 C.18-29周岁人群参保的总费用最少 D.人均参保费用不超过5000元 【答案】B 【解析】对于A,由条形图可知丁险种参保比例为, 超过五成,故A正确; 对于B,由扇形图可知,41岁以上参保人数占比:,故B错误; 对于C,由扇形图与折线图可知18-29周岁人群参保人数占比, 人均参保费用在,而54岁及以上人群参保比例虽, 但人均参保费用在6000,所以18-29周岁人群参保的总费用最少,故C正确; 对于D,由扇形图与折线图可知,人均参保费用约 , 不超过5000元,故D正确. 故选:B 【变式训练2】(多选)2021年7月至2022年7月,我国居民消费价格保持平稳,居民消费价格涨跌幅如图所示,则以下一定正确的序号为( ) 备注:,. A.2021年7月至2022年7月全国居民消费价格环比增长率的极差为1% B.2021年7月至2022年7月全国居民消费价格同比增长率的中位数与众数相同 C.从同比增长率看,2022年1月与2022年2月全国居民消费价格一定相同 D.从环比增长率看,2022年6月全国居民消费价格与2022年5月全国居民消费价格相同 【答案】ABD 【解析】对于A,2021年7月至2022年7月全国居民消费价格环比增长率的极差为,所以A正确, 对于B,易得2021年7月至2022年7月全国居民消费价格同比增长率的中位数与众数均为1.5%,所以B正确, 对于C,从同比增长率看,2022年1月与2022年2月全国居民消费价格同比增长率均为0.9%, 但2021年1月与2021年2月全国居民消费价格未知,即不一定相同, 所以2022年1月与2022年2月全国居民消费价格不一定相同,所以C错误; 对于D,从环比增长率看,2022年6月全国居民消费价格增长率为0, 所以2022年6月全国居民消费价格与2022年5月全国居民消费价格相同,所以D正确. 故选:ABD. 类型四、频率分布直方图 例.为贯彻五育并举的教育方针,某校对全体高一年级学生进行了体育测试,并将成绩(单位:分)分为6组:加以统计,得到如图所示的频率分布直方图.已知高一年级共有750名同学参加测试,则成绩达标的(不少于60分)学生人数为 . 【答案】600 【解析】根据频率分布直方图,成绩不低于60分的频率为, 可知该体育测试成绩不少于60分的学生人数为. 故答案为:600 【变式训练1】为了解全市高三学生的体能素质情况,在全市高三学生中随机抽取了1000名学生进行体能测试,并将这1000名学生的体能测试成绩整理成如下频率分布直方图.则直方图中实数的值为 . 【答案】 【解析】由直方图可知:组距为, 所以, 解得. 故答案为: 【变式训练2】某研究小组经过研究发现某种疾病的患病者与未患病者的某项医学指标有明显差异,经过大量调查,得到如下的患病者和未患病者该指标的频率分布直方图: 利用该指标制定一个检测标准,需要确定临界值c,将该指标大于c的人判定为阳性,小于或等于c的人判定为阴性.此检测标准的漏诊率是将患病者判定为阴性的概率,记为;误诊率是将未患病者判定为阳性的概率,记为.假设数据在组内均匀分布,以事件发生的频率作为相应事件发生的概率.则当漏诊率时,误诊率 . 【答案】 【解析】依题可知,左边图形第一个小矩形的面积为,所以, 所以,解得:, 由右边的频率分布直方图可得. 故答案为: 类型五、频率分布直方图与平均数、众数、中位数 例.某校从参加高二年级学业水平测试的学生中抽出80名学生,其数学成绩(均为整数,单位:分)的频率分布直方图如图所示.    (1)求这次测试数学成绩的众数; (2)求这次测试数学成绩的中位数. (3)延伸探究:若本例的条件不变,求数学成绩的平均分. (4)若本例条件不变,求80分以下的学生人数. 【答案】(1)75分;(2)分;(3)72分;(4)56 【解析】(1)由题图知,众数为分. (2)设中位数为x,由于前三个矩形面积之和为0.4,第四个矩形面积为0.3,, 因此中位数位于第四个矩形内,则,解得分. 故这次测试数学成绩的中位数约为分. (3)数学成绩的平均分为分. (4)因为分的频率为, 所以分以下的学生人数为. 【变式训练1】某校抽取100名高二学生期中考试的语文成绩,绘制频率分布直方图(如图所示),其中样本数据分组区间为:.    (1)求频率分布直方图中的值; (2)根据频率分布直方图,估计这100名学生语文成绩的众数和平均数. 【答案】(1);(2)75分 76.2分 【解析】(1)由频率分布直方图知:,解得. (2)由频率分布直方图,众数为:; 这100名学生语文成绩的平均数为: 【变式训练2】(多选)某社区通过简单随机抽样,获得了100户居民的月均用水量数据,并绘制出如图所示的频率分布直方图,由该图可以估计( ) A.平均数>中位数 B.中位数>平均数 C.中位数>众数 D.众数>平均数 【答案】AC 【解析】由图可知,众数为, 估计中位数为,得, 估计平均数, 并且也可以从直方图的的特征判断,此直方图在右边“拖尾”,所以平均数大于中位数. 所以平均数>中位数,中位数>众数. 故选:AC 类型六、百分位数 例.已知一组数据为,则这组数据第60百分位数为 . 【答案】80 【解析】将这组数据从小到大排列为:,共8个, 因为,所以这组数据第60百分位数为第5个数据,即为80. 故答案为:80 【变式训练1】(多选)若一组数据14,17,11,9,12,15,,8,10,7的第65百分位数为12,则的值可能为( ) A.8 B.10 C.13 D.14 【答案】AB 【解析】将这组数据除去后,按从小到大的顺序排序:7,8,9,10,11,12,14,15,17. 因为,所以. 故选:AB 【变式训练2】已知18个整数的中位数为5,第75百分位数也为5,那么这18个数中,5的个数的最小可能值为 . 【答案】6 【解析】由题意,将18个整数由小到大排列,中位数为第9位和第10位数的平均数, 又,则第75百分位数为第14位数,故第14位数是5, 故第9位和第10位数也是5,所以5的个数的最小可能值为6个. 故答案为:6 类型七、样本的数字特征 例.从甲队60人、乙队40人中,按照分层抽样的方法从两队共抽取10人,进行一轮答题.相关统计情况如下:甲队答对题目的平均数为1,方差为1;乙队答对题目的平均数为1.5,方差为0.4,则这10人答对题目的方差为( ) A.0.8 B.0.675 C.0.74 D.0.82 【答案】D 【解析】根据题意,按照分层抽样的方法从甲队中抽取人, 从乙队中抽取人, 这人答对题目的平均数为, 所以这人答对题目的方差为. 故选:D. 【变式训练1】(多选)设一组样本数据满足,则( ) A.拿走,这组数据的方差变大 B.拿走,这组数据的方差变大 C.拿走,这组数据的方差减小 D.拿走,这组数据的方差减小 【答案】AD 【解析】熟知对一组数据,其方差等于各个数据的平方的算术平均值与算术平均值的平方之差,即. 将拿走前后的方差分别记为. 对于A,给五个元素同时加上或减去同一个数,不影响方差,所以可以适当平移,使得剩下的4个元素:的平均值为0, 不妨设,则,,所以. 故 , 所以A正确; 对于B,考虑,则,,所以B错误; 对于C,考虑,则,,所以C错误; 对于D,由于这组数据不全相等,所以,而,所以D正确. 故选:AD. 【变式训练2】已知一组统计数据的平均数为,方差为,则函数的最小值为 . 【答案】 【解析】由,得, 则, 故,当且仅当时等号成立.所以函数的最小值为. 故答案为: 类型八、总体离散程度的估计 例.(多选)下列统计量中,能度量样本的离散程度的是( ) A.样本的标准差 B.样本的中位数 C.样本的极差 D.样本的平均数 【答案】AC 【解析】由标准差的定义可知,标准差考查的是数据的离散程度; 由中位数的定义可知,中位数考查的是数据的集中趋势; 由极差的定义可知,极差考查的是数据的离散程度; 由平均数的定义可知,平均数考查的是数据的集中趋势; 故选:AC. 【变式训练1】某校高一(1)班、(2)班的学生人数分别为40,42,在某次测验中,记(1)班所有学生的成绩分别为,,…,,平均成绩为,方差为,已知,. (1)求,; (2)记(2)班所有学生的成绩分别为,,…,,其平均成绩为82,,试求两个班的所有学生的平均成绩(结果保留整数),并说明哪一个班的成绩比较稳定. 【答案】(1)=80,=100;(2)(1)班的成绩比较稳定 【解析】(1)由题意知,得, . (2)记(2)班的平均成绩为,方差为, 则,所以, 所以两个班所有学生的平均成绩为, , 因为,所以(1)班的成绩比较稳定 【变式训练2】(多选)一个同学投掷10次骰子,记录出现的点数,根据统计结果,在下列情况中可能出现点数6的有( ) A.平均数为3,中位数为4 B.中位数为4,众数为3 C.平均数为2,方差为2.1 D.中位数为3,方差为0.85 【答案】ABD 【解析】对于A:10次点数为符合题意,故A正确; 对于B:10次点数为符合题意,故B正确; 对于C:设10次点数为且,平均数为, 假设有一次点数为,不妨设,由方差公式,代入相关数据得: ,即,显然最大只能取, 不妨设得,此时方程无解,所以, 当时得:,最大只能取, 不妨设得,此时方程有唯一解,, 即10次点数为,但此时平均数为不合题意,所以, 当得取得, 此时方程无解(其余情况也均无解),所以, 当时,平均数为不合题意. 综上所述,假设有一次点数为不成立,故C错误; 对于D:10次点数为符合题意,故D正确. 故选:ABD 类型九、由特征数解决实际问题 例.为进一步推动防范电信网络诈骗工作,预防和减少电信网络诈骗案件的发生,某市开展防骗知识大宣传活动.举办了“网络防骗”知识竞赛,从所有答卷中随机抽取100份作为样本,将样本的成绩(满分100分,成绩均为不低于40分的整数)分成六段:,,…,得到如图所示的频率分布直方图. (1)求图中的值,根据频率分布直方图计算样本成绩的平均数和下四分位数; (2)已知若总体划分为2层,通过分层随机抽样,各层抽取的样本量、样本平均数和样本方差分别为:,,;,,,记总的样本平均数为,样本方差为. 证明:; (3)已知落在的平均成绩是59,方差是7,落在的平均成绩为65,方差是4,求两组样本成绩的总平均数和总方差. 【答案】(1)=65,下四分位数为;(2)证明见解析;(3)=63,=13 【解析】(1)由题意可知,, 解得:; 平均数为, 前2组的频率和为, 前3组的频率和为, 所以下四分位数在第3组,设为, 则,得 所以下四分位数为; (2), ,, 总体方差, 又, , , 因为, , , 同理, 故, ; (3)的频率是,频数是,的频率是,频数是 所以总体平均数, 总体方差 【变式训练1】在2024年世界泳联跳水世界杯蒙特利尔站和柏林站女子10米台跳水决赛中,全红婵奉献了高水准的精彩表现,在决赛中的五个动作惊艳了全世界.在这两场决赛中,7名裁判给选手的五个跳水动作打分,两站裁判对全红婵的打分记录如下:(为了方便计算,采取分数四舍五入取整) A组(蒙特利尔站):80  80  82  78  93 B组(柏林站):81  80  86  99  86 (1)请写出这10个分数的众数、极差以及A,B两组各自的平均成绩; (2)请你根据所学的统计知识,分析两站比赛中,哪一站全红婵发挥更稳定?并说明理由. 【答案】(1)众数为80,极差为21,82.6,86.4;(2)蒙特利尔站发挥更稳定 【解析】(1)易知在这10个分数中,出现最多的是80,所以众数为80, 这10个分数中,最高分为99,最低分为78,所以极差为, A,B两组各自的平均成绩分别为, (2)可以用方差来衡量,方差越小,分数越集中,判断发挥越稳定, 设蒙特利尔站和柏林站的方差分别为,, 易知, , 因为,所以蒙特利尔站发挥更稳定. 【变式训练2】某快递公司招聘快递骑手,该公司提供了两种日工资方案:方案1:规定每日底薪元,快递骑手每完成一单业务提成元;方案2:规定每日底薪元,快递业务的前单没有提成,从第单开始,每完成一单业务提成元,该快递公司记录了每天骑手的人均业务量.现随机抽取天的数据,将样本数据分为、、、、、、七组,整理得到如图所示的频率分布直方图. (1)求频率分布直方图中的值; (2)若仅从人均日收入的角度考虑,请你利用所学的统计学知识为新聘骑手做出日工资方案的选择,并说明理由(同组中的每个数据用该组区间的中点值代替). 【答案】(1)(2)骑手应选择方案2,理由见解析 【解析】(1)解:由频率分布直方图得,解得. (2)解:快递公司人均每日完成快递数量的平均数是: 方案1日工资为:, 方案2日工资为:. 骑手应选择方案2. 四、限时冲刺练 1.某中学有高一学生1400人,高二学生1100人,高三学生1000人,用比例分配的分层随机抽样方法从该校学生中抽取若干人参加荒山绿化活动,若抽取的高三学生人数比抽取的高二学生人数少5,则抽取的高一学生人数为( ) A.60 B.65 C.70 D.75 【答案】C 【解析】设从该校学生中抽取了人,以分层随机抽样的方式按照的比例抽取, 则高二抽取的学生数为,高三抽取的学生数为, 依题意,,解得, 所以高一抽取的学生数为. 故选:C 2.从一个含有个个体的总体中抽取一容量为的样本,当选取抽签法、随机数法和分层随机抽样三种不同方法时,总体中每个个体被抽中的概率分别为,三者关系可能是( ) A. B. C. D. 【答案】B 【解析】因为在抽签法抽样、随机数法抽样和分层随机抽样中,每个个体被抽中的概率均为, 所以. 故选:B 3.国家统计局发布的2018年至2022年我国居民消费水平情况如图所示,则下列说法正确的是(居民消费水平)( )    A.2018年至2022年我国居民消费水平逐年提高 B.2018年至2022年我国城镇居民消费水平逐年提高 C.2018年至2022年我国居民消费水平数据的极差为6463元 D.2022年我国城镇人口数比农村人口数的1.5倍还要多 【答案】D 【解析】对于A,2019年的居民消费水平比2020年的居民消费水平高,故A错误; 对于B, 2018年至2022年我国城镇居民消费水平不是逐年提高,故B错误; 对于C,2018年至2022年我国居民消费水平数据的极差为6473元,故C错误; 对于D,设我国农村人口数为,城镇人口数为, 则,化简得, 所以2022年我国城镇人口数比农村人口数的1.5倍还要多,故D正确. 故选:D 4.为深入贯彻落实习近平总书记对天津工作“三个着力”重要要求,天津持续深化改革,创建全国文明城区,城市文明程度显著提升,人民群众的梦想不断实现.在创建文明城区的过程中,中央文明办对某小区居民进行了创建文明城区相关知识网络问卷调查,从本次问卷中随机抽取了50名居民的问卷结果,统计其得分数据,将所得50份数据的得分结果分为6组:,并整理得到如下的频率分布直方图,则该小区居民得分的第70百分位数为( )    A.89.09 B.86.52 C.84.55 D.81.32 【答案】C 【解析】由题意得, 解得, 因为前4组数据的频率之和为, 前5组数据的频率之和为, 则分位数在内,设分位数为x, 则,解得, 所以分位数约为. 故选:C. 5.已知某4个数据的平均值为6,方差为3,现加入数据8和10,则这6个数据的方差为( ) A.2 B. C. D. 【答案】B 【解析】设原来4个数据依次为a、b、c、d,则, 由方差为3,所以, 即, 所以, 则, 现加入数据8和10,则则其平均数为, 则这6个数据的方差为 故选:B 6.(多选)某火锅店做营业额分析,规定连续5天的日营业额小于10万元即为进入淡季,需制订优惠活动,将连续5天的日营业额的数据记录作为一组样本(记录数据都是自然数),现有4组样本,4组样本中一定符合进入淡季指标的共有( ) A.平均数 B.平均数且极差小于或等于3 C.平均数且标准差 D.众数等于5且极差小于或等于4 【答案】BD 【解析】对于A,举反例:0,0,0,4,11,其平均数,但不符合题意,故A错误; 对于B,假设有数据大于或等于10,由极差小于或等于3, 得到此数据中最小值为,此时数据的平均数必然大于7, 与矛盾,故假设错误,此组数据全部小于10,符合题意,故B正确; 对于C,举反例:1,1,1,1,11,平均数,且标准差, 但不符合进入淡季指标,故C错误; 对于D,众数为5,极差小于等于4,故最大数不超过9,故D正确. 故选:BD 7.(多选)有一组样本数据,其中是最小值,是最大值,则( ) A.的平均数等于的平均数 B.的中位数等于的中位数 C.的标准差不小于的标准差 D.的极差不大于的极差 【答案】BD 【解析】对于选项A:设的平均数为,的平均数为, 则, 因为没有确定的大小关系,所以无法判断的大小, 例如:,可得; 例如,可得; 例如,可得;故A错误; 对于选项B:不妨设, 可知的中位数等于的中位数均为,故B正确; 对于选项C:因为是最小值,是最大值, 则的波动性不大于的波动性,即的标准差不大于的标准差, 例如:,则平均数, 标准差, ,则平均数, 标准差, 显然,即;故C错误; 对于选项D:不妨设, 则,当且仅当时,等号成立,故D正确; 故选:BD. 8.(多选)为了解“全民齐参与城市更美丽”的志愿服务情况,随机抽取了100名志愿者进行问卷调查,将这100名志愿者问卷调查的得分按,,,,分成5组,并绘制出频率分布直方图,如图所示,则下列结论正确的是( ) A. B.估计这100名志愿者问卷调查得分的分位数为85 C.这100名志愿者问卷调查得分的平均数为75(同一组中的数据用该组区间的中点值为代表) D.若采用分层随机抽样从得分在,内的志愿者中抽取8人,则抽取的这8名志愿者得分在内的人数为6 【答案】ABD 【解析】对于A:由,解得,A正确. 对于B:设这100名志愿者问卷调查得分的分位数为, 则,解得,B正确. 对于C:这100名志愿者问卷调查得分的平均数为,C错误. 对于D:根据频率分布直方图可得抽取的这8名志愿者得分在内的人数为,D正确. 故选:ABD. 9.(多选)有一组样本数据,,…,,由这组数据得到新样本数据,,…,,其中(为非零常数,则( ) A.两组样本数据的样本平均数相同 B.两组样本数据的样本中位数相同 C.两组样本数据的样本标准差相同 D.两组样本数据的样本极差相同 【答案】CD 【解析】A:且,故平均数不相同,错误; B:若第一组中位数为,则第二组的中位数为,显然不相同,错误; C:,故方差相同,正确; D:由极差的定义知:若第一组的极差为,则第二组的极差为,故极差相同,正确; 故选:CD 10.现利用随机数表法从编号为00,01,02,…,18,19的20支水笔中随机选取6支,选取方法是从下列随机数表第1行的第9个数字开始由左到右依次选取两个数字,则选出来的第6支水笔的编号为 . 95226000 49840128 66175168 39682927 43772366 27096623 92580956 43890890 06482834 59741458 29778149 64608925 【答案】14 【解析】由题意可知,第一支为01,以后依次为17,09,08,06,14,所以第6支水笔的编号为14. 故答案为:14 11.为培养学生的阅读习惯,某校开展了为期一年的“弘扬传统文化,阅读经典名著”活动.在了解全校学生每年平均阅读了多少本文学经典名著时,甲同学抽取了一个容量为10的样本,并算得样本的平均数为5,方差为9;乙同学抽取了一个容量为8的样本,并算得样本的平均数为6,方差为16.已知甲、乙两同学抽取的样本合在一起组成一个容量为18的样本,则合在一起后的样本平均数为 ,方差为 .(精确到0.1) 【答案】 5.4 12.4 【解析】把甲同学抽取的样本的平均数记为,方差记为; 把乙同学抽取的样本的平均数记为,方差记为; 把合在一起后的样本的平均数记为,方差记为. 则, . 即合在一起后样本的平均数为5.4,方差为12.4. 故答案为:5.4;12.4 12.互不相等的4个正整数从小到大排序为,若它们的平均数为4,且这4个数据的极差是中位数的2倍,则这4个数据的中位数为 . 【答案】/ 【解析】由题意可知,,, 所以,所以, 所以, 又因为,,,是互不相等的4个正整数从小到大排序的, 所以,,或,,, 所以这4个数据的中位数为. 故答案为:. 13.唐三彩,中国古代陶瓷烧制工艺的珍品,它吸取了中国国画、雕塑等工艺美术的特点,在中国文化中占有重要的历史地位,在中国的陶瓷史上留下了浓墨重彩的一笔,唐三彩的生产至今已有1300多年的历史,对唐三彩的复制和仿制工艺,至今也有百余年的历史.某陶瓷厂在生产过程中,随机抽取件工艺品测得其质量指标数据,将数据分成以下六组、、、…、,得到如下频率分布直方图. (1)求出直方图中的值; (2)利用样本估计总体的思想,估计该厂所生产的工艺品的质量指标值的众数和中位数(中位数精确到); (3)现规定质量指标值小于的为二等品,质量指标值不小于的为一等品.已知该厂某月生产了件工艺品,试利用样本估计总体的思想,估计其中一等品和二等品分别有多少件. 【答案】(1);(2)众数为75,中位数为;(3)一等品有件,二等品有件 【解析】(1)在频率分布直方图中,所有直方图的面积之和为, 则,得; (2)众数为75,因为,, 所以中位数在第组,设中位数为,则, 解得. 所以,可以估计该厂所生产的工艺品的质量指标值的众数为75,中位数为; (3)由频率分布直方图可知件工艺品中二等品有件, 一等品有件, 该厂生产的件工艺品中一等品有件, 二等品有件, 所以一等品有件,二等品有件. 14.某地区有小学生9000人,初中生8600人,高中生4400人,教育局组织网络“防溺水”网络知识问答,现用分层抽样的方法从中抽取220名学生,对其成绩进行统计分析,得到如下图所示的频率分布直方图所示的频率分布直方图. (1)根据频率分布直方图,估计该地区所有学生中知识问答成绩的平均数和众数; (2)成绩位列前10%的学生平台会生成“防溺水达人”优秀证书,试估计获得“防溺水达人”的成绩至少为多少分; (3)已知落在内的平均成绩为67,方差是9,落在内的平均成绩是73,方差是29,求落在内的平均成绩和方差. (附:设两组数据的样本量、样本平均数和样本方差分别为:.记两组数据总体的样本平均数为,则总体样本方差) 【答案】(1)平均数为71,众数为75;(2),88;(3)平均成绩为,方差为. 【解析】(1)一至六组的频率分别为, 平均数. 由图可知,众数为. 以样本估计总体,该地区所有学生中知识问答成绩的平均数为分,众数为分. (2)前4组的频率之和为, 前5组的频率之和为, 第分位数落在第5组,设为x,则,解得. “防溺水达人”的成绩至少为分. (3))的频率为,)的频率为, 所以的频率与的频率之比为 的频率与的频率之比为 设内的平均成绩和方差分别为, 依题意有,解得 ,解得, 所以内的平均成绩为,方差为. 学科网(北京)股份有限公司 学科网(北京)股份有限公司 $$

资源预览图

专题08 统计九种考法(知识清单+方法讲解+重难点例题及变式+限时冲刺练)-2024-2025学年高一数学下学期期末复习专题(苏教版2019必修第二册)
1
专题08 统计九种考法(知识清单+方法讲解+重难点例题及变式+限时冲刺练)-2024-2025学年高一数学下学期期末复习专题(苏教版2019必修第二册)
2
专题08 统计九种考法(知识清单+方法讲解+重难点例题及变式+限时冲刺练)-2024-2025学年高一数学下学期期末复习专题(苏教版2019必修第二册)
3
所属专辑
相关资源
由于学科网是一个信息分享及获取的平台,不确保部分用户上传资料的 来源及知识产权归属。如您发现相关资料侵犯您的合法权益,请联系学科网,我们核实后将及时进行处理。