第6章 统计(复习讲义)数学北师大版2019必修第一册

2025-11-21
| 2份
| 77页
| 316人阅读
| 6人下载
精品

资源信息

学段 高中
学科 数学
教材版本 高中数学北师大版必修 第一册
年级 高一
章节 本章小结
类型 教案-讲义
知识点 统计
使用场景 同步教学-单元练习
学年 2025-2026
地区(省份) 全国
地区(市) -
地区(区县) -
文件格式 ZIP
文件大小 6.45 MB
发布时间 2025-11-21
更新时间 2025-11-21
作者 书山路
品牌系列 上好课·上好课
审核时间 2025-11-21
下载链接 https://m.zxxk.com/soft/55039939.html
价格 3.00储值(1储值=1元)
来源 学科网

内容正文:

第6章 统计(复习讲义) 1.数据获取:理解直接获取与间接获取数据的途径,掌握普查和抽样调查的特点及适用场景,明确总体、样本、个体的概念. 2.抽样方法:掌握简单随机抽样、分层随机抽样的原理与操作方法,能根据实际情境选择合适的抽样方法. 3.数据整理与分析:理解频数、频率的概念,学会绘制频率分布直方图;掌握样本的数字特征(平均数、中位数、众数、方差、标准差、百分位数)的计算方法,以及分层随机抽样的均值与方差计算. 4.估计思想:理解用样本估计总体分布、用样本数字特征估计总体数字特征的统计思想,能运用这些方法对总体进行推断. 5.经历 “提出问题 — 设计调查方案 — 收集数据 — 整理分析数据 — 推断总体” 的完整统计过程,提升数据处理的实践能力. ●一、获取数据的途径 (一)直接获取与间接获取数据: 1.直接获取是指通过社会调查或观察、试验等途径获取数据,由此得到的数据称为直接数据(一手数据). 2.间接获取是指借助各种媒介,包括报纸杂志、统计报表和年鉴、广播、电视或互联网等获取数据,此类数据称为间接数据(二手数据). (二)普查和抽查: 1.普查是为了掌握调查对象的整体情况,对全体调查对象进行研究的一种调查方式. 2.一般地说,在调查过程中,从全体调查对象中,按照一定的方法抽取一部分对象作为代表进行调查分析,并以此推断全体调查对象的状况,这种抽取一部分调查对象的方式叫作抽样调查,简称抽样 (三)总体和样本: 1.总体:一般地,当问题明确后,调查对象的范围也就随之确定,调查对象的全体称为总体。例如,要研究某中学高一年级学生的数学成绩,该年级所有学生的数学成绩就构成了总体。 2.样本:在进行抽样调查时,从总体中抽取的部分称为样本,抽取样本的过程称为抽样。样本中个体的数目称为样本容量(简称样本量) ●二、抽样的基本方法 (1) 简单随机抽样: 1. 简单随机抽样:一般地,从N(N为正整数)个不同个体构成的总体中,逐个不放回地抽取n(1≤n<N)个个体组成样本,并且每次抽取时总体内的每个个体被抽到的可能性相等,这样的抽样方法叫作简单随机抽样. 2. 简单随机抽样的具体实施方法: (1)抽签法步骤: ①给总体中的每个个体编号; ②将编号写在形状、大小相同的签上(如纸条、卡片、小球等),把签放入不透明箱子中搅拌均匀; ③每次随机抽取一个签,搅拌剩余签后继续抽取,直至达到预先设定的样本容量. (2)随机数法步骤: (1)把总体中的N个个体依次编码为0,1,2,⋯,N−1; (2)利用工具(转盘、摸球、随机数表、科学计算器或计算机)产生0,1,2,⋯,N−1中的随机数,产生的随机数对应哪个个体,就选取该个体,直至达到预先设定的样本容量. (2) 分层随机抽样: 如果总体是由差异明显的几类个体构成,并且知道每一类个体在总体中所占的百分比,那么按照这个比例抽取每一类个体,样本就能很好地反映总体的规律,也会提高对总体推断的准确性. 将总体按其属性特征分成互不交叉的若干类型(有时称作层),然后在每个类型中按照所占比例随机抽取一定的个体,这种抽样方法通常叫作分层随机抽样. ●三、用样本估计总体分布 (1) 从频数到频率: 频率反映了相对总数而言的相对强度,其所携带的总体信息远超过频数.在实际问题中: (1)若总体容量比较小,频数也可以较客观地反映总体分布; (2)当总体容量较大时,频率就更能客观地反映总体分布. (二)频率分布直方图: 1.频率分布直方图:根据数据的分组情况可以画出频率分布直方图,其绘制规则为: (1)每个小矩形的底边长是该组的组距; (2)每个小矩形的高是该组的频率与组距的比; (3)每个小矩形的面积等于该组的频率. 2.频率分布直方图以面积的形式反映了数据落在各个小组的频率大小,直观展现了数据的分布形态(如集中趋势、离散程度等) (三)频率折线图: 1.绘制频率折线图的方法通常是: (1)按照分组原则,在频率分布直方图的左边和右边各加一个区间; (2)从所加的左边区间的中点开始,用线段依次连接各个矩形的顶端中点,直至右边所加区间的中点. 2.频率折线图可用于估计总体的分布情况,是对频率分布直方图的补充和延伸. 3.一般地,样本容量越大,用样本的频率分布去估计总体的分布就越精确. (1)随着样本容量的增大,所划分的区间数可以随之增多,而每个区间的长度则会相应减小; (2)相应的频率折线图就会越来越接近于一条光滑曲线,此时可进一步用这条光滑曲线来更精准地刻画总体的分布规律. ●四、用样本估计总体的数字特征 (1) 样本的数字特征: 1.集中趋势的刻画:平均数、中位数、众数 (1)平均数:是这组数据的平均值,是统计中最常用的量,能反映数据的平均水平. (2)中位数:一般地,将这组数据按从小到大的顺序排列后,“中间” 的那个数据为这组数据的中位数,它使数据被分成的两部分的数量是一样的. (3)众数:是这组数据中出现次数最多的数据. 2.离散程度的刻画:极差与方差 (1)极差:是数据中最大值和最小值的差,计算简单,但没有充分利用其他数据,对数据离散程度的刻画较为粗略. (2)方差:刻画的是数据偏离平均数的离散程度。由于方差的单位是原始数据单位的平方,为了使刻画离散程度的量具有与原始数据相同的单位,实际应用中也常使用方差的算术平方根(即标准差). (2) 分层随机抽样的均值与方差 1.分层随机抽样的平均数: 2.分层随机抽样的方差: (3) 百分位数: 1.百分位数的定义:一般地,当总体是连续变量时,给定一个百分数p(0<p<1),总体的p分位数(百分位数)具有这样的特点:总体数据中的任意一个数小于或等于它的可能性是p. 2.计算一组n个数据的p分位数,可遵循以下步骤: (1)排序:按照从小到大的顺序排列原始数据; (2)计算位置指标i:计算i=np; (3)确定分位数: 若i不是整数,找到大于i的最小整数j,则p分位数为第j项数据; 若i是整数,则p分位数为第i项与第(i+1)项数据的平均数. 题型一 简单随机抽样的特征及适用条件 【例1】(24-25高一下·全国·课后作业)下列抽样方法是简单随机抽样的是(    ) A.在某年明信片销售活动中,规定每100万枚为一个开奖组,号码的后四位是2709的为三等奖 B.某车间包装一种产品,在自动包装传送带上,每隔30分钟抽一包产品,称其重量是否合格 C.从8台电脑中逐个不放回地随机抽取2台,进行质量检验,假设8台电脑已编好号,对编号随机抽取 D.仓库中有1万支奥运火炬,从中一次性抽取100支火炬进行质量检查 【变式1-1】(2025高三·全国·专题练习)下列抽样的方式属于简单随机抽样的个数为(    ) ①将500个个体编号,把号签放在一个不透明的容器内搅拌均匀,从中逐个抽取50个作为样本;②某班有55名同学指定个子最高的5名同学参加学校组织的篮球赛;③福利彩票用摇奖机摇奖. A.0 B.1 C.2 D.3 【变式1-2】(多选)(25-26高一上·全国·单元测试)下列从总体中抽得样本的方法是简单随机抽样的是(    ) A.总体编号为1~75,随机依次选出编号范围内的10个数作为抽中的编号 B.总体编号为1~75,在0~99之间产生随机整数r,若或,则舍弃,重新抽取 C.总体编号为1~75,在0~99之间产生随机整数r,r除以75的余数作为抽中的编号,若余数为0,则抽中75 D.总体编号为6001~6879,在1~879之间产生随机整数r,把作为抽中的编号 题型二 抽签法及其应用 【例2】(24-25高一下·全国·课后作业)某班有50名学生,现选取6名学生参加一个讨论会,每名学生被选到的机会相等.请用抽签法设计一个选取方案. 【变式2-1】(2024高三·全国·专题练习)在对101个人进行一次抽样时,先采用抽签法从中剔除1个人,再在剩余的100个人中随机抽取10个人,那么下列说法正确的是(   ) A.这种抽样方法对于被剔除的个体是不公平的,因为他们失去了被抽到的机会 B.每个人在整个抽样过程中被抽到的机会均等 C.由于采用了两步进行抽样,所以无法判断每个人被抽到的可能性是多少 D.每个人被抽到的可能性不相等 【变式2-2】(24-25高二下·上海·阶段练习)从101个人进行一次抽样时,先采用抽签法从中剔除1个人,再在剩余的100个人中采用随机数表法抽取10个人,那么下列说法正确的是(    ) A.这是一种科学的抽样方法 B.这种抽样方法对于被剔除的个体是不公平的,因为他们失去了被抽到的机会 C.由于采用了两步进行抽样,所以无法判断每个人被抽到的可能性是多少 D.每个人被抽到的可能性不相等 题型三 随机数表法的应用 【例3】(25-26高一上·全国·单元测试)当今,青少年视力水平的下降已引起全社会的关注.为了了解某中学高三年级400名学生的视力情况,从中抽取了50名学生进行视力检测. (1)在这个问题中,总体、样本各是什么? (2)为深入了解这50名学生的视力情况,从中随机抽取6人,分别写出利用抽签法和随机数法抽取该样本的过程. 【变式3-1】(24-25高二下·上海·阶段练习)某公司利用随机数表对生产的900支新冠疫苗进行抽样测试,先将疫苗按000,001,..,899进行编号,从中抽取90个样本,若选定从第4行第4列的数开始向右读数,(下面摘取了随机数表中的第3行至第5行),根据下图,读出的第6个数的编号是 . 1676622766 5650267107 3290797853 1355385859 8897541410 1256859926 9682731099 1696729315 5712101421 8826498176 5559563564 3854824622 3162430990 0618443253 2383013030 【变式3-2】(23-24高二上·四川广安·阶段练习)因乙肝疫苗事件,需要对某种疫苗进行检测,现从支中抽取支进行检验,利用随机数表抽取样本时,先将支按进行编号,如果从随机数表第行第列的数开始向右读,依次读取三位数,则得到的第个样本个体的编号是 (下面摘取了随机数表第行至第行) 题型四 简单随机抽样的概率 【例4】(24-25高一下·福建福州·期末)用抽签法从学号为1到50的50名学生(其中含学生李华)中不放回抽取5名学生进行问卷调查,每次抽取一个号码,共抽取5次,设李华第一次被抽到的概率为,第五次被抽到的概率为,则(    ) A.a = , B.a = , C.a = , D.a = , 【变式4-1】(24-25高一上·江西宜春·期末)某班级有名学生,班主任用不放回的简单随机抽样的方法从这名学生中抽取人进行家访,则同学被抽到的可能性为(    ) A. B. C. D. 【变式4-2】(2025高二下·湖南娄底·学业考试)某中学七年级有人,八年级有人,九年级有人,若每人被抽到的可能性都为,用随机数法在该学校抽取容量为的样本,则(    ) A. B. C. D. 题型五 分层抽样问题 【例5】(24-25高一下·湖南岳阳·期末)某校高中生共有3600人,其中高一年级1300人,高二年级人,高三年级1100人,现采取分层抽样法抽取容量为36的样本,那么高一、高二、高三各年级抽取的人数分别为(  ) A.11,14,11 B.12,12,12 C.14,12,10 D.13,12,11 【变式5-1】(23-24高一下·湖北武汉·期末)某中学高一年级有400人,高二年级有320人,高三年级有280人,若用随机数法在该中学抽取容量为n的样本,每人被抽到的可能性都为0.3,则n等于(   ) A.160 B.200 C.280 D.300 【变式5-2】(多选)(25-26高一上·全国·单元测试)某高中学校从有120名学生的“航天”社团中随机抽取30名参加一个交流会,若按社团中高一、高二、高三年级的成员人数比例分层随机抽样,则高一年级抽取10人;若按性别比例分层随机抽样,则男生抽取18人.则下列结论正确的有 (    ) A.样本量为30 B.120名社团成员中男生有72人 C.高二与高三年级的社团成员共有85人 D.高一年级的社团成员中女生最多有48人 题型六 确定极差、组数与组距 【例6】(19-20高一·全国·课后作业)从标准质量为500g的一批洗衣粉中,随机抽查了50袋,测得的质量数据如下(单位:g): 494  498  493  494  496  492  490  490  500  499  494  495  482  485  502 493  505  485  501  491  493  500  509  512  484  509  510  494  497  498 504  498  483  510  503  497  502  498  497  500  493  499  505  493  491 497  515  503  498  518 (1)找出这组数的最值,求出极差; (2)以为第一个分组的区间,作出这组数的频率分布表. 【变式6-1】(2023高三·全国·专题练习)有40个数据,其中最大值为35,最小值为14,若取组距为4,则分成的组数是 【变式6-2】(2023·上海·模拟预测)某校抽取100名学生测身高,其中身高最大值为,最小值为,根据身高数据绘制频率组距分布直方图,组距为5,且第一组下限为153.5,则组数为 . 题型七 频率分布表及其应用 【例7】(23-24高二·上海·课堂例题)某学生第二天要参加100m短跑比赛,他记录了比赛前一日集训中20次100m短跑的成绩(单位:s): 13.4 13.6 14.3 15.3 12.8 13.1 14.5 13.8 14.2 15.0 13.4 13.7 13.5 12.5 12.9 14.9 12.9 14.6 14.3 15.5 (1)制作频率分布表; (2)试估计该学生在100m短跑比赛中用时低于14s的可能性. 【变式7-1】(21-22高一·全国·课后作业)某棉纺厂为了了解一批棉花的质量,从中随机抽取了25根棉花纤维的长度(棉花纤维的长度是棉花质量的重要指标)(单位:mm),所得数据都在区间[5,40]中,具体数据如下: 12  14  16  17  17 19  20  20  21  22 23  23  23  24  24 25  25  26  27  27 28  29  30  32  34 试估计这批棉花的质量情况. 【变式7-2】(20-21高一·全国·课后作业)有一个容量为100的样本,数据分组及各组的频数如下:,6;,16;,18;,22;,20;,10;,8. (1)列出样本的频率分布表; (2)估计总体中在的数据所占的百分比. 题型八 绘制频率分布直方图及折线图 【例8】(22-23高一下·辽宁·阶段练习)有一个容量为60的样本(60名学生的数学考试成绩),分组情况如下表: 分组 频数 3 6 12 频率 0.3    (1)补全表中所剩的空格; (2)画出频率分布直方图和频率分布折线图. 【变式8-1】(2024高一下·全国·专题练习)随机观测生产某种零件的某工厂25名工人的日加工零件数,获得数据如下:30,42,41,36,44,40,37,37,25,45,29,43,31,36,49,34,33,43,38,42,32,34,46,39,36,根据上述数据得到样本的频率分布表如下: 分组 频数 3 5 8 频率 0.12 0.20 0.32 (1)确定样本频率分布表中,,和的值; (2)根据上述频率分布表,画出样本频率分布直方图与折线图. 【变式8-2】(22-23高一·全国·随堂练习)一种袋装食品用生产线自动装填,每袋质量大约为50g,但由于某些原因,每袋食品不会恰好是50g.现随机抽取100袋食品,测得的质量数据如下: 单位:g 57      46      49      54      55      58      49      61      51      49 51      60      52      54      51      55      60      56      47      47 53      51      48      53      50      52      40      45      57      53 52      51      46      48      47      53      47      53      44      47 50      52      53      47      45      48      54      52      48      46 49      52      59      53      50      43      53      46      57      49 49      44      57      52      42      49      43      47      46      48 51      59      45      45      46      52      55      47      49      50 54      47      48      44      57      47      53      58      52      48 55      53      57      49      56      56      57      53      41      48 (1)为了获得样本数据的分布情况,试制作频率分布表; (2)绘制频率分布直方图及频率分布折线图. 题型九 频率分布直方图的实际应用 【例9】(22-23高一·全国·随堂练习)据媒体报道:某市今年前4个月空气质量为优良.某中学数学兴趣小组据此提出了“今年究竟能有多少天空气质量达到优良”的问题.他们上网查询环境保护部公布的环境空气质量标准,得到下表所示的空气质量指数分级相关信息: 空气质量指数分级 空气质量指数 空气质量级别 一级(优) 二级(良) 三级(轻度污染) 空气质量指数 大于300 空气质量级别 四级(中度污染) 五级(重度污染) 六级(严重污染) 他们同时查询市环保监测站提供的资料,并从数据中随机抽取了今年1—4月份中30天的空气质量指数. 某市30天空气质量指数: 30 32 40 42 45 45 77 83 85 87 90 113 127 153 132 98 65 50 53 57 64 66 77 92 98 130 46 150 187 201 (1)根据空气分级质量标准和抽查的空气质量指数,绘制频率分布直方图. (2)试根据频率分布直方图,估计该市今年1-4月(按120天计算)空气质量是优良(包括一、二级)的天数,并评估该市的空气质量水平.到互联网查找资料,与全国其他城市比较,该市空气质量处于什么水平? 【变式9-1】(25-26高三上·河北邢台·阶段练习)从某小区抽取100户居民用户进行月用电量(单位:)调查,将得到的数据按分为6组,画出的频率分布直方图如图所示,则在被调查的用户中,月用电量落在内的户数为(    ) A.35 B.40 C.42 D.45 【变式9-2】(22-23高一上·全国·单元测试)下面是一次考试几个班同学的数学成绩(单位:分,满分为150分): 121,111,128,98,118,124,137,125,121,140, 129,122,101,103,134,126,129,132,99,132, 141,125,122,120,139,106,142,119,134,119, 122,126,114,141,132,125,111,145,110,123, 118,127,129,141,103,117,116,131,134,143, 113,142,125,136,119,110,107,124,137,100, 115,144,96,138,120,121,140,115,123,142, 119,133,120,146,119,144,119,122,119,136, 137,132,112,133,134,117,127,133,126,127, 141,119,131,131,123,128,133,126,129,134, 127,133,121,135,107,132,121,137,118,117, 107,133,131,131,125,126,140,127,114,136, 118,138,127,143,81,140,135,137,142,136, 139,124,138,119,122,136,141,119,118,114. (1)你觉得怎样直观地表示出上述数据的大致分布情况(比如哪个分数段的人数比较多,哪个分数段的人数比较少)? (2)画出频率分布直方图,看这次考试的整体分布,能说明哪些问题? 题型十 补全频率分布直方图 【例10】(2025高一下·全国·专题练习)为了让学生了解环保知识,增强环保意识,某中学举办了一次环保知识竞赛,共有900名学生参加了这次竞赛.为了了解本次竞赛的成绩情况,从中抽取了部分学生的成绩(得分均为整数,满分为100分)进行统计.请你根据尚未完成并有局部污损的频数分布表和频数分布直方图,解答下列问题: 分组 频数 频率 50.5~60.5 4 0.08 60.5~70.5 0.16 70.5~80.5 10 80.5~90.5 16 0.32 90.5~100.5 合计 50 (1)填充频数分布表的空格(将答案直接填在表格内); (2)补全频数分布直方图; (3)若成绩在75.5~85.5的学生为二等奖,问获得二等奖的学生约为多少人? 【变式10-1】(24-25高一下·广西·期末)某校举办了一次环境保护知识竞赛,为了解学生的环境保护知识掌握程度,学校采用简单随机抽样从全校名学生中抽取了一个容量为的样本,已知样本的成绩全部分布在区间内,根据调查结果绘制学生成绩的频率分布直方图如图所示,则频率分布直方图中(   ) A. B. C. D. 【变式10-2】(24-25高一上·江西赣州·开学考试)为弘扬中华传统文化,某校组织若干名学生参加汉字听写大赛,为了解学生整体听写能力,从中抽取部分学生的成绩(得分取正整数,满分为100分)进行统计分析,请根据尚未完成的下列图表,解答问题:    分组 49.5~59.5 59.5~69.5 69.5~79.5 79.5~89.5 89.5~100.5 频数 2 a 20 16 8 频率 0.04 0.08 0.40 0.32 b (1)本次抽样调查的样本容量为_______,此样本中成绩的中位数落在_______范围内.表中_______,_______; (2)补全频数分布直方图; (3)若该校共有初中生3000名,若成绩超过80分为优秀,请估计该校汉字听写能力为优秀的约有多少人. 题型十一 由频率分布直方图计算频率、频数、样本容量、总体容量 【例11】(24-25高一上·全国·周测)某校为了解高一期末数学考试的情况,从高一的所有学生数学试卷中随机抽取n份试卷进行成绩分析,得到数学成绩频率分布直方图(如图所示),其中成绩在的学生人数为6. (1)求直方图中x的值; (2)求n的值. 【变式11-1】(2025高一上·全国·专题练习)某市为修订用水政策,制定更合理的用水价格,随机抽取50户居民,得到他们的月均用水量全部介于1t至21t之间,将结果按如下方式分成八组:第一组,第二组,…,第八组,下图是按上述分组方法得到的频率分布直方图的一部分,已知第六组有4户居民,则第七组的频率为(    ) A.0.04 B.0.05 C.0.06 D.0.07 【变式11-2】(2025高二·全国·专题练习)某校从高一年级学生的体测成绩(规定满分为100分)中,随机抽取了80名学生的成绩,并进行分组:,绘制成如下频率分布直方图,则频率分布直方图中a的值是 .    题型十二 样本数字特征的计算 【例12】(24-25高一下·贵州遵义·阶段练习)已知样本容量为5的样本平均数为3,方差为,将数据9加入原样本得到样本容量为6的新样本,若新样本的平均数为,方差为,则(    ) A. B. C. D. 【变式12-1】(2025·河北邯郸·一模)已知组数据“”和组数据“”()的平均数分别为80,90,方差分别为15,20,若,则由这两组数据构成的所有数据的总体方差为(    ) A.15 B.32 C.35 D.42 【变式12-2】(多选)(23-24高二下·浙江宁波·期末)一个同学投掷10次骰子,记录出现的点数,根据统计结果,在下列情况中可能出现点数6的有(    ) A.平均数为3,中位数为4 B.中位数为4,众数为3 C.平均数为2,方差为2.1 D.中位数为3,方差为0.85 题型十三 根据数字特征求参数 【例13】(24-25高一下·福建龙岩·期末)已知一组数据的平均值为3,方差为21,删去一个数后,平均值不变,方差变为24,则原来数据的个数的值为 . 【变式13-1】(23-24高一下·青海·期末)某篮球运动员进行投篮训练,共进行了10组,每组投篮55次,每组投篮命中的个数分别为m,n,48,47,48,50,45,47,49,50.已知这组数据的平均数为48,方差为7,则(    ) A.10 B. C. D.5 【变式13-2】(25-26高三上·上海·阶段练习)样本数据20,24,6,15,18,10,42,57,2,7的极差为,中位数为,则 . 题型十四 众数、平均数、中位数的比较 【例14】(24-25高一下·山东泰安·阶段练习)如图,下列频率分布直方图显示了三种不同的分布形态.图(1)称对称形态,图(2)称不规则形态,图(3)称“右拖尾”形态,根据图形作出以下判断,正确的是(    ) A.图(1):平均数>中位数=众数 B.图(2):众数>平均数 C.图(3):众数<中位数<平均数 D.图(3):众数<平均数<中位数 【变式14-1】(24-25高一下·甘肃兰州·期中)平均数、中位数和众数都是刻画一组数据的集中趋势的信息,它们的大小关系和数据分布的形态有关.在下图分布形态中,、、分别对应这组数据的平均数、中位数和众数,则下列关系正确的是(   ) A. B. C. D. 【变式14-2】(2024·黑龙江哈尔滨·三模)如图所示,下列频率分布直方图显示了三种不同的形态.图(1)形成对称形态,图(2)形成“右拖尾”形态,图(3)形成“左拖尾”形态,根据所给图作出以下判断,正确的是(    ) A.图(1)的平均数=中位数>众数 B.图(2)的众数<中位数<平均数 C.图(2)的平均数<众数<中位数 D.图(3)的中位数<平均数<众数 题型十五 极差、方差、标准差问题 【例15】(24-25高一下·河南濮阳·期末)高一某班有24名男生和40名女生,某次数学测试中,男生的平均分与女生的平均分之差为4,若男生分数的方差为94,全班分数的方差为84,则女生分数的方差为(   ) A.90 B.86 C.78 D.72 【变式15-1】(2025·湖北·模拟预测)若一组数据的平均值,方差,若删去一个数之后,平均值没有改变,方差变为40,则这组数据的个数(   ) A.5 B.6 C.7 D.8 【变式15-2】(多选)(2024·广东·模拟预测)一组数据的平均值为5,方差为2,极差为7,中位数为6,记,的平均值为,方差为,极差为,中位数为,则(   ) A. B. C. D. 题型十六 总体百分位数的估计 【例16】(2025·陕西·模拟预测)已知一组数据按从小到大的顺序排列为,若该组数据的第60百分位数与这组数据的中位数相等,则实数的值为 . 【变式16-1】(25-26高二上·福建宁德·阶段练习)数据13,27,24,12,14,30,15,17,19,23的第60百分位数是(    ). A.19 B.21 C.23 D.23.5 【变式16-2】(25-26高二上·海南·月考)某同学统计了自2000年以来,中国代表队在历届奥运会获得金牌数如下(不含中国香港、中国台湾):26,28,32,38,38,40,48,则这组数据的70%分位数为(   ) A.26 B.32 C.35 D.38 基础巩固通关测 1.(2004·上海·高考真题)某地2004年第一季度应聘和招聘人数排行榜前5个行业的情况列表如下: 行业名称 计算机 机械 营销 物流 贸易 应聘人数 215830 200250 154676 74570 65280 行业名称 计算机 营销 机械 建筑 化工 招聘人数 124620 102935 89115 76516 70436 若用同一行业中应聘人数和招聘人数的比值的大小来衡量该行业的就业情况,则根据表中数据,就业形势一定是(    ) A.计算机行业好于化工行业 B.建筑行业好于物流行业 C.机械行业最紧张 D.营销行业比贸易行业紧张 2.(14-15高一·全国·课后作业)已知样本数据:10,8,6,10,13,8,10,12,11,7,8,9,11,9,12,9,10,11,12,11.那么频率为0.2的是(    ) A. B. C. D. 3.(25-26高一上·全国·开学考试)某班30位同学的安全知识测试成绩统计如表,其中有两个数据被遮盖,不影响下列关于成绩的统计量的是(    ) 成绩 24 25 26 27 28 29 30 人数 ▄ ▄ 3 3 6 7 9 A.平均数,众数 B.中位数,众数 C.平均数,方差 D.中位数,方差 4.(24-25高一上·贵州·阶段练习)已知甲、乙两名同学在高一的6次数学周测的成绩统计如图,则下列说法不正确的是(    ) A.甲的中位数高于乙的中位数 B.若甲、乙两组数据的平均数分别为,则 C.甲成绩的极差大于乙成绩的极差 D.甲成绩比乙成绩稳定 5.(23-24高一下·北京·期末)甲、乙两人某体育项目近五次训练成绩如图,设甲、乙两人成绩的平均数分别为,标准差分别为,则下列结论正确的是(   )    A. B. C. D. 6.(25-26高二上·黑龙江齐齐哈尔·月考)已知,若,,,的中位数为2,则(  ) A. B. C.2 D.1 7.(24-25高一下·安徽·期末)在一组样本数据中,0,1,2,3出现的频数分别为,,,,则下面四种情形中,对应样本的标准差最小的一组是(   ) A., B., C., D., 8.(25-26高二上·湖北·阶段练习)甲、乙、丙、丁对某组数据(该组数据由5个整数组成)进行分析,得到以下数字特征,则不能判断这组数据一定都小于13的是(   ) A.甲:中位数为10,众数为12 B.乙:中位数为10,极差为3 C.丙:平均数为9,方差为 D.丁:平均数为9,极差为4 9.(多选)(20-21高二下·山东菏泽·期末)在发生某公共卫生事件期间,有专业机构认为该事件在一段时间没有发生大规模群体感染的标志为“连续10天,每天新增疑似病例不超过7人”,根据过去10天甲、乙、丙、丁四地新增疑似病例数据,一定符合该标志的是(    ) A.甲地:中位数为2,众数为3 B.乙地:总体平均数为1,中位数为1 C.丙地:极差为3,第80百分位数为4 D.丁地:总体平均数为2,总体方差为3 10.(多选)(24-25高一下·陕西西安·期末)已知互不相等的数据,,,,,的平均数为,方差为,则下列选项中正确的是(    ) A.数据,,…,的平均数为 B.数据,,…,的标准差为 C.给原数据增加一个数据,且,若这七个数据的方差为,则 D.给原数据增加一个数据,且,若这七个数据的方差为,则 11.(24-25高一下·山西·阶段练习)若一组数据、、、、,这组数据的平均数为,则这组数据的中位数为 . 12.(23-24高二下·四川成都·开学考试)已知一组数据,,,的方差为4,若数据,,,的方差为36,则b的值为 . 能力提升进阶练 13.(24-25高一下·广东东莞·期末)某班级举办“以赛促学,挑战自我”数学竞赛活动,活动后将参赛的40名学生成绩分成5组:①,②,③,④,⑤.通过统计分析,得到如图所示的频率分布直方图,已知①组、②组的频率之和为,①组和⑤组的频率相同. (1)估计此次考试成绩的众数、平均数; (2)已知②组学生成绩的平均数和方差分别为64和50,④组学生成绩的平均数和方差分别为84和70,据此计算②组和④组所有学生成绩的方差. 参考公式:,其中为总样本平均数. 14.(22-23高一下·四川泸州·期末)《中华人民共和国节约能源法》要求各行各业须采取技术上可行、经济上合理以及环境和社会可以承受的措施,从能源生产到消费各个环节,降低消耗,减少损失,制止浪费,有效合理利用能源.某家庭积极响应,采用节水龙头以降低家庭用水量,并记录了使用节水龙头后50天的日用水量数据(单位:),得到频数分布表如下: 日用水量 频数 1 5 13 10 16 5 (1)据以上数据,作出使用了节水龙头50天的日用量数据的频率分布直方图; (2)若该家庭使用节水龙头前,每年的用水费用支出约为674.5元,且某地居民用水费用为3.09元,据此估计该家庭使用节水龙头后,一年能节省多少用水费用?(一年按365天计算,同一组中的数据以这组数据所在区间中点的值作代表.) 15.(24-25高一下·广东广州·期末)某研究小组经过研究发现某种疾病的患病者与未患病者的某项医学指标有明显差异,经过大量调查,得到如下的患病者和未患病者该指标的频率分布直方图: 利用该指标制定一个检测标准,需要确定临界值c,将该指标大于c的人判定为阳性,小于或等于c的人判定为阴性.此检测标准的漏诊率是将患病者判定为阴性的概率,记为;误诊率是将未患病者判定为阳性的概率,记为.假设数据在组内均匀分布,以事件发生的频率作为相应事件发生的概率. (1)当时,求与; (2)设函数,当时,求的解析式,并求在区间上的最小值. 16.(24-25高一下·吉林长春·期末)文明城市是反映城市整体文明水平的综合性荣誉称号,作为普通市民,既是文明城市的最大受益者,更是文明城市的主要创造者.长春市为提高市民对文明城市创建的认识,举办了“创建文明城市”知识竞赛,从所有答卷中随机抽取100份作为样本,将样本的成绩(满分100分,成绩均不低于40分)分成六段:,,……,,得到如图所示的频率分布直方图. (1)求频率分布直方图中的值; (2)试估计样本成绩的平均数和上四分位数: (3)已知落在的平均成绩是54,方差是7,落在的平均成绩为66,方差是4,求两组成绩合并后的平均数和方差. 17.(2011·湖南·高考真题)某河流上的一座水力发电站,每年六月份的发电量(单位:万千瓦时)与该河上游在六月份的降雨量(单位:毫米)有关据统计,当时,;每增加10,增加5.已知近20年的值为:140,110,160,70,200,160,140,160,220,200,110,160,160,200,140,110,160,220,140,160. (1)完成如下的频率分布表:近20年六月份降雨量频率分布表 (2)假定今年六月份的降雨量与近20年六月份降雨量的分布规律相同,并将频率视为概率,求今年六月份该水力发电站的发电量低于490(万千瓦时)或超过530(万千瓦时)的概率. 1 / 3 学科网(北京)股份有限公司 $ 第6章 统计(复习讲义) 1.数据获取:理解直接获取与间接获取数据的途径,掌握普查和抽样调查的特点及适用场景,明确总体、样本、个体的概念. 2.抽样方法:掌握简单随机抽样、分层随机抽样的原理与操作方法,能根据实际情境选择合适的抽样方法. 3.数据整理与分析:理解频数、频率的概念,学会绘制频率分布直方图;掌握样本的数字特征(平均数、中位数、众数、方差、标准差、百分位数)的计算方法,以及分层随机抽样的均值与方差计算. 4.估计思想:理解用样本估计总体分布、用样本数字特征估计总体数字特征的统计思想,能运用这些方法对总体进行推断. 5.经历 “提出问题 — 设计调查方案 — 收集数据 — 整理分析数据 — 推断总体” 的完整统计过程,提升数据处理的实践能力. ●一、获取数据的途径 (一)直接获取与间接获取数据: 1.直接获取是指通过社会调查或观察、试验等途径获取数据,由此得到的数据称为直接数据(一手数据). 2.间接获取是指借助各种媒介,包括报纸杂志、统计报表和年鉴、广播、电视或互联网等获取数据,此类数据称为间接数据(二手数据). (二)普查和抽查: 1.普查是为了掌握调查对象的整体情况,对全体调查对象进行研究的一种调查方式. 2.一般地说,在调查过程中,从全体调查对象中,按照一定的方法抽取一部分对象作为代表进行调查分析,并以此推断全体调查对象的状况,这种抽取一部分调查对象的方式叫作抽样调查,简称抽样 (三)总体和样本: 1.总体:一般地,当问题明确后,调查对象的范围也就随之确定,调查对象的全体称为总体。例如,要研究某中学高一年级学生的数学成绩,该年级所有学生的数学成绩就构成了总体。 2.样本:在进行抽样调查时,从总体中抽取的部分称为样本,抽取样本的过程称为抽样。样本中个体的数目称为样本容量(简称样本量) ●二、抽样的基本方法 (1) 简单随机抽样: 1. 简单随机抽样:一般地,从N(N为正整数)个不同个体构成的总体中,逐个不放回地抽取n(1≤n<N)个个体组成样本,并且每次抽取时总体内的每个个体被抽到的可能性相等,这样的抽样方法叫作简单随机抽样. 2. 简单随机抽样的具体实施方法: (1)抽签法步骤: ①给总体中的每个个体编号; ②将编号写在形状、大小相同的签上(如纸条、卡片、小球等),把签放入不透明箱子中搅拌均匀; ③每次随机抽取一个签,搅拌剩余签后继续抽取,直至达到预先设定的样本容量. (2)随机数法步骤: (1)把总体中的N个个体依次编码为0,1,2,⋯,N−1; (2)利用工具(转盘、摸球、随机数表、科学计算器或计算机)产生0,1,2,⋯,N−1中的随机数,产生的随机数对应哪个个体,就选取该个体,直至达到预先设定的样本容量. (2) 分层随机抽样: 如果总体是由差异明显的几类个体构成,并且知道每一类个体在总体中所占的百分比,那么按照这个比例抽取每一类个体,样本就能很好地反映总体的规律,也会提高对总体推断的准确性. 将总体按其属性特征分成互不交叉的若干类型(有时称作层),然后在每个类型中按照所占比例随机抽取一定的个体,这种抽样方法通常叫作分层随机抽样. ●三、用样本估计总体分布 (1) 从频数到频率: 频率反映了相对总数而言的相对强度,其所携带的总体信息远超过频数.在实际问题中: (1)若总体容量比较小,频数也可以较客观地反映总体分布; (2)当总体容量较大时,频率就更能客观地反映总体分布. (二)频率分布直方图: 1.频率分布直方图:根据数据的分组情况可以画出频率分布直方图,其绘制规则为: (1)每个小矩形的底边长是该组的组距; (2)每个小矩形的高是该组的频率与组距的比; (3)每个小矩形的面积等于该组的频率. 2.频率分布直方图以面积的形式反映了数据落在各个小组的频率大小,直观展现了数据的分布形态(如集中趋势、离散程度等) (三)频率折线图: 1.绘制频率折线图的方法通常是: (1)按照分组原则,在频率分布直方图的左边和右边各加一个区间; (2)从所加的左边区间的中点开始,用线段依次连接各个矩形的顶端中点,直至右边所加区间的中点. 2.频率折线图可用于估计总体的分布情况,是对频率分布直方图的补充和延伸. 3.一般地,样本容量越大,用样本的频率分布去估计总体的分布就越精确. (1)随着样本容量的增大,所划分的区间数可以随之增多,而每个区间的长度则会相应减小; (2)相应的频率折线图就会越来越接近于一条光滑曲线,此时可进一步用这条光滑曲线来更精准地刻画总体的分布规律. ●四、用样本估计总体的数字特征 (1) 样本的数字特征: 1.集中趋势的刻画:平均数、中位数、众数 (1)平均数:是这组数据的平均值,是统计中最常用的量,能反映数据的平均水平. (2)中位数:一般地,将这组数据按从小到大的顺序排列后,“中间” 的那个数据为这组数据的中位数,它使数据被分成的两部分的数量是一样的. (3)众数:是这组数据中出现次数最多的数据. 2.离散程度的刻画:极差与方差 (1)极差:是数据中最大值和最小值的差,计算简单,但没有充分利用其他数据,对数据离散程度的刻画较为粗略. (2)方差:刻画的是数据偏离平均数的离散程度。由于方差的单位是原始数据单位的平方,为了使刻画离散程度的量具有与原始数据相同的单位,实际应用中也常使用方差的算术平方根(即标准差). (2) 分层随机抽样的均值与方差 1.分层随机抽样的平均数: 2.分层随机抽样的方差: (3) 百分位数: 1.百分位数的定义:一般地,当总体是连续变量时,给定一个百分数p(0<p<1),总体的p分位数(百分位数)具有这样的特点:总体数据中的任意一个数小于或等于它的可能性是p. 2.计算一组n个数据的p分位数,可遵循以下步骤: (1)排序:按照从小到大的顺序排列原始数据; (2)计算位置指标i:计算i=np; (3)确定分位数: 若i不是整数,找到大于i的最小整数j,则p分位数为第j项数据; 若i是整数,则p分位数为第i项与第(i+1)项数据的平均数. 题型一 简单随机抽样的特征及适用条件 【例1】(24-25高一下·全国·课后作业)下列抽样方法是简单随机抽样的是(    ) A.在某年明信片销售活动中,规定每100万枚为一个开奖组,号码的后四位是2709的为三等奖 B.某车间包装一种产品,在自动包装传送带上,每隔30分钟抽一包产品,称其重量是否合格 C.从8台电脑中逐个不放回地随机抽取2台,进行质量检验,假设8台电脑已编好号,对编号随机抽取 D.仓库中有1万支奥运火炬,从中一次性抽取100支火炬进行质量检查 【答案】C 【分析】利用简单随机抽样的定义,逐一分析各选项即可得解. 【详解】选项A:在明信片销售活动中规定特定号码为三等奖, 这不是从总体中随机抽取个体,不属于简单随机抽样,故A错误; 选项B:在自动包装传送带上每隔30分钟抽一包产品, 抽样间隔固定,属于系统抽样,不是简单随机抽样,故B错误; 选项C:从8台已编号的电脑中逐个不放回地随机抽取2台, 符合简单随机抽样中总体个数有限、逐个抽取、不放回抽样、等可能抽样的特点, 属于简单随机抽样,故C正确; 选项D:一次性抽取100支火炬,不是逐个抽取, 不符合简单随机抽样的定义,不属于简单随机抽样,故D错误; 故选:C. 【变式1-1】(2025高三·全国·专题练习)下列抽样的方式属于简单随机抽样的个数为(    ) ①将500个个体编号,把号签放在一个不透明的容器内搅拌均匀,从中逐个抽取50个作为样本;②某班有55名同学指定个子最高的5名同学参加学校组织的篮球赛;③福利彩票用摇奖机摇奖. A.0 B.1 C.2 D.3 【答案】C 【分析】由简单随机抽样的定义对各个抽取方式进行判断即可得到结论. 【详解】②不是等可能抽取,故不是简单随机抽样,①③是简单随机抽样. 故选:C. 【变式1-2】(多选)(25-26高一上·全国·单元测试)下列从总体中抽得样本的方法是简单随机抽样的是(    ) A.总体编号为1~75,随机依次选出编号范围内的10个数作为抽中的编号 B.总体编号为1~75,在0~99之间产生随机整数r,若或,则舍弃,重新抽取 C.总体编号为1~75,在0~99之间产生随机整数r,r除以75的余数作为抽中的编号,若余数为0,则抽中75 D.总体编号为6001~6879,在1~879之间产生随机整数r,把作为抽中的编号 【答案】ABD 【分析】根据简单随机抽样的等可能性判断各项的正误. 【详解】A:因为总体编号为,且随机依次选出编号范围内的10个数, 所以每个数被抽中是等可能的,所以是简单随机抽样,对; B:总体编号为,在之间产生随机整数,若或则舍弃,重新抽取, 则每个编号均可能被抽中,且每个编号被抽中的可能性相同,所以是简单随机抽样,对; C:总体编号为,在之间产生随机整数,除以75的余数作为抽中的编号,若余数为0,则抽中75, 因为号与号被抽中的可能性不同,所以不是简单随机抽样,错; D:总体编号为,在之间产生随机整数,把作为抽中的编号, 则每个编号被抽中的可能性相同,所以是简单随机抽样,对. 故选:ABD 题型二 抽签法及其应用 【例2】(24-25高一下·全国·课后作业)某班有50名学生,现选取6名学生参加一个讨论会,每名学生被选到的机会相等.请用抽签法设计一个选取方案. 【答案】答案见解析 【分析】利用抽签法的定义即可得解. 【详解】第一步,给50名学生编号,号码依次为01,02,03,,50, 第二步,将50名学生的编号写在形状、大小相同的小纸片上,并搡成小球,制成号签, 第三步,将得到的号签放在一个不透明的容器中,搅拌均匀, 第四步,从容器中不放回地逐个抽取6个号签,并记录上面的编号,对应这6个编号的学生,即为所选取的学生. 【变式2-1】(2024高三·全国·专题练习)在对101个人进行一次抽样时,先采用抽签法从中剔除1个人,再在剩余的100个人中随机抽取10个人,那么下列说法正确的是(   ) A.这种抽样方法对于被剔除的个体是不公平的,因为他们失去了被抽到的机会 B.每个人在整个抽样过程中被抽到的机会均等 C.由于采用了两步进行抽样,所以无法判断每个人被抽到的可能性是多少 D.每个人被抽到的可能性不相等 【答案】B 【分析】根据随机抽样的特征,即可判断出结果. 【详解】由于第一次剔除时采用抽签法,对每个人来说可能性相等, 然后随机抽取10人对每个人的机会也是均等的, 所以总的来说每个人的机会都是均等的,被抽到的可能性都是相等的. 故选:B. 【变式2-2】(24-25高二下·上海·阶段练习)从101个人进行一次抽样时,先采用抽签法从中剔除1个人,再在剩余的100个人中采用随机数表法抽取10个人,那么下列说法正确的是(    ) A.这是一种科学的抽样方法 B.这种抽样方法对于被剔除的个体是不公平的,因为他们失去了被抽到的机会 C.由于采用了两步进行抽样,所以无法判断每个人被抽到的可能性是多少 D.每个人被抽到的可能性不相等 【答案】A 【分析】先说明采用抽签法每个人被剔除概率都相等,都是,不被剔除的概率也相等,都是,即可判断B;然后采用随机数表法,在没被剔除的100人中被抽到概率都是,即可判断C,综合B,C,即可判断D;综和B,C,D即可判断A. 【详解】由于先采用抽签法,从101个人中剔除1个人, 对101个人中的每个人来说被抽到(即被剔除)概率都相等,都是, 不被剔除的概率也相等,都是,故B错误; 然后采用随机数表法,在剩余的100个人中抽取10个人, 如果被抽到,概率为,也是相等的,故C错误; 所以由B,C可知,每个人被剔除的概率都是相等的,都是; 没被剔除,然后被抽到的概率也是相等的,都是,故D错误; 所以综上可知这是一种科学的抽样方法,故A正确. 故选:A 题型三 随机数表法的应用 【例3】(25-26高一上·全国·单元测试)当今,青少年视力水平的下降已引起全社会的关注.为了了解某中学高三年级400名学生的视力情况,从中抽取了50名学生进行视力检测. (1)在这个问题中,总体、样本各是什么? (2)为深入了解这50名学生的视力情况,从中随机抽取6人,分别写出利用抽签法和随机数法抽取该样本的过程. 【答案】(1)答案见解析; (2)答案见解析. 【分析】(1)根据总体、样本的定义及题干信息确定问题中总体和样本; (2)根据抽签法、随机数法的抽样过程,设计抽样步骤即可. 【详解】(1)总体是该中学高三年级400名学生的视力,样本是所抽取的50名学生的视力; (2)利用抽签法步骤如下: 第一步:将这50名学生编号,编号为1,2,3,…,50. 第二步:将50个号码分别写在纸条上,并揉成团,制成号签. 第三步:将得到的号签放在一个不透明的容器中,搅拌均匀. 第四步:从容器中逐一抽取6个号签,并记录上面的号码. 对应上面6个号码的学生就是抽取的学生; 利用随机数法步骤如下: 第一步:将这50名学生编号,编号为. 第二步:用计算机产生范围内的整数随机数,把产生的随机数作为抽中的编号. 第三步:重复第二步的过程,若出现重复的号码,则舍去,直到抽足6个号码. 对应上面6个号码的学生就是抽取的学生. 【变式3-1】(24-25高二下·上海·阶段练习)某公司利用随机数表对生产的900支新冠疫苗进行抽样测试,先将疫苗按000,001,..,899进行编号,从中抽取90个样本,若选定从第4行第4列的数开始向右读数,(下面摘取了随机数表中的第3行至第5行),根据下图,读出的第6个数的编号是 . 1676622766 5650267107 3290797853 1355385859 8897541410 1256859926 9682731099 1696729315 5712101421 8826498176 5559563564 3854824622 3162430990 0618443253 2383013030 【答案】315 【分析】利用随机数表的性质并结合题意求解即可. 【详解】由题意最先读到的1个的编号是685, 向右读下一个数是992,992它大于899,故舍去, 再下一个数是696,再下一个数是827,再下一个数是310, 再下一个数是991,舍去,再下一个数是696,舍去,再下一个数是729, 再下一个数是315,则读出的第6个数是315. 故答案为:315 【变式3-2】(23-24高二上·四川广安·阶段练习)因乙肝疫苗事件,需要对某种疫苗进行检测,现从支中抽取支进行检验,利用随机数表抽取样本时,先将支按进行编号,如果从随机数表第行第列的数开始向右读,依次读取三位数,则得到的第个样本个体的编号是 (下面摘取了随机数表第行至第行) 【答案】704 【分析】按照给定随机数表依次读取编号即可. 【详解】按照所给随机数表,依次读取的个体编号为, 所以得到的第个样本个体的编号是. 故答案为: 题型四 简单随机抽样的概率 【例4】(24-25高一下·福建福州·期末)用抽签法从学号为1到50的50名学生(其中含学生李华)中不放回抽取5名学生进行问卷调查,每次抽取一个号码,共抽取5次,设李华第一次被抽到的概率为,第五次被抽到的概率为,则(    ) A.a = , B.a = , C.a = , D.a = , 【答案】B 【分析】由题意结合简单随机抽样的特征即可确定实数,的值. 【详解】由简单随机抽样的定义知,每个个体在每次抽取中都有相同的可能性被抽到, 因为每次抽取一个号码,所以李华第一次被抽到的可能性为, 第五次被抽到的可能性为. 即李华同学在每次抽样中被抽到的可能性都是,所以,. 故选:B. 【变式4-1】(24-25高一上·江西宜春·期末)某班级有名学生,班主任用不放回的简单随机抽样的方法从这名学生中抽取人进行家访,则同学被抽到的可能性为(    ) A. B. C. D. 【答案】D 【分析】根据条件,利用简单随机抽样的定义,即可求解. 【详解】总体有个个体,每个个体被抽到的概率相同,均为, 故选:D. 【变式4-2】(2025高二下·湖南娄底·学业考试)某中学七年级有人,八年级有人,九年级有人,若每人被抽到的可能性都为,用随机数法在该学校抽取容量为的样本,则(    ) A. B. C. D. 【答案】C 【分析】根据简单随机抽样的概率公式可得出关于的等式,解之即可. 【详解】由简单随机抽样的概率公式可得,解得. 故选:C. 题型五 分层抽样问题 【例5】(24-25高一下·湖南岳阳·期末)某校高中生共有3600人,其中高一年级1300人,高二年级人,高三年级1100人,现采取分层抽样法抽取容量为36的样本,那么高一、高二、高三各年级抽取的人数分别为(  ) A.11,14,11 B.12,12,12 C.14,12,10 D.13,12,11 【答案】D 【分析】根据分层抽样的定义求得抽样比,分别计算每个年级被抽到的人数,可得答案. 【详解】用分层抽样在各层中的每个个体被抽到的可能性为, 则在高一年级抽取的人数是(人), 高二年级抽取的人数是(人), 高三年级抽取的人数是(人), 所以高一、高二、高三各年级抽取的人数分别为13,12,11, 故选:D. 【变式5-1】(23-24高一下·湖北武汉·期末)某中学高一年级有400人,高二年级有320人,高三年级有280人,若用随机数法在该中学抽取容量为n的样本,每人被抽到的可能性都为0.3,则n等于(   ) A.160 B.200 C.280 D.300 【答案】D 【分析】根据从总体中抽取样本的概率计算方法可得. 【详解】由题意,所以(人) 故选:D. 【变式5-2】(多选)(25-26高一上·全国·单元测试)某高中学校从有120名学生的“航天”社团中随机抽取30名参加一个交流会,若按社团中高一、高二、高三年级的成员人数比例分层随机抽样,则高一年级抽取10人;若按性别比例分层随机抽样,则男生抽取18人.则下列结论正确的有 (    ) A.样本量为30 B.120名社团成员中男生有72人 C.高二与高三年级的社团成员共有85人 D.高一年级的社团成员中女生最多有48人 【答案】AB 【分析】根据分层抽样的相关概念及等比例性质依次判断各项的正误. 【详解】A:从中随机抽取30名,则样本量为30,对; B:设120名社团成员中男生有人,因为按性别比例分层随机抽样时男生抽取18人, 所以,解得,所以120名社团成员中男生有72人,对; C:设高二与高三年级的社团成员共有人, 因为按社团中高一、高二、高三年级的成员人数比例分层随机抽样时高一年级抽取10人, 所以,解得,所以高二与高三年级的社团成员共有80人,错; D:根据C知,高一年级的社团成员有(人),故高一年级的社团成员中女生最多有40人,错. 故选:AB 题型六 确定极差、组数与组距 【例6】(19-20高一·全国·课后作业)从标准质量为500g的一批洗衣粉中,随机抽查了50袋,测得的质量数据如下(单位:g): 494  498  493  494  496  492  490  490  500  499  494  495  482  485  502 493  505  485  501  491  493  500  509  512  484  509  510  494  497  498 504  498  483  510  503  497  502  498  497  500  493  499  505  493  491 497  515  503  498  518 (1)找出这组数的最值,求出极差; (2)以为第一个分组的区间,作出这组数的频率分布表. 【答案】(1)最大值为518,最小值为482,极差为36;(2)见解析 【解析】(1)根据数据找出最大值最小值即可得到极差; (2)根据分组整理各组频数,求出频率,依次统计,即可得出频率分布表. 【详解】(1)这组数的最大值为518,最小值为482,极差为36. (2)以为第一个分组区间,组距为7,将数据整理为下表:作出频率分布表如图所示. 分组区间 个数累计 频数 频率 正 5 0.1 正正 14 0.28 正正正 17 0.34 正 7 0.14 正一 6 0.12 一 1 0.02 【变式6-1】(2023高三·全国·专题练习)有40个数据,其中最大值为35,最小值为14,若取组距为4,则分成的组数是 【答案】 【分析】根据分组的方法,代入计算,即可得到结果. 【详解】因为最大值为35,最小值为14, 所以在样本数据中最大值与最小值的差为, 又因为组距为, 所以应该分的组数为, 所以应该分成组. 故答案为: 【变式6-2】(2023·上海·模拟预测)某校抽取100名学生测身高,其中身高最大值为,最小值为,根据身高数据绘制频率组距分布直方图,组距为5,且第一组下限为153.5,则组数为 . 【答案】 【分析】求得各组的范围,从而确定组数. 【详解】第一组;第二组; 第三组;第四组; 第五组;第六组; 第七组. 所以组数为. 故答案为: 题型七 频率分布表及其应用 【例7】(23-24高二·上海·课堂例题)某学生第二天要参加100m短跑比赛,他记录了比赛前一日集训中20次100m短跑的成绩(单位:s): 13.4 13.6 14.3 15.3 12.8 13.1 14.5 13.8 14.2 15.0 13.4 13.7 13.5 12.5 12.9 14.9 12.9 14.6 14.3 15.5 (1)制作频率分布表; (2)试估计该学生在100m短跑比赛中用时低于14s的可能性. 【答案】(1)频率分布表见解析 (2)0.55 【分析】(1)分析数据,利用频率分布表的制作方法即可得解; (2)根据(1)中频率分布表分析该生的运动水平,从而得解. 【详解】(1)制作频率分布表如下: 分组 频数 频率 4 0.20 3 0.15 4 0.20 3 0.15 3 0.15 3 0.15 (2)从频率分布表中可以看出该生在20次100m短跑的成绩低于14s的频率为, 假定该生在第二天的比赛中发挥出平常水平, 则可估计该生在比赛中用时低于14s的可能性为0.55. 【变式7-1】(21-22高一·全国·课后作业)某棉纺厂为了了解一批棉花的质量,从中随机抽取了25根棉花纤维的长度(棉花纤维的长度是棉花质量的重要指标)(单位:mm),所得数据都在区间[5,40]中,具体数据如下: 12  14  16  17  17 19  20  20  21  22 23  23  23  24  24 25  25  26  27  27 28  29  30  32  34 试估计这批棉花的质量情况. 【答案】答案见解析 【分析】利用样本数据制作频率分布表,根据样本的频率分布估计这批棉花的质量情况. 【详解】这里的总体是某棉纺厂一批棉花的棉花纤维的长度情况,我们要利用通过抽样获得的25根棉花纤维的长度来估计总体的分布情况.由于题目中的数据很难看出任何规律,因此我们通过制作频率分布表来分析样本数据的频率分布.这组数据的最小值为12,最大值为34,故极差为22,可选取组距为5,将其分为5组.其频率分布表如下: 棉花纤维长度分布区间 频数 频率 [10,15) 2 0.08 0.016 [15,20) 4 0.16 0.032 [20,25) 9 0.36 0.072 [25,30) 7 0.28 0.056 [30,35] 3 0.12 0.024 从上表中可以估计总体的大致分布情况.比如,该棉纺厂一批棉花的棉花纤维的长度在[15,30)范围内的频率最大,不足15 mm和大于30 mm的频率相对较小. 【变式7-2】(20-21高一·全国·课后作业)有一个容量为100的样本,数据分组及各组的频数如下:,6;,16;,18;,22;,20;,10;,8. (1)列出样本的频率分布表; (2)估计总体中在的数据所占的百分比. 【答案】(1)答案见解析 (2) 【分析】(1)根据频数计算频率,即可得到频率分布表; (2)根据频率分布表即可估计总体中在的数据所占的百分比. 【详解】(1)样本的频率分布如下: 分组 频数 频率 6 0.06 16 0.16 18 0.18 22 0.22 20 0.20 10 0.10 8 0.08 合计 100 1.00 (2)从频率分布表可估计总体中在的数据所占的百分比为. 题型八 绘制频率分布直方图及折线图 【例8】(22-23高一下·辽宁·阶段练习)有一个容量为60的样本(60名学生的数学考试成绩),分组情况如下表: 分组 频数 3 6 12 频率 0.3    (1)补全表中所剩的空格; (2)画出频率分布直方图和频率分布折线图. 【答案】(1)答案见解析 (2)答案见解析 【分析】(1)分别计算各分数段的频率与频数,再补表格即可; (2)分别计算各分数段的频率除以组距的值,然后画出频率分布直方图和频率分布折线图即可. 【详解】(1)根据题意,的频率为;的频率为; 的频率为;的频率为, 频数为;的频数为. 填表如下. 分组 频数 3 6 12 21 18 频率 0.05 0.1 0.2 0.35 0.3 (2)计算的,的, 的,的, 的. 画出的频率分布直方图和频率分布折线图如图所示.    【变式8-1】(2024高一下·全国·专题练习)随机观测生产某种零件的某工厂25名工人的日加工零件数,获得数据如下:30,42,41,36,44,40,37,37,25,45,29,43,31,36,49,34,33,43,38,42,32,34,46,39,36,根据上述数据得到样本的频率分布表如下: 分组 频数 3 5 8 频率 0.12 0.20 0.32 (1)确定样本频率分布表中,,和的值; (2)根据上述频率分布表,画出样本频率分布直方图与折线图. 【答案】(1),, ,; (2)答案见解析. 【分析】(1)利用给定的数据组求出,,和的值. (2)由(1)及已知画出样本频率分布直方图与折线图. 【详解】(1)依题意,,,所以,. (2)样本频率分布直方图与折线图如图, 【变式8-2】(22-23高一·全国·随堂练习)一种袋装食品用生产线自动装填,每袋质量大约为50g,但由于某些原因,每袋食品不会恰好是50g.现随机抽取100袋食品,测得的质量数据如下: 单位:g 57      46      49      54      55      58      49      61      51      49 51      60      52      54      51      55      60      56      47      47 53      51      48      53      50      52      40      45      57      53 52      51      46      48      47      53      47      53      44      47 50      52      53      47      45      48      54      52      48      46 49      52      59      53      50      43      53      46      57      49 49      44      57      52      42      49      43      47      46      48 51      59      45      45      46      52      55      47      49      50 54      47      48      44      57      47      53      58      52      48 55      53      57      49      56      56      57      53      41      48 (1)为了获得样本数据的分布情况,试制作频率分布表; (2)绘制频率分布直方图及频率分布折线图. 【答案】(1)频率分布表见解析 (2)频率分布直方图及频率分布折线图见解析 【分析】(1)计算极差,确定组数和组距,绘制频率分布表; (2)在频率分布表的基础上,绘制频率分布直方图及频率分布折线图. 【详解】(1)1.计算极差,这组数据中,最大值为61,最小值为40,故极差为, 2.确定组数和组距,样本量在100左右,可取个组,由于,故不妨取11个组,组距定为, 3.频率分布表如下: 分组 频数 频率 2 0.02 3 0.03 7 0.07 16 0.16 17 0.17 10 0.10 20 0.20 8 0.08 10 0.10 4 0.04 3 0.03 (2)频率分布直方图如下: 频率分布折线图如下: 题型九 频率分布直方图的实际应用 【例9】(22-23高一·全国·随堂练习)据媒体报道:某市今年前4个月空气质量为优良.某中学数学兴趣小组据此提出了“今年究竟能有多少天空气质量达到优良”的问题.他们上网查询环境保护部公布的环境空气质量标准,得到下表所示的空气质量指数分级相关信息: 空气质量指数分级 空气质量指数 空气质量级别 一级(优) 二级(良) 三级(轻度污染) 空气质量指数 大于300 空气质量级别 四级(中度污染) 五级(重度污染) 六级(严重污染) 他们同时查询市环保监测站提供的资料,并从数据中随机抽取了今年1—4月份中30天的空气质量指数. 某市30天空气质量指数: 30 32 40 42 45 45 77 83 85 87 90 113 127 153 132 98 65 50 53 57 64 66 77 92 98 130 46 150 187 201 (1)根据空气分级质量标准和抽查的空气质量指数,绘制频率分布直方图. (2)试根据频率分布直方图,估计该市今年1-4月(按120天计算)空气质量是优良(包括一、二级)的天数,并评估该市的空气质量水平.到互联网查找资料,与全国其他城市比较,该市空气质量处于什么水平? 【答案】(1)频率分布直方图见解析; (2)88天,优良,处于居中靠前的位置. 【分析】(1)作出频率分布表,求出,按频率分布直方图的作图方法作图即可. (2)该市今年1-4月(按120天计算)空气质量是优良(包括一、二级)的天数为频率分布直方图里面第一二组频率之和乘120;根据频率分布直方图求出空气质量指数的平均数即可评估该市空气质量水平. 【详解】(1)根据某市30天空气质量指数的数据统计: 区间 频数 频率 8 0.2666 0.005332 14 0.4667 0.009334 5 0.1667 0.003334 2 0.0667 0.001334 1 0.0333 0.000666 频率分布直方图如图所示:    (2)估计该市今年1-4月(按120天计算)空气质量是优良(包括一、二级)的天数为: (天), 该市空气质量指数的平均值为: , 故该市空气质量水平优良,在全国处于居中靠前的位置. 【变式9-1】(25-26高三上·河北邢台·阶段练习)从某小区抽取100户居民用户进行月用电量(单位:)调查,将得到的数据按分为6组,画出的频率分布直方图如图所示,则在被调查的用户中,月用电量落在内的户数为(    ) A.35 B.40 C.42 D.45 【答案】B 【分析】利用频率分布直方图的性质先计算参数,再根据图象计算即可. 【详解】易知,所以, 即, 而月用电量落在内的户数为. 故选:B 【变式9-2】(22-23高一上·全国·单元测试)下面是一次考试几个班同学的数学成绩(单位:分,满分为150分): 121,111,128,98,118,124,137,125,121,140, 129,122,101,103,134,126,129,132,99,132, 141,125,122,120,139,106,142,119,134,119, 122,126,114,141,132,125,111,145,110,123, 118,127,129,141,103,117,116,131,134,143, 113,142,125,136,119,110,107,124,137,100, 115,144,96,138,120,121,140,115,123,142, 119,133,120,146,119,144,119,122,119,136, 137,132,112,133,134,117,127,133,126,127, 141,119,131,131,123,128,133,126,129,134, 127,133,121,135,107,132,121,137,118,117, 107,133,131,131,125,126,140,127,114,136, 118,138,127,143,81,140,135,137,142,136, 139,124,138,119,122,136,141,119,118,114. (1)你觉得怎样直观地表示出上述数据的大致分布情况(比如哪个分数段的人数比较多,哪个分数段的人数比较少)? (2)画出频率分布直方图,看这次考试的整体分布,能说明哪些问题? 【答案】(1)答案见解析 (2)答案见解析 【分析】(1)数据比较多的时候,常借助频率分布表或频率分布直方图进行表示. (2)利用频率分布表和频率分布直方图的特征即可得出结论. 【详解】(1)数据比较多的时候,要想获得数据的大致分布情况, 最好借助我们学过的图表,比如频率分布表、频率分布直方图. (2)列频率分布表如下: 成绩分组(分) 频数 频率 合计 画频率分布直方图,如图所示:    通过频率分布直方图我们可以看到, 大部分同学的成绩集中在分数段内, 说明本次考试成绩难度不大,而个别同学成绩较低, 可能学习上遇到了困难,应该引起关注. 题型十 补全频率分布直方图 【例10】(2025高一下·全国·专题练习)为了让学生了解环保知识,增强环保意识,某中学举办了一次环保知识竞赛,共有900名学生参加了这次竞赛.为了了解本次竞赛的成绩情况,从中抽取了部分学生的成绩(得分均为整数,满分为100分)进行统计.请你根据尚未完成并有局部污损的频数分布表和频数分布直方图,解答下列问题: 分组 频数 频率 50.5~60.5 4 0.08 60.5~70.5 0.16 70.5~80.5 10 80.5~90.5 16 0.32 90.5~100.5 合计 50 (1)填充频数分布表的空格(将答案直接填在表格内); (2)补全频数分布直方图; (3)若成绩在75.5~85.5的学生为二等奖,问获得二等奖的学生约为多少人? 【答案】(1)表格见解析 (2)直方图见解析 (3)人 【分析】(1)根据频数和频率的关系计算完善表格即可. (2)求出第二组的频数后补全频数分布直方图即可. (3)求出成绩在75.5~85.5的学生频率即可求解. 【详解】(1)易知样本容量为50, 故第二组的频数为,第三组的频率为, 第四组的频数为,频率为, 故频数分布表为 分组 频数 频率 50.5~60.5 4 0.08 60.5~70.5 8 0.16 70.5~80.5 10 0.20 80.5~90.5 16 0.32 90.5~100.5 12 0.24 合计 50 1.00 (2)由(1)知,60.5~70.5这一组的频数为8,补全频数分布直方图,如图: (3)成绩在75.5~80.5的学生占70.5~80.5的学生的, 因为成绩在70.5~80.5的学生频率为0.20,所以成绩在75.5~80.5的学生频率为0.10. 成绩在80.5~85.5的学生占80.5~90.5的学生的, 因为成绩在80.5~90.5的学生频率为0.32,所以成绩在80.5~85.5的学生频率为0.16, 所以成绩在75.5~85.5的学生频率为. 由于有900名学生参加了这次竞赛, 所以该校获得二等奖的学生约为(人). 【变式10-1】(24-25高一下·广西·期末)某校举办了一次环境保护知识竞赛,为了解学生的环境保护知识掌握程度,学校采用简单随机抽样从全校名学生中抽取了一个容量为的样本,已知样本的成绩全部分布在区间内,根据调查结果绘制学生成绩的频率分布直方图如图所示,则频率分布直方图中(   ) A. B. C. D. 【答案】B 【分析】根据所有直方图面积之和为可求得实数的值. 【详解】在频率分布直方图可知,所有直方图面积之和为, 所以,解得. 故选:B. 【变式10-2】(24-25高一上·江西赣州·开学考试)为弘扬中华传统文化,某校组织若干名学生参加汉字听写大赛,为了解学生整体听写能力,从中抽取部分学生的成绩(得分取正整数,满分为100分)进行统计分析,请根据尚未完成的下列图表,解答问题:    分组 49.5~59.5 59.5~69.5 69.5~79.5 79.5~89.5 89.5~100.5 频数 2 a 20 16 8 频率 0.04 0.08 0.40 0.32 b (1)本次抽样调查的样本容量为_______,此样本中成绩的中位数落在_______范围内.表中_______,_______; (2)补全频数分布直方图; (3)若该校共有初中生3000名,若成绩超过80分为优秀,请估计该校汉字听写能力为优秀的约有多少人. 【答案】(1)50,,, (2)频率直方图见解析 (3) 【分析】(1)由频率、频数,中位数的概念即可求解; (2)由表格数据即可求解; (3)由频率分布直方图确定频率即可求解; 【详解】(1)学生总数是:(人),(人),; ∴本次抽样调查的样本容量为50,成绩的中位数落在范围内,(人),; (2)根据(1)得出的a的值,补图如下:    (3)(人). 该校汉字听写能力为优秀的约有人. 题型十一 由频率分布直方图计算频率、频数、样本容量、总体容量 【例11】(24-25高一上·全国·周测)某校为了解高一期末数学考试的情况,从高一的所有学生数学试卷中随机抽取n份试卷进行成绩分析,得到数学成绩频率分布直方图(如图所示),其中成绩在的学生人数为6. (1)求直方图中x的值; (2)求n的值. 【答案】(1) (2)50 【分析】(1)根据直方图中各矩形面积之和为1,求解x的值; (2)用成绩在的学生人数6比上其在直方图中的相应频率即可求出学生总数. 【详解】(1)由频率分布直方图的性质得, , 解得. (2)已知成绩在的学生人数为6, 由频率分布直方图得成绩在的学生频率为, 所以. 【变式11-1】(2025高一上·全国·专题练习)某市为修订用水政策,制定更合理的用水价格,随机抽取50户居民,得到他们的月均用水量全部介于1t至21t之间,将结果按如下方式分成八组:第一组,第二组,…,第八组,下图是按上述分组方法得到的频率分布直方图的一部分,已知第六组有4户居民,则第七组的频率为(    ) A.0.04 B.0.05 C.0.06 D.0.07 【答案】C 【分析】由题干及频率分布直方图可得结果 【详解】第六组的频率为,所以第七组的频率为. 故选:C 【变式11-2】(2025高二·全国·专题练习)某校从高一年级学生的体测成绩(规定满分为100分)中,随机抽取了80名学生的成绩,并进行分组:,绘制成如下频率分布直方图,则频率分布直方图中a的值是 .    【答案】0.020 【分析】根据频率之和等于1求解可得. 【详解】由图可知,,解得. 故答案为: 题型十二 样本数字特征的计算 【例12】(24-25高一下·贵州遵义·阶段练习)已知样本容量为5的样本平均数为3,方差为,将数据9加入原样本得到样本容量为6的新样本,若新样本的平均数为,方差为,则(    ) A. B. C. D. 【答案】B 【分析】设原样本为,,,,,根据平均数和方差的计算公式,可得,,再利用公式计算新样本的平均数和方差即可. 【详解】设原样本为,,,,, 则:, . 所以, . 故选:B 【变式12-1】(2025·河北邯郸·一模)已知组数据“”和组数据“”()的平均数分别为80,90,方差分别为15,20,若,则由这两组数据构成的所有数据的总体方差为(    ) A.15 B.32 C.35 D.42 【答案】B 【分析】首先计算总体平均数,再代入总体方差公式,即可求解. 【详解】由条件可知,总体平均数, 设组数据的平均数为,方差为,组数据的平均数是,方差是, 所以所有数据的总体方差, . 故选:B 【变式12-2】(多选)(23-24高二下·浙江宁波·期末)一个同学投掷10次骰子,记录出现的点数,根据统计结果,在下列情况中可能出现点数6的有(    ) A.平均数为3,中位数为4 B.中位数为4,众数为3 C.平均数为2,方差为2.1 D.中位数为3,方差为0.85 【答案】ABD 【分析】ABD举例,C用反证法证明不能出现6. 【详解】对于A:10次点数为符合题意,故A正确; 对于B:10次点数为符合题意,故B正确; 对于C:设10次点数为且,平均数为, 假设有一次点数为,不妨设,由方差公式,代入相关数据得: ,即,显然最大只能取, 不妨设得,此时方程无解,所以, 当时得:,最大只能取, 不妨设得,此时方程有唯一解,, 即10次点数为,但此时平均数为不合题意,所以, 当得取得, 此时方程无解(其余情况也均无解),所以, 当时,平均数为不合题意. 综上所述,假设有一次点数为不成立,故C错误; 对于D:10次点数为符合题意,故D正确. 故选:ABD 题型十三 根据数字特征求参数 【例13】(24-25高一下·福建龙岩·期末)已知一组数据的平均值为3,方差为21,删去一个数后,平均值不变,方差变为24,则原来数据的个数的值为 . 【答案】8 【分析】根据平均数和方差的计算公式列出关于的方程,进而求解的值. 【详解】因为一组数据的平均值为3, 所以有①. 删去一个数后,平均值不变,假设删掉的数是, 则②, ①-②得. 已知原数据方差为21,根据方差公式得, 所以. 删除数据后方差变为24,则, 所以, 因为,所以,解得. 故答案为:8. 【变式13-1】(23-24高一下·青海·期末)某篮球运动员进行投篮训练,共进行了10组,每组投篮55次,每组投篮命中的个数分别为m,n,48,47,48,50,45,47,49,50.已知这组数据的平均数为48,方差为7,则(    ) A.10 B. C. D.5 【答案】A 【分析】根据平均数与方差的公式列方程可得解. 【详解】因为这组数据的平均数为48,方差为7, 所以 整理得 设,则, 因为50,所以,即, 则. 故选:A 【变式13-2】(25-26高三上·上海·阶段练习)样本数据20,24,6,15,18,10,42,57,2,7的极差为,中位数为,则 . 【答案】/ 【分析】将数据从小到大排列,求出数据的极差和中位数,即可求得答案. 【详解】由题意知样本数据从小到大排列为2,6,7,10,15,18,20,24,42,57, 故极差为,中位数为, 故, 故答案为: 题型十四 众数、平均数、中位数的比较 【例14】(24-25高一下·山东泰安·阶段练习)如图,下列频率分布直方图显示了三种不同的分布形态.图(1)称对称形态,图(2)称不规则形态,图(3)称“右拖尾”形态,根据图形作出以下判断,正确的是(    ) A.图(1):平均数>中位数=众数 B.图(2):众数>平均数 C.图(3):众数<中位数<平均数 D.图(3):众数<平均数<中位数 【答案】C 【分析】在频率分布直方图中,我们根据图形的形态特点来分析这三个统计量的大小关系。对于对称形态,平均数、中位数和众数大致相等;对于不规则形态,需根据图形具体分析;对于“右拖尾”形态,由于右侧有较大的极端值,会拉高平均数,从而使得众数、中位数和平均数有特定的大小关系。 【详解】A中应有平均数=中位数=众数; B中众数<平均数; C,D中,平均数易受极端值的影响,与中位数相比,平均数更接近“拖尾”的一边,所以平均数>中位数,而最高峰偏左,因此众数最小. 故选:C. 【变式14-1】(24-25高一下·甘肃兰州·期中)平均数、中位数和众数都是刻画一组数据的集中趋势的信息,它们的大小关系和数据分布的形态有关.在下图分布形态中,、、分别对应这组数据的平均数、中位数和众数,则下列关系正确的是(   ) A. B. C. D. 【答案】C 【分析】利用数据分布图左拖尾,即平均数小于中位数,再利用众数是用最高矩形的中点值来估计,可判断众数大于中位数,即可作出判断. 【详解】由数据分布图知,众数是最高矩形下底边的中点横坐标,因此众数为右起第二个矩形下底边的中点值, 直线左右两边矩形面积相等,而直线左边矩形面积大于右边矩形面积,则, 又数据分布图左拖尾,则平均数小于中位数,即, 所以. 故选:C. 【变式14-2】(2024·黑龙江哈尔滨·三模)如图所示,下列频率分布直方图显示了三种不同的形态.图(1)形成对称形态,图(2)形成“右拖尾”形态,图(3)形成“左拖尾”形态,根据所给图作出以下判断,正确的是(    ) A.图(1)的平均数=中位数>众数 B.图(2)的众数<中位数<平均数 C.图(2)的平均数<众数<中位数 D.图(3)的中位数<平均数<众数 【答案】B 【分析】根据平均数,中位数,众数的概念结合图形分析判断. 【详解】图(1)的分布直方图是对称的,所以平均数=中位数=众数,故A错误; 图(2)频率直方图可得,单峰不对称且“右拖尾”,最高峰偏左,众数最小, 平均数易受极端值的影响,与中位数相比,平均数总是在“拖尾”那边,平均数大于中位数,故B正确,C错误; 同理图(3)“左拖尾”,众数最大,平均数小于中位数,故D错误. 故选:B. 题型十五 极差、方差、标准差问题 【例15】(24-25高一下·河南濮阳·期末)高一某班有24名男生和40名女生,某次数学测试中,男生的平均分与女生的平均分之差为4,若男生分数的方差为94,全班分数的方差为84,则女生分数的方差为(   ) A.90 B.86 C.78 D.72 【答案】D 【分析】根据方差的计算公式和方差的性质,求出女生分数的方差. 【详解】设男生分数为,男生分数均值为; 女生分数为,女生分数均值为; 则,总体均值为, 男生分数方差为,则, 全班分数方差为, 由方差得公式可知, 代入得,解得; 因为,所以, 化简得, 解得, 则女生方差为; 故选:D. 【变式15-1】(2025·湖北·模拟预测)若一组数据的平均值,方差,若删去一个数之后,平均值没有改变,方差变为40,则这组数据的个数(   ) A.5 B.6 C.7 D.8 【答案】A 【分析】由题意得到删除的数为5,再利用方差公式求解. 【详解】由题意得到删去一个数之后,平均值没有改变,所以删除的数为5, 由题意,得, 删除一个数后的方差为:, 得,即. 故选:A. 【变式15-2】(多选)(2024·广东·模拟预测)一组数据的平均值为5,方差为2,极差为7,中位数为6,记,的平均值为,方差为,极差为,中位数为,则(   ) A. B. C. D. 【答案】AD 【分析】根据平均值、方差、极差、中位数的定义及性质可得. 【详解】由题意可得,,,,. 故选:AD 题型十六 总体百分位数的估计 【例16】(2025·陕西·模拟预测)已知一组数据按从小到大的顺序排列为,若该组数据的第60百分位数与这组数据的中位数相等,则实数的值为 . 【答案】6 【分析】计算出这组数据的第60百分位数和中位数,根据题意可得答案. 【详解】因为,所以这组数据的第60百分位数是, 又这组数据的中位数为,所以,得. 所以实数的值为6. 故答案为:6. 【变式16-1】(25-26高二上·福建宁德·阶段练习)数据13,27,24,12,14,30,15,17,19,23的第60百分位数是(    ). A.19 B.21 C.23 D.23.5 【答案】B 【分析】根据第60百分位数定义计算即可. 【详解】数据按从小到大排列为:12,13,14,15,17,19,23,24,27,30,共10个数, 因为, 所以第60百分位数是. 故选:B 【变式16-2】(25-26高二上·海南·月考)某同学统计了自2000年以来,中国代表队在历届奥运会获得金牌数如下(不含中国香港、中国台湾):26,28,32,38,38,40,48,则这组数据的70%分位数为(   ) A.26 B.32 C.35 D.38 【答案】D 【分析】根据百分位数的计算公式即可求解. 【详解】由于,这组数据的70%分位数为第5个数38, 故选:D 基础巩固通关测 1.(2004·上海·高考真题)某地2004年第一季度应聘和招聘人数排行榜前5个行业的情况列表如下: 行业名称 计算机 机械 营销 物流 贸易 应聘人数 215830 200250 154676 74570 65280 行业名称 计算机 营销 机械 建筑 化工 招聘人数 124620 102935 89115 76516 70436 若用同一行业中应聘人数和招聘人数的比值的大小来衡量该行业的就业情况,则根据表中数据,就业形势一定是(    ) A.计算机行业好于化工行业 B.建筑行业好于物流行业 C.机械行业最紧张 D.营销行业比贸易行业紧张 【答案】B 【详解】就业形势的好坏,主要看招聘人数与应聘人数的比值,比值越大,就业形势越好,故选B. 2.(14-15高一·全国·课后作业)已知样本数据:10,8,6,10,13,8,10,12,11,7,8,9,11,9,12,9,10,11,12,11.那么频率为0.2的是(    ) A. B. C. D. 【答案】D 【解析】根据所给数据,结合选项中的分组,即可求得各组的频率. 【详解】样本共有20个.根据选项,可分为4组,各组的频数和频率如下表所示: 分组 频数 频率 2 0.1 6 0.3 8 0.4 4 0.2 合计 20 1.0 从表中可以看出频率为0.2的是, 故选:D. 3.(25-26高一上·全国·开学考试)某班30位同学的安全知识测试成绩统计如表,其中有两个数据被遮盖,不影响下列关于成绩的统计量的是(    ) 成绩 24 25 26 27 28 29 30 人数 ▄ ▄ 3 3 6 7 9 A.平均数,众数 B.中位数,众数 C.平均数,方差 D.中位数,方差 【答案】B 【分析】根据中位数和众数的定义求解即可得. 【详解】∵, ∴被遮盖的两个数据之和为, ∴这组数据中,30出现的次数最多, ∴这组数据的众数是30,不受被遮盖的两个数据的影响, ∵将30位同学的成绩按从小到大进行排序后,第15个数和第16个数的平均数即为中位数,且,, ∴这组数据的中位数是,不受被遮盖的两个数据的影响, 故选:B. 4.(24-25高一上·贵州·阶段练习)已知甲、乙两名同学在高一的6次数学周测的成绩统计如图,则下列说法不正确的是(    ) A.甲的中位数高于乙的中位数 B.若甲、乙两组数据的平均数分别为,则 C.甲成绩的极差大于乙成绩的极差 D.甲成绩比乙成绩稳定 【答案】C 【分析】根据甲、乙两名同学在高一年级的6次数学周测的成绩统计的折线图,根据中位数,平均数,极差和数据的波动性,逐项分析判断,即可求解. 【详解】由甲、乙两名同学在高一年级的6次数学周测的成绩统计的折线图, 对于A中,由统计的折线图知,甲同学的中位数大于,乙同学的中位数小于, 所以甲的中位数高于乙的中位数,所以A正确; 对于B中,由统计的折线图知,甲同学只有第2次的周测成绩低于乙同学, 其他次的周测成绩都高于乙同学,可得,所以B正确; 对于C中,因为极差为样本数据的最大值与最小值的差, 由统计的折线图知,甲同学的周测成绩的极差小于乙同学周测成绩的极差,所以C不正确; 对于D中,由统计的折线图知,甲同学周测成绩的波动性小于乙同学成绩的波动性, 所以甲同学的周测成绩比乙同学的周测成绩更稳定,所以D正确. 故选:C. 5.(23-24高一下·北京·期末)甲、乙两人某体育项目近五次训练成绩如图,设甲、乙两人成绩的平均数分别为,标准差分别为,则下列结论正确的是(   )    A. B. C. D. 【答案】C 【分析】根据图像数据可得均值,由图像数据的波动程度可得方差的关系. 【详解】, , 所以,均值相等,由图可知甲波动性更大,所以. 故选:C. 6.(25-26高二上·黑龙江齐齐哈尔·月考)已知,若,,,的中位数为2,则(  ) A. B. C.2 D.1 【答案】D 【分析】分,,,四种情况,将数据从小到大排列,结合中位数定义列方程求解即可. 【详解】因为,所以, 分别令,解得, 当时,,所以,解得; 当时,,所以, 解得(舍去)或(舍去); 当时,,所以, 解得(舍去)或(舍去); 当时,,所以,解得(舍去). 综上,. 故选:D 7.(24-25高一下·安徽·期末)在一组样本数据中,0,1,2,3出现的频数分别为,,,,则下面四种情形中,对应样本的标准差最小的一组是(   ) A., B., C., D., 【答案】C 【分析】分别计算出各个选项的标准差,判断大小即可得解. 【详解】A项,平均数为, 标准差为; 同理B项,平均数为1.5,标准差为; C项,平均数为1.5,标准差为; D项,平均数为1.5,标准差为. 故选:C. 8.(25-26高二上·湖北·阶段练习)甲、乙、丙、丁对某组数据(该组数据由5个整数组成)进行分析,得到以下数字特征,则不能判断这组数据一定都小于13的是(   ) A.甲:中位数为10,众数为12 B.乙:中位数为10,极差为3 C.丙:平均数为9,方差为 D.丁:平均数为9,极差为4 【答案】B 【分析】根据各选项所给信息,逐一判断即可. 【详解】对于选项A,因为中位数为10,众数为12,所以这5个数从小到大排列后,第3个数是10,则第4个和第5个数都是12,所以这5个数都小于13;所以选项A错误. 对于选项B,因为中位数为10,极差为3,所以这5个数可以是10,10,10,11,13,则乙分析的数据中可以有大于或等于13的数;所以选项B正确. 对于选项C,因为平均数为9,方差为,由方差公式得:, 假设这5个数中出现大于或等于13的数,不妨设,则方差, 与方差为矛盾,所以假设错误,所以这5个数中没有大于或等于13的数;所以选项C错误. 对于选项D,假设这5个数中出现了大于或等于13的数,因为极差为4,所以最小的数需大于或等于9,此时这5个数的平均数一定会大于9,与平均数为9矛盾,所以这5个数都小于13,所以选项D错误. 故选:B. 9.(多选)(20-21高二下·山东菏泽·期末)在发生某公共卫生事件期间,有专业机构认为该事件在一段时间没有发生大规模群体感染的标志为“连续10天,每天新增疑似病例不超过7人”,根据过去10天甲、乙、丙、丁四地新增疑似病例数据,一定符合该标志的是(    ) A.甲地:中位数为2,众数为3 B.乙地:总体平均数为1,中位数为1 C.丙地:极差为3,第80百分位数为4 D.丁地:总体平均数为2,总体方差为3 【答案】BCD 【分析】对于A,根据中位数和众数不能限制某一天的病例超过7人;对于B,因为体平均数为1,中位数为1,则可知每天新增疑似病例不超过7人;对于C,由极差和百分位数则可判断数据的最大值,对于D,当总体平均数是2,若有一个数据超过7,则方差就大于3,从而可得答案 【详解】解:对于A,当中位数为2,众数为3时,有可能某一天的病例超过7人,所以A错误; 对于B,总体平均数为1,中位数为1时,若有一天的病例超过7人,假设某天病例为8人,而中位数为1,则平均数会超过1,所以总体平均数为1,中位数为1时,则每天新增疑似病例不超过7人,所以B正确; 对于C,极差为3,第80百分位数为4,可知数据的最大可能取值为7,所以C正确; 对于D,设连续10天,每天新增疑似病例分别为,并设有一天超过7人,设第一天为8人,则,因为总体方差为3,所以说明连续10,每天新增疑似病例不超过7人,所以D正确, 故选:BCD 10.(多选)(24-25高一下·陕西西安·期末)已知互不相等的数据,,,,,的平均数为,方差为,则下列选项中正确的是(    ) A.数据,,…,的平均数为 B.数据,,…,的标准差为 C.给原数据增加一个数据,且,若这七个数据的方差为,则 D.给原数据增加一个数据,且,若这七个数据的方差为,则 【答案】AC 【分析】根据平均值的性质求得平均数,然后利用方差的概念求解即可判断各项. 【详解】由题知,,, 所以,的平均数为, 的方差为, 所以数据,,…,的标准差为2s,A正确,B错误; 给原数据增加一个数据,且, 这七个数据的方差为, 故C正确,D错误. 故选:AC 11.(24-25高一下·山西·阶段练习)若一组数据、、、、,这组数据的平均数为,则这组数据的中位数为 . 【答案】 【分析】利用平均数公式求出的值,再利用中位数的定义可求得这组数据的中位数. 【详解】因为一组数据、、、、的平均数为, 由平均数公式可得,解得, 故这组数据由小到大排列依次为、、、、, 因此,这组数据的中位数为. 故答案为:. 12.(23-24高二下·四川成都·开学考试)已知一组数据,,,的方差为4,若数据,,,的方差为36,则b的值为 . 【答案】3或 【分析】利用平均数和方差公式可得结果. 【详解】设数据,,,的平均数为,方差为,则, , 设数据,,,的平均数为,方差为, 则, , 所以或, 故答案为:3或. 能力提升进阶练 13.(24-25高一下·广东东莞·期末)某班级举办“以赛促学,挑战自我”数学竞赛活动,活动后将参赛的40名学生成绩分成5组:①,②,③,④,⑤.通过统计分析,得到如图所示的频率分布直方图,已知①组、②组的频率之和为,①组和⑤组的频率相同. (1)估计此次考试成绩的众数、平均数; (2)已知②组学生成绩的平均数和方差分别为64和50,④组学生成绩的平均数和方差分别为84和70,据此计算②组和④组所有学生成绩的方差. 参考公式:,其中为总样本平均数. 【答案】(1)众数的估计值为75,平均数的估计值为73 (2)②组和④组所有学生成绩的方差为140. 【分析】(1)根据频率分布直方图众数及平均数定义计算求解; (2)应用分层抽样平均数及方差公式计算求解即可. 【详解】(1)由题意得,解得, 所以考试成绩的众数的估计值为75, 平均数的估计值为. (2)记②组、④组的平均数与方差分别为, 则,由题意得②组、④组分别有14人、6人, 所以②组、④组学生成绩的平均数为, 所以②组、④组学生成绩的方差为 , 所以②组和④组所有学生成绩的方差为140. 14.(22-23高一下·四川泸州·期末)《中华人民共和国节约能源法》要求各行各业须采取技术上可行、经济上合理以及环境和社会可以承受的措施,从能源生产到消费各个环节,降低消耗,减少损失,制止浪费,有效合理利用能源.某家庭积极响应,采用节水龙头以降低家庭用水量,并记录了使用节水龙头后50天的日用水量数据(单位:),得到频数分布表如下: 日用水量 频数 1 5 13 10 16 5 (1)据以上数据,作出使用了节水龙头50天的日用量数据的频率分布直方图; (2)若该家庭使用节水龙头前,每年的用水费用支出约为674.5元,且某地居民用水费用为3.09元,据此估计该家庭使用节水龙头后,一年能节省多少用水费用?(一年按365天计算,同一组中的数据以这组数据所在区间中点的值作代表.) 【答案】(1)答案见解析 (2)279.7525(元) 【分析】(1)根据频率分布表,再根据频率分布直方图的概念即可作图; (2)利用频率分布直方图求出日均用水量,再根据条件即可求结果. 【详解】(1)因为频率分布表: 日用水量 频数 1 5 13 10 16 5 频率 0.02 0.1 0.26 0.2 0.32 0.1 故频率分布直方图为:    (2)由题意,使用了节水龙头50天的日均用水量为, 所以一年的平均用水量为:, 故一年能节省元. 15.(24-25高一下·广东广州·期末)某研究小组经过研究发现某种疾病的患病者与未患病者的某项医学指标有明显差异,经过大量调查,得到如下的患病者和未患病者该指标的频率分布直方图: 利用该指标制定一个检测标准,需要确定临界值c,将该指标大于c的人判定为阳性,小于或等于c的人判定为阴性.此检测标准的漏诊率是将患病者判定为阴性的概率,记为;误诊率是将未患病者判定为阳性的概率,记为.假设数据在组内均匀分布,以事件发生的频率作为相应事件发生的概率. (1)当时,求与; (2)设函数,当时,求的解析式,并求在区间上的最小值. 【答案】(1),; (2),0.02. 【分析】(1)根据题意,由第一个图求出的矩形面积,再根据第二个图求出的矩形面积即可解出. (2)根据题意,确定分段点100,即可得出的解析式,再根据分段函数的最值求法即可解出. 【详解】(1) 依题意得: , . (2)当时, , 当时,; 当时, , 当时,,此时, 所以,在区间上的最小值为0.02. 16.(24-25高一下·吉林长春·期末)文明城市是反映城市整体文明水平的综合性荣誉称号,作为普通市民,既是文明城市的最大受益者,更是文明城市的主要创造者.长春市为提高市民对文明城市创建的认识,举办了“创建文明城市”知识竞赛,从所有答卷中随机抽取100份作为样本,将样本的成绩(满分100分,成绩均不低于40分)分成六段:,,……,,得到如图所示的频率分布直方图. (1)求频率分布直方图中的值; (2)试估计样本成绩的平均数和上四分位数: (3)已知落在的平均成绩是54,方差是7,落在的平均成绩为66,方差是4,求两组成绩合并后的平均数和方差. 【答案】(1) (2)平均数为74,上四分位数为84; (3)平均数,方差. 【分析】(1)由频率之和为1得到关于的方程,解出即可. (2)由中间数为代表求出平均数,由频率分布直方图求上四分位数(即第25百分位数)的计算公式即可求解; (3)利用分层抽样的平均数和方差的计算公式即可求解. 【详解】(1)由所有小矩形面积之和为1得,,解得 (2)平均数为 成绩落在内的频率为, 落在内的频率为, 落在内的频率为, 落在内的频率为, 设上四分位数为m,由,得,故上四分位数为84. (3)由题,成绩在有人, 成绩在有人 则这两组成绩的总平均数为, 由样本方差计算总体方差公式可得总方差为: . 17.(2011·湖南·高考真题)某河流上的一座水力发电站,每年六月份的发电量(单位:万千瓦时)与该河上游在六月份的降雨量(单位:毫米)有关据统计,当时,;每增加10,增加5.已知近20年的值为:140,110,160,70,200,160,140,160,220,200,110,160,160,200,140,110,160,220,140,160. (1)完成如下的频率分布表:近20年六月份降雨量频率分布表 (2)假定今年六月份的降雨量与近20年六月份降雨量的分布规律相同,并将频率视为概率,求今年六月份该水力发电站的发电量低于490(万千瓦时)或超过530(万千瓦时)的概率. 【答案】(I) 降雨量 70 110 140 160 200 220 频率 (II). 【详解】试题分析:(1)根据题意及可求得降雨量取的频率;(2)写出回归直线方程,根据方程求出降雨量的范围,根据“随机变量在某范围内取值的概率等于它取该范围内各值的概率和”即可求得要求的概率值. 试题解析:(1)在所给数据中,降雨量为110毫米的有3个,为160毫米的有7个,为200毫米的有3个.故近20年六月份降雨量频率分布表为 (2)依题意,得所以当时,;当时, 记“六月份发电量低于490(万千瓦时)或超过530(万千瓦时)”为时间,则 故今年六月份该水力发电站的发电量低于490(万千瓦时)或超过530(万千瓦时)的概率为0.3 1 / 3 学科网(北京)股份有限公司 $

资源预览图

第6章 统计(复习讲义)数学北师大版2019必修第一册
1
第6章 统计(复习讲义)数学北师大版2019必修第一册
2
第6章 统计(复习讲义)数学北师大版2019必修第一册
3
所属专辑
相关资源
由于学科网是一个信息分享及获取的平台,不确保部分用户上传资料的 来源及知识产权归属。如您发现相关资料侵犯您的合法权益,请联系学科网,我们核实后将及时进行处理。