第6章 统计(知识清单)数学北师大版2019必修第一册

2025-11-24
| 2份
| 64页
| 512人阅读
| 9人下载
精品

资源信息

学段 高中
学科 数学
教材版本 高中数学北师大版必修 第一册
年级 高一
章节 本章小结
类型 学案-知识清单
知识点 统计
使用场景 同步教学-单元练习
学年 2025-2026
地区(省份) 全国
地区(市) -
地区(区县) -
文件格式 ZIP
文件大小 6.85 MB
发布时间 2025-11-24
更新时间 2025-11-21
作者 a13058450603
品牌系列 上好课·上好课
审核时间 2025-10-31
下载链接 https://m.zxxk.com/soft/54643279.html
价格 3.00储值(1储值=1元)
来源 学科网

内容正文:

第6章 统计 知识点一:普查和抽查 方式 定义 特点 普查 为了掌握调查对象的整体情况,对全体调查对象进行研究的一种调查方式 所取得的资料系统、全面 抽样调查(简称抽查) 从全体调查对象中,按照一定的方法抽取一部分对象作为代表进行调查分析,并以此推断全体调查对象的状况的调查方式 优点:迅速、及时,节约人力、物力和财力; 缺点:结果具有不确定性 知识点二:总体和样本 总体 调查对象的全体 个体 总体中的每一个被考察的对象 样本 在进行抽样调查时,从总体中抽取的部分 抽样 在进行抽样调查时,从总体中抽取样本的过程 样本(容)量 样本中个体的数目 总体的分布 总体中各类数据的百分比 知识点三: 简单随机抽样 1定义: 一般地,从N(N为正整数)个不同个体构成的总体中,逐个不放回地抽取n(1≤n<N)个个体组成样本,并且每次抽取时总体内的每个个体被抽到的可能性相等,这样的抽样方法通常叫作简单随机抽样. 2.抽签法和随机数法 ①抽签法的具体步骤: (i)给总体中的每个个体编号; (ii)抽签. ②随机数法中常利用转盘或摸球、随机数表、科学计算器或计算机等工具产生随机数. 其中利用随机数表产生随机数是一个常用的方法,具体步骤如下: (i)给总体中的每个个体编号; (ii)在随机数表中随机抽取某行某列作为抽样的起点,并规定读取方法; (iii)依次从随机数表中抽取样本号码,凡是抽到编号范围内的号码,就是样本的号码,并剔除相同的号码,直至抽满为止. 知识点四:分层随机抽样: 1.定义: 将总体按其属性特征分成互不交叉的若干类型(有时称作层),然后在每个类型中按照所占比例随机抽取一定的个体,这种抽样方法通常叫作分层随机抽样. 2. 分层随机抽样的特点 (1)适用于总体由差异明显的几部分组成的情况; (2)分层随机抽样中,按抽样比例确定每层抽取个体的数量; (3)分层随机抽样也是等可能抽样,每个个体被抽到的可能性都是,而且在每层抽样时,可以根据个体情况采用不同的抽样方法; (4)分层随机抽样能充分利用已掌握的信息,使样本具有良好的代表性. 3.分层随机抽样的一般步骤 知识点五:频率分布直方图 1. 定义 在频率分布直方图中,每个小矩形的底边长是该组的组距,每个小矩形的高是该组的频率与组距的比,从而每个小矩形的面积等于该组的频率,即每个小矩形的面积=组距×=频率. 各个小矩形的面积总和等于1. 2. 画频率分布直方图的步骤 (1)计算极差:极差为一组数据中最大值与最小值的差. (2)确定组距与组数:为方便起见,一般取等长组距,并且组距应力求“取整”,组数应力求合适. 当数据在120个以内时,通常按照数据的多少分成5组~12组. 极差、组距、组数之间有如下关系: ①若为整数,则=组数; ②若不为整数,则[ ] +1=组数([x]表示不大于x的最大整数). (3)分组:通常对组内数据所在区间取左闭右开区间,最后一组取闭区间. (4)列表:统计各组数据的频数,计算频率,完成频率分布表. (5)画频率分布直方图:根据频率分布表,画出频率分布直方图. 3. 绘制频率分布直方图的注意点 (1)各组频率的和等于1. (2)在xOy坐标平面内画频率分布直方图时,x=样本数据,y= ,这样每一组的频率可以用该组的组距为底边长、为高的小矩形的面积来表示,其中矩形的高= = ×频数. (3)同样一组数据,组距不同,横轴、纵轴单位不同,得到的频率分布直方图的形状也会不同. 知识点六:频率拆线图 1.通常,在频率分布直方图中,按照分组原则,再在左边和右边各加一个区间. 从所加的左边区间的中点开始,用线段依次连接各个矩形的顶端中点,直至右边所加区间的中点,就可以得到一条折线,我们称之为频率折线图. 2. 一般地,样本容量越大,用样本的频率分布去估计总体的分布就越精确. 随着样本容量的增大,所划分的区间数也可以随之增多,而每个区间的长度则会相应随之减小,相应的频率折线图就会越来越接近于一条光滑曲线. 知识点七:样本的数字特征 1.样本的数字特征的定义 (1) 平均数是指一组数据的平均值. (2) 一般地,中位数是将一组数据按从小到大的顺序排列后,“中间”的那个数据. (3)众数是指一组数据中出现次数最多的数据. (4) 极差和方差都刻画数据的离散程度. 极差是数据中最大值和最小值的差. 方差刻画的是数据偏离平均数的离散程度. (5) 定义方差的算术平方根s==为标准差,其中x1,x2,…,xn是样本数据,n是样本容量, 是样本平均数. 特别说明:标准差(方差)的作用 (1)标准差(方差)较大,数据的离散程度较大;标准差(方差)较小,数据的离散程度较小. (2)在实际应用中,常常把平均数与标准差(方差)结合起来进行决策. 在平均数相等的情况下,比较标准差(方差)以确定稳定性. 2. 平均数和方差的性质 若x1,x2,…,xn的平均数为,方差为s2,标准差为s,则以下数据的平均数、方差和标准差有如下规律: 数据 平均数 方差 标准差 x1,x2,…,xn s2 s x1+b,x2+b,…,xn+b(b为常数) +b s2 s ax1,ax2,…,axn(a为常数) a a2s2 |a|s ax1+b,ax2+b,…,axn+b(a,b为常数) a+b a2s2 |a|s 知识点八:用样本的数字特征估计总体的数字特征 1. 定义 一般情况下,如果样本容量恰当,抽样的方法比较合理,那么样本的数字特征能够反映总体的数字特征. 在允许一定误差存在的前提下,可以用样本的数字特征去估计总体的数字特征. 2. 平均数、中位数、众数与频率分布直方图的关系: (1)在样本数据的频率分布直方图中,众数就是最高的小矩形中某个(些)点的横坐标. (2)由于在样本中,有50%的个体小于或等于中位数,也有50%的个体大于或等于中位数,因此在频率分布直方图中,中位数左侧和右侧的小矩形的面积和应该相等,据此可以估计中位数的值. (3)平均数是频率分布直方图的“重心”, 是频率分布直方图的平衡点. 用频率分布直方图估计平均数时,平均数的估计值等于频率分布直方图中各个小矩形的面积与小矩形底边中点的横坐标(组中值)之积的和. 特别说明: 利用频率分布直方图求得的众数、中位数和平均数均为近似值,往往与由实际数据得出的不一致,但它们能粗略估计众数、中位数和平均数. 知识点九:分层随机抽样的平均数与方差 1. 分层随机抽样的平均数 一般地,将样本a1,a2,…,am和样本b1,b2,…,bn合并成一个新样本,则这个新样本的平均数为=·+·. 于是,当已知上述两层构成的新样本中每层的平均数分别为 和 时,可得这个新样本的平均数为w1+w2,其中w1=,w2=,w1,w2称为权重. 更一般地,设样本中不同层的平均数和相应权重分别为,…, 和w1,w2,…,wn,则这个样本的平均数为w1+w2+…+wn= 2. 分层随机抽样的方差 设样本中不同层的平均数分别为, ,…, ,方差分别为,…, ,相应的权重分别为w1,w2,…,wn,则这个样本的方差为s2=wi[+(-)2],其中为这个样本的平均数. 知识点十:百分位数 1. 百分位数的定义 一般地,当总体是连续变量时,给定一个百分数p∈(0,1),总体的p分位数有这样的特点:总体数据中的任意一个数小于或等于它的可能性是p. 2. 四分位数 25%,50%,75%分位数是三个常用的百分位数. 把总体数据按照从小到大排列后,这三个百分位数把总体数据分成了4个部分,在这4个部分取值的可能性都是. 因此这三个百分位数也称为总体的四分位数. 其他常用的百分位数有1%,5%,10%,90%,95%,99%. 总体的p分位数通常是未知的,人们用样本的p分位数来估计它,样本容量越大,估计越准确. 3. 求百分位数的步骤 计算一组n个数据的p分位数的一般步骤如下: 第一步,按照从小到大排列原始数据; 第二步,计算i=np; 第三步,若i不是整数,大于i的最小整数为j,则p分位数为第j项数据;若i是整数,则p分位数为第i项与第(i+1)项数据的平均数. 特别说明:根据频率分布直方图计算样本数据的百分位数,首先要进行频率分布直方图中各组数据频率的计算,然后需估计百分位数在哪一组,最后应用方程思想设出百分位数,解方程即可. 原创精品资源学科网独家享有版权,侵权必究!2 学科网(北京)股份有限公司 学科网(北京)股份有限公司 【易错点】01 抽样偏差与样本容量忽视 辨析:忽略小样本估计误差;分层抽样未按比例分配导致系统性偏差. 【典例1】某学生为了估计全校学生的平均身高,调查了坐在自己旁边的3名同学,将他们身高的平均值作为全校学生平均身高的估计值. (1)该调查是抽样调查吗? (2)如果是抽样调查,请指出总体、个体、样本和样本容量; (3)这个调查结果能较好地反映总体情况吗?请说明理由. 【解析】由题意, (1)是抽样调查. (2)总体:全校学生的身高数据;个体:每名学生的身高;样本:3名被调查同学的身高; 样本容量:3(注:样本容量为数值,无单位). (3)不能,理由如下: 样本容量过小:仅调查3人,样本量远低于统计学要求(通常至少需总体的5%-10%),小样本易受极端值影响,无法稳定估计总体. 【典例2】某奶茶店推出新品,为预估受欢迎度,店主连续3天在排队顾客中调查50人,其中45人表示喜欢.店主认为“90%顾客喜爱新品”. (1)该结论可能因何种偏差失真? (2)如何设计更可靠的抽样方案? 【答案】(1)答案见解析 (2)答案见解析 【分析】根据抽样调查偏差和抽样方案设计知识分析即可. 【详解】(1)抽样偏差:排队顾客多为品牌忠实粉丝,高估喜爱率; 时间局限:仅调查高峰排队时段,忽略非高峰时段顾客偏好. (2)分时段抽样(早/中/晚各抽20人),按顾客类型分层(新客、老客各占50%),以此覆盖不同时段、不同类型顾客,提升结果可靠性. 【易错点】02 数字特征的运算与实际意义理解不清 辨析:(1)不知怎样计算平均数、中位数、众数而出错; (2)对平均数、中位数、众数等统计特征数的实际意义理解不透. 【典例1】有一组数据24,29,,25,22,,20,24,28,25.若该组数据的中位数与众数相等,则平均数为( ) A.24.4    B.25.8    C.24.4或25.8    D.24.4或24.8 【解析】将已知数据从小到大排列为20,22,24,24,25,25,28,29. 因为该组数据的中位数与众数相等,所以众数只能是24和25中的一个. 因为每组数据的中位数是唯一的,所以该组数据的众数也是唯一确定的. 又该组数据中除24,25外其他数据均只出现一次,且与不可能相等,故众数只能是24和25中的一个. 若中位数与众数均为24,则,,此时平均数为; 若中位数与众数均为25,则, 此时平均数为,故该组数据的平均数为24.4或24.8. 故选:D. 【典例2】平均数、中位数和众数都是刻画一组数据的集中趋势的信息,它们的大小关系和数据分布的形态有关.在下图分布形态中,、、分别对应这组数据的平均数、中位数和众数,则下列关系正确的是(   ) A. B. C. D. 【答案】C 【分析】利用数据分布图左拖尾,即平均数小于中位数,再利用众数是用最高矩形的中点值来估计,可判断众数大于中位数,即可作出判断. 【详解】由数据分布图知,众数是最高矩形下底边的中点横坐标,因此众数为右起第二个矩形下底边的中点值, 直线左右两边矩形面积相等,而直线左边矩形面积大于右边矩形面积,则, 又数据分布图左拖尾,则平均数小于中位数,即, 所以. 故选:C. 【易错点】03 忽视线性变换后对方差与标准差的影响 辨析:混淆线性变换后方差与标准差的变化规律. 【典例1】数据标准差为2,求的标准差. 【解析】由题意,新标准差. 【典例2】有一组样本数据,,…,,其平均数和方差分别为,.由这组数据得到一组新样本数据,,…,.其中,其平均数和方差分别为,,则(   ) A. B. C. D. 【答案】B 【分析】根据已知条件,结合平均数和方差的公式,即可求解. 【详解】因,可得,, 故B正确,A,C,D均错误. 故选:B. 重难点01 普查和抽查的选择及总体、样本、样本容量概念 (1)总体:统计中所考察对象的某一数值指标的全体构成的集合称为总体. (2)个体:构成总体的每一个元素叫做个体. (3)样本:从总体中抽取若干个个体进行考察,这若干个个体所构成的集合叫做总体的一个样本,样本中个体的数目叫做样本容量. 1.(25-26高一·重庆·开学考试)下列调查中最适合采用全面调查(普查)的是(   ) A.了解长寿沙田柚的甜度情况 B.了解某品牌新能源汽车电池的续航能力 C.了解重庆市中学生收看9月3日阅兵直播情况 D.对我国首艘电磁弹射航空母舰福建舰各零部件质量情况的调查 【答案】D 【分析】根据抽样调查和普查的特点逐一判断. 【详解】对于A,了解长寿沙田柚的甜度情况,普查工作量大且有破坏性,适合抽样调查; 对于B,了解某品牌新能源汽车电池的续航能力,普查工作量大且有破坏性,适合抽样调查; 对于C,了解重庆市中学生收看9月3日阅兵直播情况,普查工作量大,适合抽样调查; 对于D,对我国首艘电磁弹射航空母舰福建舰各零部件质量情况的调查,是精确度要求高的调查,适合全面调查. 故选:D. 2.(25-26高一·重庆潼南·开学考试)下列调查中,适合采用抽样调查的是(   ) A.调查重庆市鲁能巴蜀中学九年级(1)班50名同学的视力情况 B.重庆西站对乘坐高铁的旅客进行安检 C.为保证飞机飞行安全,工人对其零部件进行检查 D.调查重庆市中学生的周末作业完成时间 【答案】D 【分析】根据抽样调查的特点,它适用于总体较大、全面调查不经济或不现实的情况,分析选项即可. 【详解】对于A,调查重庆市鲁能巴蜀中学九年级(1)班50名同学的视力情况:总体较小(仅50人),容易进行全面调查,不适合抽样调查, 对于B,重庆西站对乘坐高铁的旅客进行安检:安检涉及安全风险,必须对每位旅客进行全面检查,不适合抽样调查, 对于C,为保证飞机飞行安全,工人对其零部件进行检查:飞机零部件检查要求全面性,任何遗漏都可能造成安全事件,不适合抽样调查, 对于D,调查重庆市中学生的周末作业完成时间:调查对象是全市范围中学生,总体较大,适合抽样调查, 因此,适合采用抽样调查的是D, 故选:D. 3.(25-26高一·全国·开学考试)为了解某校七年级学生的近视情况,从中随机抽取40名学生进行调查,其中40是该调查的(    ) A.总体 B.样本容量 C.个体 D.样本 【答案】B 【分析】本题考查了总体、个体、样本、样本容量,总体是指考查的对象的全体,个体是总体中的每一个考查的对象,样本是总体中所抽取的一部分个体,而样本容量则是指样本中个体的数目,我们在区分总体、个体、样本、样本容量这四个概念时,首先找出考查的对象,从而找出总体、个体,再根据被收集数据的这一部分对象找出样本,最后再根据样本确定出样本容量. 【详解】为了了解某校七年级学生的近视情况,从中随机抽取40名学生,并对他们的近视进行分析,样本是总体中所抽取的一部分个体,样本容量则是指样本中个体的数目,则在该调查中,40是样本容量. 故选:B. 4.(2025高一·天津河北·期末)为了了解某地参加计算机水平测试的5000名学生的成绩,从中抽取了200名学生进行调查分析.在这个问题中,被抽取的200名学生是(   ) A.个体 B.样本 C.总体 D.样本量 【答案】B 【分析】根据总体,个体,样本,样本量的定义判断即可. 【详解】被抽取的200名学生是样本. 故选:B. 5.(2025高一·全国·专题练习)某高中为了了解高一年级1200名学生的视力情况,抽查了其中200名学生的视力,并进行统计分析.下列叙述正确的是(    ) A.上述调查属于普查 B.每名学生是总体的一个个体 C.200名学生的视力是总体的一个样本 D.1200名学生是总体 【答案】C 【分析】由抽样调查的定义逐个分析判断即可 【详解】对于A,因为抽取一部分对象的调查方式是抽查,对全体对象进行研究的调查方式是普查,所以此调查为抽样调查,所以A错误; 对于B,每名学生的视力是总体的一个个体,所以B错误; 对于C,200名学生的视力是总体的一个样本,所以C正确; 对于D,1200名学生的视力是总体,所以D错误. 故选:C 6.(2025高一·黑龙江双鸭山·阶段练习)某中学研究人员希望调查该校高中学生平均每天的自习时间.他调查了100名学生,发现他们每天的平均自习时间是3h.这里的总体是(    ) A.该校的所有高中学生 B.该校所有高中学生的平均每天自习时间 C.所调查的100名高中学生 D.所调查的100名高中学生的平均每天自习时间 【答案】B 【分析】根据给定条件,利用样本、总体的意义判断即得. 【详解】调查对象的全体为该校所有高中学生的平均每天自习时间, 因此总体应是该校所有高中学生的平均每天自习时间. 故选:B 重难点02 简单随机抽样的选择及随机数法 简单随机抽样常用抽签法(适用于总体中个体数较少的情况)、随机数法(适用于个体数较多的情况). 7.【多选】(25-26高一·全国·单元测试)下列从总体中抽得样本的方法是简单随机抽样的是(    ) A.总体编号为1~75,随机依次选出编号范围内的10个数作为抽中的编号 B.总体编号为1~75,在0~99之间产生随机整数r,若或,则舍弃,重新抽取 C.总体编号为1~75,在0~99之间产生随机整数r,r除以75的余数作为抽中的编号,若余数为0,则抽中75 D.总体编号为6001~6879,在1~879之间产生随机整数r,把作为抽中的编号 【答案】ABD 【分析】根据简单随机抽样的等可能性判断各项的正误. 【详解】A:因为总体编号为,且随机依次选出编号范围内的10个数, 所以每个数被抽中是等可能的,所以是简单随机抽样,对; B:总体编号为,在之间产生随机整数,若或则舍弃,重新抽取, 则每个编号均可能被抽中,且每个编号被抽中的可能性相同,所以是简单随机抽样,对; C:总体编号为,在之间产生随机整数,除以75的余数作为抽中的编号,若余数为0,则抽中75, 因为号与号被抽中的可能性不同,所以不是简单随机抽样,错; D:总体编号为,在之间产生随机整数,把作为抽中的编号, 则每个编号被抽中的可能性相同,所以是简单随机抽样,对. 故选:ABD 8.(2025高三·全国·专题练习)下列抽样的方式属于简单随机抽样的个数为(    ) ①将500个个体编号,把号签放在一个不透明的容器内搅拌均匀,从中逐个抽取50个作为样本;②某班有55名同学指定个子最高的5名同学参加学校组织的篮球赛;③福利彩票用摇奖机摇奖. A.0 B.1 C.2 D.3 【答案】C 【分析】由简单随机抽样的定义对各个抽取方式进行判断即可得到结论. 【详解】②不是等可能抽取,故不是简单随机抽样,①③是简单随机抽样. 故选:C. 9.(2025高二·四川广安·阶段练习)因乙肝疫苗事件,需要对某种疫苗进行检测,现从支中抽取支进行检验,利用随机数表抽取样本时,先将支按进行编号,如果从随机数表第行第列的数开始向右读,依次读取三位数,则得到的第个样本个体的编号是 (下面摘取了随机数表第行至第行) 【答案】704 【分析】按照给定随机数表依次读取编号即可. 【详解】按照所给随机数表,依次读取的个体编号为, 所以得到的第个样本个体的编号是. 故答案为: 10.(2025高二·上海·阶段练习)某公司利用随机数表对生产的900支新冠疫苗进行抽样测试,先将疫苗按000,001,..,899进行编号,从中抽取90个样本,若选定从第4行第4列的数开始向右读数,(下面摘取了随机数表中的第3行至第5行),根据下图,读出的第6个数的编号是 . 1676622766 5650267107 3290797853 1355385859 8897541410 1256859926 9682731099 1696729315 5712101421 8826498176 5559563564 3854824622 3162430990 0618443253 2383013030 【答案】315 【分析】利用随机数表的性质并结合题意求解即可. 【详解】由题意最先读到的1个的编号是685, 向右读下一个数是992,992它大于899,故舍去, 再下一个数是696,再下一个数是827,再下一个数是310, 再下一个数是991,舍去,再下一个数是696,舍去,再下一个数是729, 再下一个数是315,则读出的第6个数是315. 故答案为:315 11.(2025高一·福建福州·期末)用抽签法从学号为1到50的50名学生(其中含学生李华)中不放回抽取5名学生进行问卷调查,每次抽取一个号码,共抽取5次,设李华第一次被抽到的概率为,第五次被抽到的概率为,则(    ) A.a = ,B.a = ,C.a = , D.a = , 【答案】B 【分析】由题意结合简单随机抽样的特征即可确定实数,的值. 【详解】由简单随机抽样的定义知,每个个体在每次抽取中都有相同的可能性被抽到, 因为每次抽取一个号码,所以李华第一次被抽到的可能性为, 第五次被抽到的可能性为. 即李华同学在每次抽样中被抽到的可能性都是,所以,. 故选:B. 重难点03 分层抽样的选择及求法 抽样比=. 12.(2025高一·安徽合肥·期末)某校为了解同学们对“天宫课堂”这种授课模式的兴趣,决定利用分层抽样的方法从高一、高二、高三学生中选取90人进行调查,已知该校高一年级学生有400人,高二年级学生有500人,高三年级学生有600人,则抽取的学生中,高一年级有(    ) A.40人 B.36人 C.30人 D.24人 【答案】D 【分析】确定高一、高二、高三的人数比,由分层抽样特征即可求解; 【详解】由题意可知该校高一年级学生有400人,高二年级学生有500人,高三年级学生有600人, 则高一年级,高二年级与高三年级的学生人数比为, 根据分层抽样的特征可知,抽取的学生中,高一年级有人, 故选:D 13.(2025高一·江苏淮安·期末)某校高一年级共有学生1000人,选科组合只有“物化生”、“物化地”和“历政地”三种组合,其中选择“物化生”、“物化地”的学生人数分别为600,250.现采用分层抽样的方法选出40人进行职业生涯规划调查,则从“历政地”组合中选出的学生人数为(    ) A.3 B.5 C.6 D.10 【答案】C 【分析】根据分层抽样的特征结合题意求解即可. 【详解】由题意得,选择“物化生”、“物化地”和“历政地”的学生人数比为, 所以采用分层抽样的方法选出40人进行职业生涯规划调查,从“历政地”组合中选出的学生人数为. 故选:C. 14.(25-26高二·湖南·阶段练习)某工厂有高级技工60人,中级技工90人,初级技工150人,现采用分层抽样的方法从中抽取一个容量为的样本,已知从中级技工中抽取了6人,则 . 【答案】20 【分析】利用分层抽样的性质建立方程,求解参数即可. 【详解】由题意得,解得. 故答案为:20 15.(2025高二·云南·期末)某市有大型超市家,中型超市家,小型超市家.为掌握全市超市的营业情况,现按大型超市、中型超市、小型超市进行分层,通过分层随机抽样的方法抽取一个容量为的样本,则应抽取小型超市(   ) A.家 B.家 C.家 D.家 【答案】C 【分析】直接由分层抽样的定义计算可得. 【详解】由题可知,总体容量,样本容量,所以抽样比, 故应抽取小型超市家. 故选:C. 16.(25-26高三·湖北·阶段练习)某小区对小区内的2 000名居民进行走访调查,各年龄段男、女居民人数如下表.已知在小区的居民中随机抽取1人,抽到20岁~50岁女居民的概率是0.19.现用分层随机抽样的方法在全小区抽取200名居民,则应在50岁以上的居民中抽取的女居民人数为(   ) 1岁~20岁 20岁~50岁 50岁以上 女居民 370 X Y 男居民 380 370 250 A.75 B.50 C.25 D.20 【答案】C 【分析】先求出表格中的,然后根据分层抽样的性质求解. 【详解】因为在小区的居民中随机抽取1人,抽到20岁~50岁女居民的概率是, 所以,解得, 则岁以上的女居民的人数. 现用分层随机抽样的方法在全小区居民中抽取名居民, 应在岁以上的居民中抽取的女居民人数为. 故选:C 17.【多选】(2025高一·山东泰安·期末)某公司生产三种型号的轿车,年产量分别为1500辆、6000辆和2000辆.为检验产品质量,公司质检部门要抽取57辆进行检验,则下列说法正确的是(    ) A.应采用分层随机抽样抽取 B.应采用抽签法抽取 C.三种型号的轿车依次应抽取9辆、36辆、12辆 D.这三种型号的轿车,每一辆被抽到的可能性相同 【答案】ACD 【分析】根据分层抽样的概念及计算方法,逐项判定即可求解. 【详解】对于A,因为是三种型号的轿车,个体差异明显,所以选择分层随机抽样,所以A正确; 对于B,个体数目多,用抽签法制签难,搅拌不均匀,抽出的样本不具有代表性,所以B错误; 对于C,因为,所以(辆),(辆),(辆),所以三种型号的轿车依次应抽取9辆、36辆、12辆,所以C正确; 对于D,分层随机抽样中,每一个个体被抽到的可能性相同,故选项D正确. 故选:ACD. 重难点04 分层抽样的平均数,方差和标准差的求法 在分层随机抽样中,如果第一层的样本量为m,平均数为,则样本的平均数为. 18.(2025高一·全国·课后作业)数据的平均数为,数据的平均数为,证明:. 【答案】见解析 【解析】根据题意得到,,代入计算得到证明. 【详解】由题意得, ,. ,即. 【点睛】本题考查了平均值相关证明,意在考查学生的推断能力. 19.【多选】(2025高一·广东广州·期末)某校为了解高一年级学生的身高情况,采用样本量按比例分配的分层随机抽样,抽取了男生20人,其平均数和方差分别为172和12.抽取了女生30人,其平均数和方差分别为162和24.由这些数据,可计算出总样本平均数与总样本方差分别是(    ). A. B. C. D. 【答案】AD 【分析】根据分层抽样的总样本平均数和方差公式进行求解即可. 【详解】根据题意可得总样本平均数为 , 根据方差公式可得: . 故选:AD. 20.(2025高一·北京大兴·期末)某校有高中学生1000人,其中男生400人,女生600人.A同学按男生、女生进行分层,采用分层随机抽样的方法调查该校全体高中学生的身高(单位:)情况,总样本量为100,计算得到男生身高样本的平均数为170,方差为16;女生身高样本的平均数为160,方差为18. (1)如果已知男、女样本量按比例分配,求总样本的平均数和方差; (2)如果已知男、女样本量分别为30和70,在这种情况下,总样本的平均数为,总样本的方差为,分别直接写出与与的大小关系; (3)如果已知B同学采用了简单随机抽样的方法调查该校全体高中学生的身高情况,样本量为100,其样本平均数为,能否认为比更接近总体平均身高,说明理由. 【答案】(1), (2) (3)答案见解析 【分析】(1)根据按比例的分层抽样总样本的平均数和总样本的方差公式计算可得答案; (2)根据按比例的分层抽样总样本的平均数和总样本的方差公式计算再比较大小可得答案; (3)示例1:可以认为比更接近总体平均身高。理由:男、女生身高存在明显差异,采用按男、女比例分配的分层随机抽样的效果一般会好于简单随机抽样;示例2:不能认为比更接近总体平均身高,理由:由于样本的随机性,对于一次抽样而言,可能简单随机抽样的估计效果好于分层随机抽的估计效果;示例3:无法确定是否比更接近总体平均身高,理由:由于样本的随机性,对于一次抽样而言,并不能保证分层随机抽的估计效果一定好于简单随机抽样. 【详解】(1)由题意知,总样本的平均数为 总样本的方差为 (2)男、女样本量分别为30和70时,总样本的平均数为 , 总样本的方差为 所以. (3)答案示例1:可以认为比更接近总体平均身高. 理由如下: 男、女生身高存在明显差异,采用按男、女比例分配的分层随机抽样的效 果一般会好于简单随机抽样,所以可以认为比更接近总体平均身高. 答案示例2:不能认为比更接近总体平均身高. 理由如下: 由于样本的随机性,对于一次抽样而言,可能简单随机抽样的估计效果好于 分层随机抽的估计效果,所以不能认为比更接近总体平均身高. 答案示例3:无法确定是否比更接近总体平均身高. 理由如下: 由于样本的随机性,对于一次抽样而言,并不能保证分层随机抽的估计效果 一定好于简单随机抽样,所以无法确定是否比更接近总体平均身高. 重难点05 频率分布直方图及其应用 1.频率分布直方图的数据特点: ①频率分布直方图中纵轴上的数据是各组的频率除以组距的结果,不要误认为纵轴上的数据是各组的频率,不要和条形图混淆; ②频率分布直方图中各小长方形的面积之和为1,这是解题的关键,常利用频率分布直方图估计总体分布. 2.频率分布直方图的数字特征 (1)众数:最高矩形的底边中点的横坐标. (2)中位数:中位数左边和右边的矩形的面积和应该相等. (3)平均数:平均数在频率分布直方图中等于各组区间的中点值与对应频率之积的和. 21.(25-26高三·河北邢台·阶段练习)从某小区抽取100户居民用户进行月用电量(单位:)调查,将得到的数据按分为6组,画出的频率分布直方图如图所示,则在被调查的用户中,月用电量落在内的户数为(    ) A.35 B.40 C.42 D.45 【答案】B 【分析】利用频率分布直方图的性质先计算参数,再根据图象计算即可. 【详解】易知,所以, 即, 而月用电量落在内的户数为. 故选:B 22.(25-26高二·湖南长沙·开学考试)工厂组织全体员工就作业能力进行测试,全体员工得分均在内,将其分成,, ,,,共六组,数据绘制成如图所示的频率分布直方图,若该工厂共有名员工,则估计得分少于分的人数为(   )    A. B. C. D. 【答案】C 【分析】根据频率分布直方图的性质得到分数小于的频率,进而得到人数. 【详解】由频率分布直方图,,解得. 因为得分小于的频率为,故估计得分少于分的人数为. 故选:C. 23.(2025高一·北京通州·期末)某市为了减少水资源浪费,为确定一个比较合理的标准,从该市随机调查了200户用户居民,获得了他们某月的用水量数据,整理得到如下频率分布直方图,则用水量小于1.5立方米的用户数为(    ) A.20 B.30 C.50 D.60 【答案】C 【分析】根据频数、频率及样本容量的关系即可求得答案. 【详解】根据直方图可得用水量小于1.5立方米的用户数为. 故答案为:C. 24.【多选】(2025高一·河南许昌·期末)为传承和弘扬数学文化,激发学生学习数学的兴趣,某校高一年级组织开展数学文化知识竞赛.从参赛的2000名考生成绩中随机抽取100个成绩进行统计,得到如图所示的频率分布直方图,其中90分以上视为优秀,则频率/组距(    ) A.a的值为0.030 B.抽取的考生成绩的极差介于40分至60分之间 C.2000名考生中约有10名成绩优秀 D.估计有一半以上的考生的成绩介于70分至90分之间 【答案】ABD 【分析】根据频率之和为、极差、优秀率、频率等知识对选项进行分析,从而确定正确答案. 【详解】依题意,, 解得,A选项正确. 根据频率分布直方图,, 所以极差介于40分至60分之间,B选项正确. 90分以上频率为,对应有人,C选项错误. 成绩介于70分至90分之间的频率为, 所以估计有一半以上的考生的成绩介于70分至90分之间,D选项正确. 故选:ABD 25.【多选】(2025高三·云南德宏·阶段练习)某学校为了提高高三年级学生的某学科成绩,在第一次联考后采取了“培优补短”等一系列举措.为了更好地总结经验,现从高三年级1000名学生中随机抽取100名学生,将其前后两次联考成绩(满分150分)分别按照[50,70),[70,90),…,[130,150]分成五组,绘制成频率分布直方图,如图所示.下列说法正确的是(   ) A. B.估计该年级第二次联考成绩在130分以上的学生比第一次联考对应分数段的多10人 C.第二次联考学生的成绩波动更小 D.与第一次联考相比,第二次联考成绩在[50,90)内的学生人数减少,在[110,150]内的学生人数增加 【答案】BCD 【分析】由频率和为1列方程求参数判断A;再根据两次联考对应的直方图分析B、C、D的正误. 【详解】因为,所以,A错误. 因为第一次联考成绩在130分以上的学生人数大约占, 第二次联考成绩在130分以上的学生人数大约占, 所以增加,则增加的学生人数为10,B正确. 第一次联考成绩集中于70~110分的学生人数占比为, 第二次联考成绩集中于90~130分的学生人数占比为, 第二次联考成绩数据更集中,所以方差更小,C正确. 第一次联考成绩在[50,90)内的学生人数占比为,在[110,150]内的学生人数占比为, 第二次联考成绩在[50,90)内的学生人数占比为,在[110,150]内的学生人数占比为,D正确. 故选:BCD 26.【多选】(2025·江西·模拟预测)某机构调查了一个工业园区内的小型民营企业年收入情况,并将所得数据按,,…,分成六组,画出了样本频率分布直方图,则下列结论正确的是(   ) A.该工业园区内年收入落在区间内的小型民营企业的频率为0.55 B.样本中年收入不低于500万元的小型民营企业的个数比年收入低于500万元的个数少 C.规定年收入在400万元以内(不含400万元)的民营企业才能享受减免税政策,则该工业园区有70%的小型民营企业能享受到减免税政策 D.估计样本中小型民营企业年收入的中位数等于平均数 【答案】BD 【分析】利用频率分布直方图的性质一一判定选项可得答案. 【详解】对于A,因为,所以, 则年收入落在区间内的小型民营企业的频率为, 故A错误; 对于B,样本中年收入低于500万元的小型民营企业的频率为 ,故B正确; 对于C,因为年收入在400万元以内的小型民营企业的频率为0.3, 所以该工业园区有30%的小型民营企业能享受到减免税政策,C错误. 对于D,因为,所以中位数应该在内,设为, 则,解得,所以中位数约为480, 平均数约为, 中位数等于平均数,D正确. 故选:BD. 27.【多选】(2025高二·内蒙古·期末)某地种植的新品种哈密瓜获得了丰收,随机从采摘好的哈密瓜中挑选了100个称重(单位:),并整理数据,得到如图所示的频率分布直方图.根据此频率分布直方图,下面结论正确的是(   ) A. B.估计该哈密瓜的质量不低于1.6kg的比例为30% C.估计有一半以上的该哈密瓜的质量介于1.4kg至1.6kg之间 D.估计该哈密瓜的质量的中位数介于1.5kg至1.6kg之间 【答案】BCD 【分析】先根据概率和为,可得,进而根据频率分布直方图得到对应概率,进而可得. 【详解】选项A:,解得,A错误; 选项B:估计该哈密瓜的质量不低于的比例为,B正确; 选项C:低于的概率为, 低于的概率为, 故估计有一半以上的该哈密瓜的质量介于至之间,C正确; 选项D: 低于的概率为, 低于的概率为, 估计该哈密瓜的质量的中位数介于至之间,D正确. 故选:BCD 重难点06 条形、扇形及折线图的应用 几种统计图表的特点及使用方法 (1)通过扇形图可以很清楚地表示出各部分数量同总数之间的关系. (2)折线图可以显示随时间(根据常用比例设置)而变化的连续数据,因此非常适用于显示在相等时间间隔下数据的趋势. 28.(2025高一·山东潍坊·期末)某市教育局对全市高三年级的学生身高进行抽样调查,随机抽取了200名学生,他们的身高分成,,,,五个组,根据抽样结果得到统计图表,则样本中(   ) A.女生人数和男生人数一样多 B.组中男生人数多于女生人数 C.组男生人数为24人 D.组人数最少 【答案】C 【分析】根据给定的柱状图及饼状图,逐项判断即可. 【详解】对于A,女生组有18人,组有48人,组有30人,组有18人,组有6人, 女生共有人,男生有人,因此女生人数多于男生人数,A错误; 对于B,由扇形图,男生组有人,而女生有18人,因此女生多于男生,B错误; 对于C,组有人人,C正确; 对于D,组有人,组有人,组人数不是最少的,D错误. 故选:C 29.(2025高三·上海·专题练习)某中学四位同学利用假期到一贫困村参加社会实践活动,感受年该村精准扶贫及新农村建设的变化.经过实地调查显示,该村年的经济收入增加了一倍.实现翻番,精准扶贫取得惊人成果.为更好地了解该村的经济收入变化情况,为后期精准扶贫方向提供决策参考,四位同学统计了该地区新农村建设前后农村的经济收入构成比例.得到饼图: 四位同学依据上述饼图,分别得出以下四个结论,其中结论中错误的是( ) A.精准扶贫及新农村建设后,种植收入减少 B.精准扶贫及新农村建设后,其他收入增加了一倍以上 C.精准扶贫及新农村建设后,养殖收入增加了一倍 D.精准扶贫及新农村建设后,养殖收入与第三产业收入的总和超过了经济收入的一半 【答案】A 【分析】设精准扶贫及新农村建设前和后的经济收入分别为和,根据饼状图依次验证各项收入是否满足选项中的要求,由此可得结论. 【详解】设精准扶贫及新农村建设前,经济收入为,则精准扶贫及新农村建设后,经济收入为; 对于A,精准扶贫及新农村建设前,种植收入为; 精准扶贫及新农村建设后,种植收入为; ,精准扶贫及新农村建设后,种植收入增加,A错误; 对于B,精准扶贫及新农村建设前,其他收入为; 精准扶贫及新农村建设后,其他收入为; ,精准扶贫及新农村建设后,其他收入增加了一倍以上,B正确; 对于C,精准扶贫及新农村建设前,养殖收入为; 精准扶贫及新农村建设后,养殖收入为; ,精准扶贫及新农村建设后,养殖收入增加了一倍,C正确; 对于D,精准扶贫及新农村建设后,养殖收入与第三产业收入之和的占比为,超过了总收入的一半,D正确. 故选:A. 30.(2025高一·河北·阶段练习)在统计学中,月度同比是指本月份和上一年同月份相比较的增长率,月度环比是指本月份和上一个月份相比较的增长率.如图是国家统计局发布的2023年全国居民消费价格月度涨跌幅度折线图,则下列说法正确的是(    ) A.2023年2月至6月居民的消费价格持续下降 B.2023年7月居民消费价格高于2022年同期 C.2023年4月居民消费价格环比上涨0.1%,同比下降0.1% D.2023年8月的居民消费价格是全年最高的 【答案】A 【分析】由月度同比、月度环比折线图逐个判断即可. 【详解】对于A:2月至6月环比增长率分别是,故消费价格持续下降;正确 对于B:由月度同比图可知2023年7月居民消费价格低于2022年同期;错误 对于C:2023年4月居民消费价格环比下降0.1%,同比上升0.1%,错误 对于D:虽然2023年8月的月度环比上涨幅度较大,但仅根据环比数据不能直接得出8月的居民消费价格是全年最高的,因为前面的月份价格也有变化情况,例如1月同比上涨,且后续月份价格变化复杂,不能简单判断8月价格最高,​错误​. 故选:A 重难点07 总体百分位数的估计 1.计算一组n个数据的第p百分位数的一般步骤 2.频率分布直方图中第p百分位数的计算 (1)确定百分位数所在的区间[a,b). (2)确定小于a和小于b的数据所占的百分比分别为fa%,fb%,则第p百分位数为a+×(b-a). 31.(25-26高三·陕西西安·开学考试)已知样本数据5,6,6,6,8,9,10,11,则该组数据的第60百分位数为(    ) A.6 B.7 C.8 D.9 【答案】C 【分析】根据百分位数的概念求解. 【详解】因为:, 所以样本数据5,6,6,6,8,9,10,11的第60百分位数是第5个数为8. 故选:C 32.(2025高二·湖南·学业考试)若一组数据按照从小到大的顺序排列如下:12,15,16,21,24,25,27,33,36,38.则该组数据的第41百分位数为(  ) A.21 B.24 C.25 D.27 【答案】B 【分析】根据百分位数的概念求值即可. 【详解】因为, 所以该组数据的第41百分位数为按从小到大排列的第5个数,即24. 故选:B 33.(2025·福建漳州·模拟预测)样本数据的下四分位数为(   ) A.3 B.3.5 C.10 D.11 【答案】B 【分析】根据条件,利用百分位数的求法,即可求解. 【详解】因为,所以样本数据的下四分位数为, 故选:B. 34.(25-26高二·云南·阶段练习)为了深入调研学生会考模拟考试成绩,掌握学生数学会考成绩情况,现从该年级同学中随机抽取100名学生,对其测试成绩(满分:100分)进行统计,得到样本频率分布直方图,如图,下列说法不正确的是(   )    A. B.众数为85 C.第70百分位数为80 D.该样本平均成绩为76 【答案】C 【分析】根据频率之和为1求出可判断A;根据频率分布直方图估算众数、百分位数和平均数的方法求解可判断BCD. 【详解】对A,依题意,得(频率之和为1), 解得,正确; 对B,众数为最高矩形对应中点横坐标为85,正确; 对C,因为, , 所以第70百分位数,由解得为,错误; 对D,由频率分布直方图,估计这100名学生测试成绩的平均数为: ,正确. 故选:C. 35.(2025高二·黑龙江大庆·阶段练习)某校组织全体学生参加了主题为“建党百年,薪火相传”的知识竞赛,随机抽取了200名学生进行成绩统计,发现抽取的学生的成绩都在50分至100分之间,进行适当分组后(每组为左闭右开的区间),画出频率分布直方图如图所示,全校学生成绩的第70百分位数估计值为(    )    A.80分 B.90.25分 C.92.5分 D.95分 【答案】C 【分析】由百分位数的定义即可求得样本数据的70%分位数; 【详解】由得; 70%分位数成绩在区间,设为,, 解得. 故选:C 36.(25-26高二·贵州黔南·开学考试)某校为了帮助高一学生更好地了解自己是否适合选读物理方向,在预选科之前组织了高一年级物理测试,并从中随机抽取了100名学生的物理成绩,整理得到如图所示的频率分布直方图. (1)求的值; (2)学校建议此次物理测试成绩在年级前的学生选报物理方向,其余学生建议选报历史方向,某同学想选报物理方向,根据频率分布直方图估计,他此次物理成绩应不低于多少分才能符合学校的建议?(保留小数点后一位) 【答案】(1) (2) 【分析】(1)根据频率和为1可求的值. (2)根据频率分布直方图估计数据的第百分位数即可. 【详解】(1)由频率和为1可得. (2)成绩在的频率为, 在的频率为, 在的频率为, 因为,, 所以数据的第百分位数在内, 设百分位数为, 则,解得. 所以他此次物理成绩应不低于分才能符合学校的建议. 37.(2025高三·全国·专题练习)某农产品公司新研发出一种新品种蔬菜种子,为了了解此品种蔬菜果实的平均长度,研究人员试种植后,从收获的蔬菜果实中随机选取了20个,得到的果实长度数据如下表:(单位:). 序号() 1 2 3 4 5 6 7 8 9 10 果实长度 11.6 13.0 12.8 11.8 12.0 12.8 11.5 12.7 13.4 12.4 序号() 11 12 13 14 15 16 17 18 19 20 果实长度 12.9 12.8 13.2 13.5 11.2 12.6 11.8 12.8 13.2 12.0 (1)根据样本估计此品种蔬菜果实长度的平均值和方差; (2)研究人员对该品种蔬菜果实进行了等级划分,果实长度大于为一等品,其余均为二等品,若试种植所收获的所有蔬菜中有85%的蔬菜为一等品,根据样本估计等级划分的标准. 【答案】(1), (2)等级划分的标准为果实长度大于为一等品,其余为二等品 【分析】(1)分别利用平均值与方差的计算公式代数计算即可; (2)利用百分位数的求法求出即可. 【详解】(1)由表中数据可得: , , 故估计此品种蔬菜果实长度的平均值为12.5,方差为0.43. (2)因为85%的蔬菜为一等品,则需求出样本的第15百分位数, 则,即样本的第15百分位数为样本数据从小到大排列后第3项和第4项数据的平均数, 将样本数据从小到大排列后得到第3和第4项分别为11.6和11.8, ,故, 故等级划分的标准为果实长度大于为一等品,其余为二等品. 重难点08 总体集中趋势的估计 (1)众数:一组数据中重复出现次数最多的数. (2)中位数:把一组数据按从小到大的顺序排列,处在中间位置(或中间两个数的平均数)的数叫做这组数据的中位数. (3)平均数:如果n个数x1,x2,…,xn,那么=(x1+x2+…+xn)叫做这n个数的平均数. 38.(25-26高三·湖北武汉·阶段练习)样本数据的中位数是(    ) A.7 B.9 C.11 D.13 【答案】B 【分析】利用中位数公式求解. 【详解】样本数据,这组数据共有6个, 因此这六个数据的中位数为. 故选:B 39.(25-26高三·重庆·阶段练习)高三某班有 15 名男生和 35 名女生, 在某次月考的数学成绩中, 男生的平均分比女生的平均分多 5 分, 则男生的平均分比全班的平均分(      ) A.多 1.5 分 B.多 2.5 分 C.多 3.5 分 D.多 4.5 分 【答案】C 【分析】由数据的均值性质,根据样本平均值估计总体平均值,从而得所求. 【详解】设男生平均分为,女生平均分为; 则, 总体平均分为, 则男生的平均分减全班的平均分为(分), 故男生的平均分比全班的平均分多 3.5 分. 故选:C. 40.(25-26高三·河北衡水·开学考试)一组数据从小到大排列为:,,,,,,若这组数据的中位数比分位数小,则的值为(   ) A.6 B.7 C.8 D.9 【答案】D 【分析】由中位数的定义和百分位数的定义求所给数据的中位数和分位数,由条件列方程,解方程可得结论. 【详解】由已知中位数为,由,可知分位数为10, 有,可得. 故选:D. 41.(2025高二·广东汕头·期末)汕头市某中学为了解高二学生的期末数学考试成绩,研究人员对700名学生进行调查,根据所得数据制成如图所示的频率分布直方图,则这700名学生期末数学考试成绩的中位数约为(    )    A.92.5 B.95 C.97.5 D.100 【答案】B 【分析】根据频率分布直方图的性质及中位数的概念,即可求解. 【详解】根据题意可得前几组的频率依次为0.12,0.28,0.4, 所以中位数在内,且为. 故选:B. 42.【多选】(25-26高二·河南·阶段练习)为纪念中国人民抗日战争暨世界反法西斯战争胜利80周年,某地面向全体中学生开展了以“铭记历史、缅怀先烈、珍爱和平、开创未来”为主题的知识竞赛活动.现从中随机抽取了200名学生的成绩(满分100分),将所得统计结果按分组,得到如图所示的频率分布直方图(每组数据以该组所在区间的中点值为代表),则(    ) A. B.估计样本数据的平均数为82 C.估计样本数据的众数为95 D.估计样本数据的平均数小于中位数 【答案】ACD 【分析】运用频率分布直方图计算某个小矩形的高、平均数、众数及中位数即可. 【详解】对于A选项,由题图可知,得,故A正确; 对于B选项,估计样本数据的平均数为 ,故B错误; 对于C选项,估计样本数据的众数为,故C正确; 对于D选项,前3组频率之和为, 前4组频率之和为,所以中位数在第4组, 设中位数为,则,解得, 所以平均数小于中位数,故D正确. 故选:ACD. 43.【多选】(25-26高二·江苏南京·阶段练习)2024年手机迎来发展新机遇,国内两家传媒公司共同发起了中国手机消费行为调查,下表为根据调查得到的2024年1000名中国手机用户购买手机价格频数表,同一组中的数据用该区间的中点值代表,则(  ) 价格(千元) (0,5] (5,10] (10,15] (15,20]      频数 150 600 180 50 20 A.估计1000名用户购买手机价格的众数为7.5 B.估计1000名用户购买手机价格的平均数超过8 C.估计1000名用户购买手机价格的中位数不超过6 D.估计1000名用户购买手机价格的84%分位数不超过10 【答案】AB 【分析】分别应用众数,平均数,中位数及百分位数定义分别计算各个选项即可判断. 【详解】对于A,估计名用户购买手机价格的众数为,故A正确; 对于B,平均数为,故B正确; 对于C,中位数为,故C错误; 对于D,名用户购买手机价格的84%分位数为,故D错误. 故选:AB. 44.【多选】(25-26高三·江苏镇江·开学考试)某农业研究部门在面积相等的100块稻田上种植同一种新型水稻,得到各块稻田的亩产量与田块数的关系(单位:),并整理下表 亩产量 田块数 6 12 18 30 24 10 据表中数据,下列结论正确的是(    ) A.100块稻田亩产量的中位数小于 B.100块稻田中亩产量低于的稻田所占比例低于 C.100块稻田亩产量的极差介于至之间 D.100块稻田亩产量的平均值介于至之间 【答案】BC 【分析】对于A,计算出前三段频数即可判断;对于B,计算出低于1100kg的频数,再计算比例即可判断;对于C,根据极差计算方法即可判断;对于D,根据平均值计算公式即可判断. 【详解】对于A,根据频数分布表可知,,所以亩产量的中位数不小于1050kg,故A错误; 对于B,亩产量不低于1100kg的频数为,所以低于1100kg的稻田占比为,故B正确; 对于C,稻田亩产量的最大在区间内,最小在区间内,故极差在范围内,故C正确; 对于D,由频数分布表可得,平均值为,故D错误。 故选:BC. 45.(2025高一·广西贵港·阶段练习)已知数据,,…,的平均数为4,那么数据,,…,的平均数为(    ) A. B. C.1 D.17 【答案】B 【分析】结合题意,由平均数的计算可得. 【详解】由题意可得,即 所以. 故选:B. 46.(2025高二·河北·学业考试)样本数据,,,,,的平均数为5,若,则数据,,,,的平均数是(    ) A.4 B.6 C.7 D.8 【答案】C 【分析】根据平均数定义计算可得,代入计算可得结果. 【详解】依题意可知,又可得, 因此数据,,,,的平均数是: . 故选:C 重难点09 总体离散程度的估计 (1)平均数、中位数、众数描述其集中趋势,方差和标准差描述波动大小. (2)方差的简化计算公式:或写成,即方差等于原数据平方的平均数减去平均数的平方. 47.(25-26高二·四川成都·阶段练习)下列各组数据中方差最大的一组是(   ) A.6,6,6,6,6B.5,5,6,7,7 C.4,5,6,7,8 D.2,3,6,8,9 【答案】D 【分析】根据数据的波动越大,方差越大;数据越稳定,方差越小.通过观察数据的离散程度以及计算平均值和方差来得出答案. 【详解】通过计算可得,,,,, ,,,, 所以方差最大的一组是2,3,6,8,9. 故选:D. 48.(25-26高三·江苏南京·开学考试)有一组样本数据1,2,2,2,3,5,去掉1和5后,相较于原数据不变的是(  ) A.平均数 B.极差 C.方差 D.中位数 【答案】D 【分析】根据平均数,极差,中位数的计算即可比较求解,利用方差的性质即可求解C. 【详解】样本数据1,2,2,2,3,5的平均数为,极差为4,中位数为2, 去掉1和5后的数据的平均数为,极差为1,中位数为2,故平均数和极差都发生变化,中位数不改变, 由于去掉1和5后,数据的波动性更小,故相比较于原数据,方差变小,故ABC错误,D正确. 故选:D. 49.(25-26高二·湖北·阶段练习)某校中秋节举行诗歌朗诵比赛,共有6名评委,选手甲得分的平均分和方差分别为84和17,若去掉最高分90和最低分78后,选手甲得分的方差变为(   ) A.6.5 B.7.5 C.8.5 D.9.5 【答案】B 【分析】根据平均数与方差的概念与性质,结合总体与样本之间的方差性质即可得结论. 【详解】不妨记剔除数据的平均数为,方差为,剩余四个得分的平均数为,方差为, 则,,, 由总体数据的方差的性质得,则. 故选:B. 50.(2025·河北邯郸·模拟预测)已知组数据“”和组数据“”()的平均数分别为80,90,方差分别为15,20,若,则由这两组数据构成的所有数据的总体方差为(    ) A.15 B.32 C.35 D.42 【答案】B 【分析】首先计算总体平均数,再代入总体方差公式,即可求解. 【详解】由条件可知,总体平均数, 设组数据的平均数为,方差为,组数据的平均数是,方差是, 所以所有数据的总体方差, . 故选:B 51.(25-26高三·云南曲靖·阶段练习)甲、乙两名选手在射击训练中各射击5次,成绩(单位:环)如下: 甲 7 8 9 8 8 乙 10 6 7 10 7 记甲、乙的平均成绩和方差分别为,和,,则下列结论正确的是(   ) A., B., C., D., 【答案】A 【分析】根据条件,直接求出,和,,即可求解. 【详解】因为,则, 又, ,则, 故选:A. 52.(2025高一·北京延庆·开学考试)某大学为了解学生对两家餐厅的满意度情况,从在两家餐厅都用过餐的学生中随机抽取了100人,每人分别对这两家餐厅进行满意指数打分(满意指数是指学生对餐厅满意度情况的打分,分数设置为2-10分.根据打分结果按分组,得到如图所示的频率分布直方图,其中餐厅满意指数在中有30人.    (1)求餐厅满意指数频率分布直方图中a,b的值; (2)利用样本估计总体的思想,估计餐厅满意指数和餐厅满意指数的平均数及方差(同一组中的数据用该组区间中点值作代表); 【答案】(1),; (2)答案见解析. 【分析】(1)根据已知及直方图、频率和为1列方程求参数值; (2)根据频率直方图中平均数的求法依次求出餐厅满意指数的平均值,再由方差公式求对应方差. 【详解】(1)由题设,餐厅满意指数在中有30人,则, 由,可得. (2)的平均数, 所以的方差为, 的平均数, 所以的方差为. 53.(2025高三·全国·专题练习)某厂为比较甲,乙两种工艺对橡胶产品伸缩率的处理效应,进行10次配对试验,每次配对试验选用材质相同的两个橡胶产品,随机地选其中一个用甲工艺处理,另一个用乙工艺处理,测量处理后的橡胶产品的伸缩率.甲,乙两种工艺处理后的橡胶产品的伸缩率分别记为,试验结果如下: 试验序号 1 2 3 4 5 6 7 8 9 10 伸缩率 545 533 551 522 575 544 541 568 596 548 伸缩率 536 527 543 530 560 533 522 550 576 536 记,记的样本平均数为,样本方差为. (1)求; (2)判断甲工艺处理后的橡胶产品的伸缩率较乙工艺处理后的橡胶产品的伸缩率是否有显著提高,(如果,则认为甲工艺处理后的橡胶产品的伸缩率较乙工艺处理后的橡胶产品的伸缩率有显著提高,否则不认为有显著提高). 【答案】(1),; (2)认为甲工艺处理后的橡胶产品的伸缩率较乙工艺处理后的橡胶产品的伸缩率有显著提高. 【分析】(1)根据已知表格数据得到所有的值,最后计算出均值、方差即可; (2)根据公式计算出的值,和比较大小即可得结论. 【详解】(1)计数如下表: 试验序号 1 2 3 4 5 6 7 8 9 10 9 6 8 15 11 19 18 20 12 则, . (2)由(1)知,,故有, 所以认为甲工艺处理后的橡胶产品的伸缩率较乙工艺处理后的橡胶产品的伸缩率有显著提高. 12 / 49 学科网(北京)股份有限公司 $ 第6章 统计 知识点一:普查和抽查 方式 定义 特点 普查 为了掌握调查对象的整体情况,对全体调查对象进行研究的一种调查方式 所取得的资料系统、全面 (简称抽查) 从全体调查对象中,按照一定的方法抽取一部分对象作为代表进行调查分析,并以此推断全体调查对象的状况的调查方式 优点:迅速、及时,节约人力、物力和财力; 缺点:结果具有不确定性 知识点二:总体和样本 总体 调查对象的全体 个体 总体中的每一个被考察的对象 样本 在进行抽样调查时,从总体中抽取的部分 抽样 在进行抽样调查时,从总体中抽取样本的过程 样本(容)量 样本中个体的数目 总体的分布 总体中各类数据的百分比 知识点三: 简单随机抽样 1定义: 一般地,从N(N为正整数)个不同个体构成的总体中,逐个不放回地抽取n(1≤n<N)个个体组成样本,并且每次抽取时总体内的每个个体被抽到的可能性 ,这样的抽样方法通常叫作简单随机抽样. 2.抽签法和随机数法 ①抽签法的具体步骤: (i)给总体中的每个个体编号; (ii)抽签. ②随机数法中常利用转盘或摸球、随机数表、科学计算器或计算机等工具产生随机数. 其中利用随机数表产生随机数是一个常用的方法,具体步骤如下: (i)给总体中的每个个体编号; (ii)在随机数表中随机抽取某行某列作为抽样的起点,并规定读取方法; (iii)依次从随机数表中抽取样本号码,凡是抽到编号范围内的号码,就是样本的号码,并 相同的号码,直至抽满为止. 知识点四:分层随机抽样: 1.定义: 将总体按其属性特征分成互不交叉的若干类型(有时称作层),然后在每个类型中按照所占比例随机抽取一定的个体,这种抽样方法通常叫作 . 2. 分层随机抽样的特点 (1)适用于总体由 的几部分组成的情况; (2)分层随机抽样中,按抽样比例确定每层抽取个体的数量; (3)分层随机抽样也是等可能抽样,每个个体被抽到的可能性都是,而且在每层抽样时,可以根据个体情况采用不同的抽样方法; (4)分层随机抽样能充分利用已掌握的信息,使样本具有良好的代表性. 3.分层随机抽样的一般步骤 知识点五:频率分布直方图 1. 定义 在频率分布直方图中,每个小矩形的底边长是该组的组距,每个小矩形的高是该组的频率与组距的比,从而每个小矩形的面积等于该组的频率,即每个小矩形的面积=组距×= . 各个小矩形的面积总和等于1. 2. 画频率分布直方图的步骤 (1)计算极差:极差为一组数据中最大值与最小值的差. (2)确定组距与组数:为方便起见,一般取等长组距,并且组距应力求“取整”,组数应力求合适. 当数据在120个以内时,通常按照数据的多少分成5组~12组. 极差、组距、组数之间有如下关系: ①若为整数,则=组数; ②若不为整数,则[ ] +1=组数([x]表示不大于x的最大整数). (3)分组:通常对组内数据所在区间取左闭右开区间,最后一组取闭区间. (4)列表:统计各组数据的频数,计算频率,完成频率分布表. (5)画频率分布直方图:根据频率分布表,画出频率分布直方图. 3. 绘制频率分布直方图的注意点 (1)各组频率的和等于1. (2)在xOy坐标平面内画频率分布直方图时,x=样本数据,y= ,这样每一组的频率可以用该组的组距为底边长、为高的小矩形的面积来表示,其中矩形的高= = ×频数. (3)同样一组数据,组距不同,横轴、纵轴单位不同,得到的频率分布直方图的形状也会不同. 知识点六:频率拆线图 1.通常,在频率分布直方图中,按照分组原则,再在左边和右边各加一个区间. 从所加的左边区间的中点开始,用线段依次连接各个矩形的顶端中点,直至右边所加区间的中点,就可以得到一条折线,我们称之为频率折线图. 2. 一般地,样本容量越大,用样本的频率分布去估计总体的分布就越精确. 随着样本容量的增大,所划分的区间数也可以随之增多,而每个区间的长度则会相应随之减小,相应的频率折线图就会越来越接近于一条光滑曲线. 知识点七:样本的数字特征 1.样本的数字特征的定义 (1) 平均数是指一组数据的 . (2) 一般地,中位数是将一组数据按从小到大的顺序排列后,“中间”的那个数据. (3)众数是指一组数据中出现次数最多的数据. (4) 极差和方差都刻画数据的离散程度. 极差是数据中最大值和最小值的差. 方差刻画的是数据偏离平均数的离散程度. (5) 定义方差的算术平方根s==为标准差,其中x1,x2,…,xn是样本数据,n是样本容量, 是样本平均数. 特别说明:标准差(方差)的作用 (1)标准差(方差)较大,数据的离散程度较大;标准差(方差)较小,数据的离散程度较小. (2)在实际应用中,常常把平均数与标准差(方差)结合起来进行决策. 在平均数相等的情况下,比较标准差(方差)以确定稳定性. 2. 平均数和方差的性质 若x1,x2,…,xn的平均数为,方差为s2,标准差为s,则以下数据的平均数、方差和标准差有如下规律: 数据 平均数 方差 标准差 x1,x2,…,xn s2 s x1+b,x2+b,…,xn+b(b为常数) +b s2 s ax1,ax2,…,axn(a为常数) a a2s2 |a|s ax1+b,ax2+b,…,axn+b(a,b为常数) a+b a2s2 |a|s 知识点八:用样本的数字特征估计总体的数字特征 1. 定义 一般情况下,如果样本容量恰当,抽样的方法比较合理,那么样本的数字特征能够反映总体的数字特征. 在允许一定误差存在的前提下,可以用样本的数字特征去估计总体的数字特征. 2. 平均数、中位数、众数与频率分布直方图的关系: (1)在样本数据的频率分布直方图中, 就是最高的小矩形中某个(些)点的横坐标. (2)由于在样本中,有50%的个体小于或等于中位数,也有50%的个体大于或等于中位数,因此在频率分布直方图中,中位数左侧和右侧的小矩形的面积和应该相等,据此可以估计中位数的值. (3)平均数是频率分布直方图的“重心”, 是频率分布直方图的平衡点. 用频率分布直方图估计平均数时,平均数的估计值等于频率分布直方图中各个小矩形的面积与小矩形底边中点的横坐标(组中值)之积的和. 特别说明: 利用频率分布直方图求得的众数、中位数和平均数均为近似值,往往与由实际数据得出的不一致,但它们能粗略估计众数、中位数和平均数. 知识点九:分层随机抽样的平均数与方差 1. 分层随机抽样的平均数 一般地,将样本a1,a2,…,am和样本b1,b2,…,bn合并成一个新样本,则这个新样本的平均数为=·+·. 于是,当已知上述两层构成的新样本中每层的平均数分别为 和 时,可得这个新样本的平均数为w1+w2,其中w1=,w2=,w1,w2称为权重. 更一般地,设样本中不同层的平均数和相应权重分别为,…, 和w1,w2,…,wn,则这个样本的平均数为w1+w2+…+wn= 2. 分层随机抽样的方差 设样本中不同层的平均数分别为, ,…, ,方差分别为,…, ,相应的权重分别为w1,w2,…,wn,则这个样本的方差为s2=wi[+(-)2],其中为这个样本的平均数. 知识点十:百分位数 1. 百分位数的定义 一般地,当总体是连续变量时,给定一个百分数p∈(0,1),总体的p分位数有这样的特点:总体数据中的任意一个数小于或等于它的可能性是p. 2. 四分位数 25%,50%,75%分位数是三个常用的百分位数. 把总体数据按照从小到大排列后,这三个百分位数把总体数据分成了4个部分,在这4个部分取值的可能性都是. 因此这三个百分位数也称为总体的 . 其他常用的百分位数有1%,5%,10%,90%,95%,99%. 总体的p分位数通常是未知的,人们用样本的p分位数来估计它,样本容量越大,估计越准确. 3. 求百分位数的步骤 计算一组n个数据的p分位数的一般步骤如下: 第一步,按照从小到大排列原始数据; 第二步,计算i=np; 第三步,若i不是整数,大于i的最小整数为j,则p分位数为第j项数据;若i是整数,则p分位数为第i项与第(i+1)项数据的平均数. 特别说明:根据频率分布直方图计算样本数据的百分位数,首先要进行频率分布直方图中各组数据频率的计算,然后需估计百分位数在哪一组,最后应用方程思想设出百分位数,解方程即可. 原创精品资源学科网独家享有版权,侵权必究!2 学科网(北京)股份有限公司 学科网(北京)股份有限公司 【易错点】01 抽样偏差与样本容量忽视 辨析:忽略小样本估计误差;分层抽样未按比例分配导致系统性偏差. 【典例1】某学生为了估计全校学生的平均身高,调查了坐在自己旁边的3名同学,将他们身高的平均值作为全校学生平均身高的估计值. (1)该调查是抽样调查吗? (2)如果是抽样调查,请指出总体、个体、样本和样本容量; (3)这个调查结果能较好地反映总体情况吗?请说明理由. 【典例2】某奶茶店推出新品,为预估受欢迎度,店主连续3天在排队顾客中调查50人,其中45人表示喜欢.店主认为“90%顾客喜爱新品”. (1)该结论可能因何种偏差失真? (2)如何设计更可靠的抽样方案? 【易错点】02 数字特征的运算与实际意义理解不清 辨析:(1)不知怎样计算平均数、中位数、众数而出错; (2)对平均数、中位数、众数等统计特征数的实际意义理解不透. 【典例1】有一组数据24,29,,25,22,,20,24,28,25.若该组数据的中位数与众数相等,则平均数为( ) A.24.4    B.25.8    C.24.4或25.8    D.24.4或24.8 【典例2】平均数、中位数和众数都是刻画一组数据的集中趋势的信息,它们的大小关系和数据分布的形态有关.在下图分布形态中,、、分别对应这组数据的平均数、中位数和众数,则下列关系正确的是(   ) A. B. C. D. 【易错点】03 忽视线性变换后对方差与标准差的影响 辨析:混淆线性变换后方差与标准差的变化规律. 【典例1】数据标准差为2,求的标准差. 【典例2】有一组样本数据,,…,,其平均数和方差分别为,.由这组数据得到一组新样本数据,,…,.其中,其平均数和方差分别为,,则(   ) A. B. C. D. 重难点01 普查和抽查的选择及总体、样本、样本容量概念 (1)总体:统计中所考察对象的某一数值指标的全体构成的集合称为总体. (2)个体:构成总体的每一个元素叫做个体. (3)样本:从总体中抽取若干个个体进行考察,这若干个个体所构成的集合叫做总体的一个样本,样本中个体的数目叫做样本容量. 1.(25-26高一·重庆·开学考试)下列调查中最适合采用全面调查(普查)的是(   ) A.了解长寿沙田柚的甜度情况 B.了解某品牌新能源汽车电池的续航能力 C.了解重庆市中学生收看9月3日阅兵直播情况 D.对我国首艘电磁弹射航空母舰福建舰各零部件质量情况的调查 2.(25-26高一·重庆潼南·开学考试)下列调查中,适合采用抽样调查的是(   ) A.调查重庆市鲁能巴蜀中学九年级(1)班50名同学的视力情况 B.重庆西站对乘坐高铁的旅客进行安检 C.为保证飞机飞行安全,工人对其零部件进行检查 D.调查重庆市中学生的周末作业完成时间 3.(25-26高一·全国·开学考试)为了解某校七年级学生的近视情况,从中随机抽取40名学生进行调查,其中40是该调查的(    ) A.总体 B.样本容量 C.个体 D.样本 4.(2025高一·天津河北·期末)为了了解某地参加计算机水平测试的5000名学生的成绩,从中抽取了200名学生进行调查分析.在这个问题中,被抽取的200名学生是(   ) A.个体 B.样本 C.总体 D.样本量 5.(2025高一·全国·专题练习)某高中为了了解高一年级1200名学生的视力情况,抽查了其中200名学生的视力,并进行统计分析.下列叙述正确的是(    ) A.上述调查属于普查 B.每名学生是总体的一个个体 C.200名学生的视力是总体的一个样本 D.1200名学生是总体 6.(2025高一·黑龙江双鸭山·阶段练习)某中学研究人员希望调查该校高中学生平均每天的自习时间.他调查了100名学生,发现他们每天的平均自习时间是3h.这里的总体是(    ) A.该校的所有高中学生 B.该校所有高中学生的平均每天自习时间 C.所调查的100名高中学生 D.所调查的100名高中学生的平均每天自习时间 重难点02 简单随机抽样的选择及随机数法 简单随机抽样常用抽签法(适用于总体中个体数较少的情况)、随机数法(适用于个体数较多的情况). 7.【多选】(25-26高一·全国·单元测试)下列从总体中抽得样本的方法是简单随机抽样的是(    ) A.总体编号为1~75,随机依次选出编号范围内的10个数作为抽中的编号 B.总体编号为1~75,在0~99之间产生随机整数r,若或,则舍弃,重新抽取 C.总体编号为1~75,在0~99之间产生随机整数r,r除以75的余数作为抽中的编号,若余数为0,则抽中75 D.总体编号为6001~6879,在1~879之间产生随机整数r,把作为抽中的编号 8.(2025高三·全国·专题练习)下列抽样的方式属于简单随机抽样的个数为(    ) ①将500个个体编号,把号签放在一个不透明的容器内搅拌均匀,从中逐个抽取50个作为样本;②某班有55名同学指定个子最高的5名同学参加学校组织的篮球赛;③福利彩票用摇奖机摇奖. A.0 B.1 C.2 D.3 9.(2025高二·四川广安·阶段练习)因乙肝疫苗事件,需要对某种疫苗进行检测,现从支中抽取支进行检验,利用随机数表抽取样本时,先将支按进行编号,如果从随机数表第行第列的数开始向右读,依次读取三位数,则得到的第个样本个体的编号是 (下面摘取了随机数表第行至第行) 10.(2025高二·上海·阶段练习)某公司利用随机数表对生产的900支新冠疫苗进行抽样测试,先将疫苗按000,001,..,899进行编号,从中抽取90个样本,若选定从第4行第4列的数开始向右读数,(下面摘取了随机数表中的第3行至第5行),根据下图,读出的第6个数的编号是 . 1676622766 5650267107 3290797853 1355385859 8897541410 1256859926 9682731099 1696729315 5712101421 8826498176 5559563564 3854824622 3162430990 0618443253 2383013030 11.(2025高一·福建福州·期末)用抽签法从学号为1到50的50名学生(其中含学生李华)中不放回抽取5名学生进行问卷调查,每次抽取一个号码,共抽取5次,设李华第一次被抽到的概率为,第五次被抽到的概率为,则(    ) A.a = ,B.a = ,C.a = , D.a = , 重难点03 分层抽样的选择及求法 抽样比=. 12.(2025高一·安徽合肥·期末)某校为了解同学们对“天宫课堂”这种授课模式的兴趣,决定利用分层抽样的方法从高一、高二、高三学生中选取90人进行调查,已知该校高一年级学生有400人,高二年级学生有500人,高三年级学生有600人,则抽取的学生中,高一年级有(    ) A.40人 B.36人 C.30人 D.24人 13.(2025高一·江苏淮安·期末)某校高一年级共有学生1000人,选科组合只有“物化生”、“物化地”和“历政地”三种组合,其中选择“物化生”、“物化地”的学生人数分别为600,250.现采用分层抽样的方法选出40人进行职业生涯规划调查,则从“历政地”组合中选出的学生人数为(    ) A.3 B.5 C.6 D.10 14.(25-26高二·湖南·阶段练习)某工厂有高级技工60人,中级技工90人,初级技工150人,现采用分层抽样的方法从中抽取一个容量为的样本,已知从中级技工中抽取了6人,则 . 15.(2025高二·云南·期末)某市有大型超市家,中型超市家,小型超市家.为掌握全市超市的营业情况,现按大型超市、中型超市、小型超市进行分层,通过分层随机抽样的方法抽取一个容量为的样本,则应抽取小型超市(   ) A.家 B.家 C.家 D.家 16.(25-26高三·湖北·阶段练习)某小区对小区内的2 000名居民进行走访调查,各年龄段男、女居民人数如下表.已知在小区的居民中随机抽取1人,抽到20岁~50岁女居民的概率是0.19.现用分层随机抽样的方法在全小区抽取200名居民,则应在50岁以上的居民中抽取的女居民人数为(   ) 1岁~20岁 20岁~50岁 50岁以上 女居民 370 X Y 男居民 380 370 250 A.75 B.50 C.25 D.20 17.【多选】(2025高一·山东泰安·期末)某公司生产三种型号的轿车,年产量分别为1500辆、6000辆和2000辆.为检验产品质量,公司质检部门要抽取57辆进行检验,则下列说法正确的是(    ) A.应采用分层随机抽样抽取 B.应采用抽签法抽取 C.三种型号的轿车依次应抽取9辆、36辆、12辆 D.这三种型号的轿车,每一辆被抽到的可能性相同 重难点04 分层抽样的平均数,方差和标准差的求法 在分层随机抽样中,如果第一层的样本量为m,平均数为,则样本的平均数为. 18.(2025高一·全国·课后作业)数据的平均数为,数据的平均数为,证明:. 19.【多选】(2025高一·广东广州·期末)某校为了解高一年级学生的身高情况,采用样本量按比例分配的分层随机抽样,抽取了男生20人,其平均数和方差分别为172和12.抽取了女生30人,其平均数和方差分别为162和24.由这些数据,可计算出总样本平均数与总样本方差分别是(    ). A. B. C. D. 20.(2025高一·北京大兴·期末)某校有高中学生1000人,其中男生400人,女生600人.A同学按男生、女生进行分层,采用分层随机抽样的方法调查该校全体高中学生的身高(单位:)情况,总样本量为100,计算得到男生身高样本的平均数为170,方差为16;女生身高样本的平均数为160,方差为18. (1)如果已知男、女样本量按比例分配,求总样本的平均数和方差; (2)如果已知男、女样本量分别为30和70,在这种情况下,总样本的平均数为,总样本的方差为,分别直接写出与与的大小关系; (3)如果已知B同学采用了简单随机抽样的方法调查该校全体高中学生的身高情况,样本量为100,其样本平均数为,能否认为比更接近总体平均身高,说明理由. 重难点05 频率分布直方图及其应用 1.频率分布直方图的数据特点: ①频率分布直方图中纵轴上的数据是各组的频率除以组距的结果,不要误认为纵轴上的数据是各组的频率,不要和条形图混淆; ②频率分布直方图中各小长方形的面积之和为1,这是解题的关键,常利用频率分布直方图估计总体分布. 2.频率分布直方图的数字特征 (1)众数:最高矩形的底边中点的横坐标. (2)中位数:中位数左边和右边的矩形的面积和应该相等. (3)平均数:平均数在频率分布直方图中等于各组区间的中点值与对应频率之积的和. 21.(25-26高三·河北邢台·阶段练习)从某小区抽取100户居民用户进行月用电量(单位:)调查,将得到的数据按分为6组,画出的频率分布直方图如图所示,则在被调查的用户中,月用电量落在内的户数为(    ) A.35 B.40 C.42 D.45 22.(25-26高二·湖南长沙·开学考试)工厂组织全体员工就作业能力进行测试,全体员工得分均在内,将其分成,, ,,,共六组,数据绘制成如图所示的频率分布直方图,若该工厂共有名员工,则估计得分少于分的人数为(   )    A. B. C. D. 23.(2025高一·北京通州·期末)某市为了减少水资源浪费,为确定一个比较合理的标准,从该市随机调查了200户用户居民,获得了他们某月的用水量数据,整理得到如下频率分布直方图,则用水量小于1.5立方米的用户数为(    ) A.20 B.30 C.50 D.60 24.【多选】(2025高一·河南许昌·期末)为传承和弘扬数学文化,激发学生学习数学的兴趣,某校高一年级组织开展数学文化知识竞赛.从参赛的2000名考生成绩中随机抽取100个成绩进行统计,得到如图所示的频率分布直方图,其中90分以上视为优秀,则频率/组距(    ) A.a的值为0.030 B.抽取的考生成绩的极差介于40分至60分之间 C.2000名考生中约有10名成绩优秀 D.估计有一半以上的考生的成绩介于70分至90分之间 25.【多选】(2025高三·云南德宏·阶段练习)某学校为了提高高三年级学生的某学科成绩,在第一次联考后采取了“培优补短”等一系列举措.为了更好地总结经验,现从高三年级1000名学生中随机抽取100名学生,将其前后两次联考成绩(满分150分)分别按照[50,70),[70,90),…,[130,150]分成五组,绘制成频率分布直方图,如图所示.下列说法正确的是(   ) A. B.估计该年级第二次联考成绩在130分以上的学生比第一次联考对应分数段的多10人 C.第二次联考学生的成绩波动更小 D.与第一次联考相比,第二次联考成绩在[50,90)内的学生人数减少,在[110,150]内的学生人数增加 26.【多选】(2025·江西·模拟预测)某机构调查了一个工业园区内的小型民营企业年收入情况,并将所得数据按,,…,分成六组,画出了样本频率分布直方图,则下列结论正确的是(   ) A.该工业园区内年收入落在区间内的小型民营企业的频率为0.55 B.样本中年收入不低于500万元的小型民营企业的个数比年收入低于500万元的个数少 C.规定年收入在400万元以内(不含400万元)的民营企业才能享受减免税政策,则该工业园区有70%的小型民营企业能享受到减免税政策 D.估计样本中小型民营企业年收入的中位数等于平均数 27.【多选】(2025高二·内蒙古·期末)某地种植的新品种哈密瓜获得了丰收,随机从采摘好的哈密瓜中挑选了100个称重(单位:),并整理数据,得到如图所示的频率分布直方图.根据此频率分布直方图,下面结论正确的是(   ) A. B.估计该哈密瓜的质量不低于1.6kg的比例为30% C.估计有一半以上的该哈密瓜的质量介于1.4kg至1.6kg之间 D.估计该哈密瓜的质量的中位数介于1.5kg至1.6kg之间 重难点06 条形、扇形及折线图的应用 几种统计图表的特点及使用方法 (1)通过扇形图可以很清楚地表示出各部分数量同总数之间的关系. (2)折线图可以显示随时间(根据常用比例设置)而变化的连续数据,因此非常适用于显示在相等时间间隔下数据的趋势. 28.(2025高一·山东潍坊·期末)某市教育局对全市高三年级的学生身高进行抽样调查,随机抽取了200名学生,他们的身高分成,,,,五个组,根据抽样结果得到统计图表,则样本中(   ) A.女生人数和男生人数一样多 B.组中男生人数多于女生人数 C.组男生人数为24人 D.组人数最少 29.(2025高三·上海·专题练习)某中学四位同学利用假期到一贫困村参加社会实践活动,感受年该村精准扶贫及新农村建设的变化.经过实地调查显示,该村年的经济收入增加了一倍.实现翻番,精准扶贫取得惊人成果.为更好地了解该村的经济收入变化情况,为后期精准扶贫方向提供决策参考,四位同学统计了该地区新农村建设前后农村的经济收入构成比例.得到饼图: 四位同学依据上述饼图,分别得出以下四个结论,其中结论中错误的是( ) A.精准扶贫及新农村建设后,种植收入减少 B.精准扶贫及新农村建设后,其他收入增加了一倍以上 C.精准扶贫及新农村建设后,养殖收入增加了一倍 D.精准扶贫及新农村建设后,养殖收入与第三产业收入的总和超过了经济收入的一半 30.(2025高一·河北·阶段练习)在统计学中,月度同比是指本月份和上一年同月份相比较的增长率,月度环比是指本月份和上一个月份相比较的增长率.如图是国家统计局发布的2023年全国居民消费价格月度涨跌幅度折线图,则下列说法正确的是(    ) A.2023年2月至6月居民的消费价格持续下降 B.2023年7月居民消费价格高于2022年同期 C.2023年4月居民消费价格环比上涨0.1%,同比下降0.1% D.2023年8月的居民消费价格是全年最高的 重难点07 总体百分位数的估计 1.计算一组n个数据的第p百分位数的一般步骤 2.频率分布直方图中第p百分位数的计算 (1)确定百分位数所在的区间[a,b). (2)确定小于a和小于b的数据所占的百分比分别为fa%,fb%,则第p百分位数为a+×(b-a). 31.(25-26高三·陕西西安·开学考试)已知样本数据5,6,6,6,8,9,10,11,则该组数据的第60百分位数为(    ) A.6 B.7 C.8 D.9 32.(2025高二·湖南·学业考试)若一组数据按照从小到大的顺序排列如下:12,15,16,21,24,25,27,33,36,38.则该组数据的第41百分位数为(  ) A.21 B.24 C.25 D.27 33.(2025·福建漳州·模拟预测)样本数据的下四分位数为(   ) A.3 B.3.5 C.10 D.11 34.(25-26高二·云南·阶段练习)为了深入调研学生会考模拟考试成绩,掌握学生数学会考成绩情况,现从该年级同学中随机抽取100名学生,对其测试成绩(满分:100分)进行统计,得到样本频率分布直方图,如图,下列说法不正确的是(   )    A. B.众数为85 C.第70百分位数为80 D.该样本平均成绩为76 35.(2025高二·黑龙江大庆·阶段练习)某校组织全体学生参加了主题为“建党百年,薪火相传”的知识竞赛,随机抽取了200名学生进行成绩统计,发现抽取的学生的成绩都在50分至100分之间,进行适当分组后(每组为左闭右开的区间),画出频率分布直方图如图所示,全校学生成绩的第70百分位数估计值为(    )    A.80分 B.90.25分 C.92.5分 D.95分 36.(25-26高二·贵州黔南·开学考试)某校为了帮助高一学生更好地了解自己是否适合选读物理方向,在预选科之前组织了高一年级物理测试,并从中随机抽取了100名学生的物理成绩,整理得到如图所示的频率分布直方图. (1)求的值; (2)学校建议此次物理测试成绩在年级前的学生选报物理方向,其余学生建议选报历史方向,某同学想选报物理方向,根据频率分布直方图估计,他此次物理成绩应不低于多少分才能符合学校的建议?(保留小数点后一位) 37.(2025高三·全国·专题练习)某农产品公司新研发出一种新品种蔬菜种子,为了了解此品种蔬菜果实的平均长度,研究人员试种植后,从收获的蔬菜果实中随机选取了20个,得到的果实长度数据如下表:(单位:). 序号() 1 2 3 4 5 6 7 8 9 10 果实长度 11.6 13.0 12.8 11.8 12.0 12.8 11.5 12.7 13.4 12.4 序号() 11 12 13 14 15 16 17 18 19 20 果实长度 12.9 12.8 13.2 13.5 11.2 12.6 11.8 12.8 13.2 12.0 (1)根据样本估计此品种蔬菜果实长度的平均值和方差; (2)研究人员对该品种蔬菜果实进行了等级划分,果实长度大于为一等品,其余均为二等品,若试种植所收获的所有蔬菜中有85%的蔬菜为一等品,根据样本估计等级划分的标准. 重难点08 总体集中趋势的估计 (1)众数:一组数据中重复出现次数最多的数. (2)中位数:把一组数据按从小到大的顺序排列,处在中间位置(或中间两个数的平均数)的数叫做这组数据的中位数. (3)平均数:如果n个数x1,x2,…,xn,那么=(x1+x2+…+xn)叫做这n个数的平均数. 38.(25-26高三·湖北武汉·阶段练习)样本数据的中位数是(    ) A.7 B.9 C.11 D.13 39.(25-26高三·重庆·阶段练习)高三某班有 15 名男生和 35 名女生, 在某次月考的数学成绩中, 男生的平均分比女生的平均分多 5 分, 则男生的平均分比全班的平均分(      ) A.多 1.5 分 B.多 2.5 分 C.多 3.5 分 D.多 4.5 分 40.(25-26高三·河北衡水·开学考试)一组数据从小到大排列为:,,,,,,若这组数据的中位数比分位数小,则的值为(   ) A.6 B.7 C.8 D.9 41.(2025高二·广东汕头·期末)汕头市某中学为了解高二学生的期末数学考试成绩,研究人员对700名学生进行调查,根据所得数据制成如图所示的频率分布直方图,则这700名学生期末数学考试成绩的中位数约为(    )    A.92.5 B.95 C.97.5 D.100 42.【多选】(25-26高二·河南·阶段练习)为纪念中国人民抗日战争暨世界反法西斯战争胜利80周年,某地面向全体中学生开展了以“铭记历史、缅怀先烈、珍爱和平、开创未来”为主题的知识竞赛活动.现从中随机抽取了200名学生的成绩(满分100分),将所得统计结果按分组,得到如图所示的频率分布直方图(每组数据以该组所在区间的中点值为代表),则(    ) A. B.估计样本数据的平均数为82 C.估计样本数据的众数为95 D.估计样本数据的平均数小于中位数 43.【多选】(25-26高二·江苏南京·阶段练习)2024年手机迎来发展新机遇,国内两家传媒公司共同发起了中国手机消费行为调查,下表为根据调查得到的2024年1000名中国手机用户购买手机价格频数表,同一组中的数据用该区间的中点值代表,则(  ) 价格(千元) (0,5] (5,10] (10,15] (15,20]      频数 150 600 180 50 20 A.估计1000名用户购买手机价格的众数为7.5 B.估计1000名用户购买手机价格的平均数超过8 C.估计1000名用户购买手机价格的中位数不超过6 D.估计1000名用户购买手机价格的84%分位数不超过10 44.【多选】(25-26高三·江苏镇江·开学考试)某农业研究部门在面积相等的100块稻田上种植同一种新型水稻,得到各块稻田的亩产量与田块数的关系(单位:),并整理下表 亩产量 田块数 6 12 18 30 24 10 据表中数据,下列结论正确的是(    ) A.100块稻田亩产量的中位数小于 B.100块稻田中亩产量低于的稻田所占比例低于 C.100块稻田亩产量的极差介于至之间 D.100块稻田亩产量的平均值介于至之间 45.(2025高一·广西贵港·阶段练习)已知数据,,…,的平均数为4,那么数据,,…,的平均数为(    ) A. B. C.1 D.17 46.(2025高二·河北·学业考试)样本数据,,,,,的平均数为5,若,则数据,,,,的平均数是(    ) A.4 B.6 C.7 D.8 重难点09 总体离散程度的估计 (1)平均数、中位数、众数描述其集中趋势,方差和标准差描述波动大小. (2)方差的简化计算公式:或写成,即方差等于原数据平方的平均数减去平均数的平方. 47.(25-26高二·四川成都·阶段练习)下列各组数据中方差最大的一组是(   ) A.6,6,6,6,6B.5,5,6,7,7 C.4,5,6,7,8 D.2,3,6,8,9 48.(25-26高三·江苏南京·开学考试)有一组样本数据1,2,2,2,3,5,去掉1和5后,相较于原数据不变的是(  ) A.平均数 B.极差 C.方差 D.中位数 49.(25-26高二·湖北·阶段练习)某校中秋节举行诗歌朗诵比赛,共有6名评委,选手甲得分的平均分和方差分别为84和17,若去掉最高分90和最低分78后,选手甲得分的方差变为(   ) A.6.5 B.7.5 C.8.5 D.9.5 50.(2025·河北邯郸·模拟预测)已知组数据“”和组数据“”()的平均数分别为80,90,方差分别为15,20,若,则由这两组数据构成的所有数据的总体方差为(    ) A.15 B.32 C.35 D.42 51.(25-26高三·云南曲靖·阶段练习)甲、乙两名选手在射击训练中各射击5次,成绩(单位:环)如下: 甲 7 8 9 8 8 乙 10 6 7 10 7 记甲、乙的平均成绩和方差分别为,和,,则下列结论正确的是(   ) A., B., C., D., 52.(2025高一·北京延庆·开学考试)某大学为了解学生对两家餐厅的满意度情况,从在两家餐厅都用过餐的学生中随机抽取了100人,每人分别对这两家餐厅进行满意指数打分(满意指数是指学生对餐厅满意度情况的打分,分数设置为2-10分.根据打分结果按分组,得到如图所示的频率分布直方图,其中餐厅满意指数在中有30人.    (1)求餐厅满意指数频率分布直方图中a,b的值; (2)利用样本估计总体的思想,估计餐厅满意指数和餐厅满意指数的平均数及方差(同一组中的数据用该组区间中点值作代表); 53.(2025高三·全国·专题练习)某厂为比较甲,乙两种工艺对橡胶产品伸缩率的处理效应,进行10次配对试验,每次配对试验选用材质相同的两个橡胶产品,随机地选其中一个用甲工艺处理,另一个用乙工艺处理,测量处理后的橡胶产品的伸缩率.甲,乙两种工艺处理后的橡胶产品的伸缩率分别记为,试验结果如下: 试验序号 1 2 3 4 5 6 7 8 9 10 伸缩率 545 533 551 522 575 544 541 568 596 548 伸缩率 536 527 543 530 560 533 522 550 576 536 记,记的样本平均数为,样本方差为. (1)求; (2)判断甲工艺处理后的橡胶产品的伸缩率较乙工艺处理后的橡胶产品的伸缩率是否有显著提高,(如果,则认为甲工艺处理后的橡胶产品的伸缩率较乙工艺处理后的橡胶产品的伸缩率有显著提高,否则不认为有显著提高). 12 / 49 学科网(北京)股份有限公司 $

资源预览图

第6章 统计(知识清单)数学北师大版2019必修第一册
1
第6章 统计(知识清单)数学北师大版2019必修第一册
2
第6章 统计(知识清单)数学北师大版2019必修第一册
3
所属专辑
相关资源
由于学科网是一个信息分享及获取的平台,不确保部分用户上传资料的 来源及知识产权归属。如您发现相关资料侵犯您的合法权益,请联系学科网,我们核实后将及时进行处理。