内容正文:
限时练习:60min 完成时间: 月 日 天气:
作业14 统计综合
1.简单随机抽样
(1)定义:一般地,设一个总体含有N个个体,从中逐个不放回地抽取n个个体作为样本(n≤N),如果每次抽取时总体内的各个个体被抽到的机会都相等,就把这种抽样方法叫做简单随机抽样.这样抽取的样本,叫做简单随机样本.
(2)常用方法:抽签法和随机数法.
2.分层抽样
(1)在抽样时,将总体分成互不交叉的层,然后按照一定的比例,从各层独立地抽取一定数量的个体,将各层取出的个体合在一起作为样本,这种抽样方法是一种分层抽样.
(2)分层抽样的应用范围
当总体是由差异明显的几个部分组成时,往往选用分层抽样.
3.频率分布直方图
(1)纵轴表示,即小长方形的高=;
(2)小长方形的面积=组距×=频率;
(3)各个小方形的面积总和等于1.
频率分布直方图中的常见结论
(1)众数的估计值为最高矩形的中点对应的横坐标.
(2)平均数的估计值等于频率分布直方图中每个小矩形的面积乘以小矩形底边中点的横坐标之和.
(3)中位数的估计值的左边和右边的小矩形的面积和是相等的.
4.频率分布表的画法
第一步:求极差,决定组数和组距,组距=;
第二步:分组,通常对组内数值所在区间取左闭右开区间,最后一组取闭区间;
第三步:登记频数,计算频率,列出频率分布表.
5.条形图、折线图及扇形图
(1)条形图:建立直角坐标系,用横轴(横轴上的数字)表示样本数据类型,用纵轴上的单位长度表示一定的数量,根据每个样本(或某个范围内的样本)的数量多少画出长短不同的等宽矩形,然后把这些矩形按照一定的顺序排列起来,这样一种表达和分析数据的统计图称为条形图.
(2)折线图:建立直角坐标系,用横轴上的数字表示样本值,用纵轴上的单位长度表示一定的数量,根据样本值和数量的多少描出相应各点,然后把各点用线段顺次连接,得到一条折线,用这种折线表示出样本数据的情况,这样的一种表示和分析数据的统计图称为折线图.
(3)扇形图:用一个圆表示总体,圆中各扇形分别代表总体中的不同部分,每个扇形的大小反映所表示的那部分占总体的百分比的大小,这样的一种表示和分析数据的统计图称为扇形图.
6.百分位数、众数、平均数的定义
(1)如果将一组数据从小到大排序,并计算相应的累计百分位,则某一百分位所对应数据的值就称为这一百分位的百分位数.
一般地,一组数据的第p百分位数是这样一个值,
它使得这组数据中至少有p%的数据小于或等于这个值,且至少有(100-p)%的数据大于或等于这个值.
(2)第25百分位数又称第一四分位数或下四分位数;
第75百分位数又称第三四分位数或上四分位数.
(3)众数
一组数据中出现次数最多的数据叫做这组数据的众数.
(4)平均数
一组数据的算术平均数即为这组数据的平均数,n个数据x1,x2,…,xn的平均数=(x1+x2+…+xn).
7.样本的数字特征之方差
如果有n个数据x1,x2,…,xn,那么这n个数的
(1)标准差s= .
(2)方差s2=[(x1-)2+(x2-)2+…+(xn-)2].
8. 平均数、方差的公式推广
(1)若数据x1,x2,…,xn的平均数为,则mx1+a,mx2+a,mx3+a,…,mxn+a的平均数是m+a.
(2)若数据x1,x2,…,xn的方差为s2,则数据ax1+b,ax2+b,…,axn+b的方差为a2s2.
一、单选题
1.①一次数学考试中,某班有12人的成绩在100分以上,30人的成绩在90~100分,12人的成绩低于90分,现从中抽取9人了解有关考试题目难度的情况;②运动会的工作人员为参加4×100 m接力赛的6支队伍安排跑道.针对这两件事,恰当的抽样方法分别为( )
A.分层随机抽样,简单随机抽样
B.简单随机抽样,简单随机抽样
C.简单随机抽样,分层随机抽样
D.分层随机抽样,分层随机抽样
【答案】A
【分析】根据分层抽样和简单随机抽样的特点进行解答.
【详解】①中,考试成绩在不同分数段之间的同学有明显的差异,用分层随机抽样比较恰当;
②中,总体包含的个体较少,用简单随机抽样比较恰当.
故选:A
2.已知一组数据按从小到大的顺序排列为14,19,x,23,27,其中位数是22,则x的值为( )
A.24 B.23
C.22 D.21
【答案】C
【分析】根据给定条件,利用中位数的定义求解即得.
【详解】一组数据按从小到大的顺序排列为14,19,x,23,27,则中位数是x,
因为中位数是22,所以x=22.
故选:C
3.已知甲种杂交水稻近五年的产量数据为,乙种杂交水稻的产量数据为,则下列说法错误的是( )
A.甲种的样本极差小于乙种的样本极差
B.甲种的样本平均数等于乙种的样本平均数
C.甲种的样本中位数等于乙种的样本中位数
D.甲种的样本方差大于乙种的样本方差
【答案】D
【分析】求出极差判断A;求出平均数判断B;求出中位数判断C;求出方差判断D.
【详解】对于A,甲种的样本极差,乙种的样本极差,A正确;
对于B,甲种的样本平均数,
乙种的样本平均数,B正确;
对于C,甲种的样本中位数为10.0,乙种的样本中位数为10.0,C正确.
对于D,甲种的样本方差,
乙种的样本方差,D错误.
故选:D
4.某校举办了数学知识竞赛,把1000名学生的竞赛成绩(满分100分,成绩取整数)按,,,分成四组,并整理成如图所示的频率分布直方图,则下列说法正确的为( )
A.的值为0.015 B.估计这组数据的众数为80
C.估计这组数据的第60百分位数为87 D.估计成绩低于80分的有350人
【答案】C
【分析】利用频率分布直方图的性质可判定A,利用众数、百分位数的求法可判定B、C,根据频率分布直方图计算可估计总体判定D.
【详解】易知,解得,所以A错误;
由频率分布直方图可知众数落在区间,用区间中点表示众数即85,所以B错误;
由频率分布直方图可知前两组频率之和为,
前三组频率之和为,
故第60百分位数落在区间,设第60百分位数为,
则,解得,所以C正确;
成绩低于80分的频率为,所以估计总体有,故D错误.
故选:C.
5.已知数据,,…,的平均数为,方差为,数据,,,…,的平均数为,方差为,则( )
A., B.,
C., D.,
【答案】C
【分析】根据平均数和方差的性质得到答案.
【详解】已知样本数据的平均数为,方差为,
记数据的平均数为,方差为,
则,
,
由题意可得,.
故选:C
二、多选题
6.空气质量指数AQI是反映空气质量状况的指数,AQI指数的值越小,表明空气质量越好,AQI指数不超过50,空气质量为“优”;AQI指数大于50且不超过100,空气质量为“良”;AQI指数大于100,空气质量为“污染”.如图是某市2023年空气质量指数(AQI)的月折线图.下列关于该市2023年空气质量的叙述中,说法正确的是( )
A.全年平均AQI指数对应的空气质量等级为优或良
B.每月都至少有一天空气质量为优
C.2月、8月、9月和12月均出现污染天气
D.空气质量为“污染”的天数最多的月份是2月份
【答案】ABC
【分析】根据折线图观察可得答案.
【详解】对于A,根据AQI指数月折线图可知,全年平均AQI指数都小于100,故全年的平均AQI指数对应的空气质量等级为优或良,故A正确;
对于B,每个月AQI指数的最小值不超过50,故B正确;
对于C,2月、8月、9月和12月的AQI指数的最大值超过了100,故C正确;
对于D,从折线图只能知道,2月AQI指数的最大值最大,不能说明2月的空气质量为“污染”的天数最多,故D不正确.
故选:ABC
7.为了解“全民齐参与城市更美丽”的志愿服务情况,随机抽取了100名志愿者进行问卷调查,将这100名志愿者问卷调查的得分按,,,,分成5组,并绘制出频率分布直方图,如图所示,则下列结论正确的是( )
A.
B.估计这100名志愿者问卷调查得分的分位数为85
C.这100名志愿者问卷调查得分的平均数为75(同一组中的数据用该组区间的中点值为代表)
D.若采用分层随机抽样从得分在,内的志愿者中抽取8人,则抽取的这8名志愿者得分在内的人数为6
【答案】ABD
【分析】利用概率和为1,可求判断A;设这100名志愿者问卷调查得分的分位数为,可得,求解可判断B;求得100名志愿者问卷调查得分的平均数可判断C;求得8名志愿者得分在内的人数判断D.
【详解】对于A:由,解得,A正确.
对于B:设这100名志愿者问卷调查得分的分位数为,
则,解得,B正确.
对于C:这100名志愿者问卷调查得分的平均数为,C错误.
对于D:根据频率分布直方图可得抽取的这8名志愿者得分在内的人数为,D正确.
故选:ABD.
8.某学校为了解学生身高(单位:cm)情况,采用分层随机抽样的方法从4000名学生(该校男女生人数之比为)中抽取了一个容量为100的样本.其中,男生平均身高为175,方差为184,女生平均身高为160,方差为179.则下列说法正确的是参考公式:总体分为2层,各层抽取的样本量、样本平均数和样本方差分别为:,,,,,.记总的样本平均数为,样本方差为,则( )
参考公式:
A.抽取的样本里男生有60人
B.每一位学生被抽中的可能性为
C.估计该学校学生身高的平均值为170
D.估计该学校学生身高的方差为236
【答案】ABD
【分析】根据分层抽样的公式,以及利用每层样本的平均数和方差公式,代入总体的均值和方差公式,即可判断选项.
【详解】对于项,抽取的样本里男生有人,所以A项正确;
对于B项,由题可知,每一位学生被抽中的可能性为,所以B项正确;
对于C项,估计该学校学生身高的平均值为,所以C项错误;
对于D,估计该学校学生身高的方差为,所以D项正确.
故选:ABD
三、填空题
9.记样本数据10,18,8,4,16,24,6,8,32的中位数为a,平均数为b,则= .
【答案】
【分析】先将样本数据按从小到大进行排列,再根据样本数据的中位数、平均数概念和公式进行计算即可.
【详解】将样本数据按从小到大的顺序排列,得4,6,8,8,10,16,18,24,32,
所以中位数,
由平均数的计算公式得,
所以.
故答案为:.
10.某小组5位同学各拋掷一枚正方体骰子,将正面向上的点数按从小到大的顺序记录下来,得到一组统计数据.已知这组数据的平均数为整数,最大值为6,中位数为3,方差为1.6,则这组数据的众数为 .
【答案】3
【分析】根据题意将这组数据由小到大设出来,再根据方差为1.6可判断出平均数的取值有两种情况 ,对这两种情况分别讨论即可得出结果.
【详解】设这组数据为,则平均数大于等于,
假设平均数为3.因为,
所以平均数或,
若,则,
所以,解得;
若,则,
所以,此时无解.
所以这组数据的众数为3.
故答案为:3.
四、解答题
11.某工厂甲、乙两名工人参加操作技能培训,他们在培训期间参加的8次测试成绩记录如下:
甲:95 82 88 81 93 79 84 78
乙:83 92 80 95 90 80 85 75
(1)哪个工人的成绩较好?
(2)甲、乙成绩位于内的有多少?
【答案】(1)甲的成绩较好;
(2)4个,5个.
【分析】(1)根据给定数据,求出甲乙工人成绩的平均数和方差,再比较大小作答.
(2)求出标准差及指定区间,再观察数据即得.
【详解】(1)甲工人成绩的平均数,
乙工人成绩的平均数,
甲工人成绩的方差
,
乙工人成绩的方差
,
显然,所以甲的成绩较稳定,较好.
(2)由(1)知,,
甲的成绩位于区间,即内的有4个,
乙的成绩位于区间,即内的有5个.
12.果切是一种新型水果售卖方式,商家通过对整果进行消洗、去皮、去核、冷藏等操作后,包装组合销售,在“健康消费”与“瘦身热潮”的驱动下,果切更能满足消费者的即食需求.
(1)统计得到10名中国果切消费者每周购买果切的次数依次为:1,7,4,7,4,6,6,3,7,5,求这10个数据的平均数与方差;
(2)统计600名中国果切消费者的年龄,他们的年龄均在5岁到55岁之间,按照,,,,分组,得到频率分布直方图.
①估计这600名中国果切消费者中年龄不小于35岁的人数;
②估计这600名中国果切消费者年龄的中位数及平均数(结果保留整数).
【答案】(1)5;3.6
(2)①120;②24;25.
【分析】(1)根据平均数和方差的计算方法求得正确答案.
(2)①根据频率分布直方图求得正确答案;②根据中位数和平均数的求法计算求解.
【详解】(1),
.
(2)①600名中国果切消费者中年龄不小于35岁的人数为:
.
由,,可得,
所以,解得,
所以这600名中国果切消费者年龄的中位数为24.
②其平均数
.
1.年3月,树人中学组织三个年级的学生进行党史知识竞赛.经统计,得到前名学生分布的饼状图(如图)和前名中高一学生排名分布的频率条形图(如图),则下列命题错误的是( )
A.成绩前名的人中,高一人数比高二人数多30人
B.成绩第1-名的人中,高一人数不超过一半
C.成绩第1-50名的50人中,高三最多有32人
D.成绩第51-名的50人中,高二人数比高一的多
【答案】D
【分析】求得前名的人中,高一人数和高二人数判断选项A;求得成绩第1-名的人中,高一人数判断选项B;求得成绩第1-50名的50人中,高三最多有多少人判断选项C;求得成绩第51-名的50人中,高二人数与高一人数的关系判断选项D.
【详解】由饼状图,成绩前名的人中,高一人数比高二人数多
(人).故选项A判断正确;
由条形图知,成绩第1-100名的人中,前和后人数相等,
因此高一人数为,故选项B判断正确;
成绩第1-50名的50人中,高一人数为,
因此高三最多有32人. 故选项C判断正确;
成绩第51-名的50人中,高二人数无法确定,故选项D判断错误.
故选:D
2.设a,b,c的平均数为M,a与b的平均数为N,N与c的平均数为P.若,则M与P的大小关系是( )
A. B. C. D.不能确定
【答案】B
【分析】根据a,b,c的关系,求出M,P,作差计算即可.
【详解】由题意得,,,
∴,,.
又∵,∴,
∴,
∴.
故选:B.
3.(多选)已知一组不全相等的样本数据,由生成一组新的样本数据,则新数据与原数据中可能相等的量有( )
A.极差 B.平均数 C.中位数 D.标准差
【答案】BC
【分析】利用极差的定义可判断A选项;利用平均数公式可判断B选项;利用中位数的定义可判断C选项;利用方差公式可判断D选项.
【详解】A:不妨设,则的极差为的极差为,
因为不全相等,所以,故A错误;
B|、C:设的平均数为,则的平均数为,
当时,,故B正确;
时,取为为,他们的中位数相等,故C正确;
D:设的标准差为,则的标准差为,
因为不全相等,所以,故D错误.
故选:BC.
4.已知全校共3000名学生,其中有1800名男生,1200名女生,为调查学生的身高情况,按分层随机抽样的方法抽取20名学生的身高作为样本,样本中男生身高的平均数为170,方差为30,女生身高的平均数为160,方差为45,则利用样本估计总体的平均数为 ,估计总体的方差为 .
【答案】 166 60
【分析】根据分层抽样的定义求出所抽取的男女生人数,然后结合已知数据可估计总体的平均数和方差.
【详解】由题意得抽取20名学生中,男生有名,女生有名,
因为样本中男生身高的平均数为170,方差为30,女生身高的平均数为160,方差为45,
所以利用样本估计总体的平均数为,
估计总体的方差为.
故答案为:166,60.
5.已知总体划分为3层,通过分层随机抽样,各层抽取的样本容量分别为,,,样本平均数分别为,,,样本方差分别为,,,若,则( )
A.
B.
C.总体样本平均数
D.当时,总体方差
【答案】D
【分析】根据样本平均数以及方差的定义,即可判断A、B项;计算可判断C;根据分层抽样,总体方差的求解,计算即可得出D.
【详解】对于A、B项,由于样本容量与样本平均数、样本方差之间并不是成某种比例关系,所以选项A,B错误;
对于C项,设,
则总体样本平均数,所以选项C错误;
对于D项,当时,总体样本平均数,
所以总体方差,所以选项D正确.
故选:D.
1.(多选)已知互不相同的30个样本数据,若去掉其中最大和最小的数据,设剩下的28个样本数据的方差为,平均数为;去掉的两个数据的方差为,平均数为﹔原样本数据的方差为,平均数为,若=,则下列说法正确的是( )
A.
B.
C.剩下28个数据的中位数大于原样本数据的中位数
D.剩下28个数据的22%分位数不等于原样本数据的22%分位数
【答案】ABD
【分析】对于A选项,求出剩下的28个样本数据的和、去掉的两个数据和、原样本数据和,列出方程即可;
对于B选项,写出和的表达式即可;
对于C选项,根据中位数定义判断即可;
对于D选项,根据分位数定义判断即可.
【详解】A. 剩下的28个样本数据的和为,去掉的两个数据和为,原样本数据和为,所以,因为=,所以,故A选项正确;
B.设,,
因为,所以,所以,
所以,故B选项正确;
C. 剩下28个数据的中位数等于原样本数据的中位数,故C选项错误;
D. ,所以原数据的22%分位数为从小到大的第7个;
,所以剩下28个数据的22%分位数为从小到大的第7个;
因为去掉了最小值,则剩下28个数据的22%分位数不等于原样本数据的22%分位数,故D正确.
故选:ABD.
2.(多选)某班语文老师对该班甲、乙、丙、丁4名同学连续7周每周阅读的天数(每周阅读天数可以是)进行统计,根据统计所得数据对这4名同学这7周每周的阅读天数分别做了如下描述:
甲:中位数为3,众数为5;
乙:中位数为4,极差为3;
丙:中位数为4,平均数为3;
丁:平均数为3,方差为3.
那么可以判断一周阅读天数一定没有出现7天的是( )
A.甲 B.乙 C.丙 D.丁
【答案】ACD
【分析】利用中位数,众数,平均数,极差的意义结合举反例判断ABC,计算方差并且讨论求解.
【详解】对于A,因为中位数为3,众数为5,所以这7个数从小到大排列后,第4个数是3,所
以中一定有一个数出现2次,5出现3次,所以这7个数中一定没有出现7,则正确.
对于B,因为中位数为4,极差为3,所以这7个数可以是,则B错误.
对于C,若出现1个7,则这7个数从小到大排列后,后4个数之和最小为19,前3个数之和最小为3,
从而这7个数的平均数最小为,即这7个数的平均数不可能为3,故C正确.
对于,设这7个数分别为,则,
.
若7,则
,
从而这6个数可能是或或
或或或或或
或或,这与矛盾,
即这7个数中一定没有出现7,故D正确.
故选:ACD
【点睛】关键点睛,本题考查数据的数字特征,关键是对D选项列举所有可能值推出矛盾.
3.某校有高一学生1000人,其中男女生比例为,为获得该校高一学生的身高(单位:)信息,采用随机抽样方法抽取了样本量为50的样本,其中男女生样本量均为25,计算得到男生样本的均值为172,标准差为3,女生样本的均值为162,标准差为4.
(1)计算总样本均值,并估计该校高一全体学生的平均身高;
(2)计算总样本方差.
【答案】(1)167;168
(2)37.5
【分析】(1)根据男女生的样本均值计算样本均值;根据男女生的平均身高得到全校所有学生的身高总和,再求学生身高的平均值;
(2)根据男女生的样本均值和方差,直接计算样本总体的方差即可.
【详解】(1)把男生样本记为,平均数记为,方差记为;
把女生样本记为,平均数记为,方差记为;
把样本数据的平均数记为,方差记为;高一全体学生的身高均值记为.
根据平均数的定义,总样本均值为:;
高一全体学生的身高均值为:;
(2)根据方差的定义,总样本方差为:
,
由,可得:,
同理,.
因此,
所以,总的样本方差为.
1.(2021·全国·高考真题)(多选)下列统计量中,能度量样本的离散程度的是( )
A.样本的标准差 B.样本的中位数
C.样本的极差 D.样本的平均数
【答案】AC
【分析】考查所给的选项哪些是考查数据的离散程度,哪些是考查数据的集中趋势即可确定正确选项.
【详解】由标准差的定义可知,标准差考查的是数据的离散程度;
由中位数的定义可知,中位数考查的是数据的集中趋势;
由极差的定义可知,极差考查的是数据的离散程度;
由平均数的定义可知,平均数考查的是数据的集中趋势;
故选:AC.
2.(2023·全国·高考真题)(多选)有一组样本数据,其中是最小值,是最大值,则( )
A.的平均数等于的平均数
B.的中位数等于的中位数
C.的标准差不小于的标准差
D.的极差不大于的极差
【答案】BD
【分析】根据题意结合平均数、中位数、标准差以及极差的概念逐项分析判断.
【详解】对于选项A:设的平均数为,的平均数为,
则,
因为没有确定的大小关系,所以无法判断的大小,
例如:,可得;
例如,可得;
例如,可得;故A错误;
对于选项B:不妨设,
可知的中位数等于的中位数均为,故B正确;
对于选项C:因为是最小值,是最大值,
则的波动性不大于的波动性,即的标准差不大于的标准差,
例如:,则平均数,
标准差,
,则平均数,
标准差,
显然,即;故C错误;
对于选项D:不妨设,
则,当且仅当时,等号成立,故D正确;
故选:BD.
3.(2021·天津·高考真题)从某网络平台推荐的影视作品中抽取部,统计其评分数据,将所得个评分数据分为组:、、、,并整理得到如下的频率分布直方图,则评分在区间内的影视作品数量是( )
A. B. C. D.
【答案】D
【分析】利用频率分布直方图可计算出评分在区间内的影视作品数量.
【详解】由频率分布直方图可知,评分在区间内的影视作品数量为.
故选:D.
4.(2021·全国·高考真题)为了解某地农村经济情况,对该地农户家庭年收入进行抽样调查,将农户家庭年收入的调查数据整理得到如下频率分布直方图:
根据此频率分布直方图,下面结论中不正确的是( )
A.该地农户家庭年收入低于4.5万元的农户比率估计为6%
B.该地农户家庭年收入不低于10.5万元的农户比率估计为10%
C.估计该地农户家庭年收入的平均值不超过6.5万元
D.估计该地有一半以上的农户,其家庭年收入介于4.5万元至8.5万元之间
【答案】C
【分析】根据直方图的意义直接计算相应范围内的频率,即可判定ABD,以各组的中间值作为代表乘以相应的频率,然后求和即得到样本的平均数的估计值,也就是总体平均值的估计值,计算后即可判定C.
【详解】因为频率直方图中的组距为1,所以各组的直方图的高度等于频率.样本频率直方图中的频率即可作为总体的相应比率的估计值.
该地农户家庭年收入低于4.5万元的农户的比率估计值为,故A正确;
该地农户家庭年收入不低于10.5万元的农户比率估计值为,故B正确;
该地农户家庭年收入介于4.5万元至8.5万元之间的比例估计值为,故D正确;
该地农户家庭年收入的平均值的估计值为(万元),超过6.5万元,故C错误.
综上,给出结论中不正确的是C.
故选:C.
【点睛】本题考查利用样本频率直方图估计总体频率和平均值,属基础题,样本的频率可作为总体的频率的估计值,样本的平均值的估计值是各组的中间值乘以其相应频率然后求和所得值,可以作为总体的平均值的估计值.注意各组的频率等于.
5.(2021·全国·高考真题)某厂研制了一种生产高精产品的设备,为检验新设备生产产品的某项指标有无提高,用一台旧设备和一台新设备各生产了10件产品,得到各件产品该项指标数据如下:
旧设备
9.8
10.3
10.0
10.2
9.9
9.8
10.0
10.1
10.2
9.7
新设备
10.1
10.4
10.1
10.0
10.1
10.3
10.6
10.5
10.4
10.5
旧设备和新设备生产产品的该项指标的样本平均数分别记为和,样本方差分别记为和.
(1)求,,,;
(2)判断新设备生产产品的该项指标的均值较旧设备是否有显著提高(如果,则认为新设备生产产品的该项指标的均值较旧设备有显著提高,否则不认为有显著提高).
【答案】(1);(2)新设备生产产品的该项指标的均值较旧设备有显著提高.
【分析】(1)根据平均数和方差的计算方法,计算出平均数和方差.
(2)根据题目所给判断依据,结合(1)的结论进行判断.
【详解】(1),
,
,
.
(2)依题意,,,
,所以新设备生产产品的该项指标的均值较旧设备有显著提高.
(
2
)原创精品资源学科网独家享有版权,侵权必究!
学科网(北京)股份有限公司
$$
完成时间: 月 日 天气:
作业14 统计综合
1.简单随机抽样
(1)定义:一般地,设一个总体含有N个个体,从中逐个不放回地抽取n个个体作为样本(n≤N),如果每次抽取时总体内的各个个体被抽到的机会都相等,就把这种抽样方法叫做简单随机抽样.这样抽取的样本,叫做简单随机样本.
(2)常用方法:抽签法和随机数法.
2.分层抽样
(1)在抽样时,将总体分成互不交叉的层,然后按照一定的比例,从各层独立地抽取一定数量的个体,将各层取出的个体合在一起作为样本,这种抽样方法是一种分层抽样.
(2)分层抽样的应用范围
当总体是由差异明显的几个部分组成时,往往选用分层抽样.
3.频率分布直方图
(1)纵轴表示,即小长方形的高=;
(2)小长方形的面积=组距×=频率;
(3)各个小方形的面积总和等于1.
频率分布直方图中的常见结论
(1)众数的估计值为最高矩形的中点对应的横坐标.
(2)平均数的估计值等于频率分布直方图中每个小矩形的面积乘以小矩形底边中点的横坐标之和.
(3)中位数的估计值的左边和右边的小矩形的面积和是相等的.
4.频率分布表的画法
第一步:求极差,决定组数和组距,组距=;
第二步:分组,通常对组内数值所在区间取左闭右开区间,最后一组取闭区间;
第三步:登记频数,计算频率,列出频率分布表.
5.条形图、折线图及扇形图
(1)条形图:建立直角坐标系,用横轴(横轴上的数字)表示样本数据类型,用纵轴上的单位长度表示一定的数量,根据每个样本(或某个范围内的样本)的数量多少画出长短不同的等宽矩形,然后把这些矩形按照一定的顺序排列起来,这样一种表达和分析数据的统计图称为条形图.
(2)折线图:建立直角坐标系,用横轴上的数字表示样本值,用纵轴上的单位长度表示一定的数量,根据样本值和数量的多少描出相应各点,然后把各点用线段顺次连接,得到一条折线,用这种折线表示出样本数据的情况,这样的一种表示和分析数据的统计图称为折线图.
(3)扇形图:用一个圆表示总体,圆中各扇形分别代表总体中的不同部分,每个扇形的大小反映所表示的那部分占总体的百分比的大小,这样的一种表示和分析数据的统计图称为扇形图.
6.百分位数、众数、平均数的定义
(1)如果将一组数据从小到大排序,并计算相应的累计百分位,则某一百分位所对应数据的值就称为这一百分位的百分位数.
一般地,一组数据的第p百分位数是这样一个值,
它使得这组数据中至少有p%的数据小于或等于这个值,且至少有(100-p)%的数据大于或等于这个值.
(2)第25百分位数又称第一四分位数或下四分位数;
第75百分位数又称第三四分位数或上四分位数.
(3)众数
一组数据中出现次数最多的数据叫做这组数据的众数.
(4)平均数
一组数据的算术平均数即为这组数据的平均数,n个数据x1,x2,…,xn的平均数=(x1+x2+…+xn).
7.样本的数字特征之方差
如果有n个数据x1,x2,…,xn,那么这n个数的
(1)标准差s= .
(2)方差s2=[(x1-)2+(x2-)2+…+(xn-)2].
8. 平均数、方差的公式推广
(1)若数据x1,x2,…,xn的平均数为,则mx1+a,mx2+a,mx3+a,…,mxn+a的平均数是m+a.
(2)若数据x1,x2,…,xn的方差为s2,则数据ax1+b,ax2+b,…,axn+b的方差为a2s2.
一、单选题
1.①一次数学考试中,某班有12人的成绩在100分以上,30人的成绩在90~100分,12人的成绩低于90分,现从中抽取9人了解有关考试题目难度的情况;②运动会的工作人员为参加4×100 m接力赛的6支队伍安排跑道.针对这两件事,恰当的抽样方法分别为( )
A.分层随机抽样,简单随机抽样
B.简单随机抽样,简单随机抽样
C.简单随机抽样,分层随机抽样
D.分层随机抽样,分层随机抽样
2.已知一组数据按从小到大的顺序排列为14,19,x,23,27,其中位数是22,则x的值为( )
A.24 B.23
C.22 D.21
3.已知甲种杂交水稻近五年的产量数据为,乙种杂交水稻的产量数据为,则下列说法错误的是( )
A.甲种的样本极差小于乙种的样本极差
B.甲种的样本平均数等于乙种的样本平均数
C.甲种的样本中位数等于乙种的样本中位数
D.甲种的样本方差大于乙种的样本方差
4.某校举办了数学知识竞赛,把1000名学生的竞赛成绩(满分100分,成绩取整数)按,,,分成四组,并整理成如图所示的频率分布直方图,则下列说法正确的为( )
A.的值为0.015 B.估计这组数据的众数为80
C.估计这组数据的第60百分位数为87 D.估计成绩低于80分的有350人
5.已知数据,,…,的平均数为,方差为,数据,,,…,的平均数为,方差为,则( )
A., B.,
C., D.,
二、多选题
6.空气质量指数AQI是反映空气质量状况的指数,AQI指数的值越小,表明空气质量越好,AQI指数不超过50,空气质量为“优”;AQI指数大于50且不超过100,空气质量为“良”;AQI指数大于100,空气质量为“污染”.如图是某市2023年空气质量指数(AQI)的月折线图.下列关于该市2023年空气质量的叙述中,说法正确的是( )
A.全年平均AQI指数对应的空气质量等级为优或良
B.每月都至少有一天空气质量为优
C.2月、8月、9月和12月均出现污染天气
D.空气质量为“污染”的天数最多的月份是2月份
7.为了解“全民齐参与城市更美丽”的志愿服务情况,随机抽取了100名志愿者进行问卷调查,将这100名志愿者问卷调查的得分按,,,,分成5组,并绘制出频率分布直方图,如图所示,则下列结论正确的是( )
A.
B.估计这100名志愿者问卷调查得分的分位数为85
C.这100名志愿者问卷调查得分的平均数为75(同一组中的数据用该组区间的中点值为代表)
D.若采用分层随机抽样从得分在,内的志愿者中抽取8人,则抽取的这8名志愿者得分在内的人数为6
8.某学校为了解学生身高(单位:cm)情况,采用分层随机抽样的方法从4000名学生(该校男女生人数之比为)中抽取了一个容量为100的样本.其中,男生平均身高为175,方差为184,女生平均身高为160,方差为179.则下列说法正确的是参考公式:总体分为2层,各层抽取的样本量、样本平均数和样本方差分别为:,,,,,.记总的样本平均数为,样本方差为,则( )
参考公式:
A.抽取的样本里男生有60人
B.每一位学生被抽中的可能性为
C.估计该学校学生身高的平均值为170
D.估计该学校学生身高的方差为236
三、填空题
9.记样本数据10,18,8,4,16,24,6,8,32的中位数为a,平均数为b,则= .
10.某小组5位同学各拋掷一枚正方体骰子,将正面向上的点数按从小到大的顺序记录下来,得到一组统计数据.已知这组数据的平均数为整数,最大值为6,中位数为3,方差为1.6,则这组数据的众数为 .
四、解答题
11.某工厂甲、乙两名工人参加操作技能培训,他们在培训期间参加的8次测试成绩记录如下:
甲:95 82 88 81 93 79 84 78
乙:83 92 80 95 90 80 85 75
(1)哪个工人的成绩较好?
(2)甲、乙成绩位于内的有多少?
12.果切是一种新型水果售卖方式,商家通过对整果进行消洗、去皮、去核、冷藏等操作后,包装组合销售,在“健康消费”与“瘦身热潮”的驱动下,果切更能满足消费者的即食需求.
(1)统计得到10名中国果切消费者每周购买果切的次数依次为:1,7,4,7,4,6,6,3,7,5,求这10个数据的平均数与方差;
(2)统计600名中国果切消费者的年龄,他们的年龄均在5岁到55岁之间,按照,,,,分组,得到频率分布直方图.
①估计这600名中国果切消费者中年龄不小于35岁的人数;
②估计这600名中国果切消费者年龄的中位数及平均数(结果保留整数).
1.年3月,树人中学组织三个年级的学生进行党史知识竞赛.经统计,得到前名学生分布的饼状图(如图)和前名中高一学生排名分布的频率条形图(如图),则下列命题错误的是( )
A.成绩前名的人中,高一人数比高二人数多30人
B.成绩第1-名的人中,高一人数不超过一半
C.成绩第1-50名的50人中,高三最多有32人
D.成绩第51-名的50人中,高二人数比高一的多
2.设a,b,c的平均数为M,a与b的平均数为N,N与c的平均数为P.若,则M与P的大小关系是( )
A. B. C. D.不能确定
3.(多选)已知一组不全相等的样本数据,由生成一组新的样本数据,则新数据与原数据中可能相等的量有( )
A.极差 B.平均数 C.中位数 D.标准差
4.已知全校共3000名学生,其中有1800名男生,1200名女生,为调查学生的身高情况,按分层随机抽样的方法抽取20名学生的身高作为样本,样本中男生身高的平均数为170,方差为30,女生身高的平均数为160,方差为45,则利用样本估计总体的平均数为 ,估计总体的方差为 .
5.已知总体划分为3层,通过分层随机抽样,各层抽取的样本容量分别为,,,样本平均数分别为,,,样本方差分别为,,,若,则( )
A.
B.
C.总体样本平均数
D.当时,总体方差
1.(多选)已知互不相同的30个样本数据,若去掉其中最大和最小的数据,设剩下的28个样本数据的方差为,平均数为;去掉的两个数据的方差为,平均数为﹔原样本数据的方差为,平均数为,若=,则下列说法正确的是( )
A.
B.
C.剩下28个数据的中位数大于原样本数据的中位数
D.剩下28个数据的22%分位数不等于原样本数据的22%分位数
2.(多选)某班语文老师对该班甲、乙、丙、丁4名同学连续7周每周阅读的天数(每周阅读天数可以是)进行统计,根据统计所得数据对这4名同学这7周每周的阅读天数分别做了如下描述:
甲:中位数为3,众数为5;
乙:中位数为4,极差为3;
丙:中位数为4,平均数为3;
丁:平均数为3,方差为3.
那么可以判断一周阅读天数一定没有出现7天的是( )
A.甲 B.乙 C.丙 D.丁
3.某校有高一学生1000人,其中男女生比例为,为获得该校高一学生的身高(单位:)信息,采用随机抽样方法抽取了样本量为50的样本,其中男女生样本量均为25,计算得到男生样本的均值为172,标准差为3,女生样本的均值为162,标准差为4.
(1)计算总样本均值,并估计该校高一全体学生的平均身高;
(2)计算总样本方差.
1.(2021·全国·高考真题)(多选)下列统计量中,能度量样本的离散程度的是( )
A.样本的标准差 B.样本的中位数
C.样本的极差 D.样本的平均数
2.(2023·全国·高考真题)(多选)有一组样本数据,其中是最小值,是最大值,则( )
A.的平均数等于的平均数
B.的中位数等于的中位数
C.的标准差不小于的标准差
D.的极差不大于的极差
3.(2021·天津·高考真题)从某网络平台推荐的影视作品中抽取部,统计其评分数据,将所得个评分数据分为组:、、、,并整理得到如下的频率分布直方图,则评分在区间内的影视作品数量是( )
A. B. C. D.
4.(2021·全国·高考真题)为了解某地农村经济情况,对该地农户家庭年收入进行抽样调查,将农户家庭年收入的调查数据整理得到如下频率分布直方图:
根据此频率分布直方图,下面结论中不正确的是( )
A.该地农户家庭年收入低于4.5万元的农户比率估计为6%
B.该地农户家庭年收入不低于10.5万元的农户比率估计为10%
C.估计该地农户家庭年收入的平均值不超过6.5万元
D.估计该地有一半以上的农户,其家庭年收入介于4.5万元至8.5万元之间
5.(2021·全国·高考真题)某厂研制了一种生产高精产品的设备,为检验新设备生产产品的某项指标有无提高,用一台旧设备和一台新设备各生产了10件产品,得到各件产品该项指标数据如下:
旧设备
9.8
10.3
10.0
10.2
9.9
9.8
10.0
10.1
10.2
9.7
新设备
10.1
10.4
10.1
10.0
10.1
10.3
10.6
10.5
10.4
10.5
旧设备和新设备生产产品的该项指标的样本平均数分别记为和,样本方差分别记为和.
(1)求,,,;
(2)判断新设备生产产品的该项指标的均值较旧设备是否有显著提高(如果,则认为新设备生产产品的该项指标的均值较旧设备有显著提高,否则不认为有显著提高).
(
2
)原创精品资源学科网独家享有版权,侵权必究!
学科网(北京)股份有限公司
$$