内容正文:
第六章 统计知识归纳与题型突破(10知识点+10题型)
知识点一:普查和抽查
方式
定义
特点
普查
为了掌握调查对象的整体情况,对全体调查对象进行研究的一种调查方式
所取得的资料系统、全面
抽样调查(简称抽查)
从全体调查对象中,按照一定的方法抽取一部分对象作为代表进行调查分析,并以此推断全体调查对象的状况的调查方式
优点:迅速、及时,节约人力、物力和财力;
缺点:结果具有不确定性
知识点二:总体和样本
总体
调查对象的全体
个体
总体中的每一个被考察的对象
样本
在进行抽样调查时,从总体中抽取的部分
抽样
在进行抽样调查时,从总体中抽取样本的过程
样本(容)量
样本中个体的数目
总体的分布
总体中各类数据的百分比
知识点三: 简单随机抽样
(1)定义:一般地,从N(N为正整数)个不同个体构成的总体中,逐个不放回地抽取n(1≤n<N)个个体组成样本,并且每次抽取时总体内的每个个体被抽到的可能性相等,这样的抽样方法通常叫作简单随机抽样.
(2)抽签法和随机数法
①抽签法的具体步骤:
(i)给总体中的每个个体编号;
(ii)抽签.
②随机数法中常利用转盘或摸球、随机数表、科学计算器或计算机等工具产生随机数. 其中利用随机数表产生随机数是一个常用的方法,具体步骤如下:
(i)给总体中的每个个体编号;
(ii)在随机数表中随机抽取某行某列作为抽样的起点,并规定读取方法;
(iii)依次从随机数表中抽取样本号码,凡是抽到编号范围内的号码,就是样本的号码,并剔除相同的号码,直至抽满为止.
知识点四:分层随机抽样:
(1)定义:将总体按其属性特征分成互不交叉的若干类型(有时称作层),然后在每个类型中按照所占比例随机抽取一定的个体,这种抽样方法通常叫作分层随机抽样.
(2)抽签法与随机数法的合理选择
抽签法和随机数法的特点及比较
抽签法的特点
当总体中的个体数较少时,抽签法简单易行;当总体中的个体数较多时,制作号签的成本(时间、物力、人力)会增加,将号签搅拌均匀会变得困难
随机数法的特点
可以利用随机试验(摸球、转盘等)生成随机数,也可以利用随机数表、计算机等生成随机数,利用信息技术生成随机数方便快捷,效率高,可以节省成本
比较
抽签法和随机数法的共同点:一是个体之间差异不明显,二是样本量不大;
抽签法和随机数法的不同点:总体中的个体数较少用抽签法,总体中的个体数较多用随机数法
(3)对分层随机抽样概念的理解
1. 分层随机抽样的特点
(1)适用于总体由差异明显的几部分组成的情况;
(2)分层随机抽样中,按抽样比例确定每层抽取个体的数量;
(3)分层随机抽样也是等可能抽样,每个个体被抽到的可能性都是,而且在每层抽样时,可以根据个体情况采用不同的抽样方法;
(4)分层随机抽样能充分利用已掌握的信息,使样本具有良好的代表性.
(4)分层随机抽样的一般步骤
原创精品资源学科网独家享有版权,侵权必究!1
学科网(北京)股份有限公司
§3 用样本估计总体分布
知识点五:频率分布直方图
1. 在频率分布直方图中,每个小矩形的底边长是该组的组距,每个小矩形的高是该组的频率与组距的比,从而每个小矩形的面积等于该组的频率,即每个小矩形的面积=组距×=频率. 各个小矩形的面积总和等于1.
2. 画频率分布直方图的步骤
(1)计算极差:极差为一组数据中最大值与最小值的差.
(2)确定组距与组数:为方便起见,一般取等长组距,并且组距应力求“取整”,组数应力求合适. 当数据在120个以内时,通常按照数据的多少分成5组~12组. 极差、组距、组数之间有如下关系:
①若为整数,则=组数;
②若不为整数,则[ ] +1=组数([x]表示不大于x的最大整数).
(3)分组:通常对组内数据所在区间取左闭右开区间,最后一组取闭区间.
(4)列表:统计各组数据的频数,计算频率,完成频率分布表.
(5)画频率分布直方图:根据频率分布表,画出频率分布直方图.
3. 绘制频率分布直方图的注意点
(1)各组频率的和等于1.
(2)在xOy坐标平面内画频率分布直方图时,x=样本数据,y= ,这样每一组的频率可以用该组的组距为底边长、为高的小矩形的面积来表示,其中矩形的高= = ×频数.
(3)同样一组数据,组距不同,横轴、纵轴单位不同,得到的频率分布直方图的形状也会不同.
知识点六:频率拆线图
1. 通常,在频率分布直方图中,按照分组原则,再在左边和右边各加一个区间. 从所加的左边区间的中点开始,用线段依次连接各个矩形的顶端中点,直至右边所加区间的中点,就可以得到一条折线,我们称之为频率折线图.
2. 一般地,样本容量越大,用样本的频率分布去估计总体的分布就越精确. 随着样本容量的增大,所划分的区间数也可以随之增多,而每个区间的长度则会相应随之减小,相应的频率折线图就会越来越接近于一条光滑曲线.
§4 用样本估计总体的数字特征
4. 1 样本的数字特征
知识点七:样本的数字特征
一:样本的数字特征的定义
1. 平均数是指一组数据的平均值.
2. 一般地,中位数是将一组数据按从小到大的顺序排列后,“中间”的那个数据.
3. 众数是指一组数据中出现次数最多的数据.
4. 极差和方差都刻画数据的离散程度. 极差是数据中最大值和最小值的差. 方差刻画的是数据偏离平均数的离散程度.
5. 定义方差的算术平方根s==为标准差,其中x1,x2,…,xn是样本数据,n是样本容量, 是样本平均数.
二、 方差和标准差
1. 标准差(方差)的作用
(1)标准差(方差)较大,数据的离散程度较大;标准差(方差)较小,数据的离散程度较小.
(2)在实际应用中,常常把平均数与标准差(方差)结合起来进行决策. 在平均数相等的情况下,比较标准差(方差)以确定稳定性.
2. 若x1,x2,…,xn的平均数为,方差为s2,标准差为s,则以下数据的平均数、方差和标准差有如下规律:
数据
平均数
方差
标准差
x1,x2,…,xn
s2
s
x1+b,x2+b,…,xn+b(b为常数)
+b
s2
s
ax1,ax2,…,axn(a为常数)
a
a2s2
|a|s
ax1+b,ax2+b,…,axn+b(a,b为常数)
a+b
a2s2
|a|s
知识点八:用样本的数字特征估计总体的数字特征
1. 一般情况下,如果样本容量恰当,抽样的方法比较合理,那么样本的数字特征能够反映总体的数字特征. 在允许一定误差存在的前提下,可以用样本的数字特征去估计总体的数字特征.
2. 平均数、中位数、众数与频率分布直方图的关系:
(1)在样本数据的频率分布直方图中,众数就是最高的小矩形中某个(些)点的横坐标.
(2)由于在样本中,有50%的个体小于或等于中位数,也有50%的个体大于或等于中位数,因此在频率分布直方图中,中位数左侧和右侧的小矩形的面积和应该相等,据此可以估计中位数的值.
(3)平均数是频率分布直方图的“重心”, 是频率分布直方图的平衡点. 用频率分布直方图估计平均数时,平均数的估计值等于频率分布直方图中各个小矩形的面积与小矩形底边中点的横坐标(组中值)之积的和.
3. 利用频率分布直方图求得的众数、中位数和平均数均为近似值,往往与由实际数据得出的不一致,但它们能粗略估计众数、中位数和平均数.
4. 2 分层随机抽样的均值与方差 4. 3 百分位数
知识点九:分层随机抽样的平均数与方差
1. 分层随机抽样的平均数
一般地,将样本a1,a2,…,am和样本b1,b2,…,bn合并成一个新样本,则这个新样本的平均数为=·+·.
于是,当已知上述两层构成的新样本中每层的平均数分别为 和 时,可得这个新样本的平均数为w1+w2,其中w1=,w2=,w1,w2称为权重.
更一般地,设样本中不同层的平均数和相应权重分别为,…, 和w1,w2,…,wn,则这个样本的平均数为w1+w2+…+wn=wi
2. 分层随机抽样的方差
设样本中不同层的平均数分别为, ,…, ,方差分别为,…, ,相应的权重分别为w1,w2,…,wn,则这个样本的方差为s2=wi[+(-)2],其中为这个样本的平均数.
知识点十:百分位数
1. 百分位数的定义
一般地,当总体是连续变量时,给定一个百分数p∈(0,1),总体的p分位数有这样的特点:总体数据中的任意一个数小于或等于它的可能性是p.
2. 四分位数
25%,50%,75%分位数是三个常用的百分位数. 把总体数据按照从小到大排列后,这三个百分位数把总体数据分成了4个部分,在这4个部分取值的可能性都是. 因此这三个百分位数也称为总体的四分位数.
其他常用的百分位数有1%,5%,10%,90%,95%,99%.
总体的p分位数通常是未知的,人们用样本的p分位数来估计它,样本容量越大,估计越准确.
3. 求百分位数的步骤
计算一组n个数据的p分位数的一般步骤如下:
第一步,按照从小到大排列原始数据;
第二步,计算i=np;
第三步,若i不是整数,大于i的最小整数为j,则p分位数为第j项数据;若i是整数,则p分位数为第i项与第(i+1)项数据的平均数.
4、如何求百分位数
1. 计算n个数据的p分位数时的注意事项:
(1)将数据按从小到大进行排序;
(2)若i为整数,则p分位数为第i项与第(i+1)项数据的平均数,而不是第i项数据.
2. 根据频率分布直方图计算样本数据的百分位数,首先要进行频率分布直方图中各组数据频率的计算,然后需估计百分位数在哪一组,最后应用方程思想设出百分位数,解方程即可.
题型一 :普查和抽查的选择及总体、样本、样本容量概念
例1.下列调查中,适合用普查的是( )
A.了解我省初中学生的家庭作业时间 B.了解“嫦娥四号”卫星零部件的质量
C.了解一批电池的使用寿命 D.了解某市居民对废电池的处理情况
例2.(多选)下列调查中属于抽样调查的是( )
A.检查一枚用于发射卫星的运载火箭的各零部件
B.调查某商品的质量优劣
C.某报社对某个事情进行舆论调查
D.高考考生的体检
例3.(多选)某市模考共有70000多名学生参加,某校教科室为了了解本校3390名考生的数学成绩,从中抽取300名考生的数学成绩进行统计分析,下列说法正确的是( )
A.3390名考生是总体的一个样本 B.3390名考生的数学成绩是总体
C.样本容量是300 D.70000多名考生的数学成绩是总体
巩固训练
1.(多选)某中等职业学校为了了解高二年级1200名学生的视力情况,抽查了其中200名学生的视力,并进行统计分析.下列叙述正确的是( )
A.上述调查属于全面调查 B.每名学生是总体的一个个体
C.200名学生的视力是总体的一个样本 D.1200名学生是总体
2.高考结束后,为了分析该校高三年级1000名学生的高考成绩,从中随机抽取了100名学生的成绩,就这个问题来说,下列说法中正确的是( )
A.100名学生是个体
B.样本容量是100
C.每名学生的成绩是所抽取的一个样本
D.1000名学生是样本
3.从某年级500名学生中抽取60名学生进行身高的统计分析,下列说法正确的是( )
A.500名学生是总体 B.每个被抽查的学生是个体
C.抽取的60名学生的身高是一个样本 D.抽取的60名学生的身高是样本容量
4.全班有42人,语文老师要抽取4人检查他们对某篇课文的理解情况,比较简便合理的方法是( )
A.分层抽样 B.系统抽样
C.抽签法 D.先用分层抽样再用抽签法
题型二 简单随机抽样的选择及随机数法
例1.对于简单随机抽样,下列说法正确的是( )
①它要求被抽取样本的总体的个体数有限;
②它是从总体中逐个进行抽取的,以便在抽样实践中进行操作;
③它分无放回抽样和有放回抽样;
④它是一种等可能抽样,在整个抽样过程中,每个个体被抽到的机会相等,从而保证了这种抽样方法的公平性.
A.①②③ B.①②④ C.①③④ D.①②③④
例2.(多选)关于简单随机抽样的特点有以下几种说法,其中正确的是( )
A.要求总体中的个体数有限
B.从总体中逐个抽取
C.这是一种不放回抽样
D.每个个体被抽到的机会不一样,与先后顺序有关
例3.从某班57名同学中选出4人参加户外活动,利用随机数表法抽取样本时,先将57名同学按01、02、…、57进行编号,然后从随机数表第一行的第7列和第8列数字开始往右依次选取两个数字,则选出的第4个同学的编号为( )
0347
4373
8636
9647
3661
4698
6371
6297
7424
6292
4281
1457
2042
5332
3732
1676
(注:表中的数据为随机数表第一行和第二行)
A.24 B.36 C.42 D.52
巩固训练
1.总体由编号01,02,…,29,30的30个个体组成,利用下面的随机数选取6个个体,选取方法是从如下随机数的第1行的第6列和第7列数字开始由左向右依次选取两个数字,则选出来的第6个个体的编号为( )
第1行 78 16 62 32 08 02 62 42 62 52 53 69 97 28 01 98
第2行 32 04 92 34 49 35 82 00 36 23 48 69 69 38 74 81
A.27 B.26 C.25 D.19
2.省农科站要检测某品牌种子的发芽率,计划采用随机数表法从该品牌800粒种子中抽取60粒进行检测,现将这800粒种子编号如下001,002,…,800,若从随机数表第8行第7列的数7开始向右读,则所抽取的第4粒种子的编号是 .(如下是随机数表第8行至第9行)
63 01 63 78 59 16 95 55 67 19 98 10 50 71 75 12 86 73 58 07 44 39 52 38 79 33 21 12 34 29 78 64 56 07 82 52 42 07 44 38 15 51 0 13 42 99 66 02 79 54
3.用简单随机抽样的方法从含n个个体的总体中,逐个抽取一个样本量为3的样本,若其中个体a在第一次就被抽取的可能性为,那么n= .
4.假设从高一(1)班60名同学中随机抽出30人参加一项活动,利用随机数法抽取样本时,先将60名同学按01,02,03,…,59,60进行编号,如果从随机数表第7行第3列的数开始,按两位数连续向右读取,抽出的第5名同学的号码是(下面摘取了此随机数表第7行和第8行) .
630163
785916
595567
199810
507175
128673
580744
395238
844217
533157
245506
887704
744767
217633
502583
921206
题型三 分层抽样的选择及求法
例1.关于中小学生是否应该带手机进校园,有人做了一项相关的调查:调查中有人认为中小学生不应该带手机进校园,因为中小学生大多数自控力比较差,带手机进校园会影响学生的正常学习;有人认为这只是一个相对辩证的问题,带手机进校园便于学生利用现代科技手段促进学习,只要家庭、学校、社会正确引导,可以给学生的学习带来事半功倍的效果;有人没有发表自己的看法.现要从这人中随机抽取人做进一步的调查,最适宜采用的抽样方法是( )
A.简单随机抽样 B.系统抽样
C.分层抽样 D.以上都可以
例2.①一次数学考试中,某班有12人的成绩在100分以上,30人的成绩在90~100分,12人的成绩低于90分,现从中抽取9人了解有关考试题目难度的情况;②运动会的工作人员为参加接力赛的6支队伍安排跑道.针对这两件事,恰当的抽样方法分别为( )
A.分层抽样,简单随机抽样 B.简单随机抽样,简单随机抽样
C.简单随机抽样,分层抽样 D.分层抽样,分层抽样
例3.某校有700名高一学生,400名高二学生,400名高三学生,高一数学兴趣小组欲采用按比例分配的分层抽样的方法在全校抽取15名学生进行某项调查,则下列说法正确的是( )
A.高一学生被抽到的概率最大 B.高三学生被抽到的概率最大
C.高三学生被抽到的概率最小 D.每位学生被抽到的概率相等
巩固训练
1.某工厂生产三种不同型号的产品,它们的产量之比为,用分层抽样的方法抽取一个容量为的样本.若样本中型号的产品有120件,则样本容量为( )
A.150 B.180 C.200 D.250
2.为实现乡村生态振兴,走乡村绿色发展之路,某乡政府采用分层抽样的方式从甲村和乙村抽取部分村民参与环保调研,已知甲村和乙村的人数之比是10:9,被抽到的参与环保调研的村民中,甲村比乙村多7人,则参加调研的总人数是( )
A.133 B.170 C.70 D.63
3.从一个容量为100的总体中抽取容量为10的样本,选取简单随机抽样和分层随机抽样两种不同方法抽取样本.在简单随机抽样中,总体中每个个体被抽中的概率为,某个体被抽中的概率为;在分层随机抽样中,总体中每个个体被抽中的概率为,则( )
A. B.
C. D.之间没有关系
4.某高中高一学生从物化生政史地六科中选三科组合,其中选物化生组合的学生有600人,选物化地组合的学生有400人,选政史地组合的学生有250人,现从高一学生中选取25人作样本调研情况.为保证调研结果相对准确,下列判断错误的是( )
A.用分层抽样的方法抽取物化生组合的学生12人
B.用分层抽样的方法抽取政史地组合的学生5人
C.物化生组合学生小张被选中的概率比物化地组合学生小王被选中的概率大
D.政史地组合学生小刘被选中的概率为
5.某市场有四类食品,其中粮食类、蔬菜类、肉类和水果类分别有10种、20种、20种和50种,现在从中抽取一个容量为50的样本进行食品安全检测,若采用按比例分配的分层抽样的方法抽取样本,则抽取的粮食类和水果类的样本数之和为 .
6.(多选)珠江源风景区是森林公园、省级风景名胜区、国际水利风景名胜区,景区森林茂密,溪流淙淙,有“一水滴三江,一脉隔双盘”的奇异景观,其美景吸引着大批的游客前往参观,某旅行社分年龄段统计了前往珠江源的老、中、青旅客的人数比为5∶2∶3,现使用同比例分层抽样的方法从这些旅客中随机抽取n名,若青年旅客抽到90人,则下列说法正确的是( )
A.被抽到的老年旅客和中年旅客人数之和超过200
B.
C.中年旅客抽到40人
D.老年旅客抽到150人
题型四 分层抽样的平均数,方差和标准差的求法
例1.坐位体前屈是中小学体质健康测试项目,主要测试学生躯干、腰、髋等部位关节韧带和肌肉的伸展性、弹性及身体柔韧性.在对某高中1000名高二年级学生的坐位体前屈成绩的调查中,采用分层随机抽样的方法抽取100人,已知这1000名高二年级学生中男生有600人,且抽取的样本中男生成绩的平均数和方差分别为14.5cm和14.84,女生成绩的平均数和方差分别为15.5cm和17.64.则总体方差( )
A. B. C. D.
例2.某学校高一年级在校人数为人,其中男生人,女生人,为了解学生身高发展情况,按分层随机抽样的方法抽出的男生身高为一个样本,其样本平均数为cm,抽出的女生身高为一个样本,其样本平均数为cm,则该校高一学生的平均身高为( )
A.cm B.cm C.cm D.cm
巩固训练
1.5月11日是世界防治肥胖日.我国超过一半的成年人属于超重或肥胖,岁的儿童青少年肥胖率接近,肥胖已成为严重危害我国居民健康的公共卫生问题.目前,国际上常用身体质量指数(BodyMassIndex,缩写BMI)来衡量人体胖瘦程度以及是否健康.我国成人的BMI数值标准为为偏瘦;为正常;为偏胖;为肥胖.某校为了解学生的健康状况,研究人员从学生的体测数据中,用按比例分配的分层随机抽样方法抽取样本,样本中有20名女生,女生的BMI值的平均数为20,方差为8;有30名男生,男生的BMI值的平均数为25,方差为18.则样本中所有学生的BMI值的方差为 .
2.已知用分层随机抽样从某校高二年级800名学生的数学成绩中抽取一个样本量为100的样本,其中男生成绩数据40个.女生成绩数据60个.男生成绩样本数据的平均数和方差分别为71和187.75,女生成绩样本数据的平均数和方差分别为73.5和119,则总样本的平均数为 ;方差为 .
3.已知某中学的3个年级各有学生300,300,400人,现采用分层抽样的方法从3个年级的学生中抽取10人,对他们的体重进行了统计.若3个年级被抽到的学生体重的平均值分别为48,52,55kg,方差分别为4,10,1.将这10名学生体重W(kg)作为样本,则样本的方差为 .
4.在对树人中学高一年级学生身高的调查中,采用样本比例分配的分层随机抽样,如果不知道样本数据,只知道抽取了男生20人,其平均数和方差分别为170和10,抽取了女生30人,其平均数和方差分别为160和15.则估计出总样本的方差为 .
题型五 直方图及其应用
例1.(多选)伟才学校组织开展党史知识竞赛活动,将本校全体党员党史知识竞赛的成绩(均位于之内)整理,得到如图所示的频率分布直方图.根据此频率分布直方图,下列结论正确的是( )
A.本次成绩不低于80分的人数的占比为
B.本次成绩低于70分的人数的占比为
C.估计本次成绩的平均分不高于85分
D.本次成绩位于的人数是其他人数的3倍
例2.某学校为了解本校学生上学的交通方式,在全校范围内随机抽样调查部分学生,了解到上学的交通方式主要有:A为家人接送,B为乘坐地铁,C为乘坐公交,D为其他方式.学校把收集到的数据整理绘制成条形图和扇形图,如图只给出了其中部分信息,则下列结论中正确的是( )
A.此次抽查的样本量为240
B.若该校有学生2000人,则约有500人是家人接送上学
C.扇形图中B的占比为38%
D.估计该校学生上学交通方式为乘坐地铁或者其他方式的人数占全校学生的一半
例3.某校为了解高一年级学生的体育健康标准测试(简称“体测”)成绩的分布情况,从该年级学生的体测成绩(规定满分为分)中,随机抽取了名学生的成绩,并进行分组:,,,,,绘制成如下频率分布直方图,该校高一年级学生体测成绩的众数的估计值是( )
A. B. C. D.
巩固训练
1.(多选)某校从全校随机抽取n名学生参加奥运知识竞赛,并根据这n名学生的竞赛成绩(总分为100分)绘制频率分布直方图(如图所示),其中分数在[50,60)内的学生有3名,则下列说法正确的是( )
A.
B.
C.样本中分数在[40,50)内的学生有2名
D.用同比例分层抽样方法从分数在[50,60),[90,100]内的学生中抽取4名,则分数在[50,60)内的有3名
2.某中职学校为了解全校学生国庆小长假期间阅读古典名著的时间的情况,抽查了1000名学生,将他们的阅读时间进行分组:.抽样结果绘成的频率分布直方图如图所示.则实数 .这1000名学生阅读古典名著的时间不少于8小时的人数为 .
3.从某小区抽取100户层民用户进行月用电量调查,发现他们的月用电量都在之间,进行适当分组后(每组为左用右开的区间),画出频率分布直方图如图所示,在被调查的用户中,月用电量落在区间内的户数为 .
题型六 扇形及折线图的应用
例1.如图是2020年2月15日至3月2日武汉市新冠肺炎新增确诊病例的折线统计图.则下列说法不正确的是( )
A.武汉市新冠肺炎疫情防控取得了阶段性的成果,但防控要求不能降低
B.2020年2月19日武汉市新增新冠肺炎确诊病例比前日降低了1045人
C.2020年2月15日到3月2日武汉市新冠肺炎新增确诊病例最多的一天是最少的一天16倍多
D.2020年2月19日至3月2日武汉市新增新冠肺炎确诊病例低于500人的有10天
例2.(多选)2021年3月,中共中央、国务院印发了《关于实现巩固拓展脱贫攻坚成果同乡村振兴有效衔接的意见》,某村在各级政府的指导和支持下,开展新农村建设,两年来,经济收入实现翻番,为更好地了解经济收入变化情况,统计了某村新农村建设前后农村的经济收入构成比例.得到如下扇形图:则下面结论中正确的是( )
A.新农村建设后,种植收入比例减少了23%
B.新农村建设后,其他收入增加1%
C.新农村建设后,养殖收入持平
D.新农村建设后,养殖收入与第三产业收入的总和超过了经济收入的一半
巩固训练
1.(多选)某市2023年经过招商引资后,经济收入较前一年增加了一倍,实现翻番,为更好地了解该市的经济收入的变化情况,统计了该市招商引资前后的年经济收入构成比例,得到如下扇形图.则下列结论中正确的是( )
A.招商引资后,工资净收入较前一年减少
B.招商引资后,转移净收入是前一年的2.5倍
C.招商引资后,转移净收入与财产净收入的总和超过了该年经济收入的
D.招商引资后,经营净收入较前一年增加了一倍
2.(多选)Z国进口的天然气主要分为液化天然气和气态天然气两类.2023年Z国天然气进口11997吨,其中液化天然气进口7132吨,气态天然气进口4865吨.2023年Z国天然气及气态天然气进口来源分布及数据如图所示:
下列结论正确的是( )
A.2023年Z国从B国进口的液化天然气比从A国进口的多
B.2023年Z国没有从A国进口液化天然气
C.2023年Z国从C国进口的液化天然气一定比从D国进口的多
D.2023年Z国从B国进口的液化天然气一定比从D国进口的多
3.我市教育局对全市高三年级的学生身高进行抽样调查,随机抽取了100名学生,他们的身高都处在五个层次内,根据抽样结果得到如图的统计图表,则样本中人数最多的是 层,样本中层的男生人数为 人.
4.(多选)我国新冠肺炎疫情防控进入常态化,各地有序推动复工复产.下面是某地连续11天的复工、复产指数折线图.根据该折线图,( )
A.这11天复工指数和复产指数均逐日增加
B.在这11天期间,复产指数的增量大于复工指数的增量
C.第3天至第11天,复工指数和复产指数都超过80%
D.第9天至第11天,复产指数的增量大于复工指数的增量
题型七 数字特征计算及应用
例1.在一次歌唱比赛中,有5位评委给某选手打分(分数不全相同).与原始分数相比,去掉一个最高分和一个最低分之后,一定发生改变的是( )
A.平均数 B.众数 C.中位数 D.方差
例2.已知一组数据的平均数,方差,则数据的平均数、方差分别为( )
A.16,20 B.16,80 C.18,20 D.18,80
例3.一组数据按从小到大的顺序排列如下:11,12,15,,18,20,22,26,经计算,该组数据的中位数是17,则x的值为( )
A.15 B.16 C.17 D.18
巩固训练
1.某篮球运动员进行投篮训练,共进行了10组,每组投篮55次,每组投篮命中的个数分别为m,n,48,47,48,50,45,47,49,50.已知这组数据的平均数为48,方差为7,则( )
A.10 B. C. D.5
2.已知数据,…,(,)的平均数、中位数、方差均为4,则这组数据的极差为( )
A.3 B.4 C.5 D.6
3.“杂交水稻之父”袁隆平培育的超级杂交稻在全世界推广种植.某种植户为了考察所种植的杂交水稻苗的长势,从稻田中随机抽取7株水稻苗,测得苗高(单位:)分别是23,24,23,25,26,23,25.则这组数据的众数和中位数分别是( )
A.24,25 B.23,23
C.23,24 D.24,24
4.(多选)有一组样本数据:1,2,4,3,1,2,1,则( )
A.这组数据的众数为1 B.这组数据的极差为1
C.这组数据的平均数为2 D.这组数据的中位数为
5.为了迎接中国共产党建党一百周年,某班50名同学进行了党史知识竞赛,测试成绩统计如下表,其中两个数据被遮盖.
成绩\分
91
92
93
94
95
96
97
98
99
100
人数
■
■
1
2
3
5
6
8
10
12
下列关于成绩的统计量中,与被遮盖的数据无关的是( )
A.平均数,方差 B.中位数,方差 C.中位数,众数 D.平均数,众数
6.若一组样本数据,,…的,则样本数据,,…,的方差为 .
7.(多选)有一组样本数据,其平均数、中位数、标准差、极差分别记为.由这组数据得到新样本数据,其中,其平均数、中位数、标准差、极差分别记为,则( )
A. B.
C. D.
8.第33届夏季奥林匹克运动会女子10米跳台跳水决赛中,全红禅以425的高分拿下冠军.下面统计某社团一位运动员10次跳台跳水的训练成绩:68,80,74,63,66,84,78,66,70,76,则这组数据的中位数为 .
9.庚子新春,“新冠”肆虐,面对新冠肺炎的发生,某医疗小组提出了一种治疗的新方案.为测试该方案的治疗效果,此医疗小组选取了患病程度相同的12名病人志愿者,将他们随机分成两组,每组6人.第一组用新方案治疗,第二组用旧方案治疗.统计病人的痊愈时间(单位:天)如下表:
新方案治疗
3
6
6
7
10
10
旧方案治疗
5
8
9
11
12
15
记新方案和旧方案治疗病人痊愈时间的平均数分别为和,方差分别为和.
(1)求,,,;
(2)判断新方案的治疗效果较旧方案是否有显著提高.
说明:如果,则认为新方案的治疗效果较旧方案是有显著提高,否则不认为有显著提高.
题型八 百分位数及应用
例1.样本数据3,3,4,4,5,5,6,7的第75百分位数是( )
A.6.5 B.6 C.5.5 D.5
例2.一组数据23,11,14,31,16,17,19,27的上四分位数是( )
A.14 B.15 C.23 D.25
例3.一组数据按从小到大的顺序排列为1,3,4,x,6,7,9,若该组数据的中位数与平均数相同,则该组数据的第60百分位数是( )
A.3 B.4 C.5 D.6
巩固训练
1.学校组织知识竞赛,某班8名学生的成绩(单位:分)分别是65,60,75,78,86,84,90,94,则这8名学生成绩的75%分位数是( )
A.88分 B.84分 C.85分 D.90分
2.高二年级进行消防知识竞赛,统计所有参赛同学的成绩,成绩都在内,估计所有参赛同学成绩的第75百分位数为( )
A. B. C. D.
3.已知一组数据:2,5,7,,10的平均数为6,则该组数据的第60百分位数为( )
A.7 B.6.5 C.6 D.5.5
4.(多选)现有甲、乙两组数据,甲组数据为:;乙组数据为:,若甲组数据的平均数为,标准差为,极差为,第百分位数为,则下列说法一定正确的是( )
A.乙组数据的平均数为 B.乙组数据的极差为
C.乙组数据的第百分位数为 D.乙组数据的标准差为
5.(多选)已知甲组数据为:,乙组数据为:,则下列说法正确的是( )
A.这两组数据的第80百分位数相等
B.这两组数据的极差相等
C.这两组数据分别去掉一个最大值和一个最小值后,均值都不变
D.甲组数据比乙组数据分散
题型九 直方图、折线图及扇形图的数字特征计算
例1.(多选)某高中举行的纪念红军长征出发90周年的知识答题比赛,对参赛的2000名考生的成绩进行统计,可得到如图所示的频率分布直方图,若同一组中数据用该组区间中间值作为代表值,则下列说法中正确的是( )
A.参赛成绩的众数约为75分
B.用分层抽样从该校学生中抽取容量为200的样本,则应在内的成绩抽取30人
C.参赛成绩的第75百分位数约为82.5分
D.参赛成绩的平均分约为72.8分
例2.(多选)成都七中高新校区高二年级14个班团体操比赛成绩(满分100分)从小到大排序依次为:88,89,90,90,90,90,91,91,91,92,92,93,93,94(单位分),则下列说法正确的是( )
A.众数为90 B.中位数为91.5 C.第80百分位数为92 D.方差为
例3.某校为了解高一年级学生的体育健康标准测试(简称“体测”)成绩的分布情况,从该年级学生的体测成绩(规定满分为100分)中,随机抽取了80名学生的成绩,并进行分组:,,,,,绘制成如下频率分布直方图,该校高一年级学生体测成绩的第80百分位数的估计值是( )
A.87 B.88 C.89 D.90
巩固训练
1.甲、乙两个跑步爱好者利用微信运动记录了去年下半年每个月的跑步里程(单位:公里),现将两人的数据绘制成如图所示的折线图,则下列结论中正确的是( )
A.乙跑步里程的极差等于31
B.甲跑步里程的中位数是245
C.分别记甲乙下半年每月跑步里程的标准差为,,则
D.分别记甲、乙下半年每月跑步里程的平均数为,,则
2.年巴黎奥运会中国代表队获得金牌榜第一,奖牌榜第二的优异成绩.首金是中国组合黄雨婷和盛李豪在米气步枪混合团体赛中获得,两人在决赛中次射击环数如图,则( )
A.盛李豪的平均射击环数超过
B.黄雨婷射击环数的第百分位数为
C.盛李豪射击环数的标准差小于黄雨婷射击环数的标准差
D.黄雨婷射击环数的极差小于盛李豪射击环数的极差
3.下图是甲、乙两地10月1日至7日每天最低气温走势图.
记这7天甲地每天最低气温的平均数为,标准差为;记这7天乙地每天最低气温的平均数为,标准差为.根据上述信息,下列结论中正确的是( )
A. B. C. D.
题型十 综合应用
例1.(多选)在践行“乡村振兴”战略的过程中,某地大力发展特色花卉种植业.某农户种植一种观赏花㚏,为了解花卉的长势,随机测量了枝花的高度(单位:),得到花枝高度的频率分布直方图,如图所示,则( )
A.样本花卉高度的极差不超过
B.样本花卉高度的中位数不小于众数
C.样本花的高度的平均数不小于中位数
D.样本花升高度小于的占比不超过
例2.(多选)从某小区抽取100户居民用户进行月用电量调查,发现他们的月用电量都在之间,进行适当分组后每组为左闭右开的区间,画出频率分布直方图如图所示,以下选项正确的有( )
A. B.本组样本的众数为250
C.本组样本的第45百分位数是300 D.用电量落在区间内的户数为82
例3.某高中为增强学生的海洋国防意识,组织本校1000名学生参加了“逐梦深蓝,山河荣耀”的国防知识竞赛,从中随机抽取200名学生的竞赛成绩(单位:分),成绩的频率分布直方图如图所示,则下列说法正确的是( )
A.频率分布直方图中的值为0.005
B.估计这200名学生竞赛成绩的平均数为80
C.估计这200名学生竞赛成绩的众数为78
D.估计总体中成绩落在内的学生人数为150
巩固训练
1.(多选)为了解一片经济林的生长情况,随机抽取了其中60棵树木,测量底部周长(单位:),所得数据均在区间内,其频率分布直方图如图所示,则( )
A.图中a的值为
B.样本中底部周长不少于110cm的树木的底部周长的平均数等于120
C.样本中底部周长不小于110cm的树木有18棵
D.估计该片经济林中树木的底部周长的分位数为115
2.为了检验同学们高二以来的学习效果,某市在期末的时候将组织调研考试.在某次调研考试中学校为了解同学们的调考情况,从所有同学中随机抽取某学科的100份答卷作为样本,将样本成绩按从低到高依次分为第组(如下图所示,成绩满分为100分且成绩均为不低于40分的整数),得到如图所示的频率分布直方图.
(1)根据频率分布直方图求样本成绩的上四分位数;(上四分位数即75百分位数)
(2)已知第2组的平均成绩是54,方差是4,第3组的平均成绩为66,方差是4,
①分别求第2组和第3组的人数;
②求这两组成绩的总平均数和总方差.
参考公式或数据:
方差:.
3.文明城市是反映城市整体文明水平的综合性荣誉称号,作为普通市民,既是文明城市的最大受益者,更是文明城市的主要创造者.某市为提高市民对文明城市创建的认识,举办了“创建文明城市”知识竞赛,从所有答卷中随机抽取100份作为样本,将样本的成绩(满分100分,成绩均为不低于40分的整数)分成六段:[40,50),[50,60),,[90,100]得到如图所示的频率分布直方图.
(1)求频率分布直方图中的值及样本成绩的第75百分位数;
(2)求样本成绩的众数,中位数和平均数;
(3)已知落在的平均成绩是54,方差是7,落在的平均成绩为66,方差是4,求两组成绩合并后的平均数和方差.
原创精品资源学科网独家享有版权,侵权必究!27
学科网(北京)股份有限公司
$$
第六章 统计知识归纳与题型突破(10知识点+10题型)
知识点一:普查和抽查
方式
定义
特点
普查
为了掌握调查对象的整体情况,对全体调查对象进行研究的一种调查方式
所取得的资料系统、全面
抽样调查(简称抽查)
从全体调查对象中,按照一定的方法抽取一部分对象作为代表进行调查分析,并以此推断全体调查对象的状况的调查方式
优点:迅速、及时,节约人力、物力和财力;
缺点:结果具有不确定性
知识点二:总体和样本
总体
调查对象的全体
个体
总体中的每一个被考察的对象
样本
在进行抽样调查时,从总体中抽取的部分
抽样
在进行抽样调查时,从总体中抽取样本的过程
样本(容)量
样本中个体的数目
总体的分布
总体中各类数据的百分比
知识点三: 简单随机抽样
(1)定义:一般地,从N(N为正整数)个不同个体构成的总体中,逐个不放回地抽取n(1≤n<N)个个体组成样本,并且每次抽取时总体内的每个个体被抽到的可能性相等,这样的抽样方法通常叫作简单随机抽样.
(2)抽签法和随机数法
①抽签法的具体步骤:
(i)给总体中的每个个体编号;
(ii)抽签.
②随机数法中常利用转盘或摸球、随机数表、科学计算器或计算机等工具产生随机数. 其中利用随机数表产生随机数是一个常用的方法,具体步骤如下:
(i)给总体中的每个个体编号;
(ii)在随机数表中随机抽取某行某列作为抽样的起点,并规定读取方法;
(iii)依次从随机数表中抽取样本号码,凡是抽到编号范围内的号码,就是样本的号码,并剔除相同的号码,直至抽满为止.
知识点四:分层随机抽样:
(1)定义:将总体按其属性特征分成互不交叉的若干类型(有时称作层),然后在每个类型中按照所占比例随机抽取一定的个体,这种抽样方法通常叫作分层随机抽样.
(2)抽签法与随机数法的合理选择
抽签法和随机数法的特点及比较
抽签法的特点
当总体中的个体数较少时,抽签法简单易行;当总体中的个体数较多时,制作号签的成本(时间、物力、人力)会增加,将号签搅拌均匀会变得困难
随机数法的特点
可以利用随机试验(摸球、转盘等)生成随机数,也可以利用随机数表、计算机等生成随机数,利用信息技术生成随机数方便快捷,效率高,可以节省成本
比较
抽签法和随机数法的共同点:一是个体之间差异不明显,二是样本量不大;
抽签法和随机数法的不同点:总体中的个体数较少用抽签法,总体中的个体数较多用随机数法
(3)对分层随机抽样概念的理解
1. 分层随机抽样的特点
(1)适用于总体由差异明显的几部分组成的情况;
(2)分层随机抽样中,按抽样比例确定每层抽取个体的数量;
(3)分层随机抽样也是等可能抽样,每个个体被抽到的可能性都是,而且在每层抽样时,可以根据个体情况采用不同的抽样方法;
(4)分层随机抽样能充分利用已掌握的信息,使样本具有良好的代表性.
(4)分层随机抽样的一般步骤
原创精品资源学科网独家享有版权,侵权必究!2
学科网(北京)股份有限公司
§3 用样本估计总体分布
知识点五:频率分布直方图
1. 在频率分布直方图中,每个小矩形的底边长是该组的组距,每个小矩形的高是该组的频率与组距的比,从而每个小矩形的面积等于该组的频率,即每个小矩形的面积=组距×=频率. 各个小矩形的面积总和等于1.
2. 画频率分布直方图的步骤
(1)计算极差:极差为一组数据中最大值与最小值的差.
(2)确定组距与组数:为方便起见,一般取等长组距,并且组距应力求“取整”,组数应力求合适. 当数据在120个以内时,通常按照数据的多少分成5组~12组. 极差、组距、组数之间有如下关系:
①若为整数,则=组数;
②若不为整数,则[ ] +1=组数([x]表示不大于x的最大整数).
(3)分组:通常对组内数据所在区间取左闭右开区间,最后一组取闭区间.
(4)列表:统计各组数据的频数,计算频率,完成频率分布表.
(5)画频率分布直方图:根据频率分布表,画出频率分布直方图.
3. 绘制频率分布直方图的注意点
(1)各组频率的和等于1.
(2)在xOy坐标平面内画频率分布直方图时,x=样本数据,y= ,这样每一组的频率可以用该组的组距为底边长、为高的小矩形的面积来表示,其中矩形的高= = ×频数.
(3)同样一组数据,组距不同,横轴、纵轴单位不同,得到的频率分布直方图的形状也会不同.
知识点六:频率拆线图
1. 通常,在频率分布直方图中,按照分组原则,再在左边和右边各加一个区间. 从所加的左边区间的中点开始,用线段依次连接各个矩形的顶端中点,直至右边所加区间的中点,就可以得到一条折线,我们称之为频率折线图.
2. 一般地,样本容量越大,用样本的频率分布去估计总体的分布就越精确. 随着样本容量的增大,所划分的区间数也可以随之增多,而每个区间的长度则会相应随之减小,相应的频率折线图就会越来越接近于一条光滑曲线.
§4 用样本估计总体的数字特征
4. 1 样本的数字特征
知识点七:样本的数字特征
一:样本的数字特征的定义
1. 平均数是指一组数据的平均值.
2. 一般地,中位数是将一组数据按从小到大的顺序排列后,“中间”的那个数据.
3. 众数是指一组数据中出现次数最多的数据.
4. 极差和方差都刻画数据的离散程度. 极差是数据中最大值和最小值的差. 方差刻画的是数据偏离平均数的离散程度.
5. 定义方差的算术平方根s==为标准差,其中x1,x2,…,xn是样本数据,n是样本容量, 是样本平均数.
二、 方差和标准差
1. 标准差(方差)的作用
(1)标准差(方差)较大,数据的离散程度较大;标准差(方差)较小,数据的离散程度较小.
(2)在实际应用中,常常把平均数与标准差(方差)结合起来进行决策. 在平均数相等的情况下,比较标准差(方差)以确定稳定性.
2. 若x1,x2,…,xn的平均数为,方差为s2,标准差为s,则以下数据的平均数、方差和标准差有如下规律:
数据
平均数
方差
标准差
x1,x2,…,xn
s2
s
x1+b,x2+b,…,xn+b(b为常数)
+b
s2
s
ax1,ax2,…,axn(a为常数)
a
a2s2
|a|s
ax1+b,ax2+b,…,axn+b(a,b为常数)
a+b
a2s2
|a|s
知识点八:用样本的数字特征估计总体的数字特征
1. 一般情况下,如果样本容量恰当,抽样的方法比较合理,那么样本的数字特征能够反映总体的数字特征. 在允许一定误差存在的前提下,可以用样本的数字特征去估计总体的数字特征.
2. 平均数、中位数、众数与频率分布直方图的关系:
(1)在样本数据的频率分布直方图中,众数就是最高的小矩形中某个(些)点的横坐标.
(2)由于在样本中,有50%的个体小于或等于中位数,也有50%的个体大于或等于中位数,因此在频率分布直方图中,中位数左侧和右侧的小矩形的面积和应该相等,据此可以估计中位数的值.
(3)平均数是频率分布直方图的“重心”, 是频率分布直方图的平衡点. 用频率分布直方图估计平均数时,平均数的估计值等于频率分布直方图中各个小矩形的面积与小矩形底边中点的横坐标(组中值)之积的和.
3. 利用频率分布直方图求得的众数、中位数和平均数均为近似值,往往与由实际数据得出的不一致,但它们能粗略估计众数、中位数和平均数.
4. 2 分层随机抽样的均值与方差 4. 3 百分位数
知识点九:分层随机抽样的平均数与方差
1. 分层随机抽样的平均数
一般地,将样本a1,a2,…,am和样本b1,b2,…,bn合并成一个新样本,则这个新样本的平均数为=·+·.
于是,当已知上述两层构成的新样本中每层的平均数分别为 和 时,可得这个新样本的平均数为w1+w2,其中w1=,w2=,w1,w2称为权重.
更一般地,设样本中不同层的平均数和相应权重分别为,…, 和w1,w2,…,wn,则这个样本的平均数为w1+w2+…+wn=wi
2. 分层随机抽样的方差
设样本中不同层的平均数分别为, ,…, ,方差分别为,…, ,相应的权重分别为w1,w2,…,wn,则这个样本的方差为s2=wi[+(-)2],其中为这个样本的平均数.
知识点十:百分位数
1. 百分位数的定义
一般地,当总体是连续变量时,给定一个百分数p∈(0,1),总体的p分位数有这样的特点:总体数据中的任意一个数小于或等于它的可能性是p.
2. 四分位数
25%,50%,75%分位数是三个常用的百分位数. 把总体数据按照从小到大排列后,这三个百分位数把总体数据分成了4个部分,在这4个部分取值的可能性都是. 因此这三个百分位数也称为总体的四分位数.
其他常用的百分位数有1%,5%,10%,90%,95%,99%.
总体的p分位数通常是未知的,人们用样本的p分位数来估计它,样本容量越大,估计越准确.
3. 求百分位数的步骤
计算一组n个数据的p分位数的一般步骤如下:
第一步,按照从小到大排列原始数据;
第二步,计算i=np;
第三步,若i不是整数,大于i的最小整数为j,则p分位数为第j项数据;若i是整数,则p分位数为第i项与第(i+1)项数据的平均数.
4、如何求百分位数
1. 计算n个数据的p分位数时的注意事项:
(1)将数据按从小到大进行排序;
(2)若i为整数,则p分位数为第i项与第(i+1)项数据的平均数,而不是第i项数据.
2. 根据频率分布直方图计算样本数据的百分位数,首先要进行频率分布直方图中各组数据频率的计算,然后需估计百分位数在哪一组,最后应用方程思想设出百分位数,解方程即可.
题型一 :普查和抽查的选择及总体、样本、样本容量概念
例1.下列调查中,适合用普查的是( )
A.了解我省初中学生的家庭作业时间 B.了解“嫦娥四号”卫星零部件的质量
C.了解一批电池的使用寿命 D.了解某市居民对废电池的处理情况
【答案】B
【分析】由普查得到的调查结果比较准确,但所费人力、物力和时间较多,而抽样调查得到的调查结果没有普查准确,但相对节约人力,物力和时间.
【详解】A、了解我省初中学生的家庭作业时间,适合抽样调查,故此选项错误;
B、了解“嫦娥三号”卫星零部件的状况,适合用普查,符合题意;
C、华为公司一批某型号手机电池的使用寿命,适合抽样调查,故此选项错误;
D、了解某市居民对废电池的处理情况,适合抽样调查,故此选项错误;
故选:B.
例2.(多选)下列调查中属于抽样调查的是( )
A.检查一枚用于发射卫星的运载火箭的各零部件
B.调查某商品的质量优劣
C.某报社对某个事情进行舆论调查
D.高考考生的体检
【答案】BC
【分析】根据全面调查与抽样调查的使用条件逐项判断.
【详解】对于A,运载火箭的一个零部件质量不合格,可能导致发射失败,
因此检查一枚用于发射卫星的运载火箭的各零部件是全面调查,A不是;
对于B,某商品数量大,调查某商品的质量优劣是抽样调查,B是;
对于C,对某个事情进行舆论调查,涉及对象太多,只能采用抽样调查,C是;
对于D,高考考生的体检是全面调查,D不是.
故选:BC
例3.(多选)某市模考共有70000多名学生参加,某校教科室为了了解本校3390名考生的数学成绩,从中抽取300名考生的数学成绩进行统计分析,下列说法正确的是( )
A.3390名考生是总体的一个样本 B.3390名考生的数学成绩是总体
C.样本容量是300 D.70000多名考生的数学成绩是总体
【答案】BC
【分析】根据总体、个体、样本、样本容量的概念,可以判断BC正确.
【详解】总体是3390名考生的数学成绩,样本是抽取的300名考生的数学成绩,样本容量是300.
故选:BC.
巩固训练
1.某中等职业学校为了了解高二年级1200名学生的视力情况,抽查了其中200名学生的视力,并进行统计分析.下列叙述正确的是( )
A.上述调查属于全面调查 B.每名学生是总体的一个个体
C.200名学生的视力是总体的一个样本 D.1200名学生是总体
【答案】C
【分析】利用总体、样本、调查方法的相关概念分析选项即可.
【详解】上述调查属于抽样调查,故A项错误;
每名学生的视力是总体的一个个体,故B项错误;
200名学生的视力是总体的一个样本,故C项正确;
1200名学生的视力是总体,故D项错误.
故选:C
2.高考结束后,为了分析该校高三年级1000名学生的高考成绩,从中随机抽取了100名学生的成绩,就这个问题来说,下列说法中正确的是( )
A.100名学生是个体
B.样本容量是100
C.每名学生的成绩是所抽取的一个样本
D.1000名学生是样本
【答案】B
【分析】根据有关的概念可得总体、个体、样本这三个概念考查的对象都是学生成绩,而不是学生,再结合题中选项即可得到答案.
【详解】根据有关的概念并且结合题意可得总体、个体、样本这三个概念考查的对象都是学生成绩,而不是学生,
根据选项可得选项A、D表达的对象都是学生,而不是成绩,所以A、D都错误.
C每名学生的成绩是所抽取的一个样本也是错的,应是每名学生的成绩是一个个体.
B:样本的容量是100正确.
故选:B.
3.从某年级500名学生中抽取60名学生进行身高的统计分析,下列说法正确的是( )
A.500名学生是总体 B.每个被抽查的学生是个体
C.抽取的60名学生的身高是一个样本 D.抽取的60名学生的身高是样本容量
【答案】C
【分析】根据统计中样本,总体及样本容量的概念进行判断.
【详解】由于抽取的是60名学生的身高,因此500名学生的身高是总体,每个学生的身高是个体,
这60名学生的身高构成一个样本,样本的容量为60,ABD错误,C正确.
故选:C
4.全班有42人,语文老师要抽取4人检查他们对某篇课文的理解情况,比较简便合理的方法是( )
A.分层抽样 B.系统抽样
C.抽签法 D.先用分层抽样再用抽签法
【答案】C
【分析】根据随机抽样的适用情况,即可判断选项.
【详解】因为全班的人数不多,且没有明显的差异性,所以比较简便合理的方法是抽签法.
故选:C.
题型二 简单随机抽样的选择及随机数法
例1.对于简单随机抽样,下列说法正确的是( )
①它要求被抽取样本的总体的个体数有限;
②它是从总体中逐个进行抽取的,以便在抽样实践中进行操作;
③它分无放回抽样和有放回抽样;
④它是一种等可能抽样,在整个抽样过程中,每个个体被抽到的机会相等,从而保证了这种抽样方法的公平性.
A.①②③ B.①②④ C.①③④ D.①②③④
【答案】D
【分析】由简单随机抽样的特点逐项分析判断.
【详解】对于①:简单随机抽样要求样本的总体个数有限,这样才能保证样本能够很好地代表总体,所以①正确;
对于②:由于总体数量是有限的,所以为了让数据具有代表性需要从总体中逐个地进行抽取,以便在抽取实践中进行操作,所以②正确;
对于③:简单随机抽样分无放回抽样和有放回抽样,所以③正确;
对于④:在随机抽样的出发点是使每个个体都有相同的机会被抽中,这是基于对样本数据代表性的考虑,所以④正确.
故选:D.
例2.关于简单随机抽样的特点有以下几种说法,其中正确的是( )
A.要求总体中的个体数有限
B.从总体中逐个抽取
C.这是一种不放回抽样
D.每个个体被抽到的机会不一样,与先后顺序有关
【答案】ABC
【分析】根据简单随机抽样的特点可得答案.
【详解】简单随机抽样,除具有A,B,C三个特点外,
还具有等可能性,每个个体被抽取的机会相等,与先后顺序无关,故D错误.
故选:ABC.
例3.从某班57名同学中选出4人参加户外活动,利用随机数表法抽取样本时,先将57名同学按01、02、…、57进行编号,然后从随机数表第一行的第7列和第8列数字开始往右依次选取两个数字,则选出的第4个同学的编号为( )
0347
4373
8636
9647
3661
4698
6371
6297
7424
6292
4281
1457
2042
5332
3732
1676
(注:表中的数据为随机数表第一行和第二行)
A.24 B.36 C.42 D.52
【答案】A
【分析】利用随机数表法可得结果.
【详解】从随机数表第一行第列和第列数字开始往右依次选:、、、,
选出的第4个同学的编号为24.
故选:A.
巩固训练
1.总体由编号01,02,…,29,30的30个个体组成,利用下面的随机数选取6个个体,选取方法是从如下随机数的第1行的第6列和第7列数字开始由左向右依次选取两个数字,则选出来的第6个个体的编号为( )
第1行 78 16 62 32 08 02 62 42 62 52 53 69 97 28 01 98
第2行 32 04 92 34 49 35 82 00 36 23 48 69 69 38 74 81
A.27 B.26 C.25 D.19
【答案】D
【分析】依次挑选符合条件的编号,即可求解.
【详解】从第1行的第6列和第7列数字开始由左向右依次选取两个数,符合条件的编号依次有23,20,26,24,25,19,03,…,
故第6个个体编号为19.
故选:D
2.省农科站要检测某品牌种子的发芽率,计划采用随机数表法从该品牌800粒种子中抽取60粒进行检测,现将这800粒种子编号如下001,002,…,800,若从随机数表第8行第7列的数7开始向右读,则所抽取的第4粒种子的编号是 .(如下是随机数表第8行至第9行)
63 01 63 78 59 16 95 55 67 19 98 10 50 71 75 12 86 73 58 07 44 39 52 38 79 33 21 12 34 29 78 64 56 07 82 52 42 07 44 38 15 51 0 13 42 99 66 02 79 54
【答案】507
【分析】根据随机数表法读取数据即可.
【详解】由题意,依次读取的种子的编号为:
785,916(舍去),955(舍去),567,199,810(舍去),507.
故所抽取的第4粒种子的编号为507.
故答案为:507
3.用简单随机抽样的方法从含n个个体的总体中,逐个抽取一个样本量为3的样本,若其中个体a在第一次就被抽取的可能性为,那么n= .
【答案】8
【分析】根据简单随机抽样的定义求解.
【详解】因为用简单随机抽样的方法从含n个个体的总体中逐个抽取,个体a在第一次就被抽取的可能性为,
因此,所以.
故答案为:8
4.假设从高一(1)班60名同学中随机抽出30人参加一项活动,利用随机数法抽取样本时,先将60名同学按01,02,03,…,59,60进行编号,如果从随机数表第7行第3列的数开始,按两位数连续向右读取,抽出的第5名同学的号码是(下面摘取了此随机数表第7行和第8行) .
630163
785916
595567
199810
507175
128673
580744
395238
844217
533157
245506
887704
744767
217633
502583
921206
【答案】19
【分析】由题目给出的随机数表,按照题目中给出的读取数表的方法读取即可.
【详解】从随机数表第7行第3列的数开始,按两位数连续向右读取,
抽出的前5名同学的号码是,所以第5名同学的号码是19.
故答案为:19.
题型三 分层抽样的选择及求法
例1.关于中小学生是否应该带手机进校园,有人做了一项相关的调查:调查中有人认为中小学生不应该带手机进校园,因为中小学生大多数自控力比较差,带手机进校园会影响学生的正常学习;有人认为这只是一个相对辩证的问题,带手机进校园便于学生利用现代科技手段促进学习,只要家庭、学校、社会正确引导,可以给学生的学习带来事半功倍的效果;有人没有发表自己的看法.现要从这人中随机抽取人做进一步的调查,最适宜采用的抽样方法是( )
A.简单随机抽样 B.系统抽样
C.分层抽样 D.以上都可以
【答案】C
【分析】结合总体由差异比较明显的几部分组成的特点,选择合适的方法.
【详解】因为总体由差异比较明显的几部分组成,故从总体的人的中随机抽取人做进一步调查,最适宜采用分层抽样.
故选:C.
例2.①一次数学考试中,某班有12人的成绩在100分以上,30人的成绩在90~100分,12人的成绩低于90分,现从中抽取9人了解有关考试题目难度的情况;②运动会的工作人员为参加接力赛的6支队伍安排跑道.针对这两件事,恰当的抽样方法分别为( )
A.分层抽样,简单随机抽样 B.简单随机抽样,简单随机抽样
C.简单随机抽样,分层抽样 D.分层抽样,分层抽样
【答案】A
【分析】根据分层抽样和简单随机抽样的特点判断即可.
【详解】对于①:考试成绩在不同分数段之间的同学有明显的差异,用分层随机抽样比较恰当;
对于②:总体包含的个体较少,用简单随机抽样比较恰当.
故选:A
例3.某校有700名高一学生,400名高二学生,400名高三学生,高一数学兴趣小组欲采用按比例分配的分层抽样的方法在全校抽取15名学生进行某项调查,则下列说法正确的是( )
A.高一学生被抽到的概率最大 B.高三学生被抽到的概率最大
C.高三学生被抽到的概率最小 D.每位学生被抽到的概率相等
【答案】D
【分析】根据分层抽样的定义和性质判断即可.
【详解】无论采取简单随机抽样,还是分层抽样,每个个体被抽取的概率都相同.
故选:D.
巩固训练
1.某工厂生产三种不同型号的产品,它们的产量之比为,用分层抽样的方法抽取一个容量为的样本.若样本中型号的产品有120件,则样本容量为( )
A.150 B.180 C.200 D.250
【答案】C
【分析】根据分层抽样的性质分析求解即可.
【详解】由题意得,,解得.
故选:C.
2.为实现乡村生态振兴,走乡村绿色发展之路,某乡政府采用分层抽样的方式从甲村和乙村抽取部分村民参与环保调研,已知甲村和乙村的人数之比是10:9,被抽到的参与环保调研的村民中,甲村比乙村多7人,则参加调研的总人数是( )
A.133 B.170 C.70 D.63
【答案】A
【分析】根据分层抽样的抽样比即可求解.
【详解】已知甲村和乙村的人数之比是10:9,根据分层抽样,可设甲村被抽取参与调研的村民有10a人,
则乙村被抽取参与调研的村民有9a人,则,解得.
所以参加调研的总人数为.
故选:A
3.从一个容量为100的总体中抽取容量为10的样本,选取简单随机抽样和分层随机抽样两种不同方法抽取样本.在简单随机抽样中,总体中每个个体被抽中的概率为,某个体被抽中的概率为;在分层随机抽样中,总体中每个个体被抽中的概率为,则( )
A. B.
C. D.之间没有关系
【答案】B
【分析】根据简单随机抽样、分层抽样的定义即可得到结论.
【详解】根据抽样调查的原理可得简单随机抽样,分层抽样都必须满足每个个体被抽到的概率相等,即.
故选:B
【点睛】本题考查简单随机抽样、分层抽样的原理的理解,两种抽样都是等可能抽取,是一道容易题.
4.某高中高一学生从物化生政史地六科中选三科组合,其中选物化生组合的学生有600人,选物化地组合的学生有400人,选政史地组合的学生有250人,现从高一学生中选取25人作样本调研情况.为保证调研结果相对准确,下列判断错误的是( )
A.用分层抽样的方法抽取物化生组合的学生12人
B.用分层抽样的方法抽取政史地组合的学生5人
C.物化生组合学生小张被选中的概率比物化地组合学生小王被选中的概率大
D.政史地组合学生小刘被选中的概率为
【答案】C
【分析】根据分层抽样,计算各层抽取的人数以及抽样比,即可得出答案.
【详解】对于A项,用分层抽样的方法抽取物化生组合的学生为 人,故A项正确;
对于B项,用分层抽样的方法抽取政史地组合的学生为,故B项正确;
对于C项,根据分层抽样的特征知,每位同学被选中的概率相等,均为,故C项错误;
对于D项,由C知,每位同学被选中的概率均为,故D项正确.
故选:C.
5.某市场有四类食品,其中粮食类、蔬菜类、肉类和水果类分别有10种、20种、20种和50种,现在从中抽取一个容量为50的样本进行食品安全检测,若采用按比例分配的分层抽样的方法抽取样本,则抽取的粮食类和水果类的样本数之和为 .
【答案】30
【分析】根据给定条件,利用分层抽样的抽样比计算即得.
【详解】依题意,抽取的粮食类的样本数为,
抽取的水果类的样本数为,
所以抽取的粮食类和水果类的样本数之和为30.
故答案为:30
6.(多选)珠江源风景区是森林公园、省级风景名胜区、国际水利风景名胜区,景区森林茂密,溪流淙淙,有“一水滴三江,一脉隔双盘”的奇异景观,其美景吸引着大批的游客前往参观,某旅行社分年龄段统计了前往珠江源的老、中、青旅客的人数比为5∶2∶3,现使用同比例分层抽样的方法从这些旅客中随机抽取n名,若青年旅客抽到90人,则下列说法正确的是( )
A.被抽到的老年旅客和中年旅客人数之和超过200
B.
C.中年旅客抽到40人
D.老年旅客抽到150人
【答案】ABD
【分析】根据给定条件,利用分层抽样的抽样比求出各层的数据,再逐项判断即得.
【详解】依题意,,解得,
被抽到的老年旅客人数,被抽到的中年旅客人数,
对于A,被抽到的老年旅客和中年旅客人数之和为210,A正确;
对于B,,正确;
对于C,中年旅客抽到60人,C错误;
对于D,老年旅客抽到150人,D正确.
故选:ABD
题型四 分层抽样的平均数,方差和标准差的求法
例1.坐位体前屈是中小学体质健康测试项目,主要测试学生躯干、腰、髋等部位关节韧带和肌肉的伸展性、弹性及身体柔韧性.在对某高中1000名高二年级学生的坐位体前屈成绩的调查中,采用分层随机抽样的方法抽取100人,已知这1000名高二年级学生中男生有600人,且抽取的样本中男生成绩的平均数和方差分别为14.5cm和14.84,女生成绩的平均数和方差分别为15.5cm和17.64.则总体方差( )
A. B. C. D.
【答案】C
【分析】根据分层抽样的比例确定男女生人数分别为,结合两个样本平均数即可求得总样本的平均数,进而求得方差.
【详解】按照分层随机抽样,设在男生、女生中分别抽取m名和n名,
则,解得,
由题意,男生样本的平均数为,样本方差为,
女生样本的平均数为,样本方差为,
记抽取的总样本的平均数为,总样本的样本方差为,
可得,
所以
.
故选:C.
例2.某学校高一年级在校人数为人,其中男生人,女生人,为了解学生身高发展情况,按分层随机抽样的方法抽出的男生身高为一个样本,其样本平均数为cm,抽出的女生身高为一个样本,其样本平均数为cm,则该校高一学生的平均身高为( )
A.cm B.cm C.cm D.cm
【答案】B
【分析】由题意可知,,且,根据样本平均数,求解即可.
【详解】由题意可知,,且,
所以样本平均数,
故该校高一学生的平均身高的估计值为.
故选:B.
巩固训练
1.5月11日是世界防治肥胖日.我国超过一半的成年人属于超重或肥胖,岁的儿童青少年肥胖率接近,肥胖已成为严重危害我国居民健康的公共卫生问题.目前,国际上常用身体质量指数(BodyMassIndex,缩写BMI)来衡量人体胖瘦程度以及是否健康.我国成人的BMI数值标准为为偏瘦;为正常;为偏胖;为肥胖.某校为了解学生的健康状况,研究人员从学生的体测数据中,用按比例分配的分层随机抽样方法抽取样本,样本中有20名女生,女生的BMI值的平均数为20,方差为8;有30名男生,男生的BMI值的平均数为25,方差为18.则样本中所有学生的BMI值的方差为 .
【答案】20
【分析】根据分层随机抽样的总体方差公式即可求解.
【详解】设所有学生的BMI值的平均数为,方差为,
则,
.
故答案为:20
2.已知用分层随机抽样从某校高二年级800名学生的数学成绩中抽取一个样本量为100的样本,其中男生成绩数据40个.女生成绩数据60个.男生成绩样本数据的平均数和方差分别为71和187.75,女生成绩样本数据的平均数和方差分别为73.5和119,则总样本的平均数为 ;方差为 .
【答案】 72.5 148
【分析】先分别求出男生及女生的平均数,再应用分层抽样的方差公式计算方差即可.
【详解】设男生成绩样本平均数为,方差为,
女生成绩样本平均数,方差为,总样本的平均数为,方差为,
则有,
.
所以总样本的平均数和方差分别为72.5和148.
故答案为:72.5;148
3.已知某中学的3个年级各有学生300,300,400人,现采用分层抽样的方法从3个年级的学生中抽取10人,对他们的体重进行了统计.若3个年级被抽到的学生体重的平均值分别为48,52,55kg,方差分别为4,10,1.将这10名学生体重W(kg)作为样本,则样本的方差为 .
【答案】13
【分析】先根据分层抽样的平均数公式求出平均数为52,再代入方差公式计算得出方差.
【详解】3个年级抽取的学生数分别为3,3,4人,
则,
故.
故答案为:13.
4.在对树人中学高一年级学生身高的调查中,采用样本比例分配的分层随机抽样,如果不知道样本数据,只知道抽取了男生20人,其平均数和方差分别为170和10,抽取了女生30人,其平均数和方差分别为160和15.则估计出总样本的方差为 .
【答案】37
【分析】按男女生比例抽取样本,结合相应公式计算均值和方差即可.
【详解】由题意知,
总样本的平均数为,
总样本的方差为.
故答案为:37
题型五 直方图及其应用
例1.伟才学校组织开展党史知识竞赛活动,将本校全体党员党史知识竞赛的成绩(均位于之内)整理,得到如图所示的频率分布直方图.根据此频率分布直方图,下列结论正确的是( )
A.本次成绩不低于80分的人数的占比为
B.本次成绩低于70分的人数的占比为
C.估计本次成绩的平均分不高于85分
D.本次成绩位于的人数是其他人数的3倍
【答案】ABC
【分析】由频率分布直方图中所有小长方形的面积和为1及每个小长方形的面积表示对应成绩段的频率可计算出各个成绩段的频率,从而依次判断即可.
【详解】由频率分布直方图知,成绩在、,的频率依次为:
0.2、0.5和0.25,所以成绩在的频率为.
对于A,成绩不低于80分的频率为,故A正确;
对于B,成绩低于70分的频率为0.05,故B正确;
对于C,本次成绩的平均分为(分),故C正确;
对于D,本次成绩位于的频率为,
所以成绩不在的频率为,
所以本次成绩位于的人数是其他人数的倍,故D错误.
故选:ABC.
例2.某学校为了解本校学生上学的交通方式,在全校范围内随机抽样调查部分学生,了解到上学的交通方式主要有:A为家人接送,B为乘坐地铁,C为乘坐公交,D为其他方式.学校把收集到的数据整理绘制成条形图和扇形图,如图只给出了其中部分信息,则下列结论中正确的是( )
A.此次抽查的样本量为240
B.若该校有学生2000人,则约有500人是家人接送上学
C.扇形图中B的占比为38%
D.估计该校学生上学交通方式为乘坐地铁或者其他方式的人数占全校学生的一半
【答案】ABD
【分析】根据公交的人数和比例即可求解样本量,进而判断A,根据条形图可得家人接送所占比重,即可求解B,根据乘坐地铁的人数与样本量的比即可求解CD.
【详解】因为乘坐公交的调查人数为60,所占比例为,所以调查的总人数为,故A正确,
对于B,家人接送的学生所占的比例为,故,所以B正确;
对于C:扇形图中的占比为,所以C错误;
对于D:,所以D正确.
故选:ABD
例3.某校为了解高一年级学生的体育健康标准测试(简称“体测”)成绩的分布情况,从该年级学生的体测成绩(规定满分为分)中,随机抽取了名学生的成绩,并进行分组:,,,,,绘制成如下频率分布直方图,该校高一年级学生体测成绩的众数的估计值是( )
A. B. C. D.
【答案】B
【分析】根据众数的知识确定正确答案.
【详解】由图可知,众数是.
故选:B
巩固训练
1.(多选)某校从全校随机抽取n名学生参加奥运知识竞赛,并根据这n名学生的竞赛成绩(总分为100分)绘制频率分布直方图(如图所示),其中分数在[50,60)内的学生有3名,则下列说法正确的是( )
A.
B.
C.样本中分数在[40,50)内的学生有2名
D.用同比例分层抽样方法从分数在[50,60),[90,100]内的学生中抽取4名,则分数在[50,60)内的有3名
【答案】ABC
【分析】根据在频率直方图中所有小矩形面积之和为1,结合频率直方图、分层抽样的抽样比逐一判断即可.
【详解】对于A,由,解得,故A正确;
对于B,,故B正确;
对于C,样本中分数在[40,50)内的学生有(名),故C正确;
对于D,分数在[50,60)内的学生有(名),故D错误.
故选:ABC
2.某中职学校为了解全校学生国庆小长假期间阅读古典名著的时间的情况,抽查了1000名学生,将他们的阅读时间进行分组:.抽样结果绘成的频率分布直方图如图所示.则实数 .这1000名学生阅读古典名著的时间不少于8小时的人数为 .
【答案】 /
【分析】①由直方图中所有矩形的高度之和乘以组距为可求解,②再由频率分布直方图求出时间在小时以上的频率,再求人数.
【详解】根据频率分布直方图的几何意义,坐标系内的所有矩形的高度之和乘以组距为定值1,
所以,得,
阅读时间不少于小时的人数为.
故答案为:①,②.
3.从某小区抽取100户层民用户进行月用电量调查,发现他们的月用电量都在之间,进行适当分组后(每组为左用右开的区间),画出频率分布直方图如图所示,在被调查的用户中,月用电量落在区间内的户数为 .
【答案】
【分析】首先求出参数的值,再求出月用电量落在区间的频率,即可得解.
【详解】由频率分布直方图可得,解得,
所以月用电量落在区间的频率为,
所以在被调查的用户中,月用电量落在区间内的户数为.
故答案为:
题型六 扇形及折线图的应用
例1.如图是2020年2月15日至3月2日武汉市新冠肺炎新增确诊病例的折线统计图.则下列说法不正确的是( )
A.武汉市新冠肺炎疫情防控取得了阶段性的成果,但防控要求不能降低
B.2020年2月19日武汉市新增新冠肺炎确诊病例比前日降低了1045人
C.2020年2月15日到3月2日武汉市新冠肺炎新增确诊病例最多的一天是最少的一天16倍多
D.2020年2月19日至3月2日武汉市新增新冠肺炎确诊病例低于500人的有10天
【答案】C
【分析】直接利用折线图以及统计的相关知识逐一分析即可
【详解】对于A, 19日后新增确诊病例人数与之前的各天新增确诊病例人数相比较呈大幅下降趋势,
故防控取得了阶段性的成果,但新增人数还较多,故防控要求不能降低,故A正确;
对于B,由图可知18日新增确诊病例人数1660人,19日新增确诊病例人数615人,
故2020年2月19日武汉市新增新冠肺炎确诊病例比前日降低了1045人,故B正确;
对于C,由图新增确诊病例最多一天的人数为1690,
新增确诊病例最少一天的人数111人,
故2020年2月15日到3月2日武汉市新冠肺炎新增确诊病例最多的一天人数与最少的一天的人数的比值为,C错误,
对于D,由图得到,病例低于500人的有2月20日、21日、23日、24日、25日、26日、27日、28日、3月1日、2日,共10天,故D正确;
故选:C.
例2.2021年3月,中共中央、国务院印发了《关于实现巩固拓展脱贫攻坚成果同乡村振兴有效衔接的意见》,某村在各级政府的指导和支持下,开展新农村建设,两年来,经济收入实现翻番,为更好地了解经济收入变化情况,统计了某村新农村建设前后农村的经济收入构成比例.得到如下扇形图:则下面结论中正确的是( )
A.新农村建设后,种植收入比例减少了23%
B.新农村建设后,其他收入增加1%
C.新农村建设后,养殖收入持平
D.新农村建设后,养殖收入与第三产业收入的总和超过了经济收入的一半
【答案】AD
【分析】利用扇形图求解.
【详解】A.由扇形图知:新农村建设后,种植收入比例减少了23%,故正确;
B.由扇形图知:新农村建设后,其他收入比例增加了1%,故错误;
C.由扇形图知:新农村建设后,养殖收入比例持平,故错误;
D.由扇形图知:新农村建设后,养殖收入与第三产业收入的总和超过了经济收入的一半,故正确;
故选:AD
巩固训练
1.某市2023年经过招商引资后,经济收入较前一年增加了一倍,实现翻番,为更好地了解该市的经济收入的变化情况,统计了该市招商引资前后的年经济收入构成比例,得到如下扇形图.则下列结论中正确的是( )
A.招商引资后,工资净收入较前一年减少
B.招商引资后,转移净收入是前一年的2.5倍
C.招商引资后,转移净收入与财产净收入的总和超过了该年经济收入的
D.招商引资后,经营净收入较前一年增加了一倍
【答案】BD
【分析】依题意招商引资后,经济收入较前一年增加了一倍,再依据招商引资前后的年经济收入构成比例计算即可得出结论.
【详解】根据题意,可设招商引资前的经济收入为,则招商引资后的经济收入为;
对于A,由招商引资前后的年经济收入构成比例可知招商引资前的工资收入为,招商引资后的工资收入为,
可知招商引资后,工资净收入较前一年增多,即A错误;
对于B,招商引资前的转移净收入为,招商引资后的工资收入为,
即招商引资后,转移净收入是前一年的2.5倍,可得B正确;
对于C,由招商引资后的年经济收入构成比例可知转移净收入与财产净收入的总和占比为,小于,即C错误;
对于D,招商引资后的经营净收入为,招商引资前的经营净收入为,
可得招商引资后,经营净收入较前一年增加了一倍,即D正确.
故选:BD
2.Z国进口的天然气主要分为液化天然气和气态天然气两类.2023年Z国天然气进口11997吨,其中液化天然气进口7132吨,气态天然气进口4865吨.2023年Z国天然气及气态天然气进口来源分布及数据如图所示:
下列结论正确的是( )
A.2023年Z国从B国进口的液化天然气比从A国进口的多
B.2023年Z国没有从A国进口液化天然气
C.2023年Z国从C国进口的液化天然气一定比从D国进口的多
D.2023年Z国从B国进口的液化天然气一定比从D国进口的多
【答案】ABC
【分析】由饼状统计图的实际含义逐一验算各个选项即可求解.
【详解】对于B,2023年Z国从A国进口天然气2480吨,全部为气态天然气,
所以2023年Z国没有从A国进口液化天然气,B正确.
对于A,2023年Z国从B国进口天然气2435吨,其中气态天然气1630吨,液化天然气805吨,
所以2023年Z国从B国进口的液化天然气比从A国进口的多,A正确.
对于C,假设2023年Z国气态天然气其余部分全部来自C国,共吨,
则Z国从C国进口液化天然气吨,仍然大于从D国进口的天然气的总量,
所以2023年Z国从C国进口的液化天然气一定比从D国进口的多,C正确.
对于D,2023年Z国从B国进口液化天然气吨,
2023年Z国从D国进口的天然气总量为1666吨,若全部为液化天然气,
则2023年Z国从B国进口的液化天然气比从D国进口的少,D错误.
故选:ABC.
3.我市教育局对全市高三年级的学生身高进行抽样调查,随机抽取了100名学生,他们的身高都处在五个层次内,根据抽样结果得到如图的统计图表,则样本中人数最多的是 层,样本中层的男生人数为 人.
【答案】
【分析】运用条形统计图得到女生人数,进而得到男生人数,最后按照比例求出各层人数即可.
【详解】解析:由图可知女生人数为60,则男生人数为40,
样本中层的人数为;样本中层的人数为;
样本中层的人数为;样本中层的人数为;
样本中层的人数为.故样本中层的人数最多.
样本中层的男生人数为.
故答案为:;6.
4.(多选)我国新冠肺炎疫情防控进入常态化,各地有序推动复工复产.下面是某地连续11天的复工、复产指数折线图.根据该折线图,( )
A.这11天复工指数和复产指数均逐日增加
B.在这11天期间,复产指数的增量大于复工指数的增量
C.第3天至第11天,复工指数和复产指数都超过80%
D.第9天至第11天,复产指数的增量大于复工指数的增量
【答案】CD
【分析】根据折线图,即可结合选项逐一求解.
【详解】对于A,由题图可知第8,9天复工指数和复产指数均减小,故A错误;
对于B,第1天时复工指数小于复产指数,第11天时两指数相等,故复产指数的增量小于复工指数的增量,故B错误;
对于C,由题图可知第3天至第11天,复工复产指数都超过80%,故C正确;
对于D,第9天至第11天,复产指数的增量大于复工指数的增量,故D正确.
故选:CD
题型七 数字特征计算及应用
例1.在一次歌唱比赛中,有5位评委给某选手打分(分数不全相同).与原始分数相比,去掉一个最高分和一个最低分之后,一定发生改变的是( )
A.平均数 B.众数 C.中位数 D.方差
【答案】D
【分析】根据题意,由数据的中位数、平均数、方差、众数的定义,分析可得答案.
【详解】对于A,若分数为时,则平均数为,
去掉,则平均数为,故A错误;
对于B,若分数为时,则众数为,
去掉,则众数为,故B错误;
对于C,若分数为时,则中位数为,
去掉,则中位数为,故C错误;
对于D,方差体现数据的偏离程度,因为数据不完全相同,
当去掉一个最高分、一个最低分,一定使得数据偏离程度变小,即方差变小,故D正确.
故选:D.
例2.已知一组数据的平均数,方差,则数据的平均数、方差分别为( )
A.16,20 B.16,80 C.18,20 D.18,80
【答案】D
【分析】根据平均数、方差的性质求解.
【详解】由题意数据的平均数为,
方差为,
故选:D.
例3.一组数据按从小到大的顺序排列如下:11,12,15,,18,20,22,26,经计算,该组数据的中位数是17,则x的值为( )
A.15 B.16 C.17 D.18
【答案】B
【分析】由中位数的定义即可求解.
【详解】由数据11,12,15,,18,20,22,26,
可知:中位数,
解得:.
故选:B
巩固训练
1.某篮球运动员进行投篮训练,共进行了10组,每组投篮55次,每组投篮命中的个数分别为m,n,48,47,48,50,45,47,49,50.已知这组数据的平均数为48,方差为7,则( )
A.10 B. C. D.5
【答案】A
【分析】根据平均数与方差的公式列方程可得解.
【详解】因为这组数据的平均数为48,方差为7,
所以
整理得
设,则,
因为50,所以,即,
则.
故选:A
2.已知数据,…,(,)的平均数、中位数、方差均为4,则这组数据的极差为( )
A.3 B.4 C.5 D.6
【答案】D
【分析】依题意根据平均数、方差均为4构造方程组,再由解方程可得,即可求出这组数据的极差.
【详解】根据题意,不妨设,且,可得,
由平均数为4,得,即;
由方差为4,得,即;
联立,由可解得;
根据极差定义可得这组数据的极差为.
故选:D
3.“杂交水稻之父”袁隆平培育的超级杂交稻在全世界推广种植.某种植户为了考察所种植的杂交水稻苗的长势,从稻田中随机抽取7株水稻苗,测得苗高(单位:)分别是23,24,23,25,26,23,25.则这组数据的众数和中位数分别是( )
A.24,25 B.23,23
C.23,24 D.24,24
【答案】C
【分析】把给定数据由小到大排列,再求出众数、中位数即得.
【详解】苗高由小到大排列为:,
所以这组数据的众数和中位数分别是23,24.
故选:C
4.有一组样本数据:1,2,4,3,1,2,1,则( )
A.这组数据的众数为1 B.这组数据的极差为1
C.这组数据的平均数为2 D.这组数据的中位数为
【答案】AC
【分析】根据已知数据求得众数、极差、均值、中位数后判断.
【详解】众数为1,极差为,平均数为,
数据从小到大进行排序得1,1,1,2,2,3,4,中位数为2,则AC正确,BD错误.
故选:AC.
5.为了迎接中国共产党建党一百周年,某班50名同学进行了党史知识竞赛,测试成绩统计如下表,其中两个数据被遮盖.
成绩\分
91
92
93
94
95
96
97
98
99
100
人数
■
■
1
2
3
5
6
8
10
12
下列关于成绩的统计量中,与被遮盖的数据无关的是( )
A.平均数,方差 B.中位数,方差 C.中位数,众数 D.平均数,众数
【答案】C
【分析】根据题意,结合数据的中位数和众数的概念及求法,求得数据的中位数和众数为定值,即可求解.
【详解】由表格数据可知,成绩为91分、92人的人数为人,
成绩为100分的出现的次数最多,所以成绩的众数为100,
成绩从小到大排列后处在第25/26为的两个数都是98分,所以数据的中位数为98,
所以中位数和众数与被遮盖的数据无关.
故选:C.
6.若一组样本数据,,…的,则样本数据,,…,的方差为 .
【答案】8
【分析】根据方差的性质计算可得.
【详解】根据方差性质可知为常数
所以由题意的一组样本数据,,…的,
则样本数据,…,的方差为.
故答案为:8
7.有一组样本数据,其平均数、中位数、标准差、极差分别记为.由这组数据得到新样本数据,其中,其平均数、中位数、标准差、极差分别记为,则( )
A. B.
C. D.
【答案】ACD
【分析】根据新旧数据间样本的数字特征的关系对选项进行分析,从而确定正确答案.
【详解】依题意,平均数,中位数,标准差,极差,
所以ACD选项正确,B选项错误.
故选:ACD
8.第33届夏季奥林匹克运动会女子10米跳台跳水决赛中,全红禅以425的高分拿下冠军.下面统计某社团一位运动员10次跳台跳水的训练成绩:68,80,74,63,66,84,78,66,70,76,则这组数据的中位数为 .
【答案】
【分析】将数据从小到大排列后,按中位数的定义求解即可.
【详解】解:将数据从小到大排列为:63,66,66,68,70,74,76,78,80,84.
所以中位数为:.
故答案为:
9.庚子新春,“新冠”肆虐,面对新冠肺炎的发生,某医疗小组提出了一种治疗的新方案.为测试该方案的治疗效果,此医疗小组选取了患病程度相同的12名病人志愿者,将他们随机分成两组,每组6人.第一组用新方案治疗,第二组用旧方案治疗.统计病人的痊愈时间(单位:天)如下表:
新方案治疗
3
6
6
7
10
10
旧方案治疗
5
8
9
11
12
15
记新方案和旧方案治疗病人痊愈时间的平均数分别为和,方差分别为和.
(1)求,,,;
(2)判断新方案的治疗效果较旧方案是否有显著提高.
说明:如果,则认为新方案的治疗效果较旧方案是有显著提高,否则不认为有显著提高.
【答案】(1),,,
(2)新方案的治疗效果较旧方案有显著提高
【分析】(1)根据平均数和方差的计算公式求解即可;
(2)根据题设判断即可.
【详解】(1)由已知可得,
,
同理可得,,
.
(2),,
新方案的治疗效果较旧方案有显著提高.
题型八 百分位数及应用
例1.样本数据3,3,4,4,5,5,6,7的第75百分位数是( )
A.6.5 B.6 C.5.5 D.5
【答案】C
【分析】由百分位数的定义求解即可.
【详解】解析:因为,
所以样本数据的第75百分位数是第6个数和第7个数的平均数即.
故选:C.
例2.一组数据23,11,14,31,16,17,19,27的上四分位数是( )
A.14 B.15 C.23 D.25
【答案】D
【分析】根据上四分位数的概念求值即可.
【详解】把数据按从小到大的顺序排列: 11,14, 16,17,19,23,27,31.
因为,上四分位数是.
故选:D
例3.一组数据按从小到大的顺序排列为1,3,4,x,6,7,9,若该组数据的中位数与平均数相同,则该组数据的第60百分位数是( )
A.3 B.4 C.5 D.6
【答案】D
【分析】根据中位数和平均数相同得到方程,求出,利用百分位数的定义求出答案.
【详解】由题意得,解得,
,故从小到大,选取第5个数据作为该组数据的第60百分位数,即6.
故选:D
巩固训练
1.学校组织知识竞赛,某班8名学生的成绩(单位:分)分别是65,60,75,78,86,84,90,94,则这8名学生成绩的75%分位数是( )
A.88分 B.84分 C.85分 D.90分
【答案】A
【分析】先对这8名学生的成绩按从小到大排列,然后用百分位数的定义求解即可.
【详解】8名学生的成绩从小到大排列为:60,65,75,78,84,86,90,94,
因为,所以75%分位数为第6个数和第7个数的平均数,
即分.
故选:A.
2.高二年级进行消防知识竞赛,统计所有参赛同学的成绩,成绩都在内,估计所有参赛同学成绩的第75百分位数为( )
A. B. C. D.
【答案】C
【分析】先由长方形的面积和为1求出,再由第75百分位数的定义求解;
【详解】因为,所以.
参赛成绩位于内的频率为,
第75百分位数在内,
设为,则,
解得5,即第75百分位数为85,
故选:C.
3.已知一组数据:2,5,7,,10的平均数为6,则该组数据的第60百分位数为( )
A.7 B.6.5 C.6 D.5.5
【答案】B
【分析】先根据平均数求的值,然后将数据从小到大排列,根据百分位数的概念求值.
【详解】因为.
所以数据为:2,5,6,7,10.
又因为,所以这组数据的第60百分位数为:.
故选:B
4.现有甲、乙两组数据,甲组数据为:;乙组数据为:,若甲组数据的平均数为,标准差为,极差为,第百分位数为,则下列说法一定正确的是( )
A.乙组数据的平均数为 B.乙组数据的极差为
C.乙组数据的第百分位数为 D.乙组数据的标准差为
【答案】ABC
【分析】根据平均数、极差、标准差的性质及百分位数的定义判断即可.
【详解】不妨设甲组数据从小到大排列为:,
则乙组数据从小到大排列为:,
因为甲组数据的平均数为,标准差为,极差为,第百分位数为,
则,又,所以,
所以乙组数据的平均数为,故A正确;
乙组数据的极差为,故B正确;
乙组数据的第百分位数为,故C正确;
乙组数据的标准差为,故D错误.
故选:ABC
5.已知甲组数据为:,乙组数据为:,则下列说法正确的是( )
A.这两组数据的第80百分位数相等
B.这两组数据的极差相等
C.这两组数据分别去掉一个最大值和一个最小值后,均值都不变
D.甲组数据比乙组数据分散
【答案】AC
【分析】根据给定条件,利用第80百分位数、极差、平均数、方差的意义依次判断即得.
【详解】对于A,由,得甲组数据的第80百分位数为,由,乙组数据的第80百分位数为,故A 正确;
对于B,根据极差定义,极差等于最大子减去最小值,可知甲组数据的极差为,乙组数据的极差为,故B错误;
对于C,根据均值定义可知甲组原数据均值为,去掉最值后均值为,乙组原数据均值为,去掉最值后均值为,故C正确;
对于D,由C知甲乙两组平均值都为,根据方差公式甲组
乙组数据方差为
,则,所以乙组数据分散,故D错误.
故选:AC
题型九 直方图、折线图及扇形图的数字特征计算
例1.某高中举行的纪念红军长征出发90周年的知识答题比赛,对参赛的2000名考生的成绩进行统计,可得到如图所示的频率分布直方图,若同一组中数据用该组区间中间值作为代表值,则下列说法中正确的是( )
A.参赛成绩的众数约为75分
B.用分层抽样从该校学生中抽取容量为200的样本,则应在内的成绩抽取30人
C.参赛成绩的第75百分位数约为82.5分
D.参赛成绩的平均分约为72.8分
【答案】AC
【分析】对于A,由频率分布直方图的最高小长方形中点值即可得解;对于B,由分数在内的频率和样本容量可求解;对于C,根据频率分布直方图的数据结合百分位数的定义和求解步骤计算求解即可;对于D,根据频率分布直方图中的平均数定义的求解方法即可计算得解.
【详解】对于A:由频率分布直方图可得众数为,故A正确;
对于B:由频率分布直方图可得内应抽取人,故B错误;
对于C:分数在)内的频率为,
在)内的频率为,
因此第75百分位数位于内,第75百分位数为,故C正确;
对于D:平均数为,故D错误.
故选:AC.
例2.成都七中高新校区高二年级14个班团体操比赛成绩(满分100分)从小到大排序依次为:88,89,90,90,90,90,91,91,91,92,92,93,93,94(单位分),则下列说法正确的是( )
A.众数为90 B.中位数为91.5 C.第80百分位数为92 D.方差为
【答案】AD
【分析】由平均数、众数,中位数和方差的定义和计算公式求解即可.
【详解】易知:众数为90,中位数为91,
因为,所以第80百分位数为第十二个数为93;
平均数,
则方差为.
故选:AD.
例3.某校为了解高一年级学生的体育健康标准测试(简称“体测”)成绩的分布情况,从该年级学生的体测成绩(规定满分为100分)中,随机抽取了80名学生的成绩,并进行分组:,,,,,绘制成如下频率分布直方图,该校高一年级学生体测成绩的第80百分位数的估计值是( )
A.87 B.88 C.89 D.90
【答案】B
【分析】先根据频率之和为1得到方程,求出,求出第80百分位数落在第四组数据内,设第80百分位数为,得到方程,求出答案.
【详解】,解得,
前三组数据的频率之和为,
前四组数据的频率之和为,
故该校高一年级学生体测成绩的第80百分位数落在第四组数据内,
设第80百分位数为,
则,解得,
该校高一年级学生体测成绩的第80百分位数的估计值是88.
故选:B
巩固训练
1.甲、乙两个跑步爱好者利用微信运动记录了去年下半年每个月的跑步里程(单位:公里),现将两人的数据绘制成如图所示的折线图,则下列结论中正确的是( )
A.乙跑步里程的极差等于31
B.甲跑步里程的中位数是245
C.分别记甲乙下半年每月跑步里程的标准差为,,则
D.分别记甲、乙下半年每月跑步里程的平均数为,,则
【答案】C
【分析】根据极差,中位数以及平均数的计算公式即可求解ABD,根据方差的性质即可求解C.
【详解】对于A,乙跑步里程的极差为,故A错误;
对于B,甲跑步里程的中位数为,故B错误;
对于D,甲跑步里程的平均数为,
乙跑步里程的平均数为,
,故D错误;
根据折线图可知,甲的波动大,乙的波动小,,故C正确.
故选:C.
2.年巴黎奥运会中国代表队获得金牌榜第一,奖牌榜第二的优异成绩.首金是中国组合黄雨婷和盛李豪在米气步枪混合团体赛中获得,两人在决赛中次射击环数如图,则( )
A.盛李豪的平均射击环数超过
B.黄雨婷射击环数的第百分位数为
C.盛李豪射击环数的标准差小于黄雨婷射击环数的标准差
D.黄雨婷射击环数的极差小于盛李豪射击环数的极差
【答案】C
【分析】根据图表数据可直接判断选项A,利用第百分位数的解法直接判断选项B,根据图表的分散程度即可判断选项C,根据极差的求法直接判断选项D.
【详解】由题知,盛李豪的射击环数只有两次是环,次环,
其余都是环以下,所以盛李豪平均射击环数低于,故A错误;
由于,故第百分位数是从小到大排列的第个数,故B错误;
由于黄雨婷的射击环数更分散,故标准差更大,故C正确;
黄雨婷射击环数的极差为,
盛李豪的射击环数极差为,故D错误.
故选:C
3.下图是甲、乙两地10月1日至7日每天最低气温走势图.
记这7天甲地每天最低气温的平均数为,标准差为;记这7天乙地每天最低气温的平均数为,标准差为.根据上述信息,下列结论中正确的是( )
A. B. C. D.
【答案】B
【分析】分析统计图中对应信息得出对应量的结果即可.
【详解】甲地1至7日最低气温均低于乙地,则甲地最低气温平均值也会小于乙地,即;
标准差时反应一组数据的波动强弱的量,
由图可知甲地最低气温明显波动性较大,则标准差值要大,即.
故选:B
题型十 综合应用
例1.在践行“乡村振兴”战略的过程中,某地大力发展特色花卉种植业.某农户种植一种观赏花㚏,为了解花卉的长势,随机测量了枝花的高度(单位:),得到花枝高度的频率分布直方图,如图所示,则( )
A.样本花卉高度的极差不超过
B.样本花卉高度的中位数不小于众数
C.样本花的高度的平均数不小于中位数
D.样本花升高度小于的占比不超过
【答案】D
【分析】利用极差的定义可判断A选项;利用中位数和众数的定义可判断B选项;利用平均数公式求出样本花卉高度的平均数,可判断C选项;计算出样本花升高度小于的占比,可判断D选项.
【详解】对于A选项,由频率分布直方图可知,样本花卉高度的极差为,A错;
对于B选项,样本花卉高度的众数为,
设样本花卉高度的中位数为,
前三个矩形的面积和为,
前四个矩形的面积和为,故,
由中位数的定义可得,解得,则,
所以,样本花卉高度的中位数小于众数,B错;
对于C选项,由频率分布直方图可知,
样本花卉高度的平均数为,
且,所以,样本花的高度的平均数小于中位数,C错;
对于D选项,由B选项可知,样本花升高度小于的占比为,D对.
故选:D.
例2.从某小区抽取100户居民用户进行月用电量调查,发现他们的月用电量都在之间,进行适当分组后每组为左闭右开的区间,画出频率分布直方图如图所示,以下选项正确的有( )
A. B.本组样本的众数为250
C.本组样本的第45百分位数是300 D.用电量落在区间内的户数为82
【答案】ACD
【分析】由频率分布直方图中矩形面积之和为1计算可得A正确;根据众数以及百分位数定义计算可得B错误,C正确;由频率估计对应频数计算可得D正确.
【详解】对于A,因为,
解得,故A正确;
对于B,样本的众数位于内,但不一定是250,故B错误;
对于C,前2组的频率之和为,前3组的频率之和为,
故第45百分位数位于内,设其为,
则,解得,故C正确;
对于D,的频率为,
故用电量落在区间内的户数为,故D正确.
故选:ACD
例3.某高中为增强学生的海洋国防意识,组织本校1000名学生参加了“逐梦深蓝,山河荣耀”的国防知识竞赛,从中随机抽取200名学生的竞赛成绩(单位:分),成绩的频率分布直方图如图所示,则下列说法正确的是( )
A.频率分布直方图中的值为0.005
B.估计这200名学生竞赛成绩的平均数为80
C.估计这200名学生竞赛成绩的众数为78
D.估计总体中成绩落在内的学生人数为150
【答案】AD
【分析】先根据频率之和为1可得,进而可得每组的频率,再结合统计相关知识逐项分析判断.
【详解】对于A,由,得,A正确;
对于B,由频率分布直方图知,每组的频率依次为.
估计这200名学生竞赛成绩的平均数为,B错误;
对于C,成绩在的频率最大,因此这200名学生竞赛成绩的众数为75,C错误;
对于D,总体中成绩落在内的学生人数为,D正确.
故选:AD
巩固训练
1.为了解一片经济林的生长情况,随机抽取了其中60棵树木,测量底部周长(单位:),所得数据均在区间内,其频率分布直方图如图所示,则( )
A.图中a的值为
B.样本中底部周长不少于110cm的树木的底部周长的平均数等于120
C.样本中底部周长不小于110cm的树木有18棵
D.估计该片经济林中树木的底部周长的分位数为115
【答案】ACD
【分析】根据频率分布直方图的性质,以及平均数和百分位数,以及频数与频率的计算方法,逐项判定,即可求解.
【详解】对于A选项,根据题意可得,
解得,故A选项正确;
对于B选项,因为与两组的频率之比为,
所以样本中底部周长不少于110cm的树木的底部周长的平均数估计为:
,故B选项错误;
对于C选项,因为不小于110cm的频率为,
所以不小于110cm的树木有株,故C选项正确;
对于D选项,因为前三个矩形的面积为:,
前四个矩形的面积为:,
所以分位数位于区间,则,故D选项正确.
故选:ACD.
2.为了检验同学们高二以来的学习效果,某市在期末的时候将组织调研考试.在某次调研考试中学校为了解同学们的调考情况,从所有同学中随机抽取某学科的100份答卷作为样本,将样本成绩按从低到高依次分为第组(如下图所示,成绩满分为100分且成绩均为不低于40分的整数),得到如图所示的频率分布直方图.
(1)根据频率分布直方图求样本成绩的上四分位数;(上四分位数即75百分位数)
(2)已知第2组的平均成绩是54,方差是4,第3组的平均成绩为66,方差是4,
①分别求第2组和第3组的人数;
②求这两组成绩的总平均数和总方差.
参考公式或数据:
方差:.
【答案】(1)84;
(2)①10,20;②总平均数是62,总方差是36
【分析】(1)根据频率分布直方图结合百分位数的定义计算即可;
(2)①利用频率分布直方图直接计算可得;②利用平均数与方差的计算公式计算即可.
【详解】(1)上四分位数即75百分位数,
成绩落在内的频率为
成绩落在内的频率为,
设第75百分位数为,则其位于区间,
则,解得,
所以上四分位数为84;
(2)①由图可知,成绩在的人数为,
成绩在的人数为,
②两组成绩的总平均数为,
设成绩在中10人的分数分别为;
成绩在中20人的分数分别为,
则由题意可得,,,
即,
所以,
所以两组成绩的总平均数是62,总方差是36.
3.文明城市是反映城市整体文明水平的综合性荣誉称号,作为普通市民,既是文明城市的最大受益者,更是文明城市的主要创造者.某市为提高市民对文明城市创建的认识,举办了“创建文明城市”知识竞赛,从所有答卷中随机抽取100份作为样本,将样本的成绩(满分100分,成绩均为不低于40分的整数)分成六段:[40,50),[50,60),,[90,100]得到如图所示的频率分布直方图.
(1)求频率分布直方图中的值及样本成绩的第75百分位数;
(2)求样本成绩的众数,中位数和平均数;
(3)已知落在的平均成绩是54,方差是7,落在的平均成绩为66,方差是4,求两组成绩合并后的平均数和方差.
【答案】(1),第75百分位数为84;
(2)众数为75,中位数为75,平均数为74;
(3)平均数为62,方差为37.
【分析】(1)根据频率和为1求得,结合百分数定义求第75百分位数;
(2)根据直方图,及众数、中位数、平均数求法求值;
(3)根据已知求样本总均值,再由总方差公式求样本总方差.
【详解】(1)由每组小矩形的面积之和为1,得,解得,
成绩在内的频率为,在内的频率为,
显然第75百分位数,由,解得,
所以第75百分位数为84.
(2)由,得样本成绩的众数为75,
成绩落在[40,70)内的频率为,
成绩落在内的频率为,
故中位数在[70,80)内,由,得样本成绩的中位数为75,
由.
得样本成绩的平均数为74.
(3)由频率分布直方图知,成绩在的市民人数为,成绩在的市民人数为,
所以,
总方差为.
原创精品资源学科网独家享有版权,侵权必究!48
学科网(北京)股份有限公司
$$