内容正文:
复习08 统计
一、随机抽样
1.统计的相关概念
名称
定义
总体
调查对象的全体称为整体
个体
组成整体的每一个调查对象称为个体
样本
从总体中抽取的那部分个体称为样本
样本容量
样本中包含的个体数称为样本容量
样本与样本量的区别:样本是从总体中抽取的个体组成的集合,是对象;样本量是样本中个体的数目,是一个数.
2.简单随机抽样
定义
设一个总体含有个个体,从中逐个不放回抽取个个体作为样本(),如果每次抽取时总体内的各个个体被抽到的机会都相等,就把这种抽样方法叫做简单随机抽样
方法
抽签法
把总体中的个个体编号,把号码写在号签上,将号签放在一个容器中,搅拌均匀后,每次从中抽取一个号签,连续抽取n次,就得到一个容量为n的样本
随机数法
利用随机数表、随机数骰子或计算机产生的随机数进行抽样
抽签法与随机数法
相同点
①都属于简单随机抽样,并且要求被抽取样本的总体的个体数有限;
②都是从总体中逐个不放回地进行抽取
不同点
①抽签法比随机数法操作简单;
②随机数法更适用于总体中个体数较多的时候,而抽签法适用于总体中个体数较少的情况
利用随机数法抽取个体时的注意事项:
①定起点:事先应确定以表中的哪个数(哪行哪列)作为起点.
②定方向:读数的方向(向左、向右、向上或向下都可以).
③读数规则:读数时结合编号的特点进行读取,编号为两位数则两位两位地读取,编号为三位数则三位三位地读取,如果出现重复则跳过,直到取满所需的样本个体数.
3.分层抽样
①定义:在抽样时,将总体分成互不交叉的层,然后按照一定的比例,从各层独立地抽取一定数量的个体,将各层取出的个体合在一起作为样本,这种抽样方法叫做分层抽样.
②应用范围:当总体是由差异明显的几个部分组成时,往往选用分层抽样.
注意:分层抽样是按比例抽样,每一层入样的个体数为该层的个体数乘以抽样比.
二、直方图及数据特征
1.频率分布直方图
1.画频率分布直方图的步骤
第1步:求极差(即一组数据中最大值与最小值的差);第2步:决定组距与组数;
第3步:将数据分组;第4步:列频率分布表;
第5步:画频率分布直方图(以横轴表示样本分组,纵轴表示频率与组距的比值).
2.频率分布直方图的性质:
落在各小组内的频率用各小长方形的面积表示,且各小长方形的面积的和等于1.
2、数字特征
(1)众数、中位数、平均数
数字特征
样本数据
频率分布直方图
众数
出现次数最多的数据
取最高的小长方形底边中点的横坐标
中位数
将数据按大小依次排列,处在最中间位置的一个数据(或最中间两个数据的平均数)
把频率分布直方图划分左右两个面积相等的分界线与x轴交点的横坐标
平均数
样本数据的算术平均数
每个小矩形的面积乘以小矩形底边中点的横坐标之和
(2)极差、方差和标准差
极差:即一组数据中最大值与最小值的差.
方差:.
标准差:.
注:方差和标准差反映了数据波动程度的大小.标准差、方差越大,数据的离散程度越大,越波动;标准差、方差越小,数据的离散程度越小,越稳定.
(3)性质
①若的平均数为,那么的平均数为.
②数据与数据的方差相等,即数据经过平移后方差不变.
③若的方差为s2,那么的方差为.
3.百分位数
(1)定义:一组数据的第p百分位数是这样一个值,它使得这组数据中至少有的数据小于或等于这个值,且至少有的数据大于或等于这个值.
(2)计算一组几个数据第p百分位数的步骤
第1步,按从小到大排列原始数据;第2步,计算.第3步,若i不是整数,而大于i的比邻整数为j,则第p百分位数为第j项数据;若i是整数,则第p百分位数为第i项与第(i+1)项数据的平均数.
(3)四分位数
即把所有数值由小到大排列并分成四等份,处于三个分割点位置的数值就是四分位数.
其中第25百分位数也称为第一四分位数或下四分位数等,第75百分位数也称为第三四分位数或上四分位数等.
考点01 抽签法与随机数表法
【方法点拨】利用随机数表进行抽样的具体步骤:①给总体中的每个个体编号;②在随机数表中随机抽取某行某列作为抽样的起点,并规定读取方法;③依次从随机数表中抽取样本号码,凡是抽到编号范围内的号码,就是样本的号码,并剔除相同的号码,直到抽满为止.
【例1】用抽签法进行抽样有以下及格步骤:
①把号码写在形状、大小相同的号签上(号签可以用小球、卡片、纸条制作)
②将总体中的个体编号;
③从这容器中逐个不放回地抽取号签,将取出号签所对应的个体作为样本;
④将这些号签放在一个容器内并搅拌均匀;
这些步骤的先后顺序应为
A.②①④③ B.②③④① C.①③④② D.①④②③
【例2】总体由编号为01,02,…,30的30个个体组成.利用所给的随机数表选取6个个体,选取的方法是从随机数表第1行的第3列开始,由左到右一次选取两个数字,则选出来的第5个个体的编号为( )
(第一行)1712 1340 3320 3826 1389 5103 7417 7637
(第二行)1304 0774 2119 3056 6218 3735 9683 5087
A.20 B.26 C.17 D.03
【变式1-1】某市质监局要检查某公司某个时间段生产的500克袋装牛奶的质量是否达标,现从500袋牛奶中抽取10袋进行检验.
(1)利用随机数法抽取样本时,应如何操作?
(2)如果用随机数法生成部分随机数如下所示,据此写出应抽取的袋装牛奶的编号.
162,277,943,949,545,354,821,737,932,354,873,520,964,384,263,491,648,642,175,331,572,455,068,877,047,447,672,172,065,025,834,216,337,663,013,785,916,955,567,199,810,507,175,128,673,580,667.
【变式1-2】现利用随机数表法从编号为00,01,02,…,18,19的20支水笔中随机选取6支,选取方法是从下列随机数表第1行的第9个数字开始由左到右依次选取两个数字,则选出来的第6支水笔的编号为 .
95226000 49840128 66175168 39682927 43772366 27096623
92580956 43890890 06482834 59741458 29778149 64608925
【变式1-3】某单位拟从40名员工中选1人赠送电影票,可采用下面两种选法:
选法一:将这40名员工按1至40进行编号,并相应地制作号码为1至40的40个号签,把这40个号签放在一个暗箱中搅匀,最后随机地从中抽取1个号签,与这个号签编号一致的员工是幸运人选;
选法二:将39个白球与1个红球(除颜色外,其他完全相同)混合放在一个暗箱中搅匀,让40名员工逐一从中不放回地摸取1个球,则摸到红球的员工是幸运人选.试问:
(1)这两种选法是否都是抽签法,为什么?
(2)这两种选法中每名员工被选中的可能性是否相等?
考点02 分层抽样
【方法点拨】分层随机抽样中有关计算的方法:(1)抽样比=;
(2)总体中某两层的个体数之比=样本中这两层抽取的个体数之比.
【例3】某高中的三个年级共有学生2000人,其中高一600人,高二600人,高三800人,该校现在要了解学生对校本课程的看法,准备从全校学生中抽取80人进行访谈,若采取按比例分配的分层抽样,且按年级来分层,则高一年级应抽取的人数是( )
A.24 B.26 C.30 D.36
【例4】某社区有男性居民900名,女性居民600名,该社区卫生服务站为了解该社区居民的身体健康状况,对该社区所有居民按性别采用等比例分层随机抽样的办法进行抽样调查,抽取了一个容量为100的样本,则样本中男性居民的人数为 .
【变式2-1】某学校为了解高一学生每天阅读时长,从高一男生和女生中采用分层抽样的方法抽取部分学生进行调查分析.已知该学校高一学生中男生和女生的比例是,在抽取的学生中男生比女生多24人,则被抽取的学生人数是 .
【变式2-2】某校高中年级举办科技节活动,开设A,B两个会场,其中每个同学只能去一个会场且25%的同学去A会场,剩下的同学去B会场.已知A,B会场学生年级及比例情况如下表所示:
高一
高二
高三
A会场
50%
40%
10%
B会场
40%
50%
10%
记该校高一、高二、高三年级学生所占总人数的比例分别为x,y,z,利用分层随机抽样的方法从参加活动的全体学生中抽取一个容量为n的样本.
(1)求的值;
(2)若抽到的B会场的高二学生有150人,求n的值以及抽到的A会场高一、高二、高三年级的学生人数.
【变式2-3】某高级中学共有学生3 000名,各年级男、女生的人数如表:
高一年级
高二年级
高三年级
女生
487
x
y
男生
513
560
z
已知高二年级女生比高一年级女生多53人.
(1)高二年级有多少名女生?
(2)现对各年级用比例分配的分层随机抽样的方法从全校抽取300名学生,应从高三年级抽取多少名学生?
考点03 统计图表的分析
【方法点拨】(1)条形图是用一个单位长度表示一定的数量或频率,根据数量的多少或频率的大小画成长短不同的矩形条,条形图能清楚地表示出每个项目的具体数目或频率;
(2)扇形图是用整个圆面积表示总数(100%),用圆内的扇形面积表示各个部分所占总数的百分数;
(3)折线统计图反映数据随时间的变化趋势.
【例5】国家统计局发布的2018年至2022年我国居民消费水平情况如图所示,则下列说法正确的是(居民消费水平)( )
A.2018年至2022年我国居民消费水平逐年提高
B.2018年至2022年我国城镇居民消费水平逐年提高
C.2018年至2022年我国居民消费水平数据的极差为6463元
D.2022年我国城镇人口数比农村人口数的1.5倍还要多
【例6】(多选)2021年7月至2022年7月,我国居民消费价格保持平稳,居民消费价格涨跌幅如图所示,则以下一定正确的序号为( )
备注:,.
A.2021年7月至2022年7月全国居民消费价格环比增长率的极差为1%
B.2021年7月至2022年7月全国居民消费价格同比增长率的中位数与众数相同
C.从同比增长率看,2022年1月与2022年2月全国居民消费价格一定相同
D.从环比增长率看,2022年6月全国居民消费价格与2022年5月全国居民消费价格相同
【变式3-1】如图为2014—2022年中国游戏用户规模(单位:百万人)及同比增长率、2010—2022年中国国产游戏获批版号数量(单位:个)的统计图,则下列结论正确的是( )
A.2014—2022年中国游戏用户规模逐年增长
B.2014—2022年中国游戏用户规模的同比增长率的中位数为
C.2010—2022年中国国产游戏获批版号数量的极差为223个
D.2010—2022年中国国产游戏获批版号数量的平均数超过1600个
【变式3-2】(多选)某校为了更好地支持学生个性发展,开设了学科拓展类、科技创新类、体艺特长类三种类型的校本课程,每位同学从中选择一门课程学习.现对该校5000名学生的选课情况进行了统计,如图1,并用分层随机抽样的方法从中抽取2%的学生对所选课程进行了满意率调查,如图2.则下列说法正确的是( )
A.满意度调查中抽取的样本容量为5000
B.该校学生中选择学科拓展类课程的人数为1250
C.该校学生中对体艺特长类课程满意的人数约为875
D.若抽取的学生中对科技创新类课程满意的人数为30,则
【变式3-3】(多选)2020年1月17日,国家统计局发布了2019年全国居民人均消费支出及其构成的情况,并绘制了如图的饼图.根据饼图判断,下列说法不正确的是( )
A.2019年居民在“生活用品及服务”上人均消费支出的占比为6%
B.2019年居民人均消费支出为23350元
C.2019年居民在“教育文化娱乐”上人均消费支出小于这8项人均消费支出的平均数
D.2019年居民在“教育文化娱乐”、“生活用品及服务”、“衣着”上的人均消费支出之和大于在“食品烟酒”上的人均消费支出
考点04 频率分布直方图
【方法点拨】(1)由于频率分布直方图中的纵坐标为,因此涉及纵坐标中含参数的问题,应根据频率之和为1列式求解;
(2)根据频率分布直方图(表)求样本数据在某一区间内的频率就是样本数据在该区间内的各组频率的和,而求解相应的频数还要根据频率乘以样本容量;
(3)若所求区间包含频率分布直方图中非分组的端点,可以利用“比例法”求解.
【例7】为了了解某地区高三学生的身体发育情况,抽查了该地区100名年龄为17.5岁-18岁的男生体重(kg),得到频率分布直方图如下:
根据上图可得这100名学生中体重在的学生人数是( )
A.20 B.30 C.40 D.50
【例8】为了解全市高三学生的体能素质情况,在全市高三学生中随机抽取了1000名学生进行体能测试,并将这1000名学生的体能测试成绩整理成如下频率分布直方图.则直方图中实数的值为 .
【变式4-1】从某小区抽取100户居民用户进行月用电量调查,发现他们的用电量都在之间,进行适当分组后(每组为左闭右开的区间),画出频率分布直方图如图所示.则在被调查的用户中,用电量落在区间内的户数为 .
【变式4-2】2019年1月1日,“学习强国”学习平台在全国上线,某单位组织全体党员登录学习统计学习积分得到的频率分布直方图如图所示.若学习积分在(单位:万分)的人数是32人,则该单位共有 名党员,若学习积分超过2万分的党员可获得“学习达人”称号,则该单位有 名党员能获得该称号.
【变式4-3】如图是某班一次数学测试成绩的茎叶图(图中仅列出,的数据)和频率分布直方图,则 .
考点05 频率分布直方图与平均数、众数、中位数
【方法点拨】用频率分布直方图估计总体数字特征的方法:
(1)众数:最高小长方形底边中点的横坐标;
(2)中位数:平分频率分布直方图面积且垂直于横轴的直线与横轴交点的横坐标;
(3)平均数:频率分布直方图中每个小长方形的面积乘小长方形底边中点的横坐标之和.
【例9】2021年某省高考体育百米测试中,成绩全部介于12秒与18秒之间,抽取其中100个样本,将测试结果按如下方式分成六组:第一组,第二组,…,第六组,得到如下频率分布直方图,则该100名考生的成绩的平均数和中位数(保留一位小数)分别是( )
A.15.2 15.4 B.15.1 15.4 C.15.1 15.3 D.15.2 15.3
【例10】某校高三(1)班全体女生的一次数学测试成绩的茎叶图和频率分布直方图都受到不同程度的破坏,但可见部分如下,据此解答如下问题:
(1)求高三(1)班全体女生的人数;
(2)求分数在之间的女生人数;并计算频率分布直方图中间的矩形的高;
(3)求该班女生数学测试成绩的众数、中位数和平均数的估计值.(同一组中的数据用该组区间的终点值代表)
【变式5-1】(多选)某社区通过简单随机抽样,获得了100户居民的月均用水量数据,并绘制出如图所示的频率分布直方图,由该图可以估计( )
A.平均数>中位数 B.中位数>平均数
C.中位数>众数 D.众数>平均数
【变式5-2】唐三彩,中国古代陶瓷烧制工艺的珍品,它吸取了中国国画、雕塑等工艺美术的特点,在中国文化中占有重要的历史地位,在中国的陶瓷史上留下了浓墨重彩的一笔,唐三彩的生产至今已有1300多年的历史,对唐三彩的复制和仿制工艺,至今也有百余年的历史.某陶瓷厂在生产过程中,随机抽取件工艺品测得其质量指标数据,将数据分成以下六组、、、…、,得到如下频率分布直方图.
(1)求出直方图中的值;
(2)利用样本估计总体的思想,估计该厂所生产的工艺品的质量指标值的众数和中位数(中位数精确到);
(3)现规定质量指标值小于的为二等品,质量指标值不小于的为一等品.已知该厂某月生产了件工艺品,试利用样本估计总体的思想,估计其中一等品和二等品分别有多少件.
【变式5-3】根据阅兵领导小组办公室介绍,2019年国庆70周年阅兵有59个方(梯)队和联合军乐团,总规模约1.5万人,是近几次阅兵中规模最大的一次.其中,徒步方队15个.为了保证阅兵式时队列保持整齐,各个方队对受阅队员的身高也有着非常严格的限制,太高或太矮都不行.徒步方队队员,男性身高普遍在至之间;女性身高普遍在至之间,这是常规标准.要求最为严格的三军仪仗队,其队员的身高一般都在至之间.经过随机调查某个阅兵阵营中女子100人,得到她们身高的直方图,其中.
(1)求直方图中的值;
(2)估计这个阵营女子身高的平均值;(同一组中的数据用该组区间的中点值为代表)
(3)请根据频率分布直方图估计阅兵阵营中女子身高的中位数.
考点06 总体百分位数的计算
【方法点拨】(1)求一组数据的百分位数时,一定要先将该组数据按照从小到大的顺序排列;
(2)根据频率分布直方图计算样本数据的百分位数,首先要理解频率分布直方图中各组数据频率的计算方法,其次估计百分位数在哪一组,再应用方程的思想方法及比例法,设出百分位数,利用比例列方程求解.
【例11】(多选)若一组数据14,17,11,9,12,15,,8,10,7的第65百分位数为12,则的值可能为( )
A.8 B.10 C.13 D.14
【例12】(多选)根据中国报告大厅对2023年3月~10月全国太阳能发电量进行监测统计,太阳能发电量(单位:亿千瓦时)月度数据统计如下表:
月份
3
4
5
6
发电量/亿千瓦时
242.94
230.87
240.59
259.33
月份
7
8
9
10
发电量/亿千瓦时
258.9
269.19
246.06
244.31
关于2023年3月~10月全国太阳能发电量,下列四种说法正确的是( )
A.中位数是259.115 B.极差是38.32
C.第85百分位数是259.33 D.第25百分位数是240.59
【变式6-1】从某果树上随机摘下11个水果,其直径为(单位:,则这组数据的第六十百分位数为 .
【变式6-2】(多选)为了解“全民齐参与城市更美丽”的志愿服务情况,随机抽取了100名志愿者进行问卷调查,将这100名志愿者问卷调查的得分按,,,,分成5组,并绘制出频率分布直方图,如图所示,则下列结论正确的是( )
A.
B.估计这100名志愿者问卷调查得分的分位数为85
C.这100名志愿者问卷调查得分的平均数为75(同一组中的数据用该组区间的中点值为代表)
D.若采用分层随机抽样从得分在,内的志愿者中抽取8人,则抽取的这8名志愿者得分在内的人数为6
【变式6-3】某市政府计划对居民生活用水实施阶梯式水价制度,即确定一户居民月均用水量标准(单位:),用水量不超过的部分按平价收费,超出的部分按议价收费,该市随机调查了10000户居民,获得了他们的月均用水量数据,整理得到频率分布直方图(如图).如果要让该市的居民用户的月均用水量不超出标准,那么应为 (单位:).
考点07 方差
【方法点拨】若一个总体划分为两层,通过按样本量比例分配分层随机抽样,各层抽取的样本量、样本平均数和样本方差分别为记总的样本平均数为样本方差为,则
【例13】样本数据的平均数,方差,则样本数据,,,的平均数,方差分别为( )
A.9,4 B.9,2 C.4,1 D.2,1
【例14】从甲队60人、乙队40人中,按照分层抽样的方法从两队共抽取10人,进行一轮答题.相关统计情况如下:甲队答对题目的平均数为1,方差为1;乙队答对题目的平均数为1.5,方差为0.4,则这10人答对题目的方差为( )
A.0.8 B.0.675 C.0.74 D.0.82
【变式7-1】已知在软件的控制台中,输入“,)”,按回车键,得到的4个1~20范围内的不重复的整数随机数为,则这4个整数的标准差为( )
A. B. C.40 D.10
【变式7-2】有一组样本数据(其中是最小值,是最大值)的平均数为,方差为,中位数为,则( )
A.的平均数为
B.的方差为
C.的中位数为
D.的极差为
【变式7-3】已知某4个数据的平均值为6,方差为3,现加入数据8和10,则这6个数据的方差为( )
A.2 B. C. D.
考点08 由特征数解决实际问题
码号
34
35
36
37
38
39
40
41
数量/双
2
5
9
16
9
5
3
2
如果你是鞋店经理,最关心的是哪种码号的鞋销量最大,那么对你来说最重要的是 (填“平均数”“众数”或“中位数”).
【例16】某小区广场上有甲、乙两群市民正在进行晨练,两群市民的年龄如下(单位:岁):
甲群:13,13,14,15,15,15,15,16,17,17;
乙群:64,13,14,14,15,16,16,16,16,66,
(1)甲群市民年龄的平均数、中位数和众数各是多少岁?其中哪个统计量能较好地反映甲群市民的年龄特征?
(2)乙群市民年龄的平均数、众数和中位数各是多少岁?其中哪个统计量能较好地反映乙群市民的年龄特征?
【变式8-1】为吸引更多优秀人才来乐山干事创业,2023年10月27日,乐山市招才引智系列活动——教育人才专场在西南大学北碚校区招聘大厅举行,其中,甲、乙两名大学生参加了面试,10位评委打分如茎叶图所示:
(1)写出甲得分的中位数和乙得分的众数;
(2)现有两种方案评价选手的最终得分:
方案一:直接用10位评委评分的平均值;
方案二:将10位评委评分去掉一个最低分和一个最高分之后,取剩下8个评分的平均值.
请分别用以上两种方案计算两位同学的最终得分,并判断哪种评价方案更好?为什么?
【变式8-2】某面包店记录了最近一周A,B两种口味的面包的销售情况,如下表所示:
A口味
星期
一
二
三
四
五
六
日
销量/个
16
12
14
10
18
19
13
B口味
星期
一
二
三
四
五
六
日
销量/个
13
18
10
20
12
9
14
(1)试比较最近一周A,B这两种口味的面包日销量的中位数的大小.
(2)该面包店店主将在下一周每天都制作n个A口味的面包,假设下一周A口味的面包日销量和被记录的这一周的日销量保持一致,每个面包当天卖出可获利6元,当天未售出则将损失5元,从中选一个,你应该选择哪一个?说明你的理由.
【变式8-3】某快递公司招聘快递骑手,该公司提供了两种日工资方案:方案1:规定每日底薪元,快递骑手每完成一单业务提成元;方案2:规定每日底薪元,快递业务的前单没有提成,从第单开始,每完成一单业务提成元,该快递公司记录了每天骑手的人均业务量.现随机抽取天的数据,将样本数据分为、、、、、、七组,整理得到如图所示的频率分布直方图.
(1)求频率分布直方图中的值;
(2)若仅从人均日收入的角度考虑,请你利用所学的统计学知识为新聘骑手做出日工资方案的选择,并说明理由(同组中的每个数据用该组区间的中点值代替).
一、单选题
1.某中学有高一学生1400人,高二学生1100人,高三学生1000人,用比例分配的分层随机抽样方法从该校学生中抽取若干人参加荒山绿化活动,若抽取的高三学生人数比抽取的高二学生人数少5,则抽取的高一学生人数为( )
A.60 B.65 C.70 D.75
2.一组数据按从小到大的顺序排列为2,4,m,12,16,17,若该组数据的中位数是极差的,则该组数据的第40百分位数是( )
A.4 B.5 C.6 D.9
3.构建德智体美劳全面培养的教育体系是我国教育一直以来努力的方向,铜川市第一中学积极响应党的号召,开展各项有益于德智体美劳全面发展的活动.如图所示的是该校高三(1)、(2)班两个班级在某次活动中的德智体美劳的评价得分对照图(得分越高,说明该项教育越好),则下列结论正确的是( )
①高三(2)班五项评价得分的极差为1.
②除体育外,高三(1)班的各项评价得分均高于高三(2)班对应的得分.
③高三(1)班五项评价得分的平均数比高三(2)班五项评价得分的平均数要高.
④各项评价得分中,这两个班的体育得分相差最大.
A.②③ B.②④ C.①③ D.①④
4.每年的4月23日是“世界读书日”,某中学为了了解高一年级学生的读书情况,随机调查了60名学生的册数,统计数据如表所示,则这50名学生读书册数的众数、中位数是( )
册数
0
1
2
3
4
人数
3
13
16
17
1
A.3,3 B.3,2 C.2,3 D.2,2
5.已知样本数据的平均数为,样本数据的平均数为,若样本数据的平均数为,则( )
A.12 B.10 C.2 D.11
6.为深入贯彻落实习近平总书记对天津工作“三个着力”重要要求,天津持续深化改革,创建全国文明城区,城市文明程度显著提升,人民群众的梦想不断实现.在创建文明城区的过程中,中央文明办对某小区居民进行了创建文明城区相关知识网络问卷调查,从本次问卷中随机抽取了50名居民的问卷结果,统计其得分数据,将所得50份数据的得分结果分为6组:,并整理得到如下的频率分布直方图,则该小区居民得分的第70百分位数为( )
A.89.09 B.86.52 C.84.55 D.81.32
二、多选题
7.某地区公共部门为了调查本地区中学生的吸烟情况,对随机抽出的编号为的名学生进行了调查.调查中使用了两个问题,问题:你的编号是否为奇数?问题:你是否经常吸烟?被调查者从设计好的随机装置(内有除颜色外完全相同的白球个,红球个)中摸出一个小球(摸完放回):摸到白球则如实回答问题,摸到红球则如实回答问题,回答“是”的人在一张白纸上画一个“√”,回答“否”的人什么都不用做,由于问题的答案只有“是”和“否”,而且回答的是哪个问题也是别人不知道的,因此被调查者可以毫无顾忌地给出真实的答案.最后统计得出,这人中,共有人回答“是”,则下列表述正确的是( )
A.估计被调查者中约有人吸烟
B.估计约有人对问题的回答为“是”
C.估计该地区约有的中学生吸烟
D.估计该地区约有的中学生吸烟
8.某火锅店做营业额分析,规定连续5天的日营业额小于10万元即为进入淡季,需制订优惠活动,将连续5天的日营业额的数据记录作为一组样本(记录数据都是自然数),现有4组样本,4组样本中一定符合进入淡季指标的共有( )
A.平均数 B.平均数且极差小于或等于3
C.平均数且标准差 D.众数等于5且极差小于或等于4
9.舟山某校为了加强食堂用餐质量,该校随机调查了100名学生,根据这100名学生对食堂用餐质量给出的评分数据,分成五组,得到如图所示的频率分布直方图,则下列结论正确的是( )
A.
B.该样本数据的中位数和众数均为85
C.若样本数据的平均数低于85分,则认为食堂需要整改,根据此样本我们认为该校食堂需要整改
D.为了解评分较低的原因,该校从评分低于80分的学生中用分层抽样的方法随机抽取18人座谈,则应选取评分在的学生4人
三、填空题
10.某班共有学生40人,将一次数学考试成绩(单位:分)绘制成频率分布直方图,如图所示,成绩不低于85分的人数有 人.
11.某小组成员的年龄分布茎叶图如图所示,则该小组成员年龄的第25百分位数是 .
12.为促进学生德、智、体、美、劳全面发展,某校开发出文化艺术课程、科技课程、体育课程等多类课程.为了解该校各班参加科技课程的人数,从全校随机抽取5个班级,设这5个班级参加科技课程的人数分别为.已知这5个班级参加科技课程的人数的平均数为9,方差为4,则 .
四、解答题
13.某市统计局就当地居民的月收入调查了10000人,并根据所得数据画出如图所示的样本的频率分布直方图
(1)求居民月收入在内的频率;
(2)为了分析居民的收入与年龄、职业等方面的关系,按月收入再从这10000人中用分层抽样方法抽出100人进行分析,则月收入在内的应抽多少人?
14.某工厂人员及月工资构成如下:
人员
经理
管理人员
高级技工
工人
学徒
合计
月工资(元)
22 000
2 500
2 200
2 000
1 000
29 700
人数
1
6
5
10
1
23
合计
22 000
15 000
11 000
20 000
1 000
69 000
(1)指出这个表格中的众数、中位数、平均数;
(2)这个表格中,平均数能客观地反映该工厂的月工资水平吗?为什么?
15.从2022年秋季学期起,河南省启动实施高考综合改革,实行高考科目“”模式.“3”指语文、数学、外语三门统考学科,以原始分数计入高考成绩;“1”指考生从物理、历史两门学科中“首选”一门学科,以原始分数计入高考成绩;“2”指考生从政治、地理、化学、生物四门学科中“再选”两门学科,以等级分计入高考成绩.按照方案,再选学科的等级分赋分规则如下,将考生原始成绩从高到低划分为A,B,C,D,E五个等级,各等级人数所占比例及赋分区间如下表:
等级
人数比例
赋分区间
将各等级内考生的原始分依照等比例转换法分别转换到赋分区间内,得到等级分,转换公式为,其中,分别表示原始分区间的最低分和最高分,,分别表示等级赋分区间的最低分和最高分,表示考生的原始分,表示考生的等级分,规定原始分为时,等级分为,计算结果四舍五入取整.某次化学考试的原始分最低分为50,最高分为98,呈连续整数分布,其频率分布直方图如下:
(1)求实数的值;
(2)估计此次化学考试的平均成绩;
(3)按照等级分赋分规则,估计此次考试化学成绩等级的原始分区间.若某学生化学成绩的原始分为90,并估计其等级分.
16.某果园大约还有5万个蜜桔等待出售,原销售方案是所有蜜桔都以25元/千克的价格进行销售,为了更好地促进销售,需对蜜桔质量进行质量分析,以便做出合理的促销方案.现从果园内随机采摘200个蜜桔进行测重,其质量分别在,,,,,(单位:克)中,其频率分布直方图如图所示.
(1)求m的值;
(2)估计该果园这200个蜜桔的平均质量为多少克/个;(同一组的数据以该组区间的中点值为代表)
(3)以样本估计总体,若低于55克的蜜桔以140元/百个进行销售,不低于55克的蜜桔以160元/百个进行销售,试问该果园的收益是否会更高?
17.某大学艺术专业400名学生参加某次测评,使用按男女学生人数比例分配的分层抽样方法从中随机抽取了100名学生,记录他们的分数,将数据分成7组:,,,,并整理得到如下频率分布直方图:
(1)已知样本中分数在的学生有5人,试估计总体中分数小于40的人数;
(2)试估计测评成绩的第三四分位数;
(3)已知样本中男生与女生的比例是3:1,男生样本的均值为69,方差为180,女生样本的均值为73,方差为200,求总样本的方差.
2
学科网(北京)股份有限公司
$$
复习08 统计
一、随机抽样
1.统计的相关概念
名称
定义
总体
调查对象的全体称为整体
个体
组成整体的每一个调查对象称为个体
样本
从总体中抽取的那部分个体称为样本
样本容量
样本中包含的个体数称为样本容量
样本与样本量的区别:样本是从总体中抽取的个体组成的集合,是对象;样本量是样本中个体的数目,是一个数.
2.简单随机抽样
定义
设一个总体含有个个体,从中逐个不放回抽取个个体作为样本(),如果每次抽取时总体内的各个个体被抽到的机会都相等,就把这种抽样方法叫做简单随机抽样
方法
抽签法
把总体中的个个体编号,把号码写在号签上,将号签放在一个容器中,搅拌均匀后,每次从中抽取一个号签,连续抽取n次,就得到一个容量为n的样本
随机数法
利用随机数表、随机数骰子或计算机产生的随机数进行抽样
抽签法与随机数法
相同点
①都属于简单随机抽样,并且要求被抽取样本的总体的个体数有限;
②都是从总体中逐个不放回地进行抽取
不同点
①抽签法比随机数法操作简单;
②随机数法更适用于总体中个体数较多的时候,而抽签法适用于总体中个体数较少的情况
利用随机数法抽取个体时的注意事项:
①定起点:事先应确定以表中的哪个数(哪行哪列)作为起点.
②定方向:读数的方向(向左、向右、向上或向下都可以).
③读数规则:读数时结合编号的特点进行读取,编号为两位数则两位两位地读取,编号为三位数则三位三位地读取,如果出现重复则跳过,直到取满所需的样本个体数.
3.分层抽样
①定义:在抽样时,将总体分成互不交叉的层,然后按照一定的比例,从各层独立地抽取一定数量的个体,将各层取出的个体合在一起作为样本,这种抽样方法叫做分层抽样.
②应用范围:当总体是由差异明显的几个部分组成时,往往选用分层抽样.
注意:分层抽样是按比例抽样,每一层入样的个体数为该层的个体数乘以抽样比.
二、直方图及数据特征
1.频率分布直方图
1.画频率分布直方图的步骤
第1步:求极差(即一组数据中最大值与最小值的差);第2步:决定组距与组数;
第3步:将数据分组;第4步:列频率分布表;
第5步:画频率分布直方图(以横轴表示样本分组,纵轴表示频率与组距的比值).
2.频率分布直方图的性质:
落在各小组内的频率用各小长方形的面积表示,且各小长方形的面积的和等于1.
2、数字特征
(1)众数、中位数、平均数
数字特征
样本数据
频率分布直方图
众数
出现次数最多的数据
取最高的小长方形底边中点的横坐标
中位数
将数据按大小依次排列,处在最中间位置的一个数据(或最中间两个数据的平均数)
把频率分布直方图划分左右两个面积相等的分界线与x轴交点的横坐标
平均数
样本数据的算术平均数
每个小矩形的面积乘以小矩形底边中点的横坐标之和
(2)极差、方差和标准差
极差:即一组数据中最大值与最小值的差.
方差:.
标准差:.
注:方差和标准差反映了数据波动程度的大小.标准差、方差越大,数据的离散程度越大,越波动;标准差、方差越小,数据的离散程度越小,越稳定.
(3)性质
①若的平均数为,那么的平均数为.
②数据与数据的方差相等,即数据经过平移后方差不变.
③若的方差为s2,那么的方差为.
3.百分位数
(1)定义:一组数据的第p百分位数是这样一个值,它使得这组数据中至少有的数据小于或等于这个值,且至少有的数据大于或等于这个值.
(2)计算一组几个数据第p百分位数的步骤
第1步,按从小到大排列原始数据;第2步,计算.第3步,若i不是整数,而大于i的比邻整数为j,则第p百分位数为第j项数据;若i是整数,则第p百分位数为第i项与第(i+1)项数据的平均数.
(3)四分位数
即把所有数值由小到大排列并分成四等份,处于三个分割点位置的数值就是四分位数.
其中第25百分位数也称为第一四分位数或下四分位数等,第75百分位数也称为第三四分位数或上四分位数等.
考点01 抽签法与随机数表法
【方法点拨】利用随机数表进行抽样的具体步骤:①给总体中的每个个体编号;②在随机数表中随机抽取某行某列作为抽样的起点,并规定读取方法;③依次从随机数表中抽取样本号码,凡是抽到编号范围内的号码,就是样本的号码,并剔除相同的号码,直到抽满为止.
【例1】用抽签法进行抽样有以下及格步骤:
①把号码写在形状、大小相同的号签上(号签可以用小球、卡片、纸条制作)
②将总体中的个体编号;
③从这容器中逐个不放回地抽取号签,将取出号签所对应的个体作为样本;
④将这些号签放在一个容器内并搅拌均匀;
这些步骤的先后顺序应为
A.②①④③ B.②③④① C.①③④② D.①④②③
【答案】A
【详解】由抽签法的定义可知,抽签法的步骤为:
将总体中的个体编号;
把号码写在形状、大小相同的号签上(号签可以用小球、卡片、纸条制作)
将这些号签放在一个容器内并搅拌均匀;
从这容器中逐个不放回地抽取号签,将取出号签所对应的个体作为样本;
即过程为:②①④③.
本题选择A选项.
【例2】总体由编号为01,02,…,30的30个个体组成.利用所给的随机数表选取6个个体,选取的方法是从随机数表第1行的第3列开始,由左到右一次选取两个数字,则选出来的第5个个体的编号为( )
(第一行)1712 1340 3320 3826 1389 5103 7417 7637
(第二行)1304 0774 2119 3056 6218 3735 9683 5087
A.20 B.26 C.17 D.03
【答案】D
【详解】从随机数表第1行的第3列开始,由左到右一次选取两个数字,
选出的编号依次为:12,13,40,33,20,38,26,13,89,51,03,…,
剔除掉总体编号以外的编号,以及重复的编号,
则选出来的个体的编号依次为:12,13,20,26,03,…,
所以选出来的第5个个体的编号为03.
故选:.
【变式1-1】某市质监局要检查某公司某个时间段生产的500克袋装牛奶的质量是否达标,现从500袋牛奶中抽取10袋进行检验.
(1)利用随机数法抽取样本时,应如何操作?
(2)如果用随机数法生成部分随机数如下所示,据此写出应抽取的袋装牛奶的编号.
162,277,943,949,545,354,821,737,932,354,873,520,964,384,263,491,648,642,175,331,572,455,068,877,047,447,672,172,065,025,834,216,337,663,013,785,916,955,567,199,810,507,175,128,673,580,667.
【答案】(1)答案见解析
(2)162,277,354,384,263,491,175,331,455,068.
【详解】(1)第一步,将500袋牛奶编号为001,002,…,500.
第二步,用随机数工具产生1~500范围内的整数随机数.
第三步,把产生的随机数作为抽中的编号,使与编号对应的袋装牛奶进入样本.
第四步,重复上述过程,直到产生10个不同编号为止.
(2)应抽取的袋装牛奶的编号为162,277,354,384,263,491,175,331,455,068.
【变式1-2】现利用随机数表法从编号为00,01,02,…,18,19的20支水笔中随机选取6支,选取方法是从下列随机数表第1行的第9个数字开始由左到右依次选取两个数字,则选出来的第6支水笔的编号为 .
95226000 49840128 66175168 39682927 43772366 27096623
92580956 43890890 06482834 59741458 29778149 64608925
【答案】14
【详解】由题意可知,第一支为01,以后依次为17,09,08,06,14,所以第6支水笔的编号为14.
故答案为:14
【变式1-3】某单位拟从40名员工中选1人赠送电影票,可采用下面两种选法:
选法一:将这40名员工按1至40进行编号,并相应地制作号码为1至40的40个号签,把这40个号签放在一个暗箱中搅匀,最后随机地从中抽取1个号签,与这个号签编号一致的员工是幸运人选;
选法二:将39个白球与1个红球(除颜色外,其他完全相同)混合放在一个暗箱中搅匀,让40名员工逐一从中不放回地摸取1个球,则摸到红球的员工是幸运人选.试问:
(1)这两种选法是否都是抽签法,为什么?
(2)这两种选法中每名员工被选中的可能性是否相等?
【答案】(1)选法一是抽签法,选法二不是抽签法;理由见解析
(2)相等
【详解】(1)选法一满足抽签法的特征,是抽签法.选法二不是抽签法,因为抽签法要求所有的号签编号互不相同,而选法二中的39个白球无法相互区分;
(2)由于选法一中抽取每个签和选法二中摸到每个球都是等可能的,
因此选法一中抽取1个号签的概率和选法二中摸到红球的概率相等,均为
故这两种选法中每名员工被选中的可能性相等,均为.
考点02 分层抽样
【方法点拨】分层随机抽样中有关计算的方法:(1)抽样比=;
(2)总体中某两层的个体数之比=样本中这两层抽取的个体数之比.
【例3】某高中的三个年级共有学生2000人,其中高一600人,高二600人,高三800人,该校现在要了解学生对校本课程的看法,准备从全校学生中抽取80人进行访谈,若采取按比例分配的分层抽样,且按年级来分层,则高一年级应抽取的人数是( )
A.24 B.26 C.30 D.36
【答案】A
【详解】依题意高一年级应抽取的人数为人.
故选:A
【例4】某社区有男性居民900名,女性居民600名,该社区卫生服务站为了解该社区居民的身体健康状况,对该社区所有居民按性别采用等比例分层随机抽样的办法进行抽样调查,抽取了一个容量为100的样本,则样本中男性居民的人数为 .
【答案】
【详解】根据题意,结合分层抽样的概念及计算方法,可得样本中男性居民的人数为.
故答案为:.
【变式2-1】某学校为了解高一学生每天阅读时长,从高一男生和女生中采用分层抽样的方法抽取部分学生进行调查分析.已知该学校高一学生中男生和女生的比例是,在抽取的学生中男生比女生多24人,则被抽取的学生人数是 .
【答案】168
【详解】设抽取的学生中男生人数为a,女生人数为b,
则,且,解得a=96,b=72,
则被抽取的学生人数是96+72=168.
故答案为:168.
【变式2-2】某校高中年级举办科技节活动,开设A,B两个会场,其中每个同学只能去一个会场且25%的同学去A会场,剩下的同学去B会场.已知A,B会场学生年级及比例情况如下表所示:
高一
高二
高三
A会场
50%
40%
10%
B会场
40%
50%
10%
记该校高一、高二、高三年级学生所占总人数的比例分别为x,y,z,利用分层随机抽样的方法从参加活动的全体学生中抽取一个容量为n的样本.
(1)求的值;
(2)若抽到的B会场的高二学生有150人,求n的值以及抽到的A会场高一、高二、高三年级的学生人数.
【答案】(1)
(2),50,40,10.
【详解】(1)设该校高一、高二、高三年级的人数分别为a,b,c,
则去A会场的学生总数为,去B会场的学生总数为,
则对应人数如下表所示:
高一
高二
高三
A会场
B会场
则.
(2)依题意,,解得,则抽到的A会场的学生总数为100人,
所以高一年级人数为,高二年级人数为,高三年级人数为.
【变式2-3】某高级中学共有学生3 000名,各年级男、女生的人数如表:
高一年级
高二年级
高三年级
女生
487
x
y
男生
513
560
z
已知高二年级女生比高一年级女生多53人.
(1)高二年级有多少名女生?
(2)现对各年级用比例分配的分层随机抽样的方法从全校抽取300名学生,应从高三年级抽取多少名学生?
【答案】(1)540名
(2)90名
【详解】(1)由,解得,
所以高二年级有名女生.
(2)高三年级人数为,
所以,
故应从高三年级抽取90名学生.
考点03 统计图表的分析
【方法点拨】(1)条形图是用一个单位长度表示一定的数量或频率,根据数量的多少或频率的大小画成长短不同的矩形条,条形图能清楚地表示出每个项目的具体数目或频率;
(2)扇形图是用整个圆面积表示总数(100%),用圆内的扇形面积表示各个部分所占总数的百分数;
(3)折线统计图反映数据随时间的变化趋势.
【例5】国家统计局发布的2018年至2022年我国居民消费水平情况如图所示,则下列说法正确的是(居民消费水平)( )
A.2018年至2022年我国居民消费水平逐年提高
B.2018年至2022年我国城镇居民消费水平逐年提高
C.2018年至2022年我国居民消费水平数据的极差为6463元
D.2022年我国城镇人口数比农村人口数的1.5倍还要多
【答案】D
【详解】对于A,2019年的居民消费水平比2020年的居民消费水平高,故A错误;
对于B, 2018年至2022年我国城镇居民消费水平不是逐年提高,故B错误;
对于C,2018年至2022年我国居民消费水平数据的极差为6473元,故C错误;
对于D,设我国农村人口数为,城镇人口数为,
则,化简得,
所以2022年我国城镇人口数比农村人口数的1.5倍还要多,故D正确.
故选:D
【例6】(多选)2021年7月至2022年7月,我国居民消费价格保持平稳,居民消费价格涨跌幅如图所示,则以下一定正确的序号为( )
备注:,.
A.2021年7月至2022年7月全国居民消费价格环比增长率的极差为1%
B.2021年7月至2022年7月全国居民消费价格同比增长率的中位数与众数相同
C.从同比增长率看,2022年1月与2022年2月全国居民消费价格一定相同
D.从环比增长率看,2022年6月全国居民消费价格与2022年5月全国居民消费价格相同
【答案】ABD
【详解】对于A,2021年7月至2022年7月全国居民消费价格环比增长率的极差为,所以A正确,
对于B,易得2021年7月至2022年7月全国居民消费价格同比增长率的中位数与众数均为1.5%,所以B正确,
对于C,从同比增长率看,2022年1月与2022年2月全国居民消费价格同比增长率均为0.9%,
但2021年1月与2021年2月全国居民消费价格未知,即不一定相同,
所以2022年1月与2022年2月全国居民消费价格不一定相同,所以C错误;
对于D,从环比增长率看,2022年6月全国居民消费价格增长率为0,
所以2022年6月全国居民消费价格与2022年5月全国居民消费价格相同,所以D正确.
故选:ABD.
【变式3-1】如图为2014—2022年中国游戏用户规模(单位:百万人)及同比增长率、2010—2022年中国国产游戏获批版号数量(单位:个)的统计图,则下列结论正确的是( )
A.2014—2022年中国游戏用户规模逐年增长
B.2014—2022年中国游戏用户规模的同比增长率的中位数为
C.2010—2022年中国国产游戏获批版号数量的极差为223个
D.2010—2022年中国国产游戏获批版号数量的平均数超过1600个
【答案】D
【详解】A选项:2022年中国游戏用户规模比2021年少,A错误;
B选项:2014—2022年中国游戏用户规模的同比增长率从小到大依次为,,
,,,,,,,中位数为,B错误;
C选项:2010—2022年中国国产游戏获批版号数量的极差为(个),C错误;
D选项:
,D正确.
故选:D
【变式3-2】(多选)某校为了更好地支持学生个性发展,开设了学科拓展类、科技创新类、体艺特长类三种类型的校本课程,每位同学从中选择一门课程学习.现对该校5000名学生的选课情况进行了统计,如图1,并用分层随机抽样的方法从中抽取2%的学生对所选课程进行了满意率调查,如图2.则下列说法正确的是( )
A.满意度调查中抽取的样本容量为5000
B.该校学生中选择学科拓展类课程的人数为1250
C.该校学生中对体艺特长类课程满意的人数约为875
D.若抽取的学生中对科技创新类课程满意的人数为30,则
【答案】BC
【详解】满意率调查中抽取的样本容量为错误;
由扇形统计图知,
则人,B正确;
该校学生中对体艺特长类课程满意的人数约为人,C正确;
抽取的学生中对科技创新类课程满意的人数为30,
则,则,D错误.
故选:BC.
【变式3-3】(多选)2020年1月17日,国家统计局发布了2019年全国居民人均消费支出及其构成的情况,并绘制了如图的饼图.根据饼图判断,下列说法不正确的是( )
A.2019年居民在“生活用品及服务”上人均消费支出的占比为6%
B.2019年居民人均消费支出为23350元
C.2019年居民在“教育文化娱乐”上人均消费支出小于这8项人均消费支出的平均数
D.2019年居民在“教育文化娱乐”、“生活用品及服务”、“衣着”上的人均消费支出之和大于在“食品烟酒”上的人均消费支出
【答案】BD
【详解】选项A,,故A正确;
选项B,由题意,在“生活用品及服务”上人均消费支出的占比为6%,且支出为1281元,
则2019年居民人均消费支出为元,故B错误;
选项C,2019年居民在“教育文化娱乐”上人均消费支出占比,故C正确:
选项D,2019年居民在“教育文化娱乐”、“生活用品及服务”、“衣着”上的人均消费支出占比之和为,故D错误.
故选:BD.
考点04 频率分布直方图
【方法点拨】(1)由于频率分布直方图中的纵坐标为,因此涉及纵坐标中含参数的问题,应根据频率之和为1列式求解;
(2)根据频率分布直方图(表)求样本数据在某一区间内的频率就是样本数据在该区间内的各组频率的和,而求解相应的频数还要根据频率乘以样本容量;
(3)若所求区间包含频率分布直方图中非分组的端点,可以利用“比例法”求解.
【例7】为了了解某地区高三学生的身体发育情况,抽查了该地区100名年龄为17.5岁-18岁的男生体重(kg),得到频率分布直方图如下:
根据上图可得这100名学生中体重在的学生人数是( )
A.20 B.30 C.40 D.50
【答案】C
【详解】
.
故选:C
【例8】为了解全市高三学生的体能素质情况,在全市高三学生中随机抽取了1000名学生进行体能测试,并将这1000名学生的体能测试成绩整理成如下频率分布直方图.则直方图中实数的值为 .
【答案】
【详解】由直方图可知:组距为,
所以,
解得.
故答案为:.
【变式4-1】从某小区抽取100户居民用户进行月用电量调查,发现他们的用电量都在之间,进行适当分组后(每组为左闭右开的区间),画出频率分布直方图如图所示.则在被调查的用户中,用电量落在区间内的户数为 .
【答案】
【详解】由频率分布直方图的面积和公式可得,
所以用电量落在区间内的户数为,
故答案为:
【变式4-2】2019年1月1日,“学习强国”学习平台在全国上线,某单位组织全体党员登录学习统计学习积分得到的频率分布直方图如图所示.若学习积分在(单位:万分)的人数是32人,则该单位共有 名党员,若学习积分超过2万分的党员可获得“学习达人”称号,则该单位有 名党员能获得该称号.
【答案】 80 8
【详解】由频率分布直方图得:学习积分在(单位:万分)的频率为,
因为学习积分在(单位:万分)的人数是32人,所以该单位有(人);
因为学习积分超过2万分的党员可获得“学习达人”称号,且学习积分超过2万分的频率为,
所以该单位有名党员能获得该称号.
故答案为:80;8.
【变式4-3】如图是某班一次数学测试成绩的茎叶图(图中仅列出,的数据)和频率分布直方图,则 .
【答案】
【详解】由茎叶图可知:,的频数分别为5,2;
由频率分布直方图可得:每组的频率依次为,
设样本容量为,
则,解得,
故.
故答案为:.
考点05 频率分布直方图与平均数、众数、中位数
【方法点拨】用频率分布直方图估计总体数字特征的方法:
(1)众数:最高小长方形底边中点的横坐标;
(2)中位数:平分频率分布直方图面积且垂直于横轴的直线与横轴交点的横坐标;
(3)平均数:频率分布直方图中每个小长方形的面积乘小长方形底边中点的横坐标之和.
【例9】2021年某省高考体育百米测试中,成绩全部介于12秒与18秒之间,抽取其中100个样本,将测试结果按如下方式分成六组:第一组,第二组,…,第六组,得到如下频率分布直方图,则该100名考生的成绩的平均数和中位数(保留一位小数)分别是( )
A.15.2 15.4 B.15.1 15.4 C.15.1 15.3 D.15.2 15.3
【答案】C
【详解】100名考生成绩的平均数
,
因为前三组面积和为,
前四组面积和为,
所以中位数位于第四组内,设中位数为,
则有,
解得,
故选:C.
【例10】某校高三(1)班全体女生的一次数学测试成绩的茎叶图和频率分布直方图都受到不同程度的破坏,但可见部分如下,据此解答如下问题:
(1)求高三(1)班全体女生的人数;
(2)求分数在之间的女生人数;并计算频率分布直方图中间的矩形的高;
(3)求该班女生数学测试成绩的众数、中位数和平均数的估计值.(同一组中的数据用该组区间的终点值代表)
【答案】(1)25
(2)4,
(3)众数75,中位数是73,平均数为73.8
【详解】(1)
根据茎叶图,分数在之间的女生人数为2,
根据频率分布直方图可得它所占的比率为0.008×10=0.08,
故高三(1)班全体女生的人数为.
(2)
茎叶图中可见部分共有21人,
所以分数在之间的女生人数为
所以数在之间的频率为
故频率分布直方图中之间的矩形的高为.
(3)
由(2)及茎叶图知,众数所在区间为,所以估计该班的测试成绩的众数为75.
把这25个数从小到大排列,中位数为第13个数,结合茎叶图可得中位数是73.
估计高三(1)班全体女生的一次数学测试成绩的平均数为.
【变式5-1】(多选)某社区通过简单随机抽样,获得了100户居民的月均用水量数据,并绘制出如图所示的频率分布直方图,由该图可以估计( )
A.平均数>中位数 B.中位数>平均数
C.中位数>众数 D.众数>平均数
【答案】AC
【详解】由图可知,众数为,
估计中位数为,得,
估计平均数,
并且也可以从直方图的的特征判断,此直方图在右边“拖尾”,所以平均数大于中位数.
所以平均数>中位数,中位数>众数.
故选:AC
【变式5-2】唐三彩,中国古代陶瓷烧制工艺的珍品,它吸取了中国国画、雕塑等工艺美术的特点,在中国文化中占有重要的历史地位,在中国的陶瓷史上留下了浓墨重彩的一笔,唐三彩的生产至今已有1300多年的历史,对唐三彩的复制和仿制工艺,至今也有百余年的历史.某陶瓷厂在生产过程中,随机抽取件工艺品测得其质量指标数据,将数据分成以下六组、、、…、,得到如下频率分布直方图.
(1)求出直方图中的值;
(2)利用样本估计总体的思想,估计该厂所生产的工艺品的质量指标值的众数和中位数(中位数精确到);
(3)现规定质量指标值小于的为二等品,质量指标值不小于的为一等品.已知该厂某月生产了件工艺品,试利用样本估计总体的思想,估计其中一等品和二等品分别有多少件.
【答案】(1)
(2)众数为75,中位数为
(3)一等品有件,二等品有件
【详解】(1)在频率分布直方图中,所有直方图的面积之和为,
则,得;
(2)众数为75,因为,,
所以中位数在第组,设中位数为,则,
解得.
所以,可以估计该厂所生产的工艺品的质量指标值的众数为75,中位数为;
(3)由频率分布直方图可知件工艺品中二等品有件,
一等品有件,
该厂生产的件工艺品中一等品有件,
二等品有件,
所以一等品有件,二等品有件.
【变式5-3】根据阅兵领导小组办公室介绍,2019年国庆70周年阅兵有59个方(梯)队和联合军乐团,总规模约1.5万人,是近几次阅兵中规模最大的一次.其中,徒步方队15个.为了保证阅兵式时队列保持整齐,各个方队对受阅队员的身高也有着非常严格的限制,太高或太矮都不行.徒步方队队员,男性身高普遍在至之间;女性身高普遍在至之间,这是常规标准.要求最为严格的三军仪仗队,其队员的身高一般都在至之间.经过随机调查某个阅兵阵营中女子100人,得到她们身高的直方图,其中.
(1)求直方图中的值;
(2)估计这个阵营女子身高的平均值;(同一组中的数据用该组区间的中点值为代表)
(3)请根据频率分布直方图估计阅兵阵营中女子身高的中位数.
【答案】(1),;
(2)
(3)
【详解】(1)由频率分布直方图可知,
,且,
解得:,;
(2)这个阵营女子身高的平均值为
(3)前3组的频率和为,
所以中位数为.
考点06 总体百分位数的计算
【方法点拨】(1)求一组数据的百分位数时,一定要先将该组数据按照从小到大的顺序排列;
(2)根据频率分布直方图计算样本数据的百分位数,首先要理解频率分布直方图中各组数据频率的计算方法,其次估计百分位数在哪一组,再应用方程的思想方法及比例法,设出百分位数,利用比例列方程求解.
【例11】(多选)若一组数据14,17,11,9,12,15,,8,10,7的第65百分位数为12,则的值可能为( )
A.8 B.10 C.13 D.14
【答案】AB
【详解】将这组数据除去后,按从小到大的顺序排序:7,8,9,10,11,12,14,15,17.
因为,所以.
故选:AB.
【例12】(多选)根据中国报告大厅对2023年3月~10月全国太阳能发电量进行监测统计,太阳能发电量(单位:亿千瓦时)月度数据统计如下表:
月份
3
4
5
6
发电量/亿千瓦时
242.94
230.87
240.59
259.33
月份
7
8
9
10
发电量/亿千瓦时
258.9
269.19
246.06
244.31
关于2023年3月~10月全国太阳能发电量,下列四种说法正确的是( )
A.中位数是259.115 B.极差是38.32
C.第85百分位数是259.33 D.第25百分位数是240.59
【答案】BC
【详解】将数据从小到大排序可得,共8个数据,
所以中位数是,故A错误;
极差是,故B正确;
因为,所以第85百分位数是第7个数,即,故C正确;
因为,所以第25百分位数是,故D错误;
故选:BC
【变式6-1】从某果树上随机摘下11个水果,其直径为(单位:,则这组数据的第六十百分位数为 .
【答案】20
【详解】第六十百分位数的位置为,即取第7位数20,
故第六十百分位数为20.
故答案为:20.
【变式6-2】(多选)为了解“全民齐参与城市更美丽”的志愿服务情况,随机抽取了100名志愿者进行问卷调查,将这100名志愿者问卷调查的得分按,,,,分成5组,并绘制出频率分布直方图,如图所示,则下列结论正确的是( )
A.
B.估计这100名志愿者问卷调查得分的分位数为85
C.这100名志愿者问卷调查得分的平均数为75(同一组中的数据用该组区间的中点值为代表)
D.若采用分层随机抽样从得分在,内的志愿者中抽取8人,则抽取的这8名志愿者得分在内的人数为6
【答案】ABD
【详解】对于A:由,解得,A正确.
对于B:设这100名志愿者问卷调查得分的分位数为,
则,解得,B正确.
对于C:这100名志愿者问卷调查得分的平均数为,C错误.
对于D:根据频率分布直方图可得抽取的这8名志愿者得分在内的人数为,D正确.
故选:ABD.
【变式6-3】某市政府计划对居民生活用水实施阶梯式水价制度,即确定一户居民月均用水量标准(单位:),用水量不超过的部分按平价收费,超出的部分按议价收费,该市随机调查了10000户居民,获得了他们的月均用水量数据,整理得到频率分布直方图(如图).如果要让该市的居民用户的月均用水量不超出标准,那么应为 (单位:).
【答案】/
【详解】因为,
,
所以位于之间,
所以,解得,
所以应为.
故答案为:
考点07 方差
【方法点拨】若一个总体划分为两层,通过按样本量比例分配分层随机抽样,各层抽取的样本量、样本平均数和样本方差分别为记总的样本平均数为样本方差为,则
【例13】样本数据的平均数,方差,则样本数据,,,的平均数,方差分别为( )
A.9,4 B.9,2 C.4,1 D.2,1
【答案】A
【详解】由,得样本数据,,,的平均数为,
由,得样本数据,,,的方差为.
故选:A
【例14】从甲队60人、乙队40人中,按照分层抽样的方法从两队共抽取10人,进行一轮答题.相关统计情况如下:甲队答对题目的平均数为1,方差为1;乙队答对题目的平均数为1.5,方差为0.4,则这10人答对题目的方差为( )
A.0.8 B.0.675 C.0.74 D.0.82
【答案】D
【详解】根据题意,按照分层抽样的方法从甲队中抽取人,
从乙队中抽取人,
这人答对题目的平均数为,
所以这人答对题目的方差为.
故选:D.
【变式7-1】已知在软件的控制台中,输入“,)”,按回车键,得到的4个1~20范围内的不重复的整数随机数为,则这4个整数的标准差为( )
A. B. C.40 D.10
【答案】B
【详解】这4个整数的平均数为,
则这4个整数的标准差为.
故选:B.
【变式7-2】有一组样本数据(其中是最小值,是最大值)的平均数为,方差为,中位数为,则( )
A.的平均数为
B.的方差为
C.的中位数为
D.的极差为
【答案】C
【详解】对于A中,根据平均数的性质,可得的平均数为,所以A错误;
对于B中,根据方差的性质,可得的方差为,所以B错误;
对于C中,根据中位数的定义和计算方法,可得的中位数为,所以C正确;
对于D中,根据极差的计算方法,可得的极差为,所以D错误.
故选:C.
【变式7-3】已知某4个数据的平均值为6,方差为3,现加入数据8和10,则这6个数据的方差为( )
A.2 B. C. D.
【答案】B
【详解】设原来4个数据依次为a、b、c、d,则,
由方差为3,所以,
即,
所以,
则,
现加入数据8和10,则则其平均数为,
则这6个数据的方差为
故选:B
考点08 由特征数解决实际问题
码号
34
35
36
37
38
39
40
41
数量/双
2
5
9
16
9
5
3
2
如果你是鞋店经理,最关心的是哪种码号的鞋销量最大,那么对你来说最重要的是 (填“平均数”“众数”或“中位数”).
【答案】众数
【详解】鞋店经理最关心的是哪种码号的鞋销量最大,
由题表可知,码号为37的鞋销量最大,共销售了16双,37是这组数据的众数.
故答案为:众数
【例16】某小区广场上有甲、乙两群市民正在进行晨练,两群市民的年龄如下(单位:岁):
甲群:13,13,14,15,15,15,15,16,17,17;
乙群:64,13,14,14,15,16,16,16,16,66,
(1)甲群市民年龄的平均数、中位数和众数各是多少岁?其中哪个统计量能较好地反映甲群市民的年龄特征?
(2)乙群市民年龄的平均数、众数和中位数各是多少岁?其中哪个统计量能较好地反映乙群市民的年龄特征?
【答案】(1)答案见解析;
(2)答案见解析.
【详解】(1)甲群市民年龄的平均数为(岁),
中位数为15岁,众数为15岁,平均数、中位数和众数相等,
因此它们都能较好地反映甲群市民的年龄特征.
(2)乙群市民年龄的平均数为(岁),
中位数为16岁,众数为16岁,
由于乙群市民大多数是少年儿童,所以中位数和众数能较好地反映乙群市民的年龄特征,
而平均数的可靠性较差.
【变式8-1】为吸引更多优秀人才来乐山干事创业,2023年10月27日,乐山市招才引智系列活动——教育人才专场在西南大学北碚校区招聘大厅举行,其中,甲、乙两名大学生参加了面试,10位评委打分如茎叶图所示:
(1)写出甲得分的中位数和乙得分的众数;
(2)现有两种方案评价选手的最终得分:
方案一:直接用10位评委评分的平均值;
方案二:将10位评委评分去掉一个最低分和一个最高分之后,取剩下8个评分的平均值.
请分别用以上两种方案计算两位同学的最终得分,并判断哪种评价方案更好?为什么?
【答案】(1)甲得分的中位数为,乙得分的众数为78
(2)答案见解析
【详解】(1)甲得分的中位数为;乙得分的众数为78;
(2)若使用方案一:
,
,
因为,所以甲的得分较高.
若使用方案二:
,
,
因为,所以乙的得分较高.
方案二更好,因为有一个评委给甲选手评分为99,高出其他评委的评分很多,
方案二可以规避个别极端值对平均值的影响,评选结果更公平、更正.
【变式8-2】某面包店记录了最近一周A,B两种口味的面包的销售情况,如下表所示:
A口味
星期
一
二
三
四
五
六
日
销量/个
16
12
14
10
18
19
13
B口味
星期
一
二
三
四
五
六
日
销量/个
13
18
10
20
12
9
14
(1)试比较最近一周A,B这两种口味的面包日销量的中位数的大小.
(2)该面包店店主将在下一周每天都制作n个A口味的面包,假设下一周A口味的面包日销量和被记录的这一周的日销量保持一致,每个面包当天卖出可获利6元,当天未售出则将损失5元,从中选一个,你应该选择哪一个?说明你的理由.
【答案】(1)A口味的面包日销量的中位数大于B口味的面包日销量的中位数
(2),理由见解析
【详解】(1)最近一周A口味的面包日销量按照从小到大的顺序排列为10,12,13,14,16,18,19.
所以A口味的面包日销量的中位数为14.
最近一周B口味的面包日销量按照从小到大的顺序排列为9,10,12,13,14,18,20,
所以B口味的面包日销量的中位数为13.
故A口味的面包日销量的中位数大于B口味的面包日销量的中位数.
(2)当时,下一周A口味的面包可获利
元.
当时,下一周A口味的面包可获利
元.
当时,下一周A口味的面包可获利
元.
因为,所以应该选择.
【变式8-3】某快递公司招聘快递骑手,该公司提供了两种日工资方案:方案1:规定每日底薪元,快递骑手每完成一单业务提成元;方案2:规定每日底薪元,快递业务的前单没有提成,从第单开始,每完成一单业务提成元,该快递公司记录了每天骑手的人均业务量.现随机抽取天的数据,将样本数据分为、、、、、、七组,整理得到如图所示的频率分布直方图.
(1)求频率分布直方图中的值;
(2)若仅从人均日收入的角度考虑,请你利用所学的统计学知识为新聘骑手做出日工资方案的选择,并说明理由(同组中的每个数据用该组区间的中点值代替).
【答案】(1)
(2)骑手应选择方案2,理由见解析
【详解】(1)解:由频率分布直方图得,解得.
(2)解:快递公司人均每日完成快递数量的平均数是:
方案1日工资为:,
方案2日工资为:.
骑手应选择方案2.
一、单选题
1.某中学有高一学生1400人,高二学生1100人,高三学生1000人,用比例分配的分层随机抽样方法从该校学生中抽取若干人参加荒山绿化活动,若抽取的高三学生人数比抽取的高二学生人数少5,则抽取的高一学生人数为( )
A.60 B.65 C.70 D.75
【答案】C
【详解】设从该校学生中抽取了人,以分层随机抽样的方式按照的比例抽取,
则高二抽取的学生数为,高三抽取的学生数为,
依题意,,解得,
所以高一抽取的学生数为.
故选:C
2.一组数据按从小到大的顺序排列为2,4,m,12,16,17,若该组数据的中位数是极差的,则该组数据的第40百分位数是( )
A.4 B.5 C.6 D.9
【答案】C
【详解】根据题意,数据按从小到大的顺序排列为2,4,m,12,16,17,
则极差为,故该组数据的中位数是,
数据共6个,故中位数为,解得,
因为,所以该组数据的第40百分位数是第3个数6,
故选:C.
3.构建德智体美劳全面培养的教育体系是我国教育一直以来努力的方向,铜川市第一中学积极响应党的号召,开展各项有益于德智体美劳全面发展的活动.如图所示的是该校高三(1)、(2)班两个班级在某次活动中的德智体美劳的评价得分对照图(得分越高,说明该项教育越好),则下列结论正确的是( )
①高三(2)班五项评价得分的极差为1.
②除体育外,高三(1)班的各项评价得分均高于高三(2)班对应的得分.
③高三(1)班五项评价得分的平均数比高三(2)班五项评价得分的平均数要高.
④各项评价得分中,这两个班的体育得分相差最大.
A.②③ B.②④ C.①③ D.①④
【答案】C
【详解】对于①,高三(2)班德智体美劳各项得分依次为9.5,9,9.5,9,8.5,
所以极差为,正确;
对于②,两班的德育分相等,错误;
对于③,高三(1)班的平均数为,
高三(2)班的平均数为,故正确;
对于④,两班的体育分相差,
而两班的劳育得分相差,错误,
故选:C.
4.每年的4月23日是“世界读书日”,某中学为了了解高一年级学生的读书情况,随机调查了60名学生的册数,统计数据如表所示,则这50名学生读书册数的众数、中位数是( )
册数
0
1
2
3
4
人数
3
13
16
17
1
A.3,3 B.3,2 C.2,3 D.2,2
【答案】B
【详解】∵将这组样本数据按从小到大的顺序排列,其中处于中间的两个数都是2,
∴这组数据的中位数为2;
∵这组样本数据中,3出现了17次,出现的次数最多,
∴这组数据的众数是3;
故B符合题意,
故选:B.
5.已知样本数据的平均数为,样本数据的平均数为,若样本数据的平均数为,则( )
A.12 B.10 C.2 D.11
【答案】B
【详解】根据题意可得,解得.
故选:B.
6.为深入贯彻落实习近平总书记对天津工作“三个着力”重要要求,天津持续深化改革,创建全国文明城区,城市文明程度显著提升,人民群众的梦想不断实现.在创建文明城区的过程中,中央文明办对某小区居民进行了创建文明城区相关知识网络问卷调查,从本次问卷中随机抽取了50名居民的问卷结果,统计其得分数据,将所得50份数据的得分结果分为6组:,并整理得到如下的频率分布直方图,则该小区居民得分的第70百分位数为( )
A.89.09 B.86.52 C.84.55 D.81.32
【答案】C
【详解】由题意得,
解得,
因为前4组数据的频率之和为,
前5组数据的频率之和为,
则分位数在内,设分位数为x,
则,解得,
所以分位数约为.
故选:C.
二、多选题
7.某地区公共部门为了调查本地区中学生的吸烟情况,对随机抽出的编号为的名学生进行了调查.调查中使用了两个问题,问题:你的编号是否为奇数?问题:你是否经常吸烟?被调查者从设计好的随机装置(内有除颜色外完全相同的白球个,红球个)中摸出一个小球(摸完放回):摸到白球则如实回答问题,摸到红球则如实回答问题,回答“是”的人在一张白纸上画一个“√”,回答“否”的人什么都不用做,由于问题的答案只有“是”和“否”,而且回答的是哪个问题也是别人不知道的,因此被调查者可以毫无顾忌地给出真实的答案.最后统计得出,这人中,共有人回答“是”,则下列表述正确的是( )
A.估计被调查者中约有人吸烟
B.估计约有人对问题的回答为“是”
C.估计该地区约有的中学生吸烟
D.估计该地区约有的中学生吸烟
【答案】BC
【解析】根据题意知被调查者回答第一个问题的概率为,其编号为奇数的概率也是,计算可得出随机抽出的名学生中回答第一个问题且为“是”的学生人数,由此可求出回答第二个问题且为“是”的学生人数,由此可估计此地区中学生吸烟人数的百分比,进而可估计出被调查者中吸烟的人数,判断选项即可得出结论.
【详解】随机抽出的名学生中,回答第一个问题的概率是,其编号是奇数的概率也是.
所以回答问题且回答的“是”的学生人数为;
回答问题且回答的“是”的人数为.
由此可估计该地区中学生吸烟人数的百分比为,估计被调查者中吸烟的人数为.
故选:BC.
【点睛】本题考查利用样本的数字特征估计总体的数字特征,同时也考查了抽样方法的应用,考查计算能力,属于中等题.
8.某火锅店做营业额分析,规定连续5天的日营业额小于10万元即为进入淡季,需制订优惠活动,将连续5天的日营业额的数据记录作为一组样本(记录数据都是自然数),现有4组样本,4组样本中一定符合进入淡季指标的共有( )
A.平均数 B.平均数且极差小于或等于3
C.平均数且标准差 D.众数等于5且极差小于或等于4
【答案】BD
【详解】对于A,举反例:0,0,0,4,11,其平均数,但不符合题意,故A错误;
对于B,假设有数据大于或等于10,由极差小于或等于3,
得到此数据中最小值为,此时数据的平均数必然大于7,
与矛盾,故假设错误,此组数据全部小于10,符合题意,故B正确;
对于C,举反例:1,1,1,1,11,平均数,且标准差,
但不符合进入淡季指标,故C错误;
对于D,众数为5,极差小于等于4,故最大数不超过9,故D正确.
故答案为:BD
9.舟山某校为了加强食堂用餐质量,该校随机调查了100名学生,根据这100名学生对食堂用餐质量给出的评分数据,分成五组,得到如图所示的频率分布直方图,则下列结论正确的是( )
A.
B.该样本数据的中位数和众数均为85
C.若样本数据的平均数低于85分,则认为食堂需要整改,根据此样本我们认为该校食堂需要整改
D.为了解评分较低的原因,该校从评分低于80分的学生中用分层抽样的方法随机抽取18人座谈,则应选取评分在的学生4人
【答案】ACD
【详解】由直方图可知:,A正确;
设中位数为,则,即中位数为(分),B错误;
平均分,故C正确;
组有(人),同理组有15(人),组有20(人),
根据分层抽样的原理,从组抽取的人数为(人),D正确;
故选:ACD.
三、填空题
10.某班共有学生40人,将一次数学考试成绩(单位:分)绘制成频率分布直方图,如图所示,成绩不低于85分的人数有 人.
【答案】9
【详解】由频率分布直方图的频率和为1,可得:,解得:.
故成绩不低于85分的人的频率为,
所以成绩不低于85分的人数有.
故答案为:9.
11.某小组成员的年龄分布茎叶图如图所示,则该小组成员年龄的第25百分位数是 .
【答案】/
【详解】因为,所以该小组成员年龄的第25百分位数是,
故答案为:.
12.为促进学生德、智、体、美、劳全面发展,某校开发出文化艺术课程、科技课程、体育课程等多类课程.为了解该校各班参加科技课程的人数,从全校随机抽取5个班级,设这5个班级参加科技课程的人数分别为.已知这5个班级参加科技课程的人数的平均数为9,方差为4,则 .
【答案】0
【详解】依题意得,
化简得.
易知,得.
又因为,
所以这5个数的绝对值不超过4,所以,即,
当时,可得,无解;
当时,可得,由,
,得这四个平方数只能为,则,符合题意,此时;
当时,,无解.
综上,.
故答案为:0.
四、解答题
13.某市统计局就当地居民的月收入调查了10000人,并根据所得数据画出如图所示的样本的频率分布直方图
(1)求居民月收入在内的频率;
(2)为了分析居民的收入与年龄、职业等方面的关系,按月收入再从这10000人中用分层抽样方法抽出100人进行分析,则月收入在内的应抽多少人?
【答案】(1)0.15
(2)25
【详解】(1)由频率分布直方图可知,居民月收入在频率为;
(2)居民月收入在频率为,
10000人中月收入在的人数为人,
再从10000人用分层抽样方法抽出100人,
月收入在的人数为人.
14.某工厂人员及月工资构成如下:
人员
经理
管理人员
高级技工
工人
学徒
合计
月工资(元)
22 000
2 500
2 200
2 000
1 000
29 700
人数
1
6
5
10
1
23
合计
22 000
15 000
11 000
20 000
1 000
69 000
(1)指出这个表格中的众数、中位数、平均数;
(2)这个表格中,平均数能客观地反映该工厂的月工资水平吗?为什么?
【答案】(1)众数为2000元,中位数为2200元,平均数为3000元
(2)不能,理由见解析
【详解】(1)由表格可知,众数为2 000元.
把23个数据按从小到大(或从大到小)的顺序排列,排在中间的数应是第12个数,其值为2 200,故中位数为2 200元.
平均数为(22 000+15 000+11 000+20 000+1 000)÷23=69 000÷23=3 000(元).
(2)虽然月工资的平均数为3 000元,但由表格中所列出的数据可见,只有经理在平均数以上,其余的人都在平均数以下,故用平均数不能客观真实地反映该工厂的工资水平.
15.从2022年秋季学期起,河南省启动实施高考综合改革,实行高考科目“”模式.“3”指语文、数学、外语三门统考学科,以原始分数计入高考成绩;“1”指考生从物理、历史两门学科中“首选”一门学科,以原始分数计入高考成绩;“2”指考生从政治、地理、化学、生物四门学科中“再选”两门学科,以等级分计入高考成绩.按照方案,再选学科的等级分赋分规则如下,将考生原始成绩从高到低划分为A,B,C,D,E五个等级,各等级人数所占比例及赋分区间如下表:
等级
人数比例
赋分区间
将各等级内考生的原始分依照等比例转换法分别转换到赋分区间内,得到等级分,转换公式为,其中,分别表示原始分区间的最低分和最高分,,分别表示等级赋分区间的最低分和最高分,表示考生的原始分,表示考生的等级分,规定原始分为时,等级分为,计算结果四舍五入取整.某次化学考试的原始分最低分为50,最高分为98,呈连续整数分布,其频率分布直方图如下:
(1)求实数的值;
(2)估计此次化学考试的平均成绩;
(3)按照等级分赋分规则,估计此次考试化学成绩等级的原始分区间.若某学生化学成绩的原始分为90,并估计其等级分.
【答案】(1);
(2)73分;
(3),91分.
【详解】(1)由频率分布直方图得:,解得,
所以.
(2)化学考试成绩在区间的频率依次为,
于是,
所以此次化学考试的平均成绩约为73分.
(3)由频率分布直方图知,原始分成绩位于区间的占比为,位于区间的占比为,
估计等级A的原始分区间的最低分在区间内,为,
因此估计此次考试化学成绩A等级的原始分区间为,
由,解得,估计该学生的等级分为91分.
16.某果园大约还有5万个蜜桔等待出售,原销售方案是所有蜜桔都以25元/千克的价格进行销售,为了更好地促进销售,需对蜜桔质量进行质量分析,以便做出合理的促销方案.现从果园内随机采摘200个蜜桔进行测重,其质量分别在,,,,,(单位:克)中,其频率分布直方图如图所示.
(1)求m的值;
(2)估计该果园这200个蜜桔的平均质量为多少克/个;(同一组的数据以该组区间的中点值为代表)
(3)以样本估计总体,若低于55克的蜜桔以140元/百个进行销售,不低于55克的蜜桔以160元/百个进行销售,试问该果园的收益是否会更高?
【答案】(1)
(2)59克/个
(3)该果园收益会更高.
【详解】(1)根据题意得,
解得.
(2)该果园这200个蜜桔的平均质量约为克/个
(3)依题意可估计该果园这5万个蜜桔的总质量为万克千克
若按原销售方案进行销售,则可获得的收益约为元;
若低于55克的蜜桔以140元/百个进行销售,不低于55克的蜜桔以160元/百个进行销售,则可获得的收益约为元.
因为,所以按新方案进行销售,该果园收益会更高.
17.某大学艺术专业400名学生参加某次测评,使用按男女学生人数比例分配的分层抽样方法从中随机抽取了100名学生,记录他们的分数,将数据分成7组:,,,,并整理得到如下频率分布直方图:
(1)已知样本中分数在的学生有5人,试估计总体中分数小于40的人数;
(2)试估计测评成绩的第三四分位数;
(3)已知样本中男生与女生的比例是3:1,男生样本的均值为69,方差为180,女生样本的均值为73,方差为200,求总样本的方差.
【答案】(1)20人
(2)78.75
(3)188
【详解】(1)由频率分布直方图知,分数在的频率为,
在样本中分数在的人数为(人),
又在样本中分数在在的学生有5人,
所以样本中低于40分的人数有人,
故总体中分数小于40的人数为人;
(2)测试成绩从低到高排序,样本中分数在的频率为,
样本中分数在的频率为,则75%分位数在之间,
所以估计测评成绩的75%分位数为;
(3)由题意可知总样本的均值为:,
所以总样本的方差为.
2
学科网(北京)股份有限公司
$$