内容正文:
清单06 统计学初步
(10个考点梳理+题型解读+提升训练)
【清单01】简单随机抽样
一般地,设一个总体含有N(N为正整数)个个体,从中逐个抽取n()个个体作为样本,如果抽取是放回的,且每次抽取时总体内的各个个体被抽到的概率都相等,我们把这样的抽样方法叫做放回简单随机抽样;如果抽取是不放回的,且每次抽取时总体内未进入样本的各个个体被抽到的概率都相等,我们把这样的抽样方法叫做不放回简单随机抽样.除非特殊声明,本章所称的简单随机抽样指不放回简单随机抽样.
【清单02】简单随机抽样的方法
(1)抽签法:
把总体中的N个个体编号,把编号写在外观、质地等无差别的小纸片(也可以是卡片、小球等)上作为号签,将这些小纸片放在一个不透明的盒里,充分搅拌,最后从盒中不放回地逐个抽取号签,使与号签上的编号对应的个体进入样本,直到抽足样本所需的个数.
(2)随机数法:
用随机数工具产生编号范围内的整数随机数,把产生的随机数作为抽中的编号,使与编号对应的个体进入样本.重复上述过程,直到抽足样本所需的个数.
①用随机试验生成随机数;②用信息技术生成随机数;
③用计算器生成随机数;④用电子表格软件生成随机数;⑤用R统计软件生成随机数.
【清单03】总体均值
一般地,总体中有N个个体,它们的变量值分别为Y1,Y2,…,YN,则称为总体均值,又称总体平均数.
如果总体的N个变量值中,不同的值共有k()个,不妨记为Y1,Y2,…,Yk,其中Yi出现的频数(i=1,2,…,k),则总体均值还可以写成加权平均数的形式
【清单04】分层抽样
(1)根据已掌握的信息,将总体分成若干部分.
(2)根据总体中的个体数N和样本容量n计算出抽样比.
(3)根据抽样比k计算出各层中应抽取的个体数:(其中为第i层所包含的个体总数).
(4)按步骤3所确定的数在各层中随机抽取个体,并合在一起得到容量为n的样本.
【清单05】频率分布直方图绘制步骤
①求极差,即一组数据中的最大值与最小值的差.
②决定组距与组数.组距与组数的确定没有固定的标准,一般数据的个数越多,所分组数越多.当样本容量不超过100时,常分成5~12组.为方便起见,一般取等长组距,并且组距应力求“取整”.
③将数据分组.
④列频率分布表.计算各小组的频率,第i组的频率是.
⑤画频率分布直方图.其中横轴表示分组,纵轴表示,实际上就是频率分布直方图中各小长方形的高度,它反映了各组样本观测数据的疏密程度.
【清单06】第p百分位数
一般地,一组数据的第p百分位数是这样一个值,它使得这组数据中至少有的数据小于或等于这个值,且至少有的数据大于或等于这个值.
计算第百分位数的步骤
第1步:按从小到大排列原始数据.
第2步:计算.
第3步:若i不是整数,而大于i的比邻整数为j,则第p百分位数为第j项数据;若i是整数,则第p百分位数为第i项与第项数据的平均数.
【清单07】四分位数
常用的分位数有第25百分位数、第50百分位数、第75百分位数,这三个分位数把一组由小到大排列后的数据分成四等份,因此称为四分位数.其中第25百分位数也称为第一四分位数或下四分位数等,第75百分位数也称为第三四分位数或上四分位数等.
【清单08】频率分布直方图中的众数、中位数、平均数
①在频率分布直方图中,众数是最高矩形中点的横坐标;
②中位数左边和右边的直方图的面积应该相等;
③平均数的估计值等于频率分布直方图中每个小矩形的面积乘以小矩形底边中点的横坐标之和.
方差、标准差
一组数据,用表示这组数据的平均数,则这组数据的方差为,标准差为.
【清单09】由统计信息解决实际问题
用样本的标准差、方差估计总体的方法
(1)用样本估计总体时,样本的平均数、标准差只是总体的平均数、标准差的近似.实际应用中,当所得数据的平均数不相等时,需先分析平均水平,再计算标准差(方差)分析稳定情况.
(2)标准差、方差的取值范围是.
(3)因为标准差与原始数据的单位相同,且平方后可能夸大了偏差的程度,所以虽然方差与标准差在刻画样本数据的离散程度上是一样的,但在解决实际问题时,一般多采用标准差.
【考点题型一】抽签法的应用
技巧:抽签法的应用条件及注意点
(1)一个抽样试验能否用抽签法,关键看两点:一是制签是否方便;二是个体之间差异不明显.一般地,当样本容量和总体容量较小时,可用抽签法.
(2)应用抽签法时应注意以下几点:
①分段时,如果已有分段可不必重新分段;②签要求大小、形状完全相同;
③号签要均匀搅拌;④要逐一不放回的抽取.
【例1】从一个含有个个体的总体中抽取一容量为的样本,当选取抽签法、随机数法和分层随机抽样三种不同方法时,总体中每个个体被抽中的概率分别为,三者关系可能是( )
A. B. C. D.
【变式1-1】下列抽样试验中,适合用抽签法的是( )
A.从某厂生产的3000件产品中抽取600件进行质量检验
B.从某厂生产的两箱(每箱15件)产品中抽取6件进行质量检验
C.从甲、乙两厂生产的两箱(每箱15件)产品中抽取6件进行质量检验
D.从某厂生产的3000件产品中抽取10件进行质量检验
【变式1-2】使用简单随机抽样从1 000件产品中抽出50件进行某项检查,合适的抽样方法是( )
A.抽签法 B.随机数表法
C.分层抽样法 D.以上都不对
【变式1-3】某校为了了解高二学生的身高情况,打算在高二年级12个班中抽取3个班,再按每个班男女生比例抽取样本,正确的抽样方法是( )
A.简单随机抽样 B.先用分层抽样,再用随机数表法
C.分层抽样 D.先用抽签法,再用分层抽样
【变式1-4】现要完成下列2项抽样调查:
①从10盒酸奶中抽取3盒进行食品卫生检查;
②东方中学共有160名教职工,其中教师120名,行政人员16名,后勤人员24名.为了了解教职工对学校在校务公开方面的意见,拟抽取一个容量为20的样本.
较为合理的抽样方法是( )
A.①抽签法,②分层随机抽样 B.①随机数法,②分层随机抽样
C.①随机数法,②抽签法 D.①抽签法, ②随机数法
【考点题型二】随机数法的应用
技巧:用随机数工具产生编号范围内的整数随机数,把产生的随机数作为抽中的编号,使与编号对应的个体进入样本.重复上述过程,直到抽足样本所需的个数.
①用随机试验生成随机数;②用信息技术生成随机数;③用计算器生成随机数;
④用电子表格软件生成随机数;⑤用R统计软件生成随机数.
【例2】已知某运动员每次射击击中目标的概率为80%.现采用随机模拟的方法估计某运动员射击4次,至少击中3次的概率.先由计算器给出0到9之间取整数值的随机数,指定0,1表示没有击中目标,2,3,4,5,6,7,8,9表示击中目标,以4个随机数为一组,代表射击4次的结果,经随机模拟产生了20组随机数:
7527 0293 7140 9857 0347 4373 8636 6947 7610 4281
1417 4698 0371 6233 2616 8045 6011 3661 9597 7424
根据以上数据估计该射击运动员射击4次,至少击中3次的概率为( )
A.0.852 B.0.7 C.0.8 D.0.75
【变式2-1】近几年7月,武汉持续高温,市气象局将发布高温橙色预警信号(高温橙色预警标准为24小时内最高气温将升至37摄氏度以上),在今后的3天中,每一天最高气温37摄氏度以上的概率是.某人用计算机生成了10组随机数,结果如下:
726
127
821
763
314
245
521
986
402
862
若用0,1,2,3,4表示高温橙色预警,用5,6,7,8,9表示非高温橙色预警,依据该模拟实验,则今后的3天中恰有2天发布高温橙色预警信号的概率估计是( )
A. B. C. D.
【变式2-2】从某班57名同学中选出4人参加户外活动,利用随机数表法抽取样本时,先将57名同学按01、02、…、57进行编号,然后从随机数表第一行的第7列和第8列数字开始往右依次选取两个数字,则选出的第4个同学的编号为( )
0347
4373
8636
9647
3661
4698
6371
6297
7424
6292
4281
1457
2042
5332
3732
1676
(注:表中的数据为随机数表第一行和第二行)
A.24 B.36 C.42 D.52
【变式2-3】从100个篮球中任取一个,检查其质量,用随机数表法抽取样本,则应编号为( )
A.1,2,3,,100 B.001,002,003,,100
C.0,1,2,3,,100 D.0,1,2,,99
【变式2-4】某总体由编号为的个个体组成,利用下列随机数表选出个个体,选法是下列表中第一行第列开始从左到右依次选个数字,选出的第个个体编号为( )
1818
0792
4544
1716
5809
7983
8619
6216
7650
0310
5523
6405
0526
6238
A.16 B.09 C.19 D.61
【考点题型三】分层抽样的应用
技巧:(1)根据已掌握的信息,将总体分成若干部分.
(2)根据总体中的个体数N和样本容量n计算出抽样比.
(3)根据抽样比k计算出各层中应抽取的个体数:(其中为第i层所包含的个体总数).
(4)按步骤3所确定的数在各层中随机抽取个体,并合在一起得到容量为n的样本.
【例3】我市某所高中每天至少用一个小时学习数学的学生共有1200人,其中一、二、三年级的人数比为,要用分层随机抽样的方法从中抽取一个容量为120的样本,则应抽取的一年级学生的人数为( )
A.52 B.48 C.36 D.24
【变式3-1】某工厂生产三种不同型号的产品,它们的产量之比为,用分层抽样的方法抽取一个容量为的样本.若样本中型号的产品有120件,则样本容量为( )
A.150 B.180 C.200 D.250
【变式3-2】某学校对100名学生的身高进行统计,得到各身高段的人数并整理如下表:
身高(cm)
[150,155)
[155,160)
[160,165)
[165,170)
[170,175)
[175,180]
频数
10
20
30
25
10
5
根据表中数据,下列结论中正确的是( )
A.100名学生身高的中位数小于160cm
B.100名学生中身高低于165cm的学生所占比例超过
C.100名学生身高的极差介于20cm至30cm之间
D.100名学生身高的平均值介于160cm至165cm之间
【变式3-3】某校高一年级有900名学生,现用比例分配的分层随机抽样方法抽取一个容量为81的样本,其中抽取男生和女生的人数分别为45,36,则该校高一年级的女生人数为( )
A.350 B.400 C.500 D.550
【变式3-4】坐位体前屈是中小学体质健康测试项目,主要测试学生躯干、腰、髋等部位关节韧带和肌肉的伸展性、弹性及身体柔韧性.在对某高中1000名高二年级学生的坐位体前屈成绩的调查中,采用分层随机抽样的方法抽取100人,已知这1000名高二年级学生中男生有600人,且抽取的样本中男生成绩的平均数和方差分别为14.5cm和14.84,女生成绩的平均数和方差分别为15.5cm和17.64.则总体方差( )
A. B. C. D.
【考点题型四】频率分布直方图中的相关计算问题
技巧:①在频率分布直方图中,众数是最高矩形中点的横坐标;
②中位数左边和右边的直方图的面积应该相等;
③平均数的估计值等于频率分布直方图中每个小矩形的面积乘以小矩形底边中点的横坐标之和.
【例4】某校为了解高一年级学生的体育健康标准测试(简称“体测”)成绩的分布情况,从该年级学生的体测成绩(规定满分为100分)中,随机抽取了80名学生的成绩,并进行分组:,,,,,绘制成如下频率分布直方图,该校高一年级学生体测成绩的第80百分位数的估计值是( )
A.87 B.88 C.89 D.90
【变式4-1】某校为了解高一年级学生的体育健康标准测试(简称“体测”)成绩的分布情况,从该年级学生的体测成绩(规定满分为100分)中,随机抽取了80名学生的成绩,并进行分组:,,,,,绘制成如下频率分布直方图,频率分布直方图中a的值是( )
A.0.017 B.0.018 C.0.020 D.0.023
【变式4-2】习近平总书记在致首届全民阅读大会的贺信中指出:“阅读是人类获取知识、启智增慧、培养道德的重要途径,可以让人得到思想启发,树立崇高理想,涵养浩然之气;希望全社会都参与到阅读中来,形成爱读书、读好书、善读书的浓厚氛围.”为落实习总书记关于阅读的重要指示,复兴中学开展了“读名著、品经典”活动.现从全校学生中随机抽取了部分学生,并统计了他们的阅读时间(单位:),分组整理数据得到如图所示的频率分布直方图,据此估计该校学生阅读时间不少于的概率为( )
A.0.150 B.0.400 C.0.450 D.0.850
【变式4-3】如图是某市随机抽取的100户居民的月均用水量频率分布直方图,如果要让60%的居民用水不超出标准(单位:t),根据直方图估计,下列最接近的数为( )
A.8.5 B.9 C.9.5 D.10
【变式4-4】某校组织50名学生参加庆祝中华人民共和国成立75周年知识竞赛,经统计这50名学生的成绩都在区间内,按分数分成5组:,得到如图所示的频率分布直方图(不完整),根据图中数据,下列结论错误的是( )
A.成绩在上的人数最少
B.成绩不低于80分的学生所占比例为
C.50名学生成绩的极差为50
D.50名学生成绩的平均分小于中位数
【考点题型五】百分位数在具体数据中的应用
技巧:第1步:按从小到大排列原始数据.
第2步:计算.
第3步:若i不是整数,而大于i的比邻整数为j,则第p百分位数为第j项数据;若i是整数,则第p百分位数为第i项与第项数据的平均数.
【例5】给定数组,则错误的是( )
A.中位数为3 B.标准差为
C.众数为2和3 D.第85百分位数为4
【变式5-1】一组数据23,11,14,31,16,17,19,27的上四分位数是( )
A.14 B.15 C.23 D.25
【变式5-2】一组数据按从小到大的顺序排列为1,3,4,x,6,7,9,若该组数据的中位数与平均数相同,则该组数据的第60百分位数是( )
A.3 B.4 C.5 D.6
【变式5-3】学校组织知识竞赛,某班8名学生的成绩(单位:分)分别是65,60,75,78,86,84,90,94,则这8名学生成绩的75%分位数是( )
A.88分 B.84分 C.85分 D.90分
【变式5-4】某校高二年级15个班参加朗诵比赛的得分如下:
85 86 87 88 89 90 91 91 92 93 93 94 95 97 99
则这组数据的40%分位数为( )
A.90 B.91 C.90.5 D.92
【考点题型六】百分位数在统计表或统计图中的应用
技巧:频率直方图计算百分位数的规律
求总体百分位数的估计,首先要从小到大排列数据,频率直方图看作数据均匀分布在直方图上,然后计算出,当i不是整数要取整,频率直方图要计算出比例值.
【例6】研究小组为了解高三学生自主复习情况,随机调查了1000名学生的每周自主复习时间,按照时长(单位:小时)分成五组:,,,,,得到如图所示的频率分布直方图,则样本数据的第60百分位数的估计值是( )
A.7 B.7.5 C.7.8 D.8
【变式6-1】高二年级进行消防知识竞赛,统计所有参赛同学的成绩,成绩都在内,估计所有参赛同学成绩的第75百分位数为( )
A. B. C. D.
【变式6-2】下图是我国2018~2023年纯电动汽车销量统计情况,下列说法错误的是( )
A.我国纯电动汽车销量呈现逐年增长趋势
B.这六年销量第60百分位数为536.5万辆
C.这六年增长率最大的为2019年至2020年
D.2020年销量高于这六年销量的平均值
【变式6-3】一家水果店为了解本店苹果的日销售情况,记录了过去天的日销售量(单位:kg),将全部数据按区间,,…,分成5组,得到如图所示的频率分布直方图:
根据图中信息判断,下列说法中不恰当的一项是( )
A.图中的值为
B.这天中有天的日销售量不低于kg
C.这天销售量的中位数的估计值为kg
D.店长希望每天的苹果尽量新鲜,又能地满足顾客的需要(在天中,大约有天可以满足顾客的需求),则每天的苹果进货量应为kg
【变式6-4】某校为了解学生课外阅读情况,对该校学生的年阅读量(单位:本)进行抽样调查,将调查数据整理得到如图所示的频率分布直方图,则样本数据的第25百分位数所在的区间为( )
A. B. C. D.
【考点题型七】平均数、中位数、众数在具体数据中的应用
技巧:众数、中位数、平均数的意义
(1)样本的众数、中位数和平均数常用来表示样本数据的“中心值”,其中众数和中位数容易计算,不受少数几个极端值的影响,但只能表达样本数据中的少量信息,平均数代表了数据更多的信息,但受样本中每个数据的影响,越极端的数据对平均数的影响也越大.
(2)当一组数据中有不少数据重复出现时,其众数往往更能反映问题,当一组数据中个别数据较大时,可用中位数描述其集中趋势.
【例7】若4个数据的平均值为6,方差为5,现加入数据8和10,则这6个数据的方差为( )
A. B. C. D.6
【变式7-1】“幸福感指数”是指人们主观地评价自己目前生活状态满意程度的指标,常用区间内的一个数来表示,该数越接近10表示满意程度越高.现随机抽取5位某小区居民,他们的幸福感指数分别为8,5,8,9,10,以下说法错误的是( )
A.这组数据的极差是5 B.这组数据的平均数是8
C.这组数据的众数是8 D.估计这组数据的第80百分位数是8
【变式7-2】某运动员在一次训练中共射击次,射击成绩(单位:环)如下:,,,,,.则下列说法正确的是( )
A.成绩的极差为 B.成绩的第百分位数等于成绩的平均数
C.成绩的中位数为和 D.若增加一个成绩,则成绩的方差不变
【变式7-3】在一次歌唱比赛中,有5位评委给某选手打分(分数不全相同).与原始分数相比,去掉一个最高分和一个最低分之后,一定发生改变的是( )
A.平均数 B.众数 C.中位数 D.方差
【变式7-4】2024年度最具幸福感城市调查推选活动于9月16日正式启动,在100个地级及以上的候选城市名单中,成都市入选.“幸福感指数”是指某个人主观地评价他对自己目前生活状态满意程度的指标,常用区间内的一个数来表示,该数越接近10表示满意度越高,现随机抽取10位成都市居民,他们的幸福感指数分别为4,5,6,7,7,7,8,8,9,9,则下列说法错误的是( )
A.该组数据的第60百分位数为7.5 B.该组数据的极差为5
C.该组数据的平均数为7.5 D.该组数据的中位数为7
【考点题型八】在频率分布直方图中求平均数、中位数、众数
技巧:知频率分布直方图中求平均数、中位数、众数
(1)众数:频率分布直方图中,最高矩形的底边中点的横坐标.
(2)中位数:在频率分布直方图中,把频率分布直方图划分为左右两个面积相等的部分的分界线与x轴交点的横坐标称为中位数.
(3)平均数:平均数在频率分布直方图中等于每个小矩形底边中点的横坐标与小矩形的面积的乘积之和.
【例8】文明城市是反映城市整体文明水平的综合性荣誉称号,作为普通市民,既是文明城市的最大受益者,更是文明城市的主要创造者.某市为提高市民对文明城市创建的认识,举办了“创建文明城市”知识竞赛,从所有答卷中随机抽取100份作为样本,将样本的成绩(满分100分,成绩均为不低于40分的整数)分成六段:[40,50),[50,60),,[90,100]得到如图所示的频率分布直方图.
(1)求频率分布直方图中的值及样本成绩的第75百分位数;
(2)求样本成绩的众数,中位数和平均数;
(3)已知落在的平均成绩是54,方差是7,落在的平均成绩为66,方差是4,求两组成绩合并后的平均数和方差.
【变式8-1】某校高一年级设有羽毛球训练课,期末对学生进行羽毛球五项指标(正手发高远球、定点高远球、吊球、杀球以及半场计时往返跑)考核,满分100分.参加考核的学生有40人,考核得分的频率分布直方图如图所示.
(1)由频率分布直方图,求出图中的值,并估计考核得分的第60百分位数;
(2)为了提升同学们的羽毛球技能,校方准备招聘高水平的教练.现采用分层抽样的方法(样本量按比例分配),从得分在)内的学生中抽取5人,再从中挑出两人进行试课,求两人得分分别来自和的概率;
【变式8-2】某社团为统计居民运动时长,调查了某小区100名居民平均每天的运动时长(单位:h),并根据统计数据分为,,,,,六个小组(所调查的居民平均每天的运动时长均在内),得到的频率分布直方图如图所示.
(1)求出图中m的值,并估计这100名居民平均每天的运动时长的中位数;
(2)按分组用分层随机抽样的方法从平均每天运动时长在,这两个时间段内的居民中抽出6人分享运动心得,若再从这6人中选出2人发言,求这2人来自不同分组的概率.
【变式8-3】书籍是精神世界的入口,阅读让精神世界闪光,阅读逐渐成为许多人的一种生活习惯,每年4月23日为世界读书日.某研究机构为了解某地年轻人的阅读情况,通过随机抽样调查了100位年轻人,对这些人每天的阅读时间(单位:分钟)进行统计,得到样本的频率分布直方图,如图所示.
(1)根据频率分布直方图,估计这100位年轻人每天阅读时间的第85百分位数;
(2)根据频率分布直方图,估计阅读时间在的当地年轻人的平均阅读时间;(结果保留分数)
(3)为进一步了解年轻人的阅读方式,研究机构采用分层随机抽样的方法从每天阅读时间位于分组,和的年轻人中抽取5人,再从中任选2人进行调查,求其中至少有1人每天阅读时间位于的概率.
【变式8-4】某居民小区为了提高小区居民的读书兴趣,特举办读书活动,准备进一定量的书籍丰富小区图书站.由于不同年龄段需看不同类型的书籍,为了合理配备资源,现对小区内读书者进行年龄调查,随机抽取了一天中40名读书者进行调查,将他们的年龄分成6段:,,,,,,得到的频率分布直方图如图所示.
(1)估计这40名读书者中年龄分布在区间上的人数;
(2)估计这40名读书者年龄的众数和第80百分位数;
【考点题型九】标准差与方差的应用
技巧:实际应用中标准差、方差的意义
在实际问题中,仅靠平均数不能完全反映问题,还要研究方差,方差描述了数据相对平均数的离散程度,在平均数相同的情况下,方差越大,离散程度越大,数据波动性越大,稳定性越差;方差越小,数据越集中,稳定性越高.
【例9】某校有名同学参加国家安全知识竞赛,甲同学得知其他名同学的成绩(单位:分)分别为、、、,若这名同学的平均成绩为,则下列结论正确的是( )
A.甲同学的竞赛成绩为
B.这名同学竞赛成绩的方差为
C.这名同学竞赛成绩的第百分位数是
D.从这名同学中任取一人,其竞赛成绩高于平均成绩的概率为
【变式9-1】现有甲、乙两组数据,甲组数据为:;乙组数据为:,若甲组数据的平均数为,标准差为,极差为,第百分位数为,则下列说法一定正确的是( )
A.乙组数据的平均数为 B.乙组数据的极差为
C.乙组数据的第百分位数为 D.乙组数据的标准差为
【变式9-2】有一组样本数据,,…,,其平均数、中位数、方差、极差分别记为,,,,由这组数据得到新样本数据,,…,,其中,其平均数、中位数、方差、极差分别记为,,,,则( )
A. B.
C. D.
【变式9-3】已知甲组数据为:,乙组数据为:,则下列说法正确的是( )
A.这两组数据的第80百分位数相等
B.这两组数据的极差相等
C.这两组数据分别去掉一个最大值和一个最小值后,均值都不变
D.甲组数据比乙组数据分散
【变式9-4】下列说法正确的是( )
A.数据的第60百分位数为10.
B.用简单随机抽样的方法从51个个体中抽取2个个体,则每个个体被抽到的概率都是
C.投掷一枚均匀硬币和一个均匀骰子各一次,记“硬币正面向上”为事件A,“骰子向上的点数大于4”为事件,则事件都发生的概率是.
D.若样本的平均数和方差分别为2和3,则的平均数和方差分别为8和27.
【考点题型十】用样本平均数和样本标准差估计总体
技巧:用样本平均数和样本标准差估计总体注意事项
(1)标准差代表数据的离散程度,考虑数据范围时需要加减标准差.
(2)计算样本平均数、样本方差直接利用公式,注意公式的变形和整体代换.
【例10】庚子新春,“新冠”肆虐,面对新冠肺炎的发生,某医疗小组提出了一种治疗的新方案.为测试该方案的治疗效果,此医疗小组选取了患病程度相同的12名病人志愿者,将他们随机分成两组,每组6人.第一组用新方案治疗,第二组用旧方案治疗.统计病人的痊愈时间(单位:天)如下表:
新方案治疗
3
6
6
7
10
10
旧方案治疗
5
8
9
11
12
15
记新方案和旧方案治疗病人痊愈时间的平均数分别为和,方差分别为和.
(1)求,,,;
(2)判断新方案的治疗效果较旧方案是否有显著提高.
说明:如果,则认为新方案的治疗效果较旧方案是有显著提高,否则不认为有显著提高.
【变式10-1】某厂为比较甲,乙两种工艺对橡胶产品伸缩率的处理效应,进行10次配对试验,每次配对试验选用材质相同的两个橡胶产品,随机地选其中一个用甲工艺处理,另一个用乙工艺处理,测量处理后的橡胶产品的伸缩率.甲,乙两种工艺处理后的橡胶产品的伸缩率分别记为,试验结果如下:
试验序号
1
2
3
4
5
6
7
8
9
10
伸缩率
545
533
551
522
575
544
541
568
596
548
伸缩率
536
527
543
530
560
533
522
550
576
536
记,记的样本平均数为,样本方差为.
(1)求;
(2)判断甲工艺处理后的橡胶产品的伸缩率较乙工艺处理后的橡胶产品的伸缩率是否有显著提高,(如果,则认为甲工艺处理后的橡胶产品的伸缩率较乙工艺处理后的橡胶产品的伸缩率有显著提高,否则不认为有显著提高).
试验序号
1
2
3
4
5
6
7
8
9
10
9
6
8
-8
15
11
19
18
20
12
【变式10-2】某水果公司以10元/的成本价新进2000箱荔枝,每箱质量,在出售荔枝前,需要去掉损坏的荔枝,现随机抽取20箱,去掉损坏荔枝后称得每箱的质量(单位:)如下:4.7,4.8,4.6,4.5,4.8,4.9,4.8,4.7,4.8,4.7,4.8,4.9,4.7,4.8,4.5,4.7,4.7,4.9,4.7,5.0.
整理数据:
质量()
4.5
4.6
4.7
4.8
4.9
5.0
数量(箱)
2
1
7
a
3
1
分析数据:
平均数
众数
中位数
4.75
b
c
(1)____________,____________,____________;
(2)平均数、众数、中位数都能反映这组数据的集中趋势,请根据以上样本数据分析的结果,任意选择其中一个统计量,估算这2000箱荔枝共损坏了多少千克?
(3)根据(2)中的结果,求该公司销售这批荔枝每千克定为多少元才不亏本(结果保留一位小数)?
【变式10-3】某工厂生产某款产品,该产品市场评级规定:评分在10分及以上的为一等品,低于10分的为二等品.下面是检验员从一批产品中随机抽样的6件产品的评分:
10.1
9.8
10.0
9.7
10.0
9.8
经计算得,其中为抽取的第i件产品的评分,.
(1)求这组样本平均数和方差;
(2)从以上随机抽取的6件产品中任意抽取2件,求这两件均为一等品的概率;
(3)若厂家改进生产线,使得生产出的每件产品评分均提高0.2.再从改进后生产的产品中随机抽取6件产品,估计这6件产品的平均等级是否为一等品?说明理由.
【变式10-4】某高校两个班级在一门选修课程的某次考试中的成绩(总分:100分)如下:
甲班
84
75
78
95
67
49
86
77
66
88
73
78
53
45
74
91
84
99
53
84
67
57
68
55
90
73
72
67
57
乙班
74
58
92
100
74
37
83
97
66
84
61
75
94
70
73
84
81
48
82
66
83
100
90
66
93
44
分别计算两个班级成绩的平均数、中位数和众数,并说明在这次考试中哪个班的成绩更好.
原创精品资源学科网独家享有版权,侵权必究!37
原创精品资源学科网独家享有版权,侵权必究!37
学科网(北京)股份有限公司
$$
清单06 统计学初步
(10个考点梳理+题型解读+提升训练)
【清单01】简单随机抽样
一般地,设一个总体含有N(N为正整数)个个体,从中逐个抽取n()个个体作为样本,如果抽取是放回的,且每次抽取时总体内的各个个体被抽到的概率都相等,我们把这样的抽样方法叫做放回简单随机抽样;如果抽取是不放回的,且每次抽取时总体内未进入样本的各个个体被抽到的概率都相等,我们把这样的抽样方法叫做不放回简单随机抽样.除非特殊声明,本章所称的简单随机抽样指不放回简单随机抽样.
【清单02】简单随机抽样的方法
(1)抽签法:
把总体中的N个个体编号,把编号写在外观、质地等无差别的小纸片(也可以是卡片、小球等)上作为号签,将这些小纸片放在一个不透明的盒里,充分搅拌,最后从盒中不放回地逐个抽取号签,使与号签上的编号对应的个体进入样本,直到抽足样本所需的个数.
(2)随机数法:
用随机数工具产生编号范围内的整数随机数,把产生的随机数作为抽中的编号,使与编号对应的个体进入样本.重复上述过程,直到抽足样本所需的个数.
①用随机试验生成随机数;②用信息技术生成随机数;
③用计算器生成随机数;④用电子表格软件生成随机数;⑤用R统计软件生成随机数.
【清单03】总体均值
一般地,总体中有N个个体,它们的变量值分别为Y1,Y2,…,YN,则称为总体均值,又称总体平均数.
如果总体的N个变量值中,不同的值共有k()个,不妨记为Y1,Y2,…,Yk,其中Yi出现的频数(i=1,2,…,k),则总体均值还可以写成加权平均数的形式
【清单04】分层抽样
(1)根据已掌握的信息,将总体分成若干部分.
(2)根据总体中的个体数N和样本容量n计算出抽样比.
(3)根据抽样比k计算出各层中应抽取的个体数:(其中为第i层所包含的个体总数).
(4)按步骤3所确定的数在各层中随机抽取个体,并合在一起得到容量为n的样本.
【清单05】频率分布直方图绘制步骤
①求极差,即一组数据中的最大值与最小值的差.
②决定组距与组数.组距与组数的确定没有固定的标准,一般数据的个数越多,所分组数越多.当样本容量不超过100时,常分成5~12组.为方便起见,一般取等长组距,并且组距应力求“取整”.
③将数据分组.
④列频率分布表.计算各小组的频率,第i组的频率是.
⑤画频率分布直方图.其中横轴表示分组,纵轴表示,实际上就是频率分布直方图中各小长方形的高度,它反映了各组样本观测数据的疏密程度.
【清单06】第p百分位数
一般地,一组数据的第p百分位数是这样一个值,它使得这组数据中至少有的数据小于或等于这个值,且至少有的数据大于或等于这个值.
计算第百分位数的步骤
第1步:按从小到大排列原始数据.
第2步:计算.
第3步:若i不是整数,而大于i的比邻整数为j,则第p百分位数为第j项数据;若i是整数,则第p百分位数为第i项与第项数据的平均数.
【清单07】四分位数
常用的分位数有第25百分位数、第50百分位数、第75百分位数,这三个分位数把一组由小到大排列后的数据分成四等份,因此称为四分位数.其中第25百分位数也称为第一四分位数或下四分位数等,第75百分位数也称为第三四分位数或上四分位数等.
【清单08】频率分布直方图中的众数、中位数、平均数
①在频率分布直方图中,众数是最高矩形中点的横坐标;
②中位数左边和右边的直方图的面积应该相等;
③平均数的估计值等于频率分布直方图中每个小矩形的面积乘以小矩形底边中点的横坐标之和.
方差、标准差
一组数据,用表示这组数据的平均数,则这组数据的方差为,标准差为.
【清单09】由统计信息解决实际问题
用样本的标准差、方差估计总体的方法
(1)用样本估计总体时,样本的平均数、标准差只是总体的平均数、标准差的近似.实际应用中,当所得数据的平均数不相等时,需先分析平均水平,再计算标准差(方差)分析稳定情况.
(2)标准差、方差的取值范围是.
(3)因为标准差与原始数据的单位相同,且平方后可能夸大了偏差的程度,所以虽然方差与标准差在刻画样本数据的离散程度上是一样的,但在解决实际问题时,一般多采用标准差.
【考点题型一】抽签法的应用
技巧:抽签法的应用条件及注意点
(1)一个抽样试验能否用抽签法,关键看两点:一是制签是否方便;二是个体之间差异不明显.一般地,当样本容量和总体容量较小时,可用抽签法.
(2)应用抽签法时应注意以下几点:
①分段时,如果已有分段可不必重新分段;②签要求大小、形状完全相同;
③号签要均匀搅拌;④要逐一不放回的抽取.
【例1】从一个含有个个体的总体中抽取一容量为的样本,当选取抽签法、随机数法和分层随机抽样三种不同方法时,总体中每个个体被抽中的概率分别为,三者关系可能是( )
A. B. C. D.
【答案】B
【分析】根据抽样的概念,每个个体被抽中的概率是均等的,进而即可选择答案.
【详解】因为在抽签法抽样、随机数法抽样和分层随机抽样中,每个个体被抽中的概率均为,所以.
故选:B.
【变式1-1】下列抽样试验中,适合用抽签法的是( )
A.从某厂生产的3000件产品中抽取600件进行质量检验
B.从某厂生产的两箱(每箱15件)产品中抽取6件进行质量检验
C.从甲、乙两厂生产的两箱(每箱15件)产品中抽取6件进行质量检验
D.从某厂生产的3000件产品中抽取10件进行质量检验
【答案】B
【分析】根据抽签法的适用条件,结合选项依次判断即可.
【详解】选项A,总体中的个体数较大,样本容量也较大,不适合用抽签法,故A不符合题意;
选项B,总体中的个体数较小,样本容量也较小,
且同厂生产的两箱产品可视为搅拌均匀了,可用抽签法,故B符合题意;
选项C,甲、乙两厂生产的两箱产品质量可能差别较大,
不能满足搅拌均匀的条件,不能用抽签法,故C不符合题意;
选项D,总体中的个体数较大,不适合用抽签法,故D不符合题意.
故选:B
【变式1-2】使用简单随机抽样从1 000件产品中抽出50件进行某项检查,合适的抽样方法是( )
A.抽签法 B.随机数表法
C.分层抽样法 D.以上都不对
【答案】B
【分析】根据抽样方法的特征与适用条件,即可容易判断.
【详解】由于总体容量相对较大,且没有明显差异,样本容量较小,故采用随机数表法较为合适.
故选:B.
【变式1-3】某校为了了解高二学生的身高情况,打算在高二年级12个班中抽取3个班,再按每个班男女生比例抽取样本,正确的抽样方法是( )
A.简单随机抽样 B.先用分层抽样,再用随机数表法
C.分层抽样 D.先用抽签法,再用分层抽样
【答案】D
【分析】利用抽样方法求解.
【详解】解:在高二年级12个班中抽取3个班,这属于简单随机抽样中的抽签法,
按男女生比例抽取样本属于分层抽样,所以是先用抽签法,再用分层抽样.
故选:D.
【变式1-4】现要完成下列2项抽样调查:
①从10盒酸奶中抽取3盒进行食品卫生检查;
②东方中学共有160名教职工,其中教师120名,行政人员16名,后勤人员24名.为了了解教职工对学校在校务公开方面的意见,拟抽取一个容量为20的样本.
较为合理的抽样方法是( )
A.①抽签法,②分层随机抽样 B.①随机数法,②分层随机抽样
C.①随机数法,②抽签法 D.①抽签法, ②随机数法
【答案】A
【分析】根据已知条件,结合抽签法和分层随机抽样的定义,即可求解
【详解】①总体较少,宜用抽签法;②各层间差异明显,宜用分层随机抽样.
故选:A.
【考点题型二】随机数法的应用
技巧:用随机数工具产生编号范围内的整数随机数,把产生的随机数作为抽中的编号,使与编号对应的个体进入样本.重复上述过程,直到抽足样本所需的个数.
①用随机试验生成随机数;②用信息技术生成随机数;③用计算器生成随机数;
④用电子表格软件生成随机数;⑤用R统计软件生成随机数.
【例2】已知某运动员每次射击击中目标的概率为80%.现采用随机模拟的方法估计某运动员射击4次,至少击中3次的概率.先由计算器给出0到9之间取整数值的随机数,指定0,1表示没有击中目标,2,3,4,5,6,7,8,9表示击中目标,以4个随机数为一组,代表射击4次的结果,经随机模拟产生了20组随机数:
7527 0293 7140 9857 0347 4373 8636 6947 7610 4281
1417 4698 0371 6233 2616 8045 6011 3661 9597 7424
根据以上数据估计该射击运动员射击4次,至少击中3次的概率为( )
A.0.852 B.0.7 C.0.8 D.0.75
【答案】D
【分析】根据给定的随机数表,求出只击中1次或2次的频数,再求出古典概率.
【详解】由已知的数表知,射击运动员射击4次,只击中1次或2次的有7140,7610,1417,0371,6011,共5组,
因此该射击运动员射击4次,至少击中3次的有15组,
所以该射击运动员射击4次,至少击中3次的概率为.
故选:D
【变式2-1】近几年7月,武汉持续高温,市气象局将发布高温橙色预警信号(高温橙色预警标准为24小时内最高气温将升至37摄氏度以上),在今后的3天中,每一天最高气温37摄氏度以上的概率是.某人用计算机生成了10组随机数,结果如下:
726
127
821
763
314
245
521
986
402
862
若用0,1,2,3,4表示高温橙色预警,用5,6,7,8,9表示非高温橙色预警,依据该模拟实验,则今后的3天中恰有2天发布高温橙色预警信号的概率估计是( )
A. B. C. D.
【答案】D
【分析】根据0,1,2,3,4表示高温橙色预警,在10组随机数中列出3天中恰有2天发布高温橙色预警的随机数,根据古典概型的公式计算即可得解.
【详解】3天中恰有2天发布高温橙色预警包括的随机数有:127,821,245,521共4个,
所以今后的3天中恰有2天发布高温橙色预警信号的概率估计是.
故选:D.
【变式2-2】从某班57名同学中选出4人参加户外活动,利用随机数表法抽取样本时,先将57名同学按01、02、…、57进行编号,然后从随机数表第一行的第7列和第8列数字开始往右依次选取两个数字,则选出的第4个同学的编号为( )
0347
4373
8636
9647
3661
4698
6371
6297
7424
6292
4281
1457
2042
5332
3732
1676
(注:表中的数据为随机数表第一行和第二行)
A.24 B.36 C.42 D.52
【答案】A
【分析】利用随机数表法可得结果.
【详解】从随机数表第一行第列和第列数字开始往右依次选:、、、,
选出的第4个同学的编号为24.
故选:A.
【变式2-3】从100个篮球中任取一个,检查其质量,用随机数表法抽取样本,则应编号为( )
A.1,2,3,,100 B.001,002,003,,100
C.0,1,2,3,,100 D.0,1,2,,99
【答案】B
【分析】根据随机数表法的特征即可求解.
【详解】由于ACD的编号位数不相同,所以不能作为随机数表法的编号,
B编号位数相同,可以作为随机数表法的编号.
故选:B.
【变式2-4】某总体由编号为的个个体组成,利用下列随机数表选出个个体,选法是下列表中第一行第列开始从左到右依次选个数字,选出的第个个体编号为( )
1818
0792
4544
1716
5809
7983
8619
6216
7650
0310
5523
6405
0526
6238
A.16 B.09 C.19 D.61
【答案】C
【分析】根据随机数表,依次进行选择即可得出结果.
【详解】选取方法是从随机数表第1行的第列数字开始,
从左到右依次选取两个数字,
则选出来的个个体编号分别为∶
所以选出来的第个个体编号为.
故选:C.
【考点题型三】分层抽样的应用
技巧:(1)根据已掌握的信息,将总体分成若干部分.
(2)根据总体中的个体数N和样本容量n计算出抽样比.
(3)根据抽样比k计算出各层中应抽取的个体数:(其中为第i层所包含的个体总数).
(4)按步骤3所确定的数在各层中随机抽取个体,并合在一起得到容量为n的样本.
【例3】我市某所高中每天至少用一个小时学习数学的学生共有1200人,其中一、二、三年级的人数比为,要用分层随机抽样的方法从中抽取一个容量为120的样本,则应抽取的一年级学生的人数为( )
A.52 B.48 C.36 D.24
【答案】C
【分析】根据给定条件,利用分层抽样的抽样比列式计算即得.
【详解】依题意,应抽取的一年级学生的人数为.
故选:C
【变式3-1】某工厂生产三种不同型号的产品,它们的产量之比为,用分层抽样的方法抽取一个容量为的样本.若样本中型号的产品有120件,则样本容量为( )
A.150 B.180 C.200 D.250
【答案】C
【分析】根据分层抽样的性质分析求解即可.
【详解】由题意得,,解得.
故选:C.
【变式3-2】某学校对100名学生的身高进行统计,得到各身高段的人数并整理如下表:
身高(cm)
[150,155)
[155,160)
[160,165)
[165,170)
[170,175)
[175,180]
频数
10
20
30
25
10
5
根据表中数据,下列结论中正确的是( )
A.100名学生身高的中位数小于160cm
B.100名学生中身高低于165cm的学生所占比例超过
C.100名学生身高的极差介于20cm至30cm之间
D.100名学生身高的平均值介于160cm至165cm之间
【答案】D
【分析】根据中位数的定义判断A选项,求出100名学生中身高低于165cm的学生有的人数判断B选项,根据极差的定义判断C选项,根据平均值的定义判断D选项.
【详解】100名学生身高的中位数是第和第名学生身高的平均值,
第名和第名学生的身高均大于,所以100名学生身高的中位数大于160cm,故A错误;
100名学生中身高低于165cm的学生有名,
所以100名学生中身高低于165cm的学生所占比例为,故B错误;
100名学生身高的极差最大为,最小为,
但是“介于”不能准确表示临界值能否取到,故C错误;
100名学生身高的平均值为,故D正确.
故选:D.
【变式3-3】某校高一年级有900名学生,现用比例分配的分层随机抽样方法抽取一个容量为81的样本,其中抽取男生和女生的人数分别为45,36,则该校高一年级的女生人数为( )
A.350 B.400 C.500 D.550
【答案】B
【分析】根据分层抽样定义计算即可.
【详解】设该校高一年级的女生人数为,
则,解得.
故选:B.
【变式3-4】坐位体前屈是中小学体质健康测试项目,主要测试学生躯干、腰、髋等部位关节韧带和肌肉的伸展性、弹性及身体柔韧性.在对某高中1000名高二年级学生的坐位体前屈成绩的调查中,采用分层随机抽样的方法抽取100人,已知这1000名高二年级学生中男生有600人,且抽取的样本中男生成绩的平均数和方差分别为14.5cm和14.84,女生成绩的平均数和方差分别为15.5cm和17.64.则总体方差( )
A. B. C. D.
【答案】C
【分析】根据分层抽样的比例确定男女生人数分别为,结合两个样本平均数即可求得总样本的平均数,进而求得方差.
【详解】按照分层随机抽样,设在男生、女生中分别抽取m名和n名,
则,解得,
由题意,男生样本的平均数为,样本方差为,
女生样本的平均数为,样本方差为,
记抽取的总样本的平均数为,总样本的样本方差为,
可得,
所以
.
故选:C.
【考点题型四】频率分布直方图中的相关计算问题
技巧:①在频率分布直方图中,众数是最高矩形中点的横坐标;
②中位数左边和右边的直方图的面积应该相等;
③平均数的估计值等于频率分布直方图中每个小矩形的面积乘以小矩形底边中点的横坐标之和.
【例4】某校为了解高一年级学生的体育健康标准测试(简称“体测”)成绩的分布情况,从该年级学生的体测成绩(规定满分为100分)中,随机抽取了80名学生的成绩,并进行分组:,,,,,绘制成如下频率分布直方图,该校高一年级学生体测成绩的第80百分位数的估计值是( )
A.87 B.88 C.89 D.90
【答案】B
【分析】先根据频率之和为1得到方程,求出,求出第80百分位数落在第四组数据内,设第80百分位数为,得到方程,求出答案.
【详解】,解得,
前三组数据的频率之和为,
前四组数据的频率之和为,
故该校高一年级学生体测成绩的第80百分位数落在第四组数据内,
设第80百分位数为,
则,解得,
该校高一年级学生体测成绩的第80百分位数的估计值是88.
故选:B
【变式4-1】某校为了解高一年级学生的体育健康标准测试(简称“体测”)成绩的分布情况,从该年级学生的体测成绩(规定满分为100分)中,随机抽取了80名学生的成绩,并进行分组:,,,,,绘制成如下频率分布直方图,频率分布直方图中a的值是( )
A.0.017 B.0.018 C.0.020 D.0.023
【答案】C
【分析】由频率之和为1得到方程,求出答案.
【详解】由题意得,解得
故选:C
【变式4-2】习近平总书记在致首届全民阅读大会的贺信中指出:“阅读是人类获取知识、启智增慧、培养道德的重要途径,可以让人得到思想启发,树立崇高理想,涵养浩然之气;希望全社会都参与到阅读中来,形成爱读书、读好书、善读书的浓厚氛围.”为落实习总书记关于阅读的重要指示,复兴中学开展了“读名著、品经典”活动.现从全校学生中随机抽取了部分学生,并统计了他们的阅读时间(单位:),分组整理数据得到如图所示的频率分布直方图,据此估计该校学生阅读时间不少于的概率为( )
A.0.150 B.0.400 C.0.450 D.0.850
【答案】D
【分析】根据频率分布直方图中矩形面积的含义即可求得答案.
【详解】由频率分布直方图可估计该校学生阅读时间不少于的概率为:
,
故选:D
【变式4-3】如图是某市随机抽取的100户居民的月均用水量频率分布直方图,如果要让60%的居民用水不超出标准(单位:t),根据直方图估计,下列最接近的数为( )
A.8.5 B.9 C.9.5 D.10
【答案】A
【分析】首先判断位于之间,再根据百分位数计算规则计算可得结论.
【详解】因为,,
所以应在,
所以,解得.
故最接近的数为.
故选:A.
【变式4-4】某校组织50名学生参加庆祝中华人民共和国成立75周年知识竞赛,经统计这50名学生的成绩都在区间内,按分数分成5组:,得到如图所示的频率分布直方图(不完整),根据图中数据,下列结论错误的是( )
A.成绩在上的人数最少
B.成绩不低于80分的学生所占比例为
C.50名学生成绩的极差为50
D.50名学生成绩的平均分小于中位数
【答案】C
【分析】根据频率分布直方图求出的频率,再结合各组频率及统计的相关概念逐项判断.
【详解】设这一组的频率为,则由各组频率之和为1,
得,解得,
各组频率依次为:,
对于A,这一组频率最小,即成绩在上的人数最少,A正确;
对于B,成绩不低于80分的学生频率为,成绩不低于80分的学生所占比例为,B正确;
对于C,极差为数据中最大值与最小值的差,而50名学生的成绩都在区间内,
但成绩的最大值不一定是100,最小值也不一定是,则极差小于等于,但不一定等于50,C错误;
对于D,根据频率分布直方图,得50名学生成绩的平均数是
,而50名学生成绩的中位数为80,
因此50名学生成绩的平均分小于中位数,D正确.
故选:C
【考点题型五】百分位数在具体数据中的应用
技巧:第1步:按从小到大排列原始数据.
第2步:计算.
第3步:若i不是整数,而大于i的比邻整数为j,则第p百分位数为第j项数据;若i是整数,则第p百分位数为第i项与第项数据的平均数.
【例5】给定数组,则错误的是( )
A.中位数为3 B.标准差为
C.众数为2和3 D.第85百分位数为4
【答案】D
【分析】求得数组的中位数判断选项A;求得数组的标准差判断选项B;求得数组的众数判断选项C;求得数组的第85百分位数判断选项D.
【详解】将数组从小到大依次排列为
则中位数为,故选项A判断正确;
平均数为
标准差为
,
故选项B判断正确;
众数为2和3,故选项C判断正确;
由,可得第85百分位数为5. 故选项D判断错误.
故选:D
【变式5-1】一组数据23,11,14,31,16,17,19,27的上四分位数是( )
A.14 B.15 C.23 D.25
【答案】D
【分析】根据上四分位数的概念求值即可.
【详解】把数据按从小到大的顺序排列: 11,14, 16,17,19,23,27,31.
因为,上四分位数是.
故选:D
【变式5-2】一组数据按从小到大的顺序排列为1,3,4,x,6,7,9,若该组数据的中位数与平均数相同,则该组数据的第60百分位数是( )
A.3 B.4 C.5 D.6
【答案】D
【分析】根据中位数和平均数相同得到方程,求出,利用百分位数的定义求出答案.
【详解】由题意得,解得,
,故从小到大,选取第5个数据作为该组数据的第60百分位数,即6.
故选:D
【变式5-3】学校组织知识竞赛,某班8名学生的成绩(单位:分)分别是65,60,75,78,86,84,90,94,则这8名学生成绩的75%分位数是( )
A.88分 B.84分 C.85分 D.90分
【答案】A
【分析】先对这8名学生的成绩按从小到大排列,然后用百分位数的定义求解即可.
【详解】8名学生的成绩从小到大排列为:60,65,75,78,84,86,90,94,
因为,所以75%分位数为第6个数和第7个数的平均数,
即分.
故选:A.
【变式5-4】某校高二年级15个班参加朗诵比赛的得分如下:
85 86 87 88 89 90 91 91 92 93 93 94 95 97 99
则这组数据的40%分位数为( )
A.90 B.91 C.90.5 D.92
【答案】C
【分析】由百分位数的计算方法求出即可;
【详解】由题意,,故这组数据的40%分位数为从小到大第6,7位数据的平均数,即.
故选:C.
【考点题型六】百分位数在统计表或统计图中的应用
技巧:频率直方图计算百分位数的规律
求总体百分位数的估计,首先要从小到大排列数据,频率直方图看作数据均匀分布在直方图上,然后计算出,当i不是整数要取整,频率直方图要计算出比例值.
【例6】研究小组为了解高三学生自主复习情况,随机调查了1000名学生的每周自主复习时间,按照时长(单位:小时)分成五组:,,,,,得到如图所示的频率分布直方图,则样本数据的第60百分位数的估计值是( )
A.7 B.7.5 C.7.8 D.8
【答案】B
【分析】根据百分位数的计算公式即可求解.
【详解】由于
样本数据的第60百分位数值是:小时;
故选:B
【变式6-1】高二年级进行消防知识竞赛,统计所有参赛同学的成绩,成绩都在内,估计所有参赛同学成绩的第75百分位数为( )
A. B. C. D.
【答案】C
【分析】先由长方形的面积和为1求出,再由第75百分位数的定义求解;
【详解】因为,所以.
参赛成绩位于内的频率为,
第75百分位数在内,
设为,则,
解得5,即第75百分位数为85,
故选:C.
【变式6-2】下图是我国2018~2023年纯电动汽车销量统计情况,下列说法错误的是( )
A.我国纯电动汽车销量呈现逐年增长趋势
B.这六年销量第60百分位数为536.5万辆
C.这六年增长率最大的为2019年至2020年
D.2020年销量高于这六年销量的平均值
【答案】D
【分析】根据条形图,结合百分位数、平均数求法及各项描述判断正误即可.
【详解】A:由条形图知,我国纯电动汽车销量呈现逐年增长趋势,对;
B:由,故第60百分位数为2021年数据,为536.5万辆,对;
C:由图知:2019年到2020年增长率超过了100%,其它都不超过100%,对;
D:由,错;
故选:D
【变式6-3】一家水果店为了解本店苹果的日销售情况,记录了过去天的日销售量(单位:kg),将全部数据按区间,,…,分成5组,得到如图所示的频率分布直方图:
根据图中信息判断,下列说法中不恰当的一项是( )
A.图中的值为
B.这天中有天的日销售量不低于kg
C.这天销售量的中位数的估计值为kg
D.店长希望每天的苹果尽量新鲜,又能地满足顾客的需要(在天中,大约有天可以满足顾客的需求),则每天的苹果进货量应为kg
【答案】D
【分析】选项A,利用频率分布直方图的性质,即可求解;选项B,利用频率分布直方图,得到不低于kg的频率为,即可求解;选项C,设中位数为,根据条件,建立方程,即可求解;选项D,将问题转化成求第分位数,即可判断出正误.
【详解】对于选项A,由图知,解得,所以选项A正确,
对于选项B,由图知日销售量不低于kg的频率为,由,所以选项B正确,
对于选项C,设中位数为,由,解得,所选项C正确,
对于选项D,设第分位数为,则有,得到,所以选项D错误,
故选:D.
【变式6-4】某校为了解学生课外阅读情况,对该校学生的年阅读量(单位:本)进行抽样调查,将调查数据整理得到如图所示的频率分布直方图,则样本数据的第25百分位数所在的区间为( )
A. B. C. D.
【答案】B
【分析】根据百分位数的计算即可求解.
【详解】数据在的概率为,
数据在的概率为,
故样本数据的第25百分位数所在的区间为,
故选:B
【考点题型七】平均数、中位数、众数在具体数据中的应用
技巧:众数、中位数、平均数的意义
(1)样本的众数、中位数和平均数常用来表示样本数据的“中心值”,其中众数和中位数容易计算,不受少数几个极端值的影响,但只能表达样本数据中的少量信息,平均数代表了数据更多的信息,但受样本中每个数据的影响,越极端的数据对平均数的影响也越大.
(2)当一组数据中有不少数据重复出现时,其众数往往更能反映问题,当一组数据中个别数据较大时,可用中位数描述其集中趋势.
【例7】若4个数据的平均值为6,方差为5,现加入数据8和10,则这6个数据的方差为( )
A. B. C. D.6
【答案】C
【分析】根据题意,由平均数以及方差的计算公式,代入计算,即可得到结果
【详解】设原来4个数据依次为a、b、c、d,则,
由方差为5,所以,
即,
所以,
则,
现加入数据8和10,则其平均数为,
则这6个数据的方差为
.
故选:C.
【变式7-1】“幸福感指数”是指人们主观地评价自己目前生活状态满意程度的指标,常用区间内的一个数来表示,该数越接近10表示满意程度越高.现随机抽取5位某小区居民,他们的幸福感指数分别为8,5,8,9,10,以下说法错误的是( )
A.这组数据的极差是5 B.这组数据的平均数是8
C.这组数据的众数是8 D.估计这组数据的第80百分位数是8
【答案】D
【分析】根据极差,平均数,众数,百分位数的定义计算,即可判断.
【详解】根据题意,幸福感指数从小到大排序为:5,8,8,9,10,
对于A,极差为,故A正确;
对于B,平均数为,故B正确;
对于C,根据众数的定义可知这组数据的众数为8,故C正确;
对于D,因为,所以这组数据的第80百分位数是,故D不正确;
故选:D.
【变式7-2】某运动员在一次训练中共射击次,射击成绩(单位:环)如下:,,,,,.则下列说法正确的是( )
A.成绩的极差为 B.成绩的第百分位数等于成绩的平均数
C.成绩的中位数为和 D.若增加一个成绩,则成绩的方差不变
【答案】B
【分析】分别求出运动员的极差、平均值、中位数、方差以及第百分位,由此判断四个选项即可.
【详解】A.,极差为,故错误,不符合题意;
B.第百分位数,平均数,故正确,符合题意;
C.成绩的中位数为,故错误,不符合题意;
D.若增加一个成绩,则成绩的方差会变小,故错误,不符合题意;
故选:B.
【变式7-3】在一次歌唱比赛中,有5位评委给某选手打分(分数不全相同).与原始分数相比,去掉一个最高分和一个最低分之后,一定发生改变的是( )
A.平均数 B.众数 C.中位数 D.方差
【答案】D
【分析】根据题意,由数据的中位数、平均数、方差、众数的定义,分析可得答案.
【详解】对于A,若分数为时,则平均数为,
去掉,则平均数为,故A错误;
对于B,若分数为时,则众数为,
去掉,则众数为,故B错误;
对于C,若分数为时,则中位数为,
去掉,则中位数为,故C错误;
对于D,方差体现数据的偏离程度,因为数据不完全相同,
当去掉一个最高分、一个最低分,一定使得数据偏离程度变小,即方差变小,故D正确.
故选:D.
【变式7-4】2024年度最具幸福感城市调查推选活动于9月16日正式启动,在100个地级及以上的候选城市名单中,成都市入选.“幸福感指数”是指某个人主观地评价他对自己目前生活状态满意程度的指标,常用区间内的一个数来表示,该数越接近10表示满意度越高,现随机抽取10位成都市居民,他们的幸福感指数分别为4,5,6,7,7,7,8,8,9,9,则下列说法错误的是( )
A.该组数据的第60百分位数为7.5 B.该组数据的极差为5
C.该组数据的平均数为7.5 D.该组数据的中位数为7
【答案】C
【分析】根据百分位数的计算即可判断A,根据极差的定义即可求解B,根据平均数的计算即可求解C,根据中位数的计算即可求解D.
【详解】A选项:,因此该组数据的第60百分位数为,故A正确;
B选项:该组数据最大为9,最小为4,因此极差为,故B正确;
C选项:该组数据的平均数为,故C错误;
D选项:该组数据的中位数为第五个和第六个数据的平均值7,故D正确,
故选:C.
【考点题型八】在频率分布直方图中求平均数、中位数、众数
技巧:知频率分布直方图中求平均数、中位数、众数
(1)众数:频率分布直方图中,最高矩形的底边中点的横坐标.
(2)中位数:在频率分布直方图中,把频率分布直方图划分为左右两个面积相等的部分的分界线与x轴交点的横坐标称为中位数.
(3)平均数:平均数在频率分布直方图中等于每个小矩形底边中点的横坐标与小矩形的面积的乘积之和.
【例8】文明城市是反映城市整体文明水平的综合性荣誉称号,作为普通市民,既是文明城市的最大受益者,更是文明城市的主要创造者.某市为提高市民对文明城市创建的认识,举办了“创建文明城市”知识竞赛,从所有答卷中随机抽取100份作为样本,将样本的成绩(满分100分,成绩均为不低于40分的整数)分成六段:[40,50),[50,60),,[90,100]得到如图所示的频率分布直方图.
(1)求频率分布直方图中的值及样本成绩的第75百分位数;
(2)求样本成绩的众数,中位数和平均数;
(3)已知落在的平均成绩是54,方差是7,落在的平均成绩为66,方差是4,求两组成绩合并后的平均数和方差.
【答案】(1),第75百分位数为84;
(2)众数为75,中位数为75,平均数为74;
(3)平均数为62,方差为37.
【分析】(1)根据频率和为1求得,结合百分数定义求第75百分位数;
(2)根据直方图,及众数、中位数、平均数求法求值;
(3)根据已知求样本总均值,再由总方差公式求样本总方差.
【详解】(1)由每组小矩形的面积之和为1,得,解得,
成绩在内的频率为,在内的频率为,
显然第75百分位数,由,解得,
所以第75百分位数为84.
(2)由,得样本成绩的众数为75,
成绩落在[40,70)内的频率为,
成绩落在内的频率为,
故中位数在[70,80)内,由,得样本成绩的中位数为75,
由.
得样本成绩的平均数为74.
(3)由频率分布直方图知,成绩在的市民人数为,成绩在的市民人数为,
所以,
总方差为.
【变式8-1】某校高一年级设有羽毛球训练课,期末对学生进行羽毛球五项指标(正手发高远球、定点高远球、吊球、杀球以及半场计时往返跑)考核,满分100分.参加考核的学生有40人,考核得分的频率分布直方图如图所示.
(1)由频率分布直方图,求出图中的值,并估计考核得分的第60百分位数;
(2)为了提升同学们的羽毛球技能,校方准备招聘高水平的教练.现采用分层抽样的方法(样本量按比例分配),从得分在)内的学生中抽取5人,再从中挑出两人进行试课,求两人得分分别来自和的概率;
【答案】(1),(2)
【分析】(1)利用频率分布直方图中各组频率之和为1求出的值,根据百分位数的定义列出方程,求解即得;
(2)利用分层抽样方法确定从两组中应抽取的数目,设出样本点,列出试验所含的样本空间和事件包含的样本点,根据古典概型概率公式计算即可.
【详解】(1)由题意得:,解得,
因为,
,
设第60百分位数为,则,
解得,即第60百分位数为85.
(2)由题意知,抽出的5位同学中,得分在的有人,设为,
在的有人,设为.
则“从中挑出两人进行试课”这个试验的样本空间为:
,,
设事件“两人得分分别来自和”,
则,
因此
所以两人得分分别来自和的概率为.
【变式8-2】某社团为统计居民运动时长,调查了某小区100名居民平均每天的运动时长(单位:h),并根据统计数据分为,,,,,六个小组(所调查的居民平均每天的运动时长均在内),得到的频率分布直方图如图所示.
(1)求出图中m的值,并估计这100名居民平均每天的运动时长的中位数;
(2)按分组用分层随机抽样的方法从平均每天运动时长在,这两个时间段内的居民中抽出6人分享运动心得,若再从这6人中选出2人发言,求这2人来自不同分组的概率.
【答案】(1),2.4h(2).
【分析】(1)根据频率分布直方图的性质可得,再利用中位数的计算公式直接计算;(2)根据分层抽样等比例的性质直接计算人数,再根据古典概型公式计算即可.
【详解】(1)由,解得.
因为,所以中位数在内,设中位数为x,则,得,
即估计这100名居民平均每天的运动时长的中位数为2.4h.
(2)由题知,平均每天运动时长在,内的频率分别为0.5,0.1,
则应从平均每天运动时长在,内的居民中分别抽出5人,1人.
记时间段内的5人分别为a,b,c,d,e,记时间段内的1人为M,则从这6人中选出2人的基本事件有,,,,,,,,,,,,,,共15个,
2人来自不同分组的基本事件,,,,,共5个,
所以这2人来自不同分组的概率为.
【变式8-3】书籍是精神世界的入口,阅读让精神世界闪光,阅读逐渐成为许多人的一种生活习惯,每年4月23日为世界读书日.某研究机构为了解某地年轻人的阅读情况,通过随机抽样调查了100位年轻人,对这些人每天的阅读时间(单位:分钟)进行统计,得到样本的频率分布直方图,如图所示.
(1)根据频率分布直方图,估计这100位年轻人每天阅读时间的第85百分位数;
(2)根据频率分布直方图,估计阅读时间在的当地年轻人的平均阅读时间;(结果保留分数)
(3)为进一步了解年轻人的阅读方式,研究机构采用分层随机抽样的方法从每天阅读时间位于分组,和的年轻人中抽取5人,再从中任选2人进行调查,求其中至少有1人每天阅读时间位于的概率.
【答案】(1)85;(2)(3)
【分析】(1)根据频率分布直方图中所有小矩形面积之和为求出,再根据百分数计算规则计算可得;
(2)首先求出、的人数,即可估计平均数;
(3)首先求出,和各组抽取的人数,再利用列举法及古典概型的概率公式计算可得.
【详解】(1)由题意可知,,解得,
前3组的频率和为,
前4组的频率和为,
所以第85百分位数在第4组,设为,则,解得,
所以这100位年轻人每天阅读时间的第85百分位数为85;
(2)因为的人数有:人,
的人数有:人,
所以阅读时间在的当地年轻人的平均阅读时间为;
(3)由于,和的频率之比为,
故抽取的5人中,和分别为1人,2人,2人,
记的1人为,的2人为,的2人为,
故随机抽取2人的所有样本点为,
,共包含10个样本点,
其中至少有1人每天阅读时间位于的样本点为,
,共包含7个样本点,
故至少有1人每天阅读时间位于概率.
【变式8-4】某居民小区为了提高小区居民的读书兴趣,特举办读书活动,准备进一定量的书籍丰富小区图书站.由于不同年龄段需看不同类型的书籍,为了合理配备资源,现对小区内读书者进行年龄调查,随机抽取了一天中40名读书者进行调查,将他们的年龄分成6段:,,,,,,得到的频率分布直方图如图所示.
(1)估计这40名读书者中年龄分布在区间上的人数;
(2)估计这40名读书者年龄的众数和第80百分位数;
【答案】(1)30(2)众数为55;第80百分位数为66
【分析】(1)先根据频率分布直方图求出频率,再根据频数的计算方法可得答案;
(2)最高矩形中点横坐标即为众数;根据百分位数的定义可求得样本的第80百分位数;
【详解】(1)由频率分布直方图知,年龄在区间上的频率为:
所以40名读书者中年龄分布在区间上的人数为:;
(2)由频率分布直方图可知,40名读书者年龄的众数约为55;
年龄在区间上的频率为:
年龄在区间上的频率为:,
故第80百分位数位于之间,设为,
所以,解得,
所以这40名读书者年龄的第80百分位数约为66.
【考点题型九】标准差与方差的应用
技巧:实际应用中标准差、方差的意义
在实际问题中,仅靠平均数不能完全反映问题,还要研究方差,方差描述了数据相对平均数的离散程度,在平均数相同的情况下,方差越大,离散程度越大,数据波动性越大,稳定性越差;方差越小,数据越集中,稳定性越高.
【例9】某校有名同学参加国家安全知识竞赛,甲同学得知其他名同学的成绩(单位:分)分别为、、、,若这名同学的平均成绩为,则下列结论正确的是( )
A.甲同学的竞赛成绩为
B.这名同学竞赛成绩的方差为
C.这名同学竞赛成绩的第百分位数是
D.从这名同学中任取一人,其竞赛成绩高于平均成绩的概率为
【答案】ABD
【分析】利用平均数公式可求出甲同学的竞赛成绩,可判断A选项;利用方差公式可判断B选项;
利用百分位数的定义可判断C选项;利用古典概型的概率公式可判断D选项.
【详解】设甲同学的成绩为分,由平均数公式可得,解得,
对于A选项,甲同学的竞赛成绩为,A对;
对于B选项,这名同学竞赛成绩的方差为
,B对;
对于C选项,这名同学竞赛成绩由低到高依次为:、、、、,
因为,则这名同学竞赛成绩的第百分位数是,C错;
对于D选项,在这名同学种,竞赛成绩高于分的人数为,
所以,从这名同学中任取一人,其竞赛成绩高于平均成绩的概率为,D对.
故选:ABD.
【变式9-1】现有甲、乙两组数据,甲组数据为:;乙组数据为:,若甲组数据的平均数为,标准差为,极差为,第百分位数为,则下列说法一定正确的是( )
A.乙组数据的平均数为 B.乙组数据的极差为
C.乙组数据的第百分位数为 D.乙组数据的标准差为
【答案】ABC
【分析】根据平均数、极差、标准差的性质及百分位数的定义判断即可.
【详解】不妨设甲组数据从小到大排列为:,
则乙组数据从小到大排列为:,
因为甲组数据的平均数为,标准差为,极差为,第百分位数为,
则,又,所以,
所以乙组数据的平均数为,故A正确;
乙组数据的极差为,故B正确;
乙组数据的第百分位数为,故C正确;
乙组数据的标准差为,故D错误.
故选:ABC
【变式9-2】有一组样本数据,,…,,其平均数、中位数、方差、极差分别记为,,,,由这组数据得到新样本数据,,…,,其中,其平均数、中位数、方差、极差分别记为,,,,则( )
A. B.
C. D.
【答案】ABD
【分析】A选项,利用平均数的定义计算出答案;B选项,由中位数定义可得新样本数据的顺序与原样本数据相同,B正确;C选项,由方差性质得到;D选项,由极差的性质得到D正确.
【详解】A.,A正确;
B.新样本数据的顺序与原样本数据相同,即中位数满足,B正确;
C.根据方差性质,有成立,C错误;
D.若是,,…,中最大(或最小)值,
则对应也是,,…,中最大(或最小)值,
所以极差满足,D正确.
故选:ABD.
【变式9-3】已知甲组数据为:,乙组数据为:,则下列说法正确的是( )
A.这两组数据的第80百分位数相等
B.这两组数据的极差相等
C.这两组数据分别去掉一个最大值和一个最小值后,均值都不变
D.甲组数据比乙组数据分散
【答案】AC
【分析】根据给定条件,利用第80百分位数、极差、平均数、方差的意义依次判断即得.
【详解】对于A,由,得甲组数据的第80百分位数为,由,乙组数据的第80百分位数为,故A 正确;
对于B,根据极差定义,极差等于最大子减去最小值,可知甲组数据的极差为,乙组数据的极差为,故B错误;
对于C,根据均值定义可知甲组原数据均值为,去掉最值后均值为,乙组原数据均值为,去掉最值后均值为,故C正确;
对于D,由C知甲乙两组平均值都为,根据方差公式甲组
乙组数据方差为
,则,所以乙组数据分散,故D错误.
故选:AC
【变式9-4】下列说法正确的是( )
A.数据的第60百分位数为10.
B.用简单随机抽样的方法从51个个体中抽取2个个体,则每个个体被抽到的概率都是
C.投掷一枚均匀硬币和一个均匀骰子各一次,记“硬币正面向上”为事件A,“骰子向上的点数大于4”为事件,则事件都发生的概率是.
D.若样本的平均数和方差分别为2和3,则的平均数和方差分别为8和27.
【答案】ABD
【分析】求出第60百分位数判断A;利用简单随机抽样的意义判断B;利用独立事件的概率计算判断C;利用平均数的方差的性质计算判断D.
【详解】对于A,由,得第60百分位数为左起第5个数10,A正确;
对于B,从51个个体中抽取2个个体,则每个个体被抽到的概率都是,B正确;
对于C,,事件相互独立,则,C错误;
对于D,依题意,的平均数为,方差为,D正确.故选:ABD
【考点题型十】用样本平均数和样本标准差估计总体
技巧:用样本平均数和样本标准差估计总体注意事项
(1)标准差代表数据的离散程度,考虑数据范围时需要加减标准差.
(2)计算样本平均数、样本方差直接利用公式,注意公式的变形和整体代换.
【例10】庚子新春,“新冠”肆虐,面对新冠肺炎的发生,某医疗小组提出了一种治疗的新方案.为测试该方案的治疗效果,此医疗小组选取了患病程度相同的12名病人志愿者,将他们随机分成两组,每组6人.第一组用新方案治疗,第二组用旧方案治疗.统计病人的痊愈时间(单位:天)如下表:
新方案治疗
3
6
6
7
10
10
旧方案治疗
5
8
9
11
12
15
记新方案和旧方案治疗病人痊愈时间的平均数分别为和,方差分别为和.
(1)求,,,;
(2)判断新方案的治疗效果较旧方案是否有显著提高.
说明:如果,则认为新方案的治疗效果较旧方案是有显著提高,否则不认为有显著提高.
【答案】(1),,,
(2)新方案的治疗效果较旧方案有显著提高
【分析】(1)根据平均数和方差的计算公式求解即可;
(2)根据题设判断即可.
【详解】(1)由已知可得,
,
同理可得,,
.
(2),,
新方案的治疗效果较旧方案有显著提高.
【变式10-1】某厂为比较甲,乙两种工艺对橡胶产品伸缩率的处理效应,进行10次配对试验,每次配对试验选用材质相同的两个橡胶产品,随机地选其中一个用甲工艺处理,另一个用乙工艺处理,测量处理后的橡胶产品的伸缩率.甲,乙两种工艺处理后的橡胶产品的伸缩率分别记为,试验结果如下:
试验序号
1
2
3
4
5
6
7
8
9
10
伸缩率
545
533
551
522
575
544
541
568
596
548
伸缩率
536
527
543
530
560
533
522
550
576
536
记,记的样本平均数为,样本方差为.
(1)求;
(2)判断甲工艺处理后的橡胶产品的伸缩率较乙工艺处理后的橡胶产品的伸缩率是否有显著提高,(如果,则认为甲工艺处理后的橡胶产品的伸缩率较乙工艺处理后的橡胶产品的伸缩率有显著提高,否则不认为有显著提高).
【答案】(1),;
(2)认为甲工艺处理后的橡胶产品的伸缩率较乙工艺处理后的橡胶产品的伸缩率有显著提高.
【分析】(1)直接利用平均数公式即可计算出,再得到所有的值,最后计算出方差即可;
(2)根据公式计算出的值,和比较大小即可.
【详解】(1)计数如下表:
试验序号
1
2
3
4
5
6
7
8
9
10
9
6
8
-8
15
11
19
18
20
12
则,
.
(2)由(1)知:,,故有,
所以认为甲工艺处理后的橡胶产品的伸缩率较乙工艺处理后的橡胶产品的伸缩率有显著提高.
【变式10-2】某水果公司以10元/的成本价新进2000箱荔枝,每箱质量,在出售荔枝前,需要去掉损坏的荔枝,现随机抽取20箱,去掉损坏荔枝后称得每箱的质量(单位:)如下:4.7,4.8,4.6,4.5,4.8,4.9,4.8,4.7,4.8,4.7,4.8,4.9,4.7,4.8,4.5,4.7,4.7,4.9,4.7,5.0.
整理数据:
质量()
4.5
4.6
4.7
4.8
4.9
5.0
数量(箱)
2
1
7
a
3
1
分析数据:
平均数
众数
中位数
4.75
b
c
(1)____________,____________,____________;
(2)平均数、众数、中位数都能反映这组数据的集中趋势,请根据以上样本数据分析的结果,任意选择其中一个统计量,估算这2000箱荔枝共损坏了多少千克?
(3)根据(2)中的结果,求该公司销售这批荔枝每千克定为多少元才不亏本(结果保留一位小数)?
【答案】(1)6,4.7,4.75(2)答案见解析(3)答案见解析
【分析】(1)根据众数和中位数的定义求解即可;
(2)从平均数、中位数、众数中,任选一个计算即可;
(3)求出成本,根据(2)的结果计算即可.
【详解】(1),
4.7出现的次数最多,∴众数,
将这组数据按照从小到大的顺序排列,第10箱质量为4.7,第11箱质量为4.8,
∴中位数,
(2)若选平均数4.75,则这2000箱荔枝共损坏了,
若选择众数4.7,则这2000箱荔枝共损坏了,
若选择中位数4.75,这2000箱荔枝共损坏了;
(3)若选平均数或中位数,则(元),
若选众数,则(元),
答:若选平均数或中位数,该公司销售这批荔枝每千克定为10.5元才不亏本,
若选众数,该公司销售这批荔枝每千克定为10.7元才不亏本
【变式10-3】某工厂生产某款产品,该产品市场评级规定:评分在10分及以上的为一等品,低于10分的为二等品.下面是检验员从一批产品中随机抽样的6件产品的评分:
10.1
9.8
10.0
9.7
10.0
9.8
经计算得,其中为抽取的第i件产品的评分,.
(1)求这组样本平均数和方差;
(2)从以上随机抽取的6件产品中任意抽取2件,求这两件均为一等品的概率;
(3)若厂家改进生产线,使得生产出的每件产品评分均提高0.2.再从改进后生产的产品中随机抽取6件产品,估计这6件产品的平均等级是否为一等品?说明理由.
【答案】(1)平均数9.9,方差0.02
(2)
(3)新样本平均等级不一定是一等品,理由见解析
【分析】(1)根据平均数和方差计算公式求解即可;
(2)由列举法结合概率公式求解;
(3)根据平均数公式得出改进后生产的产品评分的平均数,再由平均数的定义作出判断.
【详解】(1),
样本方差为
,
(2)用,,表示抽取的6件产品中的三个一等品,
用,,表示抽取的6件产品中的三个二等品,
则该试验的样本空间可表示为
共有15个样本点.
设事件A为两次都抽到一等品,它包含了3种等可能的结果,
即.
所以.
即两件均为一等品的概率为.
(3)因为改进后随机抽取的6件产品是改进前抽取的6件产品每个提高0.2分,
所以估计改进后生产的产品评分的平均数,
所以可以认为这6件产品平均等级为一等品.
因为样本数据具有随机性这6件产品不一定是一等品,
所以新样本平均值不一定达到10分以上,所以新样本平均等级不一定是一等品.
【变式10-4】某高校两个班级在一门选修课程的某次考试中的成绩(总分:100分)如下:
甲班
84
75
78
95
67
49
86
77
66
88
73
78
53
45
74
91
84
99
53
84
67
57
68
55
90
73
72
67
57
乙班
74
58
92
100
74
37
83
97
66
84
61
75
94
70
73
84
81
48
82
66
83
100
90
66
93
44
分别计算两个班级成绩的平均数、中位数和众数,并说明在这次考试中哪个班的成绩更好.
【答案】答案见解析
【分析】利用平均数、中位数和众数的计算方法与代表意义即可得解.
【详解】依题意,
,
,
首先对两班的成绩按高低进行排列,甲班从低到高的顺序:45,49,53,53,55,57,57,
66,67,67,67,68,72,73,73,74,75,77,78,78,84,84,84,86,88,90,91,95,99;
乙班从低到高的顺序:37,44,48,58,61,66,66,66,70,73,74,74,75,81,82,
83,83,84,84,90,92,93,94,97,100,100;
故甲班的中位数为73,乙班的中位数;
甲班的众数为84和67,乙班的众数为66,
由于甲班的平均成绩小于乙班的平均成绩,且甲班成绩的中位数小于乙班的,
所以乙班的成绩更好点.
原创精品资源学科网独家享有版权,侵权必究!37
原创精品资源学科网独家享有版权,侵权必究!37
学科网(北京)股份有限公司
$$