内容正文:
限时规范训练(七十)
A级 基础落实练
1.以下是某宿舍6名学生某日上午的体温记录:36.3,36.1,36.4,36.7,36.5,36.6(单位:℃),则该组数据的第80百分位数为( )
A.36.7 B.36.6
C.36.5 D.36.4
解析:B 将6名学生该日上午的体温记录从小到大排列为36.1,36.3,36.4,36.5,36.6,36.7,
因为80%×6=4.8,所以该组数据的第80百分位数为36.6.
2.已知一组数据x1,x2,x3,x4,x5的平均数为2,方差为,则另一组数据3x1-2,3x2-2,3x3-2,3x4-2,3x5-2的平均数、方差分别为( )
A.2, B.2,1
C.4, D.4,
解析:D 因为一组数据x1,x2,x3,x4,x5的平均数为2,方差为,
所以另一组数据3x1-2,3x2-2,3x3-2,3x4-2,3x5-2的平均数为3×2-2=4,
方差为32×=.
3.(多选)(2021·新高考Ⅱ卷)下列统计量中,能度量样本x1,x2,…,xn的离散程度的是( )
A.样本x1,x2,…,xn的标准差
B.样本x1,x2,…,xn的中位数
C.样本x1,x2,…,xn的极差
D.样本x1,x2,…,xn的平均数
解析:AC 由标准差的定义可知,标准差考查的是数据的离散程度;由中位数的定义可知,中位数考查的是数据的集中趋势;由极差的定义可知,极差考查的是数据的离散程度;由平均数的定义可知,平均数考查的是数据的集中趋势.故选AC.
4.(多选)成立时间少于10年、估值超过10亿美元且未上市的企业称为独角兽企业.2022年中国新经济独角兽企业分布较广泛、覆盖居民生活的各个方面.如图为2022年中国新经济独角兽企业 TOP100的行业分布图,在中国新经济独角兽企业 TOP100榜单中,京、沪、粤三地的企业数量共同占比达到70%.下列说法正确的是( )
2022年中国新经济独角兽企业TOP100行业分布
A随着智能出行与共享经济观念的普及,汽车交通行业备受投资者关注
B.在该 TOP100榜单中独角兽企业数量的中位数是3
C.在中国新经济独角兽企业 TOP100榜单中,京、沪、粤三地的企业超过82家
D.2022年中国新经济独角兽企业 TOP100榜单中,企业服务、汽车交通、先进制造行业的企业数量共同占比超过30%
解析:AD A选项,由图可知,汽车交通行业在独角兽企业 TOP100榜单中数量较多,故A选项正确;
B选项,数据为11,10,10,10,10,9,7,6,4,4,4,4,3,2,2,2,2,则中位数为4,故B选项不正确;
C选项,100×70%=70<82,故C选项不正确;
D选项,企业服务、汽车交通、先进制造行业的企业数量共同占比为×100%=31%>30%,故D选项正确.
5.(2024·云南红河州第二次检测)我国是世界上严重缺水的国家之一,城市缺水问题较为突出.某市政府为了解居民节约用水的意识,随机调查了100户居民某年的月均用水量数据(单位:立方米),制成如图所示的频率分布直方图,下列说法正确的是( )
A.该组样本数据的极差是4立方米
B.全市居民用户月均用水量的中位数的估计值是2.25立方米
C.全市居民用户月均用水量的众数的估计值是2立方米
D.可估计全市居民用户中月均用水量超过3立方米的约占15%
解析:D 对于A,由频率分布直方图无法得到这组数据的最大值和最小值,故无法准确判断这组数据的极差,故A错误;
对于B,因为(0.2+0.3+0.4)×0.5=0.45,0.45+0.5×0.5=0.7,设中位数为x,由0.45+0.5×(x-2)=0.5得x=2.1,故B错误;
对于C,由频率分布直方图可得全市居民用户月均用水量的众数的估计值为=2.25,故C错误;
对于D,由频率分布直方图可得月均用水量超过3立方米的频率为(0.1+0.1+0.1)×0.5=0.15,可估计全市居民用户中月均用水量超过3立方米的约占15%,故D正确.
6.(多选)(2024·济南联考)球队统计了某篮球运动员在联赛前9轮比赛中的得分数据(9个数据不全相同),已知该运动员在第10轮比赛中的得分恰好为前9轮得分的平均数,则该运动员前10轮比赛的得分数据与前9轮比赛的得分数据相比,下列说法正确的是( )
A.极差一定不变
B.平均数一定不变
C.方差一定变小
D.中位数一定不变
解析:ABC 由题知,极差一定不变,平均数一定不变,故A,B正确;
设前9轮得分的方差为s2,则前10轮得分的方差为s′2=×(9s2+0)=<s2,所以方差一定变小,故C正确;
当且仅当前9轮得分的平均数等于中位数时,中位数一定不变,故D错误.
7.(2024·沧州模拟)已知某样本数据分别为1,2,3,a,6,若样本平均数=3,则样本方差s2=________.
解析:由题设,得==3,可得a=3,所以s2= (xi-)2=.
答案:
8.某影院记录了观看某部影片的70位观众的年龄,其中年龄位于区间[10,20)内的有10位,位于区间[20,30)内的有20位,位于区间[30,40)内的有25位,位于区间[40,50]内的有15位,则这70位观众年龄的众数的估计值为________.
解析:由于25>20>15>10,故众数位于区间[30,40)内,所以众数的估计值为=35.
答案:35
9.某年级120名学生在一次百米测试中,成绩全部介于13秒与18秒之间.将测试结果分成5组:[13,14),[14,15),[15,16),[16,17),[17,18],得到如图所示的频率分布直方图.如果从左到右的5个小矩形的面积之比为1∶3∶7∶6∶3,那么成绩的70%分位数约为________秒.
解析:设成绩的70%分位数为x,
因为=0.55,
=0.85,所以x∈[16,17),
所以0.55+(x-16)×=0.70,
解得x=16.5(秒).
答案:16.5
10.自中国进入工业化进程以来,个人的文化水平往往影响或在某种程度上决定了个人的薪酬高低,文化水平较高的人往往收入较高,将个人的文化水平用数字表示,记“没有接受过系统学习或自学的成年人”为最低分25分,“顶级尖端人才”为最高分95分.为了分析A市居民的受教育程度,从A市居民中随机抽取1000人的文化水平数据X,将样本分成小学[25,35),初中[35,45),高中[45,55),专科[55,65),本科[65,75),硕士[75,85),博士[85,95]七组,整理后得到如图所示的频率分布直方图.
(1)求样本数据的众数和中位数(保留一位小数);
(2)请估计该市居民的平均文化水平.(同组中的每个数据用该组区间的中点值代替)
解:(1)样本数据的众数为=70.0.
X∈[25,65)的频率为0.05+0.05+0.15+0.20=0.45<0.50,
X∈[25,75)的频率为0.05+0.05+0.15+0.20+0.30=0.75>0.50.
所以中位数在区间[65,75)上,中位数为
65+10×=65+≈66.7.
(2)平均文化水平
=30×0.05+40×0.05+50×0.15+60×0.20+70×0.30+80×0.20+90×0.05=64.5.
11.一次数学知识竞赛中,两组学生的成绩如下:
分数
50
60
70
80
90
100
人数
甲组
2
5
10
13
14
6
乙组
4
4
16
2
12
12
经计算,两组的平均分都是80分,请根据所学过的统计知识,进一步判断这次竞赛中哪个组更优秀,并说明理由.
解:从不同的角度分析如下:
①甲组成绩的众数为90分,乙组成绩的众数为70分,从成绩的众数这一角度看,甲组成绩好些.
②s=×[2×(50-80)2+5×(60-80)2+10×(70-80)2+13×(80-80)2+14×(90-80)2+6×(100-80)2]=172.
同理得s=256.
因为s<s,所以甲组的成绩比乙组的成绩稳定.
③甲、乙两组成绩的中位数、平均数都是80分,其中甲组成绩在80分以上(含80分)的有33人,乙组成绩在80分以上(含80分)的有26人,从这一角度看,甲组成绩总体较好.
④从成绩统计表看,甲组成绩大于或等于90分的有20人,乙组成绩大于或等于90分的有24人,所以乙组成绩在高分段的人数多.
同时,乙组满分比甲组多6人,从这一角度看,乙组成绩较好.
B级 能力提升练
12.(多选)已知一组数据丢失了一个大于3的数据,剩下的六个数据分别是3,3,5,3,6,11,若这组数据的平均数与众数的和是中位数的2倍,则丢失的数据可能是( )
A.4 B.12
C.18 D.20
解析:AC 设丢失的数据为x,则这七个数据的平均数为,众数是3,若3<x<5,则中位数为x,此时+3=2x,解得x=4;若x≥5,则中位数为5,此时+3=2×5,解得x=18.综上所述,丢失的数据可能是4或18.
13.(多选)(2024·泰州模拟)设一组样本的统计数据为:x1,x2,…,xn,其中n∈N*,x1,x2,…,xn∈R.已知该样本的统计数据的平均数为,方差为s2,设函数f(x)= (xi-x)2,x∈R,则下列说法正确的是( )
A.设b∈R,则x1+b,x2+b,…,xn+b的平均数为+b
B.设a∈R,则ax1,ax2,…,axn的方差为as2
C.当x=时,函数f(x)有最小值ns2
D.f(x1)+f(x2)+…+f(xn)<n2s2
解析:AC 对于A,x1,x2,…,xn的平均数=(x1+x2+…+xn),x1+b,x2+b,…,xn+b的平均数为(x1+b+x2+b+…+xn+b)=(x1+x2+…+xn)+=+b,A正确;
对于B,x1,x2,…,xn的方差s2
=[(x1-)2+(x2-)2+…+(xn-)2],ax1,ax2,…,axn的平均数为(ax1+ax2+…+axn)=a(x1+x2+…+xn)=a,方差为
[(ax1-a)2+(ax2-a)2+…+(axn-a)2]=
a2[(x1-)2+(x2-)2+…+(xn-)2]=a2s2,B错误;
对于C,f(x)= (xi-x)2=(x1-x)2+(x2-x)2+…+(xn-x)2=x-2nx+nx2,又s2= (xi-)2=(x-n2),故x=ns2+n2,故f(x)=x-2nx+nx2=nx2-2nx+n2+ns2=n(x-)2+ns2,故当x=时,函数f(x)有最小值ns2,C正确;
对于D,由上知f(x1)≥ns2,f(x2)≥ns2,…,f(xn)≥ns2,
f(x1)+f(x2)+…+f(xn)≥ns2+ns2+…+ns2=n2s2,D错误.故选AC.
14.中国独有的文书工具,即笔、墨、纸、砚,有文房四宝之名,起源于南北朝时期.其中宣纸是文房四宝的一种,宣纸“始于唐代,产于泾县”,因唐代泾县隶属宣州管辖,故因地得名宣纸.宣纸按质量等级分为正牌(优等品)、副牌(合格品)、废品三等.某公司生产的宣纸为纯手工制作,年产宣纸10 000刀(1刀=100张),该公司按照某种质量指标x给宣纸确定等级如表所示:
x的范围
(44,48]∪(52,56]
(48,52]
[0,44]∪(56,60]
质量等级
副牌
正牌
废品
在该公司所生产的宣纸中随机抽取了一刀进行检验,得到概率分布直方图如图所示,已知每张正牌宣纸的利润为15元,副牌宣纸的利润为8元,废品的利润为-20元.
(1)试估计该公司的年利润;
(2)市场上有一种售价为100万元的机器可以改进宣纸的生产工艺,但这种机器的使用寿命为一年,只能提高宣纸的质量,不能增加宣纸的年产量.据调查这种机器生产的宣纸的质量指标x如表所示:
x的范围
(-2,+2)
(-6,+6)
频率
0.6827
0.9545
其中为质量指标x的平均值,但是由于人们对传统手工工艺的认可,改进后的正牌和副牌宣纸的利润都将下降3元/张,请问该公司是否购买这种机器?请你为公司提出合理建议,并说明理由.(同一组的数据用该组区间的中点值作代表)
解:(1)由频率分布直方图得,一刀宣纸有正牌100×0.1×4=40(张),有副牌100×0.05×4×2=40(张),有废品100×0.025×4×2=20(张),
∴该公司一刀宣纸的利润的估计值为
40×15+40×8-20×20=520(元),
∴估计该公司的年利润为520万元.
(2)由频率分布直方图,得
=42×0.025×4+46×0.05×4+50×0.1×4+54×0.05×4+58×0.025×4=50.
这种机器生产的宣纸的质量指标x如表所示:
x的范围
(48,52)
(44,56)
频率
0.6827
0.9545
∴一刀宣纸中正牌的张数估计为
100×0.6827=68.27,
废品的张数估计为100×(1-0.9545)=4.55,
副牌的张数为100×(0.9545-0.6827)=27.18,
∴一刀宣纸的利润为
68.27×12+27.18×5-4.55×20
=864.14(元),
∴公司改进后该公司的年利润为
864.14-100=764.14(万元),
∵764.14>520,∴建议该公司购买这种机器.
学科网(北京)股份有限公司
$$