内容正文:
中学生表理化贺识皱种与拓是年5月
知何闲样本数据科学估什总体特征
■田红月
用样本估计总体通常有两种方法:一是
点评:处理频率分布直方图时,需紧扣
从“形”的角度,通过频率分布表、频率分布直
方图,用样本分布刻画总体的分布规律:二是
“小运形的面积一组距×案一频率”,要明
从“数”的角度,借助平均数、中位数反映数据
确各组对应的频率。
的集中趋势和一般水平,利用方差、标准差反
题型二:样本数字特征的计算、比较与
映数据的离散程度,根据百分位数反映数值
估计
在一组数据中的相对位置。
例2已知一组样本数据x1,x2,…,x,
题型一:用样本的频率分布直方图估计
(x1<x<…<x,)的平均数为x,方差为s2,
总体
则(
)。
例1某地区对100名新入职教师技能
A.6x1+1,6x。+1,·,6x2+1的平均数
测试的成绩进行了分析,成绩都在区间[50,
为6x
100]内,得到的频率分布直方图如图1所示,
B.2x1十1,2x2十1,…,2x,+1的方差为s
则下列结论中不正确的是(
)。
C.4x1+1,4x2+1,…,4x,+1的25%
◆频率/组距
分位数为4x?+1
0.04
D.3x1+1,3x,十1,…,3x,十1的极差为
x1-x1
0.02
解:对于A,6x1十1,6x2十1,…,6x?+1
0.015
的平均数为6x+1,A错误。对于B,2x1十
成绩/分
1,2x2十1,…,2x,十1的方差为4s,B错误。
5060708090100
对于C,由25%×7=1.75<2,可得4x1+1,
图1
4x2十1,…,4x,十1的25%分位数为4x十
A.成绩在[50,60)内的频数为10
1,C正确。对于D,3x1+1,3x2+1,…,3x
B.所有小矩形面积之和为1
十1的极差为3(x,一x1),D错误。应选C。
C.成绩的中位数在区间[80,90)内
点评:设原数据为x:(i=1,2,3,…),新
D.成绩的平均数在区间[80,90)内
数据为y:=ax:十b,a,b为常数,则平均数、
解:由频率分布直方图中小矩形面积之
百分位数随数据的线性变换同步变换;方差
和为1,可得(a+0.015+0.02+0.04+
仅与a有关、与b无关,即s=as;极差与
0.015)×10=1,即a=0.01,所以成绩在
a的绝对值成正比、与b无关。
[50,60)内的频数为100×a×10=100×
例3某工厂生产某款产品,该产品市
0.01×10=10,A,B正确。设成绩的中位数
场评级规定:评分在10分及以上的为一等
为y,由0.01×10+0.015×10+0.02×10=
品,低于10分的为二等品。表1是检验员从
0.450.5,0.01×10+0.015×10+0.02×
批产品中随机抽取的10件产品的评分。
10十0.04×10=0.85>0.5,易得中位数y在
表1
区间[80,90)内,C正确。设成绩的平均数为
9510.29798109.610.19.710.110.3
x,则x=(55×0.01+65×0.015+75×0.02
10
+85×0.04+95×0.015)×10=78.5,所以
经计算得
∑xi=98.078,其中x:为
平均数在区间[70,80)内,D错误。应选D。
抽取的第i件产品的评分,i=1,2,3,…,10。
18
资一数型识糖物室预骨中学生表理化
(1)求这组样本的平均数和方差。
800名学生的数学成绩(满分为100分,成绩
(2)若厂家改进生产线,使得生产出的每
都是整数)中抽取一个容量为100的样本,其
件产品评分均提高0.3。根据以上随机抽取
中男生成绩数据40个,女生成绩数据60个,
的10件产品改进后的评分,估计改进后该厂
再将40个男生成绩的样本数据分为6组:
生产的产品评分的平均数和方差。
L40,50),L50,60),60,70),70,80),L80,
(9.5+
解:(1)样本的平均数为x=10
90),[90,100],绘制得到如图2所示的频率
分布直方图。
10.2+9.7+9.8+10+9.6+10.1+9.7+
◆频率/组距
10.1+10.3)=9.9。
0.03
样本的方差为=品氵
0.025
0.02
10
0.015
6∑z72=98.078-9.92=0.0
0.01
:=1
0.005
(2)因为改进后随机抽取的10件产品的
成绒公
0405060708090100
评分是改进前抽取的10件产品的评分每个
图2
提高0.3,所以改进后生产的产品评分的平
(1)估计男生成绩样本数据的第80百分
均数为x1=x十0.3=10.2,方差不变,仍为
位数。
s1=s2=0.068。
(2)若成绩不低于80分的为“优秀”等
点评:熟记方差公式s=】∑(x:x)
级,用样本的频率分布估计总体,则估计高二
n
年级男生中成绩为“优秀”等级的人数。
=1∑x-x,灵活选用方差公式的恰当形
n=1
解:(1)在[40,80)内的成绩的频率为
式是优化解题过程、提升计算效率与准确度
0.01×10+0.015×10+0.015×10+0.03×
的关键。
10=0.70.8,在[40,90)内的成绩的频率为
题型三:总体百分位数的估计
0.7+0.025×10=0.95>0.8,可知第80百
例4一组数据6,4,a,8,6,10,12的平
分位数在[80,90)内,所以80+10×
均数为7,则该组数据的()。
0.8-0.7
A.第50百分位数为8
0.95-0.7=84,所以估计第80百分位数约
B.第50百分位数为7
是84。
C.第75百分位数为9
(2)成绩不低于80分的频率为(0.025+
D.第75百分位数为10
0.005)×10=0.3,则高二年级男生中成绩优
解:因为6,4,a,8,6,10,12的平均数为
委人数估计为0.3×0×800=96,所以估
7,所以6+4+a+8十6+10+12=7,解得0
7
计高二年级男生中成绩为“优秀”的人数为96。
=3。将这七个数从小到大排列为3,4,6,6,
点评:用样本估计总体的两个关键点:用
8,10,12。因为i=7×50%=3.5,所以第50
样本的频率分布估计总体的频率分布:用样
百分位数为6,A,B不正确。因为i=7×
本的数字特征估计总体的数字特征。
75%=5.25,所以第75百分位数为10,C不
说明:本文系2024年云南省教育厅科学
正确。应选D。
研究基金项目立项课题“基于‘三新’背景下
点评:解答此类问题要遵循“补→排·
选科走班的高中数学分层教学实践研究”(课
定”三步,即先利用条件补全数据,再将数据
题编号:2024J0625)的研究成果。
排序定位,最后按百分位数的定义精准取值。
作者单位:云南省昆明市盘龙区财大附中
例5用分层随机抽样从某校高二年级
(责任编辑王琼霞)
19