内容正文:
4.3数据分类
要闾提园
1.一般地,设一组数据为x1,x2,…,xm,它的平均数为x,离差平方和为S,如果把这组数据分为两组,前
m个数据为第一组,后(n一m)个数据为第二组,第一组的平均数记作x1,第二组的平均数记作x2,令
S=(x1-x1)2+(x2-x1)2+…十(xm-x1)2+(xm+1-x2)2+(xm+2-x2)2+…十(xn-x2)2,
S=m(x1-x)2+(n-m)(x2-x)2,
其中S为组内离差平方和,反映了两个组内数据的离散程度,S?为组间离差平方和,反映了两组数据
之间的差异程度】
离差平方和、组内离差平方和、组间离差平方和三者之间的关系:S2=S十S
2.数据分组的原则:符合“组内离差平方和最小”
已课内基础练
知识点②
组间离差平方和
知识点①
组内离差平方和
4.现有两组数据:
1.将数据分为两组时,组内离差平方和越小,
A组:2,4,6.B组:8,10,12
说明
请计算这两组数据的组间离差平方和.
A.两组数据的平均数差距越大
B.每组数据内部越集中
C.数据的总数越少
D.中位数越接近平均数
2.已知一组数据分为两组,分别为3,5,7和
11,13,15,则这两组数据的组内离差平方和
为
3.某实验将10株植物分为两组,每组5株,记
知识点③
按“组内离差平方和最小”原则将
录其生长高度(单位:cm)如下:
数据分组
对照组:12,14,15,13,16.
5.现有一组数据:1,3,5,8,10,12.若要将其分
实验组:18,20,19,21,22
为两组,且需满足“组内离差平方和最小”的
请计算这两组数据的组内离差平方和.
原则,应如何分组?
下册第4章
已课外拓展练
8.某公司5名员工的季度绩效分数为75,80,
6.某公司统计3个部门的月销售额(单位:万
85,90,95.人力资源部门想将员工分为“普
元),结果如下:
通组”和“优秀组”,要求组内绩效同质性高
部门A:15,20,18.部门B:30,25,35,40.部
(组内离差平方和最小),如何分组?计算最
门C:10,12,8.
小离差平方和。
求所有部门的组内离差平方和(结果保留2
位小数).
色核心素养练
9.某农场种植6块试验田,亩产量(单位:kg)
7.某班级5名学生的成绩为60,70,78,90,
如下:300,320,350,400,450,500.若将试验
100.若将其分为两组,如何分组可使组内离
田分为两组,使组内离差平方和最小,如何
差平方和最小?请计算最小值.
分组?请说明分组意义:
2
八年级数学XJ版4.2方差
1.A2.403.D4.35.C
6.甲【解析】甲接受“送教上门”时间的平均数为
7+8+8+9+7+8+8+9+7+9=8h),
10
甲接受“送教上门”时间的方差为
=3X(7-8)+4×(8-8)2+3×(9-8)3
10
乙接受“送教上门”时间的平均数为
6+8+7+7+8+9+10+7+9+9=8h),
10
乙接受“送教上门”时间的方差为
元-6-8y+3x7-8+2X8-89+3X0-8+0-8
10
7
因为<名,所以甲学生每周接受“送教上门”的时间
更稳定,
7.解:样本平均数为(11.8+11.7+12.0+12.1+12.3+
12.2+12.0+11.5+12.3+12.1)÷10=12(mm),
方差为0×[4.8-12y+1.7-12)+(12.0
12)2+(12.1-12)2+(12.3-12)2+(12.2-12)2+
(12.0-12)2+(11.5-12)2+(12.3-12)2+(12.1-
12)2]=0.062.因为0.062>0.04,所以该工厂可以
退货。
8.D【解析】甲班视力值的平均数为日×(4.7+5.0十
4.7+4.8+4.7十4.7十4.6十4.4)=4.7;中位数为
4.7十4.7=4,7:众数为4.7:方差为s品=8×[4×(4.7
2
-4.7)2+(5.0-4.7)+(4.8-4.7)2+(4.6-4.7)2+
(4.4-47)门=0.025.乙班视力值的平均数为日×
(4.8+4.7+4.7+5.0+4.6+4.5+4.9+4.4)=4.7:中
位数为7牛=4.7:众数为7:方茶为立=日×
2
[(4.8-4.7)2+2×(4.7-4.7)2+(5.0-4.7)2+(4.6
-4.7)2+(4.5-4.7)2+(4.9-4.7)2+(4.4-4.7)2]
=0.035.综上可知,只有D选项说法正确
9.解:(1)86和9
(2)甲的平均数是(7十8十8十8+9)÷5=8,则甲的方
差是5×[(7-8)+3×(8-8)+(9-8)]=0.4.
乙的平均数是(6+6+9+9+10)÷5=8,则乙的方差
是5×[2×(6-8)+2×(9-8)2+(10-8)]=2.8.
因为0.4<2.8,所以甲的成绩比较稳定
(3)变小【解析】(3)如果乙再射击1次,命中8环,那么
乙的方差是日×[2×(6-8+2×(9-8)+(10-8)+
7
(8-8)门=3<2.8.故乙射击成绩的方差会变小
10.解:(1)177.518537.5
(2)应选乙.理由:因为37.5<93.75,所以s2<s,所
以乙的成绩更稳定.故应选乙参赛.
(3)示例:①从平均数和方差的角度看,乙的一分钟跳
绳成绩好些;②从平均数和中位数的角度看,甲的一
分钟跳绳成绩好些(合理即可).
4.3数据分类
1.B2.16
3.解,对照组的平均数为2+13+14+15+16-14(m.
5
离差平方和为(12-14)2+(13-14)2+(14-14)2+
(15-14)2+(16-14)2=10:
实验组的平均数为18+19+20+21+22
5
=20(cm),
离差平方和为(18-20)2+(19-20)2+(20-20)2十
(21-20)2+(22-20)2=10.
故这两组数据的组内离差平方和为10十10=20.
4解:A组的平均数为2十6-4,
B组的平均数为=8+10+12=10,
3
两组的总平均数为2+4+6+8+10+12-7。
6
故这两组数据的组间离差平方和为3×(4一7)2十3×
(10-7)2=54.
5.解:将从小到大排列的6个数据依次分为两组,有下面
5种情况:
分组情况
组内离差平方和
第1组1个,第2组5个
53.2
第1组2个,第2组4个
28.75
第1组3个,第2组3个
16
第1组4个,第2组2个
28.75
第1组5个,第2组1个
53.2
由表可知,当1,3,5为一组,8,10,12为另一组时,组内
离差平方和最小.
6.解:部门A:平均数为15+20+18≈17.67(万元),离差
3
平方和为(15-17.67)+(20-17.67)2+(18
17.67)2≈12.67.
部门B:平均数为30+25+35+40
32.5(万元),离差
4
平方和为(30-32.5)2+(25-32.5)2+(35-32.5)2+
(40-32.5)=125.
部门C,平均数为10+12+8-10(万元),离差平方和
3
下册参考答案
27个
为(10-10)2+(12-10)2+(8-10)2=8.
故所有部门的组内离差平方和为12.67+125+8
145.67.
7.解:将数据60,70,78,90,100分成两组共有4种情况,
分别计算组内离差平方和(精确到0.01)如下表所示:
第一组离差第二组离差
组内离差
分组
平方和
平方和
平方和
第1个间隔
0
523
523
第2个间隔
50
242.67
292.67
第3个间隔
162.67
50
212.67
第4个间隔
483
0
483
由表可知,当60,70,78一组,90,100一组时,组内离差
平方和最小,最小值约为212.67.
8.解:将数据75,80,85,90,95分成两组,共有4种情况,
分别计算组内离差平方和,如下表所示:
第一组离差
第二组离差
组内离差
分组
平方和
平方和
平方和
第1个间隔
0
125
125
第2个间隔
12.5
50
62.5
第3个间隔
50
12.5
62.5
第4个间隔
125
0
125
由表可知,当75,80一组,85,90,95一组或75,80,85
组,90,95一组时,组内离差平方和最小,最小值为62.5.
9.解:将数据300,320,350,400,450,500分成两组,共有
5种情况,分别计算组内离差平方和(精确到0.01),如
下表所示:
第一组离差
第二组离差
组内离差
分组
平方和
平方和
平方和
第1个间隔
0
21320
21320
第2个间隔
200
12500
12700
第3个间隔
1266.67
5000
6266.67
第4个间隔
5675
1250
6925
第5个间隔
14920
0
14920
由表可知,要使组内离差平方和最小,应300,320,350
一组,400,450,500一组.
意义示例:分组后组内产量波动小,便于分析不同种植
方案的效果(言之有理即可)。
4.4四分位数与箱线图
第1课时四分位数
1.B2.C3.B4.70分~90分
5.解:将这组数据按从小到大的顺序排列:11,11,11,12,
12,12,13,13,14,14,14,15.
12+13
第二四分位数是
2
=12.5.
第一四分位数是2
11+12
=11.5.
第三四分位数是14十14-14.
2
28
八年级数学XJ版
6.B7.48
8.解:由题意可知,男生组和女生组的25个数据都是按
从小到大的顺序排列的:
女生组的第一四分位数m5=3.2,第三四分位数m
=3.7,则女生组的第三四分位数与第一四分位数的差
为3.7-3.2=0.5;
男生组的第一四分位数ms=4.7,第三四分位数m
=5.8,则男生组的第三四分位数与第一四分位数的差
为5.8-4.7=1.1.
第2课时箱线图
1.B2.25253.甲
4.解:因为这8个数据的最小值为102,最大值为150,
m25=113.5,m50=120,m6=127.5,
所以画箱线图如图」
收缩压/mmHg
150
-150
140
130
127.5
120
120
113.5
110
100-
-102
5.B
6.解:(1)将数据从小到大排序为40,56,59,60,67,68,71,
73,76,77,81,82,86,89,90,90,97,101,104,120.最小值
为40,最大值为120,第-四分位数为67十68=67.5,中
2
位数为7十81=79,第三四分位数为20
90+90
=90.
2
(2)箱线图如图所示.
1min跳绳次数
120F
120
110
100
90
80
79
J67.5
50
40
40
30
4.5
数据的频数分布
4.5.1频数与频率
1.C2.C3.B4.4
5.A【解析】依题意可知,8≤x<32这个范围的频数为
2+8+6=16,则频率为28-0.8
6.B【解析】依题意,50一2一8一15一5=20(名),
所以20÷50=0.4,即第四组的频率是0.4.
7.D【解析】第4组的频率为1一0.15一0.75=0.10.