内容正文:
第六章 数据的分析
考点1: 算术平均数与加权平均数
概念:算术平均数:一组数据的总和除以数据个数,公式:x (__)=
加权平均数:考虑各数据“权重”的平均数,公式:x (__)=(w为权重)
例:算术平均数:求数据3,5,7的平均数→x (__)==5
加权平均数:某科成绩中,平时作业占20%、测验占30%、期末占50%,若小明三项得分分别为80、90、85
则最终成绩→80×0.2+90×0.3+85×0.5=85.5
· 易错点:①计算加权平均数时,混淆“权重”的形式(如把“份数”“百分比”直接当数据相加);
②忽略数据个数,漏算或多算数据导致算术平均数错误。
考点2: 中位数与众数
概念:
中位数:将数据从小到大(或从大到小)排序后,中间位置的数(数据个数为偶数时,取中间两个数的平均数);
众数:一组数据中出现次数最多的数(可多个).
例:中位数:求数据2,4,5,7,9的中位数→排序后中间数为5;求2,4,6,8的中位数→=5.
众数:数据3,3,5,5,5,7的众数是5;数据2,2,4,4,6的众数是2和4.
· 易错点:①求中位数前未对数据排序(如直接取原始数据的中间数);
②误认为“众数只有一个”,忽略多众数的情况.
考点3: 极差、方差与标准差
概念:极差:一组数据中最大值与最小值的差,公式:极差=最大值-最小值;
方差:刻画数据波动程度的统计量,公式:s2=[(x1-x (__))2+(x2-x (__))2++(xn-x (__))2];
标准差:方差的算术平方根,公式:s=
例:极差:数据4,6,8,10的极差→10-4=6
方差:求数据1,2,3,4,5的方差→x (__)=3,s2=[(1-3)2+(2-3)2+(3-3)2+(4-3)2+(5-3)2]=2
· 易错点:①计算方差时,漏除数据个数n;
②混淆“方差与稳定性的关系”(方差越小,数据越稳定),误认为方差大更稳定.
练习1.
1. 《奇迹再现》是一首充满激情与正能量的歌曲,歌词激励人心,旋律欢快激昂.以下是摘自歌曲简谱的部分旋律,当中出现的音符的中位数是( ).
A.1 B.2 C.5 D.7
2. 某校开展视力检查,某班45名同学视力检查数据如下表:
视力
4.3
4.4
4.5
4.6
4.7
4.8
4.9
5.0
人数
1
4
4
7
11
10
5
3
这45名同学视力检查数据的众数是( ).
A.4.6 B.4.7 C.4.8 D.4.9
3. 甲、乙、丙、丁四人进行射箭测试,每人测试10次,射箭成绩的平均数都是8.8环,方差分别为s2甲=0.65,s2乙=0.45,s2丙=0.55,s2丁=0.50,则射箭成绩最稳定的是( ).
A.甲 B.乙 C.丙 D.丁
4. 一家鞋店在一段时间内销售了某种女鞋30双,各种尺码鞋的销售量如表所示:
鞋的尺码/cm
22
22.5
23
23.5
24
24.5
25
销售量双
1
2
5
11
7
3
1
若每双鞋的销售利润相同,则该店主最应关注的销售数据是下列统计量中的( ).
A.平均数 B.方差 C.众数 D.中位数
5. 学校积极开展球类运动,在一次定点投篮测试中,每人投篮5次,七年级某班统计全班50名学生投中的次数,并记录如下:
投中次数(次)
0
1
2
3
4
5
人数(人)
1
●
10
17
●
6
表格中有两处数据不小心被墨汁遮盖了,下列关于投中次数的统计量中可以确定的是( ).
A.平均数 B.中位数 C.众数 D.方差
6. 射击运动队进行射击测试,甲、乙两名选手的测试成绩如图,其成绩的方差分别记为s2甲和s2乙,则s2甲和s2乙的大小关系是( ).
A.s2甲>s2乙 B.s2甲<s2乙 C.s2甲=s2乙 D.无法确定
7. 学校举行篮球技能大赛,评委从控球技能和投球技能两方面为选手打分,各项成绩均按百分制计,然后再按控球技能占60%,投球技能占40%计算选手的综合成绩(百分制).选手李林控球技能得90分,投球技能得80分.李林综合成绩为( ).
A.170分 B.86分 C.85分 D.84分
8. 小明根据方差公式s2=[(x1-3)2+(2-3)2+(3-3)2+(3-3)2+(6-3)2]分析和计算得出了四个结论,其中不正确的是( ).
A.x1=1 B.众数是3 C.n=5 D.s2=2.4
9. 一组数据2,3,5,6,x的平均数正好也是这组数据的中位数,那么x= .
10. 已知一组正整数a,1,b,b,3有唯一众数8,中位数是5,则这一组数据的平均数为 .
11. 已知数据x1,x2,x3…的平均数是5,方差是2,则数据3x1+4,3x2+4,3x3+4…的平均数是 ,方差是 .
12. 已知数据x1,x2,x3…的平均数为3,方差为2,则数据2x1+3,2x2+3,2x3+3…的平均数为 ,方差是 .
13. 某灯泡厂为测量一批灯泡的使用寿命,从中抽查了100只灯泡,它们的使用寿命如下表所示:则这批灯泡的平均使用寿命是 h.
使用寿命x/h
60≤x<100
100≤x<140
140≤x<180
灯泡只数
30
30
40
考点4: 箱线图
概念:箱线图通过“五值”(最小值、下四分位数Q1、中位数Q2、上四分位数Q3、最大值)展示数据分布,
其中:下四分位数Q1:排序后前半部分数据的中位数;
上四分位数Q3:排序后后半部分数据的中位数;
四分位距:Q3-Q1(刻画中间50%数据的波动).
例:对数据1,3,5,7,9,11,13画箱线图:
最小值=1,最大值=13;中位数Q2=7;
Q1(前半部分1,3,5的中位数)=3;Q3(后半部分9,11,13的中位数)=11;
箱线图的箱从3到11,线延伸至1和13.
· 易错点:
①计算四分位数时,错误划分“前半部分/后半部分”(如数据个数为偶数时,重复或遗漏中间数);
②误将箱线图的“箱的长度”等同于极差(实际是四分位距).
练习2.
1. 在统计学中经常用一组数据的最小值、下四分位数、中位数、上四分位数和最大值画出箱线图来反映数据的分布情况.如图1所示,在箱线图中,位于最下面和最上面的实横线分别表示下边缘(最小值)和上边缘(最大值),中间箱体的底端是下四分位数,箱体中部的“×”表示平均值,箱体的顶端是上四分位数,异常值是明显偏离样本的个别值.已知(1)班和(2)班人数相等,在一次考试中两班成绩的箱线图如图2所示,则下列说法正确的是( ).
A.(1)班成绩比(2)班成绩集中
B.(1)班成绩的上四分位数是80
C.(1)班有同学的成绩超过140分
D.(1)班的平均分高于(2)班的平均分
2. 将某组数据绘制成箱线图如图所示,则该组数据的上四分位数为( ).
A.140 B.150 C.163 D.180
3. 已知一班和二班人数相等,在一次考试中两班成绩(分)的箱线图如图所示,则下列说法正确的是( ).
A.一班成绩比二班成绩集中
B.一班成绩的下四分位数是80分
C.一班有同学的成绩超过140分
D.一班的平均分高于二班的平均分
4. 下面是根据八年2班学生1分钟跳绳次数制作的箱线图,由图不能确定这组数据的( ) A.下四分位数 B.中位数 C.最大值 D.平均数
5. 有一组被墨水污染的数据:4,17,7,15,★,★,18,15,10,4,4,11,这组数据的箱线图如图所示,下列说法不正确的是( ).
A.这组数据的下四分位数是4 B.这组数据的中位数是10
C.这组数据的上四分位数是15 D.被墨水污染的数据一个数是3,另一个数可能是13
考点5: 频数、频率与统计图表
概念:频数:某组数据出现的次数;
频率:频数与总数据个数的比值(频率=);
常见统计图表:频数分布表、频数分布直方图、箱线图等。
例: 一组数据5,5,6,7,7,7,8中,“7”的频数是3,频率是.
· 易错点:
①频率计算时,混淆“组频数”与“总数”;
②解读直方图时,误将“矩形高度”当频数(实际是“矩形面积”对应频数,若组距相等则高度对应频数).
考点6: 用样本估计总体
概念:通过样本的统计量(平均数、方差等)估计总体的对应特征(适用于样本具有代表性的情况).
例: 某校八年级抽取50名学生的数学成绩,计算样本平均数为82,则估计该校八年级学生数学平均成绩约为82
· 易错点:用“不具有代表性的样本”(如样本容量过小、抽样偏向)估计总体,导致结果偏差.
练习3.
1. 某中学八(1)班在一次数学测试中,某题(满分为5分)的得分情况如图所示,请据图回答:
(1)这题得分的众数是 分,中位数是 分;
(2)求这题得分的平均数;
(3)八(1)班和八(2)班在该题中的平均得分相同,但八(1)班成绩的方差s2甲=a,八(2)班成绩的方差s2乙=b,且a>b>0,那么该题成绩比较稳定的班级是八( )班.(填“1”或“2” )
2. 某银行有A和B两个理财经营团队.上半年这两个理财团队分别负责经营12项理财产品,收益率(单位:%)如下:
A:4.77 3.98 4.88 4.89 2.15 3.85 3.64 3.21 3.18 2.02 4.11 4.10
B:3.18 3.84 3.99 3.67 3.40 3.60 4.10 4.21 4.15 4.44 3.87 3.91
某同学想要利用四分位数分析A,B两个团队的经营水平.下表为他绘制的两个团队理财产品收益率数据的四分位数.
两个团队理财产品收益率数据的四分位数(单位:%)
团队
m25
m50
m75
A
3.195
3.915
4.440
B
a
3.890
b
请根据以上信息,完成下列问题:
(1)表中a= ,b=_ _;
(2)该同学基于四分位数绘制了团队A的箱线图如图所示,获得了团队A数据的直观表示.请你根据团队A的箱线图在图中补全团队B的箱线图,并根据箱线图对A,B两个团队的经营水平从总体经营效益,稳健度方面作出评价.
3. 某学校举办的“青春飞扬”主题演讲比赛分为初赛和决赛两个阶段.
(1)初赛由10名教师评委和45名学生评委给每位选手打分(百分制).对评委给某位选手的打分进行整理、描述和分析.下面给出了部分信息.
a.教师评委打分:86 88 90 91 91 91 91 92 92 98
b.学生评委打分的频数分布直方图如图(数据分6组:第1组82≤x<85,第2组85≤x<88,第3组88≤x<91,第4组91≤x<94,第5组94≤x<97,第6组97≤x≤100):
c.评委打分的平均数、中位数、众数如下:
平均数
中位数
众数
教师评委
91
91
m
学生评委
90.8
n
93
根据以上信息,回答下列问题:
①m的值为 ,n的值位于学生评委打分数据分组的第 组;
②若去掉教师评委打分中的最高分和最低分,记其余8名教师评委打分的平均数为x (__),则x (__) 91(填“>”“=”或“<”);
(2)决赛由5名专业评委给每位选手打分(百分制).对每位选手,计算5名专业评委给其打分的平均数和方差.平均数较大的选手排序靠前,若平均数相同,则方差较小的选手排序靠前.5名专业评委给进入决赛的甲、乙、丙三位选手的打分如下:
评委1
评委2
评委3
评委4
评委5
甲
93
90
92
93
92
乙
91
92
92
92
92
丙
90
94
90
94
k
若丙在甲、乙、丙三位选手中的排序居中,则这三位选手中排序最靠前的是 ,表中k(k为整数)的值为 .
6 / 6
学科网(北京)股份有限公司
$
第六章 数据的分析
考点1: 算术平均数与加权平均数
概念:算术平均数:一组数据的总和除以数据个数,公式:x (__)=
加权平均数:考虑各数据“权重”的平均数,公式:x (__)=(w为权重)
例:算术平均数:求数据3,5,7的平均数→x (__)==5
加权平均数:某科成绩中,平时作业占20%、测验占30%、期末占50%,若小明三项得分分别为80、90、85
则最终成绩→80×0.2+90×0.3+85×0.5=85.5
· 易错点:①计算加权平均数时,混淆“权重”的形式(如把“份数”“百分比”直接当数据相加);
②忽略数据个数,漏算或多算数据导致算术平均数错误。
考点2: 中位数与众数
概念:
中位数:将数据从小到大(或从大到小)排序后,中间位置的数(数据个数为偶数时,取中间两个数的平均数);
众数:一组数据中出现次数最多的数(可多个).
例:中位数:求数据2,4,5,7,9的中位数→排序后中间数为5;求2,4,6,8的中位数→=5.
众数:数据3,3,5,5,5,7的众数是5;数据2,2,4,4,6的众数是2和4.
· 易错点:①求中位数前未对数据排序(如直接取原始数据的中间数);
②误认为“众数只有一个”,忽略多众数的情况.
考点3: 极差、方差与标准差
概念:极差:一组数据中最大值与最小值的差,公式:极差=最大值-最小值;
方差:刻画数据波动程度的统计量,公式:s2=[(x1-x (__))2+(x2-x (__))2++(xn-x (__))2];
标准差:方差的算术平方根,公式:s=
例:极差:数据4,6,8,10的极差→10-4=6
方差:求数据1,2,3,4,5的方差→x (__)=3,s2=[(1-3)2+(2-3)2+(3-3)2+(4-3)2+(5-3)2]=2
· 易错点:①计算方差时,漏除数据个数n;
②混淆“方差与稳定性的关系”(方差越小,数据越稳定),误认为方差大更稳定.
练习1.
1. 《奇迹再现》是一首充满激情与正能量的歌曲,歌词激励人心,旋律欢快激昂.以下是摘自歌曲简谱的部分旋律,当中出现的音符的中位数是( B ).
A.1 B.2 C.5 D.7
2. 某校开展视力检查,某班45名同学视力检查数据如下表:
视力
4.3
4.4
4.5
4.6
4.7
4.8
4.9
5.0
人数
1
4
4
7
11
10
5
3
这45名同学视力检查数据的众数是( B ).
A.4.6 B.4.7 C.4.8 D.4.9
3. 甲、乙、丙、丁四人进行射箭测试,每人测试10次,射箭成绩的平均数都是8.8环,方差分别为s2甲=0.65,s2乙=0.45,s2丙=0.55,s2丁=0.50,则射箭成绩最稳定的是( B ).
A.甲 B.乙 C.丙 D.丁
4. 一家鞋店在一段时间内销售了某种女鞋30双,各种尺码鞋的销售量如表所示:
鞋的尺码/cm
22
22.5
23
23.5
24
24.5
25
销售量双
1
2
5
11
7
3
1
若每双鞋的销售利润相同,则该店主最应关注的销售数据是下列统计量中的( C ).
A.平均数 B.方差 C.众数 D.中位数
5. 学校积极开展球类运动,在一次定点投篮测试中,每人投篮5次,七年级某班统计全班50名学生投中的次数,并记录如下:
投中次数(次)
0
1
2
3
4
5
人数(人)
1
●
10
17
●
6
表格中有两处数据不小心被墨汁遮盖了,下列关于投中次数的统计量中可以确定的是( C ).
A.平均数 B.中位数 C.众数 D.方差
6. 射击运动队进行射击测试,甲、乙两名选手的测试成绩如图,其成绩的方差分别记为s2甲和s2乙,则s2甲和s2乙的大小关系是( A ).
A.s2甲>s2乙 B.s2甲<s2乙 C.s2甲=s2乙 D.无法确定
7. 学校举行篮球技能大赛,评委从控球技能和投球技能两方面为选手打分,各项成绩均按百分制计,然后再按控球技能占60%,投球技能占40%计算选手的综合成绩(百分制).选手李林控球技能得90分,投球技能得80分.李林综合成绩为( B ).
A.170分 B.86分 C.85分 D.84分
8. 小明根据方差公式s2=[(x1-3)2+(2-3)2+(3-3)2+(3-3)2+(6-3)2]分析和计算得出了四个结论,其中不正确的是( D ).
A.x1=1 B.众数是3 C.n=5 D.s2=2.4
9. 一组数据2,3,5,6,x的平均数正好也是这组数据的中位数,那么x= -1,4或9 .
10. 已知一组正整数a,1,b,b,3有唯一众数8,中位数是5,则这一组数据的平均数为 5 .
11. 已知数据x1,x2,x3…的平均数是5,方差是2,则数据3x1+4,3x2+4,3x3+4…的平均数是 19 ,方差是
18 .
12. 已知数据x1,x2,x3…的平均数为3,方差为2,则数据2x1+3,2x2+3,2x3+3…的平均数为 9 ,方差是
8 .
13. 某灯泡厂为测量一批灯泡的使用寿命,从中抽查了100只灯泡,它们的使用寿命如下表所示:则这批灯泡的平均使用寿命是 124 h.
使用寿命x/h
60≤x<100
100≤x<140
140≤x<180
灯泡只数
30
30
40
考点4: 箱线图
概念:箱线图通过“五值”(最小值、下四分位数Q1、中位数Q2、上四分位数Q3、最大值)展示数据分布,
其中:下四分位数Q1:排序后前半部分数据的中位数;
上四分位数Q3:排序后后半部分数据的中位数;
四分位距:Q3-Q1(刻画中间50%数据的波动).
例:对数据1,3,5,7,9,11,13画箱线图:
最小值=1,最大值=13;中位数Q2=7;
Q1(前半部分1,3,5的中位数)=3;Q3(后半部分9,11,13的中位数)=11;
箱线图的箱从3到11,线延伸至1和13.
· 易错点:
①计算四分位数时,错误划分“前半部分/后半部分”(如数据个数为偶数时,重复或遗漏中间数);
②误将箱线图的“箱的长度”等同于极差(实际是四分位距).
练习2.
1. 在统计学中经常用一组数据的最小值、下四分位数、中位数、上四分位数和最大值画出箱线图来反映数据的分布情况.如图1所示,在箱线图中,位于最下面和最上面的实横线分别表示下边缘(最小值)和上边缘(最大值),中间箱体的底端是下四分位数,箱体中部的“×”表示平均值,箱体的顶端是上四分位数,异常值是明显偏离样本的个别值.已知(1)班和(2)班人数相等,在一次考试中两班成绩的箱线图如图2所示,则下列说法正确的是( C ).
A.(1)班成绩比(2)班成绩集中
B.(1)班成绩的上四分位数是80
C.(1)班有同学的成绩超过140分
D.(1)班的平均分高于(2)班的平均分
2. 将某组数据绘制成箱线图如图所示,则该组数据的上四分位数为( C ).
A.140 B.150 C.163 D.180
3. 已知一班和二班人数相等,在一次考试中两班成绩(分)的箱线图如图所示,则下列说法正确的是( B ).
A.一班成绩比二班成绩集中
B.一班成绩的下四分位数是80分
C.一班有同学的成绩超过140分
D.一班的平均分高于二班的平均分
4. 下面是根据八年2班学生1分钟跳绳次数制作的箱线图,由图不能确定这组数据的( D ) A.下四分位数 B.中位数 C.最大值 D.平均数
5. 有一组被墨水污染的数据:4,17,7,15,★,★,18,15,10,4,4,11,这组数据的箱线图如图所示,下列说法不正确的是( B ).
A.这组数据的下四分位数是4 B.这组数据的中位数是10
C.这组数据的上四分位数是15 D.被墨水污染的数据一个数是3,另一个数可能是13
考点5: 频数、频率与统计图表
概念:频数:某组数据出现的次数;
频率:频数与总数据个数的比值(频率=);
常见统计图表:频数分布表、频数分布直方图、箱线图等。
例: 一组数据5,5,6,7,7,7,8中,“7”的频数是3,频率是.
· 易错点:
①频率计算时,混淆“组频数”与“总数”;
②解读直方图时,误将“矩形高度”当频数(实际是“矩形面积”对应频数,若组距相等则高度对应频数).
考点6: 用样本估计总体
概念:通过样本的统计量(平均数、方差等)估计总体的对应特征(适用于样本具有代表性的情况).
例: 某校八年级抽取50名学生的数学成绩,计算样本平均数为82,则估计该校八年级学生数学平均成绩约为82
· 易错点:用“不具有代表性的样本”(如样本容量过小、抽样偏向)估计总体,导致结果偏差.
练习3.
1. 某中学八(1)班在一次数学测试中,某题(满分为5分)的得分情况如图所示,请据图回答:
(1)这题得分的众数是 3 分,中位数是 3 分;
(2)求这题得分的平均数;
(3)八(1)班和八(2)班在该题中的平均得分相同,但八(1)班成绩的方差s2甲=a,八(2)班成绩的方差s2乙=b,且a>b>0,那么该题成绩比较稳定的班级是八( 2 )班.(填“1”或“2” )答案:(2)这题得分的平均数为2.86分
2. 某银行有A和B两个理财经营团队.上半年这两个理财团队分别负责经营12项理财产品,收益率(单位:%)如下:
A:4.77 3.98 4.88 4.89 2.15 3.85 3.64 3.21 3.18 2.02 4.11 4.10
B:3.18 3.84 3.99 3.67 3.40 3.60 4.10 4.21 4.15 4.44 3.87 3.91
某同学想要利用四分位数分析A,B两个团队的经营水平.下表为他绘制的两个团队理财产品收益率数据的四分位数.
两个团队理财产品收益率数据的四分位数(单位:%)
团队
m25
m50
m75
A
3.195
3.915
4.440
B
a
3.890
b
请根据以上信息,完成下列问题:
(1)表中a=___3.635___,b=___4.125___;
(2)该同学基于四分位数绘制了团队A的箱线图如图所示,获得了团队A数据的直观表示.请你根据团队A的箱线图在图中补全团队B的箱线图,并根据箱线图对A,B两个团队的经营水平从总体经营效益,稳健度方面作出评价.
答案:(2)如图所示,
通过箱线图可知,团队A产品收益率的中位数与团队B的几乎相等,
故可知两个团队的经营效益基本一样,但团队A的产品收益率明显比团队B的收益率的波动大,即团队B的经营水平更稳健,
故对于稳健型的投资者,选择团队B的理财产品更合适.
3. 某学校举办的“青春飞扬”主题演讲比赛分为初赛和决赛两个阶段.
(1)初赛由10名教师评委和45名学生评委给每位选手打分(百分制).对评委给某位选手的打分进行整理、描述和分析.下面给出了部分信息.
a.教师评委打分:86 88 90 91 91 91 91 92 92 98
b.学生评委打分的频数分布直方图如图(数据分6组:第1组82≤x<85,第2组85≤x<88,第3组88≤x<91,第4组91≤x<94,第5组94≤x<97,第6组97≤x≤100):
c.评委打分的平均数、中位数、众数如下:
平均数
中位数
众数
教师评委
91
91
m
学生评委
90.8
n
93
根据以上信息,回答下列问题:
①m的值为 91 ,n的值位于学生评委打分数据分组的第 4 组;
②若去掉教师评委打分中的最高分和最低分,记其余8名教师评委打分的平均数为x (__),则x (__) < 91(填“>”“=”或“<”);
(2)决赛由5名专业评委给每位选手打分(百分制).对每位选手,计算5名专业评委给其打分的平均数和方差.平均数较大的选手排序靠前,若平均数相同,则方差较小的选手排序靠前.5名专业评委给进入决赛的甲、乙、丙三位选手的打分如下:
评委1
评委2
评委3
评委4
评委5
甲
93
90
92
93
92
乙
91
92
92
92
92
丙
90
94
90
94
k
若丙在甲、乙、丙三位选手中的排序居中,则这三位选手中排序最靠前的是 甲 ,表中k(k为整数)的值为 92 .
6 / 6
学科网(北京)股份有限公司
$