内容正文:
24.3 数据的四分位数(1)
集中趋势和离散程度都是数据分布某一方面的特征. 为了获取数据更多的信息,人们还关心数据整体的分布情况. 本节我们将学习用四分位数大致刻画一组数据的分布情况.
复习引入
问题 某银行有A和B两个理财产品经营团队.近三年,这两个团队分别负责经营12项理财产品,收益率(单位:%)如下:
A
B
如果你是一位购买理财产品的投资者,会选择哪个团队的产品?
我们可以用产品收益率的平均数和方差来刻画这两个团队的经营水平.
A
B
①团队B的产品收益率的平均数稍大于团队A,但差别不大;
因此,如果你是稳健型投资者,那么应该选择团队B经营的理财品;
由两个团队的理财产品收益率的平均数和方差可以看出:
②团队A的产品收益率的方差明显大于团队B,即团队B的产品收益的稳定性要好于团队A.
如果你是激进型投资者,那么应该选择团队A经营的理财产品.
如果投资者还想进一步了解两个团队理财产品收益率的具体情况,例如收益率大部分在什么范围,哪些范围比较集中等信息,那么产品收益率的平均数和方差能反映出这些信息吗?
思考
平均数和方差虽然可以反映产品收益率的集中趋势和离散程度,但无法反映出投资客户关心的这些信息.因此,我们需要能反映产品收益率更多分布信息的统计量.
一组数据按从小到大的顺序排列,中位数是从中间点把数据分成2等份,将数据分成100等份的每一分点处的值叫作这组数据的百分位数,相比中位数,百分位数可以较全面地反映出数据的分布信息.
由于每个团队的产品收益率的数据个数不多,我们可以用三个特殊的百分位数来刻画.
A
3.915这个值把所有数据分成2等份,所有数据中小于这个值的占50%,称3.915为这组数据的50%分位数.
3.915
A
3.915
3.915左侧数据的中位数
3.915右侧数据的中位数
3.195
4.44
3.915
3.195
4.44
A
所有数据中小于这个值的占50%,称3.915为这组数据的50%分位数.
所有数据中小于这个值的占25%,称3.195为这组数据的25%分位数.
所有数据中小于这个值的占75%,称4.44为这组数据的75%分位数.
由于3.195,3.915,4.44这三个值把这组按由小到大顺序排列的数据分成四等份,所以称它们为这组数据的四分位数,从小到大分别称为这组数据的第一四分位数、第二四分位数(中位数)、第三四分位数,分别记为Q1,Q2,Q3 .
第一四分位数又称下四分位数,第三四分位数又称上四分位数.
3.915
3.195
4.44
第一四分位数
第二四分位数
第三四分位数
3.915
3.195
4.44
A
第一四分位数
第二四分位数
第三四分位数
①产品收益率小于3.195%的项目数占总数的25%;
可以大致看出其产品收益率的分布情况:
②产品收益率小于3.915%的项目数占总数的一半;
③产品收益率大于4.44%的项目数占总数的25%;
④产品收益率在3.195%至4.44%之间的项目数占总数的50%.
类似地,根据团队B的产品收益率数据计算出据团队B产品收益率三个四分位数,从中你能得到什么信息?
B
3.89
第二四分位数
3.89左侧数据的中位数
3.89目侧数据的中位数
3.635
4.125
第一四分位数
第三四分位数
根据团队B的产品收益率数据计算出据团队B产品收益率三个四分位数,从中你能得到什么信息?
B
3.89
第二四分位数
3.635
4.125
第一四分位数
第三四分位数
①产品收益率小于3.635%的项目数占总数的25%;
可以大致看出团队B的产品收益率的分布情况:
②产品收益率小于3.89%的项目数占总数的一半;
③产品收益率大于4.125%的项目数占总数的25%;
④产品收益率在3.635%至4.125%之间的项目数占总数的50%.
课堂小结
一、计算一组数据的四分位数的一般步骤:
1.按从小到大的顺序排列的一组数据;
2.找出这组数据的中位数,作为这组数据的第二四分位数;
3.找出中位数左侧和右侧的数据各自的中位数,分别作为这组数据的第一四分位数和第三四分位数.
利用一组数据的三个四分位数,以及最小值、最大值可以刻画这组数据的大致分布情况.
二、求得一组数据的四分位数的意义:
课堂练习
1.某地有8个快递收件点,在某地接收到的快递个数分别为 360,284,290,300,188,240,260,288,这组数据的上四分位数和下四分位数分别为( )
A.250,290 B.295, 250 C.240,300 D.240,295
2.在一次知识竞赛中,某校8名同学的成绩(单位:分)分别为:
80,82,84,90,92,94,96,98,
则这组数据的第一四分位数是
B
83
3.幸福指数是衡量人们对自身生存和发展状况的感受和体验,即人们的幸福感的一种指数,某机构从某社区随机调查了12人,得到他们的幸福指数分别是:
7.6,8.5,7.8,9.2,8.1,9,7.9,9.5,8.3,8.8,6.9,9.4
求这组数据的四分位数并说明这组数据的分布情况.
解:这组数据按从小到大顺序排列为:
6.9, 7.6, 7.8, 7.9, 8.1, 8.3, 8.5, 8.8, 9, 9.2, 9.4, 9.5
8.4
7.85
9.1
①幸福指数7.85以下的人数占总人数的25%;
可以大致看出这组数据的分布情况:
②幸福指数8.4以下的人数占总人数的一半;
③幸福指数9.1以上的人数占总人数的25%;
④幸福指数在7.85至9.1之间的人数占总人数的50%.
解:这组数据按从小到大顺序排列为:
6.9, 7.6, 7.8, 7.9, 8.1, 8.3, 8.5, 8.8, 9, 9.2, 9.4, 9.5
Q2=8.4
Q1=7.85
Q3=9.1
①幸福指数7.85以下的人数占总人数的25%;
可以大致看出这组数据的分布情况:
②幸福指数8.4以下的人数占总人数的一半;
③幸福指数9.1以上的人数占总人数的25%;
④幸福指数在7.85至9.1之间的人数占总人数的50%.
$