内容正文:
4.2.2 对比分析
主讲教师:张琦慧
学 校:浙江大学附属中学
年 级:高中
学 科:信息技术(浙教版)
4.2.2 对比分析
年 级:高中
学 科:信息技术(浙教版)
峨眉山?
庐山?
黄山?
嵩山?
泰山?
崂山?
比较不同相机的价格、性能、便携度、续航等方面的优劣……
比较不同目的地的风景、文化、费用,不同交通方式的时间效率、成本和舒适度……
医学?
建筑?
法学?
经济?
文学?
比较不同职业发展潜力、薪资、与自身的匹配度等……
平均分析
数据
2
数
据
1
数据3
对比分析
代表总体一般水平
反映个体差异
“对比分析”
平均分析与对比分析结合使用
在生活中,对比分析是一种常见的思考和决策方法。
在统计学中,对比分析是指将两个或两个以上的数据进行比较,分析他们的差异,从数量上展示和说明研究对象规模的大小、水平的高低、速度的快慢,以及各种关系是否协调,从而揭示这些数据所代表的事物发展变化情况和规律性。
对比分析的主要方法
横向对比
热门手机指标对比
纵向对比
华为企业近五年销售收入
同一时间条件下对不同总体指标的比较
同一总体条件下对不同时期指标的比较
换个例子??不要水印
对比分析的主要方法——横向对比和纵向对比
能否描述下图中所使用的对比分析方法?
结合使用了横向对比和纵向对比。
2018-2022 届本科毕业生就业城市类型分布变化
横向对比
同一年份不同城市类型就业情况对比
同一城市类型不同年份就业情况对比
纵向对比
1月 2月 3月 4月 5月 6月 7月 8月 9月 10月 11月 12月
2022年
2023年
环比:与前一统计期对比
反映事物逐期发展的情况
同比和环比
16%↑
20%↑
例:XX手机品牌市场份额
同比增长16%
同比:历史同期数据对比
反映事物发展的相对情况
例:XX品牌零售营业额环比增长20%
思考与讨论1
在进行对比分析时,如何合理地使用同比或环比?
环比
同比
观察长期趋势
评估年度业绩
消除季节性因素影响
观察短期变化
反映即时趋势
观察季节性变化
旅游社旅游套餐规划调整
公司年度财务报告
股票市场表现
房地产近十年市场分析
猪肉价格变动
在实际分析中,同比和环比往往不是孤立使用的,而是相互补充。
通过结合使用同比和环比,可以从不同角度全面理解数据的变化。
改成如何合理使用同比或环比
思考与讨论2
所有的数据都可以直接进行对比吗?
思考:上海各月销售额远高于武汉和杭州,能否说明上海店铺的销售表现最好?
例1:某品牌在上海、杭州、武汉各门店的月销售总额如下图表所示:
不是所有的数据都可以直接用于对比分析,可能需要进行变换处理。
对比分析在使用过程中必须遵守可比性原则
地区 上海 武汉 杭州
店铺数量 86 28 32
数据标准化—— Z-score标准化
Z-score标准化是一种比较常用的标准化方法,它可以告诉我们一个数据点相对于数据集平均值的位置。
例2:某次考试小王物理考了85分,技术考了79分,能否说明小王物理比技术学得好?
物理Z分数=(85-年级物理平均分)/年级物理成绩标准差
技术Z分数=(79-年级技术平均分)/年级技术成绩标准差
小王两科成绩相对于年级整体成绩的“标准成绩”
数组的平均数
数组的标准差
若Z分数是2,则该数据比平均值高两个标准差;
若Z分数是-1,则该数据比平均值低一个标准差。
对比分析——任务实践
某班级七选三科目的考试成绩存储在“成绩.xlsx”文件中,如何分析该班学生在各科目上的得分情况?
Minitab
使用Minitab进行数据标准化
第二步:
依次计算Z分数
第一步:
将excel中的数据复制到工作表中
并创建用于存储Z分数的列
第三步:
将Z分数转换为T分数或直接计算T分数
数据变换前后的变化——时间序列图
标准化前后的概率分布情况
【小结】经过标准化后,数据具有以下特点:
符合标准正态分布,平均数为0,标准差为1。
不会改变原始数据的分布形状和分布顺序。
标准分会出现负值,有时为方便理解会进行线性变化转为T分数。
“技术”原始数据
“技术”Z分数
“技术”T分数
对比分析应用
①利用集中趋势指标直接进行对比。常用对比指标:算术平均值、中位数。
比较不同时期集中趋势指标的发展变化。
使用中位数更具说服力。
抗极端值影响,使得比较更加客观。
在数据分布不对称时,更能代表大多数员工的薪水水平。
②比较离中趋势指标。常用离中趋势指标:四分位距、方差、标准差。
例如一个房地产开发商想要了解不同地区房价的分布情况,并决定在哪些地区投资。他们从每个地区随机抽取了100个房产的销售价格作为样本,使用样本离中趋势指标进行对比:
从IQR来看,B房价分布范围最广,表明房价离散程度最大。
方差和标准差显示地区B的房价波动最大,这意味着投资风险较高,但也可能带来更高的回报。
C房价较为稳定,投资风险较低。
使用离中趋势指标进行对比分析的优势:
抗极端值影响;反映数据的多样性
风险评估:量化房价的波动程度,帮助投资者评估风险。
集中趋势指标(如平均数、中位数)只能告诉我们数据的中心位置,而离中趋势指标提供了数据分布的宽度和形状的信息,这对于理解数据的整体特性至关重要。
地区 IQR(四分位距) 方差 标准差
A 5000 2500000 1581.14
B 7000 4900000 2213.59
C 3000 1600000 1264.91
③用样本指标推算总体指标,用推算出的总体指标进行对比分析。
以农作物抽样测量所得的亩产量,推断总体亩产量,从而进行不同地区或不同时期的总产量的对比;
制造商可能会对生产线上的一小部分产品进行质量检测,根据这些样本数据来评估整个批次产品的合格率,通过对比不同时期产品合格率对产品质量进行控制。
美国每十年进行一次全国人口普查,以准确统计国家的人口数量和分布。然而由于成本和资源限制,人口普查局采用了抽样调查的方法,根据推算出的总体指标进行地区间、时间序列上的分析。
课堂小结
$$