内容正文:
第四章
数据处理与应用
1、常用表格数据的处理
2、大数据处理
3、大数据典型应用
学习目标:
1、理解数据整理目的和常见数据问题。
2、针对典型的数据问题,利用软件对数据进行整理、组织与计算。
3、在数据分析的基础上,能利用合适的统计图表呈现数据分析结果。
数据整理
乔布斯是世界上第一个对自身所有DNA和肿瘤DNA进行排序的人。为此,他支付了高达几十万美元的费用。他得到的不是样本,而是包括整个基因的数据文档。医生按照所有基因按需下药,最终这种方式帮助乔布斯延长了好几年的生命。
数据整理的目的
数据整理的目的是检测和修正错漏的数据,
整合数据资源,规整数据格式,提高数据质量。
常见的数据问题有数据缺失,数据重复,数据异常,逻辑错误,格式不一致等。P108
数据整理实例
某厂生产的火柴,规定每盒装50根,采用自动装盒技术后,每盒装火柴的根数和50略有差异.现从大批火柴中任意抽取50盒,每盒根数如下:
48 50 48 52 52 50 49 51 50 51
49 49 50 51 48 51 50 51 52 49
49 51 51 50 50 51 48 50 52 49
50 50 51 52 49 51 50 52 49 52
51 49 50 51 52 50 49 50 48 50
(1)整理数据,设计统计表表示结果.
(2)画统计图表示数据.
(3)每盒恰好桩50根火柴的盒数所占的百分比是多少?
实例分析
解:(1)用画“正”字计数统计装不同根数火柴的盒数,用下表表示结果。
数据分类 48 49 50 51 52 合计
画“正”字计数
火柴盒数
百分比
正
5
10
15
12
8
50
10%
20%
30%
24%
16%
100%
正正
正正正
正正正
正正
火柴盒数
48
49
50
51
52
0
5
10
15
火柴根数
(2)统计图如图所示
5
8
12
15
10
实例分析
(3)恰好装50根火柴的盒数所占的百分比是
实例分析
数据计算
常见的数据处理软件:Excel、SPSS、SAS、MATLAB、R、Python、Java。P109
数据整理——EXCEL
曾经, 有一堆学习或生活的数据放在我面前, 我没有头绪, 等我抓狂的时候我才后悔莫及, 人世间最痛苦的事莫过于此。
如果上天能够给我一个再来一次的机会, 我会