5.3数据的分析-2020-2021学年粤教版（2019）高中信息技术必修一课件

2021-03-16

| 19页

| 1623人阅读

| 28人下载

普通

资源信息

学段	高中
学科	信息技术
教材版本	高中信息技术粤教版必修1 数据与计算
年级	高一
章节	5.3 数据的分析
类型	课件
知识点	-
使用场景	同步教学
学年	2021-2022
地区（省份）	全国
地区（市）	-
地区（区县）	-
文件格式	PPTX
文件大小	87 KB
发布时间	2021-03-16
更新时间	2021-03-16
作者	懒猫...
品牌系列	-
审核时间	2021-03-16
下载链接	https://m.zxxk.com/soft/27366601.html
价格	0.50储值（1储值=1元）
来源	学科网

内容正文：

2019粤教版信息技术必修一数据与计算 5.1认识大数据 5.2数据的采集 5.3数据的分析 5.4数据的可视化表达第五章数据处理和可视化表达 5.3.1特征探索 5.3.2关联分析 5.3.3聚类分析 5.3.4数据分类 5.3数据的分析数据分析数据分析就是在一堆杂乱无章的数据中，运用数字化工具和技术，探索数据内在的结构和规律，构建数学模型，并进行可视化表达，通过验证将模型转化为知识，为诊断过去，预测未来发挥作用。数据分析特征探索关联分析聚类与分类建立模型模型评价特征探索特征探索数据特征探索的主要任务是对数据进行预处理，发现和处理缺失值、异常数据，绘制直方图，观察分析数据的分布特征，求最大值、最小值、极差等描述性统计量。关联分析关联分析就是分析并发现存在于大量数据之间的关联性或相关性，从而描述一个事物中某些属性同时出现的规律和模式。关联性分析的基本算法（1）扫描历史数据，并对每项数据进行频率次数统计。（2）构建候选项集C1，并计算其支持度，即数据出现频率次数与总数的比。（3）对候选项集的支持度进行筛选，筛选的数据项支持度应当不小于最小支持度，从而形成频繁项集L1。（4）对频繁项集L2进行连接生成候选项集C2，重复上述步骤，最终形成频繁K项集或者最大频繁项集。聚类分析聚类分析聚类分析是一种探索性的分析，在分类的过程中，人们不必事先给出一个分类的标准，聚类分析能够从样本数据出发，自动进行分类。 K-平均算法基本思想就是在空间N个点中，初始选择K个点作为中心聚类点，然后将N个点分别与K个点计算距离，选择自己最近的点作为自己的中心点，再不断更新中心聚集点，以达到“物以类聚，人以群分”的效果。聚类分析的基本算法（1）从数据点集合中随机选择K个点作为初始的聚集中心，每个中心点代表着每个聚集中心的平均值。（2）对其余的每个数据点，依次判断其与K个中心点的距离，距离最近的表明它属于这项聚类。（3）重新计算新的聚簇集合的平均值即中心点。整个过程不断迭代计算，直到达到预先设定的迭代次数或中心点不再频繁波动。数据分类数据分类数据分类是数据分析处理中最基本的方法。数据分类通常的做法是，基于样本数据先训练构建分类函数或者分类模型（也称为分类器），该分类器具有将待分类数据项映射到某一特点类别的功能。数据分类和回归分析都可

资源预览图

5.3数据的分析-2020-2021学年粤教版（2019）高中信息技术必修一课件

所属专辑