5.3 数据的分析与可视化表达 课件 2023—2024学年粤教版(2019)高中信息技术必修1

2024-03-07
| 27页
| 946人阅读
| 3人下载
普通

资源信息

学段 高中
学科 信息技术
教材版本 高中信息技术粤教版必修1 数据与计算
年级 -
章节 5.3 数据的分析
类型 课件
知识点 -
使用场景 同步教学-新授课
学年 2024-2025
地区(省份) 全国
地区(市) -
地区(区县) -
文件格式 PPTX
文件大小 1.87 MB
发布时间 2024-03-07
更新时间 2024-03-07
作者 匿名
品牌系列 -
审核时间 2024-03-07
下载链接 https://m.zxxk.com/soft/43720581.html
价格 0.50储值(1储值=1元)
来源 学科网

内容正文:

数据的分析 与可视化表达 1 2 目 录 CONTENT 01 02 数据的分析 数据的可视化表达 2 3 目 录 CONTENT 01 02 数据的分析 数据的可视化表达 特征探索 关联分析 聚类分析 数据分类 3 数据的分析 4 01 运用数字化工具和技术,探索数据内在的结构和规律 数据 进行预测 做出决策 采集 存储 保护 分析 可视化表达 4 5 数据的分析 01 特征探索 关联分析 数据分类 01 03 02 04 预处理 分布特征 描述性统计量 分析并发现存在于大量数据之间的关联性或相关性 从样本数据出发,自动进行分类 K-平均算法 基于样本数据先训练构建分类函数或者分类模型(分类器),再根据分类器具进行预测。 聚类分析 5 6 数据的分析 01 特征探索 预处理 分布特征 描述性统计量 检查数据是否缺失,是否有异常 6 7 数据的分析 01 特征探索 关联分析 数据分类 01 03 02 04 预处理 分布特征 描述性统计量 分析并发现存在于大量数据之间的关联性或相关性 从样本数据出发,自动进行分类 K-平均算法 基于样本数据先训练构建分类函数或者分类模型(分类器),再根据分类器具进行预测。 聚类分析 7 8 数据的分析 01 关联分析 分析并发现存在于大量数据之间的关联性或相关性 全国零售业巨头沃尔玛再对消费者购物行为分析时,发现:男性顾客在购买尿布时,常常会顺便搭几瓶啤酒来犒劳自己。 8 9 数据的分析 01 订单编号 商品1 商品2 商品3 商品4 商品5 商品6 1 啤酒 苹果 奶酪 2 奶酪 薯片 3 薯片 面包 苹果 牛奶 4 薯片 面包 牛奶 香蕉 5 面包 6 奶酪 苹果 牛奶 薯片 7 牛奶 奶酪 香蕉 面包 啤酒 8 薯片 奶酪 香蕉 啤酒 牛奶 9 面包 薯片 奶酪 苹果 香蕉 10 薯片 面包 香蕉 牛奶 啤酒 苹果 9 10 数据的分析 01 支持度:某商品(或组合)在所有订单中出现的频率。 订单编号 商品1 商品2 商品3 商品4 商品5 商品6 1 啤酒 苹果 奶酪 2 奶酪 薯片 3 薯片 面包 苹果 牛奶 4 薯片 面包 牛奶 香蕉 5 面包 6 奶酪 苹果 牛奶 薯片 7 牛奶 奶酪 香蕉 面包 啤酒 8 薯片 奶酪 香蕉 啤酒 牛奶 9 面包 薯片 奶酪 苹果 香蕉 10 薯片 面包 香蕉 牛奶 啤酒 苹果 支持度(面包牛奶) =(面包+牛奶)/ 记录总数 = 4/10 置信度:在所有包含A的订单中出现B商品的概率。 置信度(面包牛奶) =(面包+牛奶)/ 面包 = 4/6 提升度:销售A商品对B商品带来的提升率。 提升度(面包牛奶) =(面包+牛奶)/ 有牛奶无面包 = 4/10 频繁项集:支持度大于或等于某个阈值的项集。 项集:包含一个或多个商品的组合。写作:AB 10 11 数据的分析 01 支持度:某商品(或组合)在所有订单中出现的频率。 支持度(面包牛奶) =(面包+牛奶)/ 记录总数 = 4/10 置信度:在所有包含A的订单中出现B商品的概率。 置信度(面包牛奶) =(面包+牛奶)/ 面包 = 4/6 提升度:销售A商品对B商品带来的提升率。 提升度(面包牛奶) =(面包+牛奶)/ 有牛奶无面包 = 4/10 频繁项集:支持度大于或等于某个阈值的项集。 项集:包含一个或多个商品的组合。写作:AB 找出频繁项集(即一个商品组合):按照“支持度≥最小支持度”的标准筛选出频繁项集。 找出强关联原则:在所有的销售记录中,找出所有的强关联原则。 11 12 数据的分析 01 特征探索 关联分析 数据分类 01 03 02 04 预处理 分布特征 描述性统计量 分析并发现存在于大量数据之间的关联性或相关性 从样本数据出发,自动进行分类 K-平均算法 基于样本数据先训练构建分类函数或者分类模型(分类器),再根据分类器具进行预测。 聚类分析 12 13 数据的分析 01 聚类分析 从样本数据出发,自动进行分类 K-平均算法 1 3 2 4 5 6 13 14 数据的分析 01 聚类分析 从样本数据出发,自动进行分类 K-平均算法 1 3 2 4 5 6 14 15 数据的分析 01 聚类分析 从样本数据出发,自动进行分类 K-平均算法 1 3 2 4 5 6 15 16 数据的分析 01 K-平均算法步骤 随机选取K个点作为质心; 计算每个点到K个质心的距离,分成K个簇; 计算K个簇样本的平均值作为新的

资源预览图

5.3 数据的分析与可视化表达 课件  2023—2024学年粤教版(2019)高中信息技术必修1
1
5.3 数据的分析与可视化表达 课件  2023—2024学年粤教版(2019)高中信息技术必修1
2
5.3 数据的分析与可视化表达 课件  2023—2024学年粤教版(2019)高中信息技术必修1
3
5.3 数据的分析与可视化表达 课件  2023—2024学年粤教版(2019)高中信息技术必修1
4
5.3 数据的分析与可视化表达 课件  2023—2024学年粤教版(2019)高中信息技术必修1
5
5.3 数据的分析与可视化表达 课件  2023—2024学年粤教版(2019)高中信息技术必修1
6
所属专辑
相关资源
由于学科网是一个信息分享及获取的平台,不确保部分用户上传资料的 来源及知识产权归属。如您发现相关资料侵犯您的合法权益,请联系学科网,我们核实后将及时进行处理。