5.3 数据的分析与可视化表达课件 2023—2024学年粤教版（2019）高中信息技术必修1

2024-03-07

| 27页

| 946人阅读

| 3人下载

普通

资源信息

学段	高中
学科	信息技术
教材版本	高中信息技术粤教版必修1 数据与计算
年级	-
章节	5.3 数据的分析
类型	课件
知识点	-
使用场景	同步教学-新授课
学年	2024-2025
地区（省份）	全国
地区（市）	-
地区（区县）	-
文件格式	PPTX
文件大小	1.87 MB
发布时间	2024-03-07
更新时间	2024-03-07
作者	匿名
品牌系列	-
审核时间	2024-03-07
下载链接	https://m.zxxk.com/soft/43720581.html
价格	0.50储值（1储值=1元）
来源	学科网

内容正文：

数据的分析与可视化表达 1 2 目录 CONTENT 01 02 数据的分析数据的可视化表达 2 3 目录 CONTENT 01 02 数据的分析数据的可视化表达特征探索关联分析聚类分析数据分类 3 数据的分析 4 01 运用数字化工具和技术，探索数据内在的结构和规律数据进行预测做出决策采集存储保护分析可视化表达 4 5 数据的分析 01 特征探索关联分析数据分类 01 03 02 04 预处理分布特征描述性统计量分析并发现存在于大量数据之间的关联性或相关性从样本数据出发，自动进行分类 K-平均算法基于样本数据先训练构建分类函数或者分类模型（分类器），再根据分类器具进行预测。聚类分析 5 6 数据的分析 01 特征探索预处理分布特征描述性统计量检查数据是否缺失，是否有异常 6 7 数据的分析 01 特征探索关联分析数据分类 01 03 02 04 预处理分布特征描述性统计量分析并发现存在于大量数据之间的关联性或相关性从样本数据出发，自动进行分类 K-平均算法基于样本数据先训练构建分类函数或者分类模型（分类器），再根据分类器具进行预测。聚类分析 7 8 数据的分析 01 关联分析分析并发现存在于大量数据之间的关联性或相关性全国零售业巨头沃尔玛再对消费者购物行为分析时，发现：男性顾客在购买尿布时，常常会顺便搭几瓶啤酒来犒劳自己。 8 9 数据的分析 01 订单编号商品1 商品2 商品3 商品4 商品5 商品6 1 啤酒苹果奶酪 2 奶酪薯片 3 薯片面包苹果牛奶 4 薯片面包牛奶香蕉 5 面包 6 奶酪苹果牛奶薯片 7 牛奶奶酪香蕉面包啤酒 8 薯片奶酪香蕉啤酒牛奶 9 面包薯片奶酪苹果香蕉 10 薯片面包香蕉牛奶啤酒苹果 9 10 数据的分析 01 支持度：某商品(或组合)在所有订单中出现的频率。订单编号商品1 商品2 商品3 商品4 商品5 商品6 1 啤酒苹果奶酪 2 奶酪薯片 3 薯片面包苹果牛奶 4 薯片面包牛奶香蕉 5 面包 6 奶酪苹果牛奶薯片 7 牛奶奶酪香蕉面包啤酒 8 薯片奶酪香蕉啤酒牛奶 9 面包薯片奶酪苹果香蕉 10 薯片面包香蕉牛奶啤酒苹果支持度(面包牛奶) =（面包+牛奶）/ 记录总数 = 4/10 置信度：在所有包含A的订单中出现B商品的概率。置信度(面包牛奶) =（面包+牛奶）/ 面包 = 4/6 提升度：销售A商品对B商品带来的提升率。提升度(面包牛奶) =（面包+牛奶）/ 有牛奶无面包 = 4/10 频繁项集：支持度大于或等于某个阈值的项集。项集：包含一个或多个商品的组合。写作：AB 10 11 数据的分析 01 支持度：某商品(或组合)在所有订单中出现的频率。支持度(面包牛奶) =（面包+牛奶）/ 记录总数 = 4/10 置信度：在所有包含A的订单中出现B商品的概率。置信度(面包牛奶) =（面包+牛奶）/ 面包 = 4/6 提升度：销售A商品对B商品带来的提升率。提升度(面包牛奶) =（面包+牛奶）/ 有牛奶无面包 = 4/10 频繁项集：支持度大于或等于某个阈值的项集。项集：包含一个或多个商品的组合。写作：AB 找出频繁项集（即一个商品组合）：按照“支持度≥最小支持度”的标准筛选出频繁项集。找出强关联原则：在所有的销售记录中，找出所有的强关联原则。 11 12 数据的分析 01 特征探索关联分析数据分类 01 03 02 04 预处理分布特征描述性统计量分析并发现存在于大量数据之间的关联性或相关性从样本数据出发，自动进行分类 K-平均算法基于样本数据先训练构建分类函数或者分类模型（分类器），再根据分类器具进行预测。聚类分析 12 13 数据的分析 01 聚类分析从样本数据出发，自动进行分类 K-平均算法 1 3 2 4 5 6 13 14 数据的分析 01 聚类分析从样本数据出发，自动进行分类 K-平均算法 1 3 2 4 5 6 14 15 数据的分析 01 聚类分析从样本数据出发，自动进行分类 K-平均算法 1 3 2 4 5 6 15 16 数据的分析 01 K-平均算法步骤随机选取K个点作为质心；计算每个点到K个质心的距离，分成K个簇；计算K个簇样本的平均值作为新的

资源预览图

5.3 数据的分析与可视化表达课件 2023—2024学年粤教版（2019）高中信息技术必修1

所属专辑

必修1 数据的分析与可视化表达课件 2023—2024学年粤教版（2019）高中信息技术必修1

个人

必修1 数据的分析与可视化表达课件 2023—2024学年粤教版（2019）高中信息技术必修1

高一信息技术个人合辑 2 份文档

327人已阅读

5.3 数据的分析与可视化表达 课件 2023—2024学年粤教版（2019）高中信息技术必修1

资源信息

内容正文：

资源预览图

5.3 数据的分析与可视化表达课件 2023—2024学年粤教版（2019）高中信息技术必修1