项目九 了解机器学习中的数据采集与预处理教学设计-2025-2026学年沪科版高中信息技术必修一
2025-11-16
|
6页
|
237人阅读
|
1人下载
普通
资源信息
| 学段 | 高中 |
| 学科 | 信息技术 |
| 教材版本 | 高中信息技术沪科版必修1 数据与计算 |
| 年级 | 高一 |
| 章节 | 2.了解机器学习中的数据采集与预处理 |
| 类型 | 教案-教学设计 |
| 知识点 | - |
| 使用场景 | 同步教学-新授课 |
| 学年 | 2025-2026 |
| 地区(省份) | 全国 |
| 地区(市) | - |
| 地区(区县) | - |
| 文件格式 | DOCX |
| 文件大小 | 35 KB |
| 发布时间 | 2025-11-16 |
| 更新时间 | 2025-11-16 |
| 作者 | xkw_053781218 |
| 品牌系列 | - |
| 审核时间 | 2025-11-16 |
| 下载链接 | https://m.zxxk.com/soft/54928151.html |
| 价格 | 1.00储值(1储值=1元) |
| 来源 | 学科网 |
|---|
摘要:
该高中信息技术教学设计聚焦机器学习中的数据采集与预处理,以2025年AI大模型热点视频导入,通过手写数字识别项目贯穿,梳理机器学习流程,搭建从数据采集(MNIST数据集)到预处理(向量化)的知识支架,帮助学生建立数据驱动的认知。
特色在于前沿情境激发信息意识,动态演示与像素矩阵模拟器具象化向量化过程,结合Python编程实践(读取MNIST数据、可视化图像)发展计算思维与数字化学习能力,分层任务与智慧中小学平台互动实现多元评价,为教师提供完整教学资源,助力学生理解数据价值与技术应用。
内容正文:
教学设计
课程基本信息
课题
了解机器学习中的数据采集与预处理
课型
新授课
学科
信息技术
年级
高一
学段
高中
版本章节
沪科版第四章第二节
教学目标
1. 信息意识
①通过对2025年AI大模型热点案例的分析,学生能认识到数据是人工智能应用和发展的核心驱动力与战略资源。
②通过了解MNIST数据集的采集与人工标注过程,学生能体会数据生产的成本与价值,理解高质量、规范化的数据对于模型性能的决定性影响,初步建立数据质量观。
2. 计算思维
①学生能运用分解的思维,将“图像识别”问题分解为“数据采集、预处理、模型训练、评估”等多个步骤,理解机器学习的基本流程。
②学生能运用抽象的思维,理解将具体的图像(灰度/二值)抽象为像素矩阵,并进一步数据向量化的过程与意义,掌握其核心方法。
③学生能理解验证集与测试集在模型优化与评估中的不同作用,形成评估与优化的思维。
3. 数字化学习与创新
①学生能熟练运用智慧中小学等在线平台进行资源获取、协作探究、成果分享与学习评价,适应混合式学习环境。
②学生能通过编写和运行代码,亲手实现MNIST数据集的读取、可视化及简单的二值化处理,在实践中验证理论,提升利用数字化工具解决问题的能力。
③在探究“二值图像向量化”等拓展任务中,鼓励学生进行思维发散,尝试将所学方法迁移到新的简单情境中,激发创新潜能。
4. 信息社会责任
通过讨论AI大模型对海量数据的需求,引导学生辩证地思考数据应用可能初步建立负责任地使用数据和发展AI技术的责任感。
教学重难点
重点
1.数据在机器学习流程中的核心作用:通过MNIST数据集的划分理解它的不同用途。
2.数据预处理的核心——向量化:理解将图像像素矩阵转换为一维数组的必要性与方法。
难点
1.区分“验证集”与“测试集”在模型训练与评估中的不同角色。
2.将图像的视觉信息与计算机处理的数值信息建立联系,理解“向量化”的本质。
学情分析
沪教版教材的高一学生们已经有一定Python编程基础,对人工智能的概念有初步的、感性的认识(如手机语音助手、AI人脸识别),并对AI技术抱有浓厚的兴趣。但是学生对机器学习的认知可能停留在表层,对于其背后依赖的数据驱动缺乏系统化了解。对于“矩阵”、“向量”等数学概念可能会感到抽象难懂,产生畏难情绪,数据处理的实际操作经验几乎为零。建议教学采用“情境导入-任务驱动-探究学习”的模式,将用最直观的“手写数字识别”项目贯穿始终,将抽象概念具体化、可视化。通过代码实践和平台互动,让学生在“做中学”,化解难点。
教学准备
课堂准备:PPT课件,在线教学平台(如智慧中小学平台),安装Python及tensorflow、matplotlib、numpy库的机房环境。
课前准备:1.学生自主复习Python列表操作;2.预习教材内容;3.熟悉智慧中小学平台的基本操作。
教学过程
教学任务
教学内容
设计意图
创新设计(含AI应用)
(一)情境导入,热点引路
1. 播放AI科普短视频。
展示2025年最新的多模态大模型(如GPT-5、deepseek等)的惊艳应用。
2. 教师提问:“同学们,这些‘聪明’的AI模型,它们的‘智慧’是从何而来?是靠程序员一条条指令编码出来的吗?”
3. 引导学生讨论:得出结论——模型的智慧源于对海量数据的学习。
4. 引出课题:“今天,我们就从一个AI的‘启蒙’项目——手写数字识别入手,一起揭开机器学习中数据采集与预处理的神秘面纱。”
利用前沿科技热点短视频,快速吸引学生注意力,激发学生探究欲望。通过设问,引导学生思考AI的本质,自然过渡到本节课的核心——数据。
【AI热点时事引入】紧密结合2025年AI大模型的发展,让学生感受到所学知识与最前沿科技的紧密联系,体现课程的时代性与前瞻性。
(二)初探流程,明晰概念
梳理机器学习流程,认识MNIST数据集
1. 回顾与讲解:结合教材图4-4,师生共同梳理机器学习的一般过程(数据采集→建立模型→验证模型→评估模型→应用模型)。强调数据是起点和根基。
2. 介绍MNIST:展示教材图4-5和图4-6。
(1)WHAT是什么:70000张手写数字灰度图。
(2)WHERE怎么来:250人书写,人工标注(强调“标注”是给数据贴标签,是监督学习的关键)。
(3)HOW怎么用:详细讲解数据集的划分:
①训练集 (Train, 55000):用于“学习”,建立模型。
②验证集 (Validation, 5000):用于“模拟考试”,初步验证和调参。
③测试集 (Test, 10000):用于“最终大考”,客观评估模型性能。
构建系统知识框架,让学生对机器学习有整体认知,为后续理解模型评估打下基础。
【信息技术与学科深度融合】在PPT中用流程图展示数据流向,将抽象的“划分”概念可视化。在智慧中小学平台发布即时选择题,如“以下哪个数据集用于模型的最终评估?”,进行即时师生互动反馈,巩固概念。
(三) 深度探究一:数据的向量化
探究向量化的必要性与方法
1. 【提问】“计算机如何‘看懂’一张图片?”引导学生思考计算机只认识数字。
2. 可视化过程:
展示教材图4-7,动态演示一张28x28的灰度图如何转换为一个28x28的数字矩阵(每个像素对应一个0-1之间的小数)。
演示如何将该矩阵“拉平”成一个长度为784的一维数组。强调概念:这就是向量化。
3. 【深度探究活动】:
①在智慧中小学平台的小组讨论区,围绕“思考与讨论”的两个问题展开协作探究。
②问题1:为什么要将矩阵转化为一维数组?
③引导与总结:教师巡视指导,最后总结:一维数组是许多机器学习算法的标准输入格式,简化了数据处理流程和模型结构。
④问题2:如果是二值图像,该如何完成向量化?
⑤引导与总结:引导学生回顾“二值图像”定义(像素值非0即1)。得出结论:方法相同,只是矩阵中的数值只有0和1,拉平后的一维数组同样由0和1构成。
这是本节课的技术核心。通过课件演示将抽象过程具象化。小组探究将学习的主动权交给学生,培养学生合作与高阶思维能力。通过对比灰度图与二值图,加深对向量化通用性的理解。
【深度融合与AI应用】:
1. 提供在线的像素矩阵模拟器,让学生可以上传一个小尺寸的示例图,实时看到矩阵和向量的生成过程。
2. 在智慧中小学平台,小组的讨论过程和结论会被记录,作为过程性评价的依据。
(四) 实践体验,代码验证
编程实现数据读取与可视化
1. 教师演示:运行配套代码mnist_explorer.py。
①用 input_data.read_data_sets 读取MNIST数据。
②从训练集中随机取出一张图片的向量,通过reshape和matplotlib库将其还原为图像并显示。
③同时打印出该图片对应的标签。
2. 学生实践:
①学生动手运行代码,观察并记录输出。
②挑战任务:尝试修改代码,显示验证集或测试集中的图片;尝试显示一张二值化处理后的图片(将灰度值大于0.5的设为1,否则为0)。
3. 分享与点评:邀请学生分享屏幕展示成果,小组间互相进行点评,最后统一教师评价。
“纸上得来终觉浅,绝知此事要躬行”。通过代码的实践操作,让学生亲眼见证“向量”如何变回“图像”,深刻理解了数据向量化,建立坚实的数据理性认识。
【信息技术深度融合】:将理论知识与编程课堂实践相互融合、无缝衔接。代码骨架降低了操作门槛,让所有学生都能获得成功体验。挑战任务为学有余力的学生提供了拓展空间,积极响应国家教科理念,对不同学力的学生进行分层教学。
(五) 融会贯通,总结提升
课堂小结
1. 回顾总结:师生共同回顾本节课的知识脉络:AI热点→机器学习流程→MNIST数据集→数据预处理(向量化)→代码实践。
2. 价值升华:
①回顾时代热点,再次联系课前的2025年AI热门大模型,指出它们正是依赖于比MNIST庞大亿万倍的数据和更复杂的预处理技术。
②强调核心:“数据就是AI的石油,预处理更像是是炼油厂。没有高质量的数据和精心的预处理,再先进的算法也无法发挥其作用与威力。”
③提出AI未来发展展望:数据的质量(如标注准确性、多样性)直接决定AI的天花板,鼓励学生未来在数据科学领域深入探索。
构建完整的知识闭环,强化学生课堂记忆。将具体知识点提升到方法论和价值层面,培养学生的数据素养和科学视野。
【AI应用与综合评价】在智慧中小学平台发布本课节的总结性评价问卷,包含概念题、简单应用题和一道开放题(如:“请举例说明一个你设想中的AI应用,并分析它可能需要哪些数据以及如何预处理”),实现综合评价。
作业设计
【基础性作业】(全体完成)
1.在智慧中小学平台完成本课的课后练习题,主要考查数据集划分、向量化等核心概念。
2.撰写一段学习反思(100-150字),描述你对“数据是AI基石”这句话的新理解,并提交至平台。
【拓展性作业】(选做,鼓励完成,针对学有余力想进一步突破的学生)
方案A(理论研究):调研除MNIST外,计算机视觉领域另一个著名的开源数据集(如CIFAR-10),试着撰写一份简短的调研报告,比较它与MNIST的异同。
方案B(编程实践):修改课堂代码,尝试将MNIST的灰度图像全部转换为二值图像,并统计数字‘0’和‘1’在训练集中各有多少个样本。
板书设计
第四章 人工智能初步
第二节:机器学习中的数据采集与预处理
一、机器学习流程:
数据采集 → 建立模型 → 验证模型 → 评估模型 → 应用模型
(核心:数据驱动)
二、MNIST数据集:
来源:250人手写,人工标注
构成:70000张 28x28 灰度图
划分:
训练集 (Train: 55000) —— 课本
验证集 (Validation: 5000) —— 模拟考
测试集 (Test: 10000) —— 期末考
三、数据预处理:向量化
目的:将图像转为算法可处理的数值格式
方法:
灰度图/二值图 → (28x28)像素矩阵 → “拉平” → 长度784的一维向量
关键:理解像素值与视觉信息的对应关系。
教学反思
本教学设计力求体现新课标理念,具有以下特色与可预见的反思点:
本次课堂能够成功激发学生学习激情并学习效率得到提升的几个原因在于:一、课堂引入有着一定前沿性与趣味性。以2025年AI大模型热点切入,成功抓住了学生的兴趣点,让课程内容“活”了起来。二、课堂深度与广度结合:不仅讲解了“是什么”,更通过深度探究活动引导学生思考“为什么”,这样不仅让课堂理论部分不无聊乏味,还使学生们培养了计算思维和数据思维。三、信息技术与课堂深度融合。课堂中借助智慧中小学平台的使用贯穿了预习、课中互动、评价与课后作业全流程,实现了信息技术与学科教学的真正深度融合。编程实践环节将理论与现实世界连接,化解了抽象概念。四、课堂课后评价多元化。过程性评价:比如智慧中小学平台讨论、课堂表现;以及课堂总结性评价:比如平台问卷、作业相结合,实现了对学生更全面的考核。
同时本次教学也存在一定不足之处、改进的地方:
一、课堂时间把控:探究活动和实践环节可能耗时较多,需要教师根据课堂实际情况灵活调整节奏,确保核心目标的达成。二、学生学力差异性问题:尽管提供了分层任务和代码骨架,但班级内学生的编程基础差异可能仍然会导致实践环节进度不一。老师可以根据不同班级的学情情况,考虑组建“编程互助小组”,发挥学生优秀骨干的带头作用。三、硬件与网络依赖高。本课高度依赖机房和网络环境。需提前做好应急预案,比如准备离线数据集和备用课件,以防万一。
学科网(北京)股份有限公司
$
相关资源
由于学科网是一个信息分享及获取的平台,不确保部分用户上传资料的 来源及知识产权归属。如您发现相关资料侵犯您的合法权益,请联系学科网,我们核实后将及时进行处理。