内容正文:
《人工智能中的机器学习》
教学课件
浙教版八年级下册 · 智能技术初体验
1.7.2013
同学们好!欢迎来到今天的信息技术课堂。在我们的生活中,越来越多的智能设备和应用让我们感到惊奇。手机能识别花草,视频APP总能推荐我们喜欢的内容,语音助手能听懂我们的话。这些神奇的“智能”背后,究竟隐藏着什么秘密呢?今天,就让我们一起走进人工智能的世界,揭开“机器学习”的神秘面纱。
‹#›
你是否也遇到过这些“智能”时刻?
神奇的“植物学家”
周末去公园,看到一朵漂亮的花,拿出手机拍一下,它就告诉你花的名字、习性。
🤔 它为什么能认识这么多花?是有人把所有花的照片都存进去了吗?
懂你的“推荐官”
刷短视频时,发现推荐的内容越来越合心意,好像APP知道你喜欢什么。
🤔 它是怎么猜到你的喜好的?难道它在“监视”我吗?
万能的“语音助手”
对着手机说“明天天气怎么样?”,它能准确回答,甚至能听懂你的口音。
🤔 它为什么能听懂不同人的话,而不仅仅是标准普通话?
1.7.2013
同学们,请大家回想一下,在生活中是不是经常遇到这样的场景?用手机拍花就能知道名字,刷短视频总能刷到自己喜欢的内容,语音助手能听懂我们说话。这些应用似乎非常“懂”我们。大家有没有想过,它们为什么能做到这些呢?是程序员把所有可能性都写进代码里了吗?这些问题,正是我们今天要探讨的核心。
‹#›
揭开“智能”背后的神秘面纱
同学们观察得非常仔细!这些应用似乎和我们之前学的“编程”不太一样。
传统编程
我们像老师一样,一步步告诉计算机该做什么
“你要这样做,然后那样做...”
智能应用
给计算机海量数据,它自己总结规律、学会解决问题
“我自己研究明白了!”
这种让计算机“自主学习”的神奇技术,就是我们今天的主角 ——机器学习!
1.7.2013
没错,这些智能应用的工作方式和我们传统理解的编程有本质区别。传统编程是我们作为程序员,像老师一样,手把手地告诉计算机每一步该做什么。而这些智能应用,更像是计算机通过大量的数据,自己总结出了规律,学会了解决问题。这种让计算机“自主学习”的技术,就是我们今天的主题——机器学习。
‹#›
新知探究一:什么是机器学习?
📚 教材定义
机器学习是人工智能的一个子领域,它使计算机模拟或实现人类的学习行为,从获取的信息和过往经验中学习,自主获取新知识或技能,无需人工预设固定规则,从而解决新问题。
💡 通俗理解
让计算机从大量数据中自己“总结规律”,而不是靠人写死每一步指令。
数据驱动
自主学习
无需固定规则
1.7.2013
那么,到底什么是机器学习呢?教材给出了一个比较正式的定义。简单来说,就是让计算机像人一样去学习。但它不是通过上课,而是通过分析海量的数据,自己总结出规律。这个过程有三个核心特点:首先,它是“数据驱动”的,数据是它的食物;其次,它能“自主学习”,不需要人一直盯着;最后,它“无需固定规则”,能适应新情况。
‹#›
对比分析:传统编程 VS 机器学习
核心逻辑
传统编程
人写规则
↓
计算机执行
机器学习
给数据+算法
↓
机器学规律
↓
自主决策
规则来源
传统编程
人工预设
固定不变
机器学习
从海量数据中
自主学习
持续优化
适应能力
传统编程
局限性大
仅能解决
预设好的问题
机器学习
具备泛化能力
举一反三
解决未知新问题
1.7.2013
为了更好地理解机器学习,我们把它和传统编程做个对比。传统编程就像是我们给计算机一个菜谱,它严格按照步骤做菜。而机器学习,是我们给它一堆食材和做好的菜,让它自己去学习菜谱。所以,传统编程的规则是固定的,而机器学习的规则是从数据中学来的,可以不断优化。这也决定了机器学习能解决我们没有预设过的新问题。
‹#›
对比分析:机器学习 VS 人类学习
人类学习Human Learning
🧠 核心逻辑:观察实践 → 总结规律 → 解决新问题
📚 经验来源:亲身经历、书本知识与他人传授
🎓 学习方式:举一反三,触类旁通,方式灵活多变
机器学习Machine Learning
⚙️ 核心逻辑:给数据+算法 → 机器归纳规律 → 自主决策
💾 经验来源:海量标注数据,无亲身经历
🔢 学习方式:高度依赖数据的质量与数量,需重复训练
💡 互动思考:“机器学习就像一个做了无数道题的学生,它通过做题总结出解题方法,遇到新题也能尝试解答。”这个比喻贴切吗?为什么?
1.7.2013
我们再把机器学习和我们人类的学习做个对比。我们人类通过观察、实践、读书来学习,能够举一反三。而机器学习则完全依赖于数据,数据就是它的“书本”和“经验”。它的学习效果,直接取决于数据的好坏和多少。大家觉得“机器学习像做了无数道题的学生”这个比喻贴切吗?这个比喻非常形象,因为机器学习确实是通过大量的“习题”(数据)来总结规律的。
‹#›
机器学习的核心:数据驱动
如果说人类学习依赖于经验积累,那么机器学习的本质,就是完全依赖于对海量数据的分析与学习。
数据是机器学习的
“燃料” 与 “经验”
基础前提:没有数据,机器学习算法就成了无源之水,无从谈起。
决定性因素:数据的数量和质量,直接决定了最终模型的“聪明”程度。
图像数据
文本信息
音频声音
行为记录
1.7.2013
所以,我们可以得出一个非常重要的结论:数据是机器学习的核心。数据就是机器学习的燃料,没有数据,一切都是空谈。而且,数据的数量和质量,直接决定了训练出来的模型好不好用,聪不聪明。一个模型如果只看过很少的图片,那它肯定不如看过亿万张图片的模型识别人脸来得准。
‹#›
了解了机器学习的基本概念,我们来深入看看它具体是如何工作的
监督学习 · Supervised Learning
接下来,我们将以此为例,一步步拆解它的核心流程
1.7.2013
好了,我们已经了解了机器学习的基本概念。那么,它具体是如何工作的呢?这听起来可能很复杂,但别担心,接下来我们会以一种最常见的学习方式——“监督学习”为例,像剥洋葱一样,一步步拆解它的核心流程,让大家一看就懂。
‹#›
新知探究二:监督学习的流程
📚 教材案例:手写数字识别 (MNIST)
🤔思考:在这个案例中,我们给机器看的“练习题”有什么特点?机器又是如何一步步从这些练习题中,学会识别陌生的手写数字的?
01 数据采集
收集大量带“标准答案”的手写数字图片,作为模型的“练习题”与“参考答案”。
02 模型训练
将数据输入算法,让模型不断学习图片特征与数字标签之间的对应关系,调整内部参数。
03 预测输出
模型学习完成后,输入一张全新的手写数字图片,自动输出识别结果,完成任务。
1.7.2013
我们来看一个经典的例子:手写数字识别。我们想让机器学会认识0到9这十个数字。大家可以思考一下,我们需要给机器看什么样的“练习题”?这个过程可以分为三步:首先是收集数据,然后是训练模型,最后是用模型来做预测。接下来我们一步步看。
‹#›
第一步:数据采集(带标签的数据)
关键 KEY
核心任务是收集大量的“数据 + 答案”配对组合,这是模型学习的基础。
示例 EXAMPLE
收集成千上万张手写数字图片,并为每一张明确标注:“这是3”、“那是7”。
术语 TERM
这种既有原始数据,又有明确分类或数值答案的数据,被称为带标签数据 (Labeled Data)。
比喻 METAPHOR
这就像给学生做的练习题集,每一道题目旁边都附带了清晰的标准答案,便于对照学习。
1.7.2013
第一步是数据采集。这里的关键是,我们收集的数据必须是“带标签”的。什么意思呢?就是每张手写数字图片,我们都要告诉机器:“嘿,这张图是数字5”,“那张图是数字8”。这种既有数据又有答案的数据,就叫做带标签数据。这就好比我们给学生做的练习题,每道题后面都附上了标准答案。
‹#›
第二步:模型训练(核心环节)
01 输入:带标签数据
将我们整理好的手写数字图片与对应标签,完整输入给机器学习算法,作为算法学习的“教科书”。
02 过程:算法自主学习
算法会自动对数据进行分析与归纳,寻找“特定像素形状”与“数字含义”之间的对应规律,这是模型的“成长”过程。
03 产出:训练好的模型
算法完成学习后,最终生成一个封装了所有规律的程序文件。它就是我们解决手写数字识别问题的核心“武器”。
💡 一句话理解模型:它是封装了学习规律的“智能工具”,也是机器学习的最终产物。
1.7.2013
第二步,也是最核心的一步,就是模型训练。我们把刚才收集的带标签数据,喂给一个机器学习算法。这个算法就像一个聪明的学生,它会自己去分析这些图片和标签,找出“什么样的形状对应数字1”,“什么样的形状对应数字2”这样的规律。当它学完所有数据后,就会生成一个“模型”。这个模型,就是我们训练出来的“智能工具”。
‹#›
核心概念:什么是“模型”?
模型是规律的载体
它不是魔法,而是“记住”了从海量数据中学习到的客观规律与知识。
模型是可复用的工具
一旦完成训练,就能脱离训练数据,无限次地处理新任务、解决新问题。
互动思考:公式y = f(x)代表什么?
x = 输入 (Input)
待处理的新数据。例如:一张全新的手写数字图片。
y = 输出 (Output)
模型给出的答案。例如:“这张图片是数字 5”。
生活类比:这就像我们学会了汉字的写法和含义后,就能认出任何一个新的手写汉字一样。
1.7.2013
那么,这个“模型”到底是什么呢?我们可以把它理解为一个装满了规律的黑盒子。它记住了从数据中学到的知识,并且可以反复使用。我们可以用一个简单的函数来表示它:y = f(x)。这里的x,就是我们给它的新数据,比如一张新的手写数字图片;y,就是模型给出的答案,比如“这是数字5”。而这个f,就是模型本身,它代表了从输入到输出的映射关系。
‹#›
第三步:预测输出(应用环节)
输入过程
将新的、没有标签的数据输入到已经训练完成的AI模型中,开启预测流程。
模型推理
模型调取并运用在训练阶段学到的规律,对输入的新数据进行高速分析与逻辑判断。
输出结果
经过计算,模型给出最终的预测结论,完成整个应用推理过程。
经典示例
输入一张未标注的手写数字图,模型快速识别并输出:“这是数字 5”。
新的手写数字图片
训练好的AI模型
识别结果:“5”
1.7.2013
有了训练好的模型,我们就可以进入第三步:预测输出。这是应用环节。我们把一张全新的、模型从未见过的手写数字图片输入进去,模型就会运用它学到的规律,告诉我们它认为这张图是什么数字。如果它说对了,就说明我们的模型训练成功了!
‹#›
关键认知:模型的“泛化能力”
💡 生活中的类比:
一个只见过苹果和香蕉的孩子,在第一次见到橙子时,是无法认出它是一种水果的。
▍ 什么是“泛化能力”?
指机器学习模型处理训练数据之外的全新、未知数据的能力。这是衡量模型是否实用的核心指标。
▍ 互动思考:0-5 能认出 6-9 吗?
不能。因为模型只学习了0-5的像素规律,没有见过6-9的特征,所以无法进行“举一反三”的推理。
💡 核心结论:数据的全面性至关重要
模型只能解决与“训练数据规律”一致的问题。
1.7.2013
这里有一个非常关键的概念,叫做“泛化能力”。简单说,就是模型处理新数据的能力。比如,如果我们训练模型时只用了0到5的数字,那它能认出6到9吗?答案是不能。因为它从没见过,就学不会。这告诉我们,训练数据的全面性非常重要。模型只能“举一反三”,但不能“无中生有”。就像一个孩子如果只见过苹果和香蕉,他是无法理解橙子也是水果的。
‹#›
新知探究三:机器学习的两大类型
监督学习 (Supervised Learning)
🔑 核心特点:使用带有明确“答案”的带标签数据进行训练,如同有老师指导的学习过程。
🎯 主要目标:学习“输入→输出”的映射规律,解决现实中的预测和分类问题。
无监督学习 (Unsupervised Learning)
🔑 核心特点:使用没有任何标签的数据,机器需要自主探索数据的内在特征,如同自主探索发现。
🎯 主要目标:发现海量数据中隐藏的结构、模式或关系,常用于数据的聚类和分组分析。
1.7.2013
除了我们刚才讲的“监督学习”,还有一种常见的学习方式,叫做“无监督学习”。监督学习就像有老师教,给的练习题都有答案,目标是学会预测和分类。而无监督学习,就像没有老师,只有一堆数据,让机器自己去发现其中的规律,比如哪些数据是一类的,这个过程叫做聚类和分组。
‹#›
监督学习的应用场景
图像识别
拍照识花、人脸识别、手写数字识别等,通过大量带标签的图像数据训练模型进行分类或检测。
垃圾邮件过滤
基于邮件的文本内容、发件人信息及历史标记(垃圾/非垃圾),训练模型自动识别并拦截新的垃圾邮件。
语音识别
将人类的语音信号转换为文本,广泛应用于语音助手、实时字幕生成及会议记录等场景。
疾病诊断辅助
输入病人的症状、化验指标等数据,利用已有的“健康/患病”历史数据训练模型,辅助预测新患者的健康状况。
1.7.2013
监督学习的应用非常广泛。我们开头提到的拍照识花、人脸识别,都属于图像识别。还有我们每天都在用的垃圾邮件过滤、语音转文字,甚至在医疗领域,帮助医生根据症状数据诊断疾病,这些都是监督学习的典型应用。它们的共同点是,都需要有“标准答案”的训练数据。
‹#›
无监督学习的应用场景
用户分群
电商平台分析用户的购买记录,自动将喜好相似的用户归为一类(例如,“数码爱好者”、“美妆达人”),实现精准营销。
商品推荐
分析海量商品数据,自动将属性或受众相似的商品进行聚类分组,如“夏季连衣裙”、“户外运动鞋”,辅助商品管理与推荐系统。
异常检测
在金融、网络安全等领域,从海量的正常数据中,识别并标记偏离正常模式的行为,如信用卡盗刷、网络入侵或欺诈交易。
社交网络分析
分析复杂的社交网络关系,发现隐藏的社群结构、识别关键意见领袖(KOL),或者挖掘用户之间的紧密联系。
1.7.2013
无监督学习的应用同样重要。比如,电商平台为什么能给你推荐可能喜欢的商品?它就是用无监督学习分析了大量用户的购买行为,把相似的用户分成一群,再把相似的商品分成一类。还有,银行如何发现信用卡盗刷?也是通过无监督学习找出消费行为中的异常模式。这些都是在没有“标准答案”的情况下,让机器自己去发现规律。
‹#›
它们属于哪种学习类型?
给模型看大量标注了“猫”和“狗”的图片,让它学会区分猫和狗。
监督学习
分析一个班级所有同学的各科成绩,找出成绩相似的学生群体。
无监督学习
训练模型识别不同人的语音指令,让它准确理解并执行用户的意图。
监督学习
分析超市的海量销售数据,发现哪些商品经常被顾客一起购买,用于优化摆放。
无监督学习
1.7.2013
现在我们来做个小练习,判断一下下面这些例子分别属于哪种学习类型。大家思考一下,区分猫狗、分析成绩、识别语音、分析购物数据,哪些是有“标准答案”的,哪些是让机器自己找规律的?(稍作停顿,引导学生回答)没错,区分猫狗和识别语音是监督学习,因为我们有明确的标签。而分析成绩和购物数据是无监督学习,因为我们只是让机器去发现群体和关联。
‹#›
实践体验:动手训练一个AI模型
Let's Do It! 亲手体验机器学习的神奇之处
Teachable Machine
Google 出品的机器学习实验平台
有趣的工具
利用谷歌的在线神器
开启你的AI探索之旅,
简单几步即可上手。
零代码门槛
无需编写任何代码,
直观感受并体验
“监督学习”的完整流程。
明确的目标
亲手训练一个AI模型,
让它学会准确识别
“石头、剪刀、布”手势!
Ready? Let's Start! 🚀
1.7.2013
理论学习之后,最激动人心的部分来了!我们要亲手训练一个AI模型!我们将使用谷歌提供的一个非常棒的在线工具——Teachable Machine。它非常直观,不需要我们写任何代码,就能让我们完整地体验一遍监督学习的流程。我们的目标是训练一个能识别“石头、剪刀、布”手势的模型。大家准备好了吗?
‹#›
实践步骤一:采集数据
01
访问网站:打开浏览器,访问 Google Teachable Machine 官方网站。
02
创建项目:点击主界面的“Get Started”,选择创建一个“图像项目” (Image Project)。
03
设置类别:新建三个分类,分别重命名为“Rock (石头)”、“Paper (布)”、“Scissors (剪刀)”。
04
拍摄图像:依次点击各分类下的录制按钮,用摄像头为每个手势拍摄至少20张样本图片。
1.7.2013
第一步,数据采集。大家跟着我操作:打开Teachable Machine网站,创建一个图像项目。然后,我们创建三个类别,分别叫“石头”、“布”、“剪刀”。接下来,就是用电脑摄像头,分别为每个类别拍摄至少20张手势照片。记住,这就是我们在收集“带标签的数据”。
‹#›
第二步:训练模型 & 第三步:测试预测
01 / 训练模型 (Train Model)
点击“Train Model”(训练模型)按钮,等待几秒钟。工具会自动分析数据,学习手势特征与标签之间的内在规律,快速完成模型构建。
02 / 测试预测 (Preview)
切换到“Preview”(预览)界面,用新的手势对着摄像头。观察模型是否能实时准确地识别你的手势动作,并在屏幕上输出正确的分类结果。
1.7.2013
数据采集完成后,我们就可以进行第二步和第三步了。点击“训练模型”按钮,大家可以看到进度条在跑,这就是模型在学习我们刚才拍摄的手势规律。训练完成后,切换到预览界面,现在你可以对着摄像头做不同的手势,看看模型能不能准确地识别出来。是不是很神奇?
‹#›
实践反思:为什么有时候识别不准?
数据质量差
手势拍得不清楚、光线太暗、或者拍摄背景过于杂乱,都可能干扰模型的判断。
数据量不足
每个类别的图片数量太少,样本覆盖不够全面,导致模型无法学习到手势的全部规律。
数据有偏见
如果只拍了自己的手,模型只记住了你的特征,换其他同学的手或角度就可能“不认识”了。
“垃圾进,垃圾出” (Garbage In, Garbage Out)
高质量、足量、无偏见的数据,是机器学习成功的关键!
1.7.2013
在刚才的实践中,大家可能会发现,有时候模型识别得不准。这是为什么呢?可能是我们拍的照片太模糊,或者光线不好;也可能是拍的照片数量太少,模型没学够;还有可能是我们只拍了自己的手,换个同学的手它就不认识了。这就引出了一个非常重要的原则:“垃圾进,垃圾出”。输入的数据质量差,输出的模型效果就差。所以,高质量、足够多、没有偏见的数据,是机器学习成功的关键!
‹#›
拓展延伸:机器学习是万能的吗?——它的挑战
数据偏见 (Bias)
如果训练数据本身就带有偏见(比如,大部分人脸数据都是男性),那么模型也会学到这种偏见,导致对女性面孔识别率低。
隐私泄露 (Privacy)
机器学习需要大量数据,这些数据可能包含个人隐私信息,存在泄露风险。一旦数据库被攻破,用户的个人信息安全将面临严峻挑战。
技术滥用 (Misuse)
技术可能被不法分子利用,例如制作虚假的Deepfake视频来误导公众,或发起更复杂的网络攻击,对社会秩序和个人声誉造成严重威胁。
1.7.2013
机器学习非常强大,但它并不是万能的,也面临着一些挑战。首先是数据偏见,如果训练数据本身就有问题,比如性别歧视,模型也会学会歧视。其次是隐私问题,我们的数据被用来训练模型,存在泄露的风险。最后是技术滥用,比如现在很火的AI换脸技术,就可能被用来制作虚假视频,造成危害。
‹#›
拓展延伸:面对AI,我们应该怎么做?
树立正确的技术伦理观
认识到技术是中立的,但使用方式有善恶,做有道德的技术使用者。
保护个人数据隐私
谨慎提供个人敏感信息,仔细阅读应用的数据使用政策,保护好数字身份。
理性看待AI技术
既不盲目崇拜神话AI,也不恐惧排斥AI。它只是我们的工具,而不是生活的主宰。
努力学习,拥抱未来
主动了解AI知识,培养创新思维与综合能力,为未来与AI共处做好准备。
1.7.2013
面对这些挑战,我们作为未来的公民,应该怎么做呢?首先,要树立正确的价值观,知道技术本身是中立的,关键在于怎么用。其次,要保护好自己的个人隐私,谨慎授权。同时,要理性看待AI,它不是洪水猛兽,而是我们的工具。最重要的是,我们要努力学习,了解AI,这样才能在未来更好地与AI共处,甚至成为AI的创造者。
‹#›
一节课的时间很短,
但我们对人工智能的探索才刚刚开始。
让我们一起回顾今天学到的核心知识。
KEY TAKEAWAYS REVIEW
1.7.2013
一节课的时间很快就过去了,但我们对人工智能和机器学习的探索才刚刚拉开序幕。现在,让我们一起快速回顾一下今天都学到了哪些核心知识。
‹#›
本节课核心知识回顾
01 / 一个定义
机器学习是让计算机从数据中自主学习规律,无需预设固定规则的技术。核心在于“让数据说话”,而非人工编写所有规则。
02 / 核心流程 (监督学习)
标准闭环:数据采集(带标签)→模型训练→预测输出。每一步都环环相扣,决定了最终的效果。
03 / 两大基础类型
•监督学习:有标签数据,主要解决“预测与分类”问题。
•无监督学习:无标签数据,主要解决“聚类与分组”问题。
04 / 关键认知
在AI的世界里,数据是地基,模型是大厦。掌握技术的同时,要时刻牢记技术是服务于人的,需合理且负责任地使用。
1.7.2013
我们来梳理一下今天的知识点。首先,我们知道了机器学习的定义,就是让计算机自主学习规律,而不是依赖人工编写的固定规则。其次,我们学习了监督学习的核心三步流程:从数据采集开始,经过模型训练,最后实现预测输出。接着,我们区分了有标签的“监督学习”和无标签的“无监督学习”这两大基础类型。最后,我想强调一个关键认知:数据是机器学习的基础,技术是为了解决问题而生的,所以我们要始终坚持合理、负责任地使用它。
‹#›
总结与展望
揭开面纱,探索原理
今天,我们一起走进了机器学习的世界,揭开了它神秘的面纱,初步了解了其背后的逻辑、基本原理以及在现实世界中的广泛应用。
AI核心,改变世界
作为人工智能的核心引擎,机器学习正在重塑各行各业,从智能推荐到自动驾驶,它正以惊人的速度深刻地改变着我们的生活与世界。
保持好奇,创造未来
希望大家保持对技术的好奇心,理性看待发展。在生活中观察应用,在课堂上扎实积累,努力成为未来智能时代的创造者和负责任的使用者!
1.7.2013
总结一下,今天我们一起揭开了机器学习的神秘面纱。这项技术正在深刻地改变我们的世界。希望大家课后能继续保持好奇心,去发现生活中更多的机器学习应用。同时,也要理性看待技术,努力学习,让我们一起成为未来智能时代的创造者和负责任的使用者!
‹#›
谢谢观看
1.7.2013
我的讲解就到这里。现在是提问环节,大家有什么问题可以随时提出。谢谢大家!
‹#›
$